به گزارش تابش کوثر، روز ۲۰ ژانویه، آزمایشگاه تحقیقاتی ناشناختهای از چین تحت عنوان دیپسیک، یک مدل متنباز به نام دیپسیک-R1 منتشر کرد که توجه بسیاری را در سیلیکون ولی به خود جلب کرده است. بر اساس مقالهای که توسط این شرکت منتشر شده، مدل دیپسیک-R1 توانسته است در معیارهای ریاضی و استدلالی، مدلهای پیشرو از جمله OpenAI o1 را پشت سر بگذارد.
مارینا ژانگ، استاد دانشگاه فناوری سیدنی، در این باره میگوید: «برخلاف بسیاری از شرکتهای چینی که به سختافزار پیشرفته متکی هستند، دیپسیک بر بهینهسازی منابع از طریق نرمافزار تمرکز کرده است. این شرکت با استفاده از روشهای متنباز، تخصص جمعی را به کار گرفته و نوآوریهای مشترک را تقویت کرده است.»
دیپسیک ابتدا به عنوان شاخهای از صندوق پوشش ریسک High-Flyer شروع به کار کرد. لیانگ ونفنگ، بنیانگذار دیپسیک و فارغالتحصیل علوم کامپیوتر، در سال ۲۰۲۳ تصمیم گرفت منابع این صندوق را به توسعه مدلهای پیشرفته هوش مصنوعی اختصاص دهد. لیانگ در مصاحبهای با نشریه ۳۶Kr گفت: «این تصمیم صرفاً ناشی از کنجکاوی علمی بود و انگیزهای تجاری نداشت.»
تیم تحقیقاتی دیپسیک از دانشجویان دکترا از دانشگاههای برتر چین تشکیل شده که با وجود کمبود تجربه صنعتی، توانستهاند در محیطی مشارکتی به تحقیق بپردازند. لیانگ معتقد است جوانان برای انجام تحقیقات علمی با سرمایهگذاری بالا و سود کم، مناسبتر هستند.
محدودیتهای صادراتی آمریکا که دسترسی چین به تراشههای پیشرفته را محدود کرده، دیپسیک را به یافتن روشهای بهینهتر برای آموزش مدلهای هوش مصنوعی سوق داده است. وندی چانگ، تحلیلگر مؤسسه Mercator، میگوید: «دیپسیک با استفاده از روشهای ابتکاری مانند طرحهای ارتباطی بین تراشهها و کاهش حافظه مورد نیاز، توانسته مدلی بسازد که با یکدهم قدرت محاسباتی مدل Llama 3.1 متا آموزش دیده است.»
دیپسیک با انتشار متنباز این نوآوریها، در جامعه جهانی هوش مصنوعی اعتبار بسیاری کسب کرده است. به گفته چانگ، «این موفقیت میتواند تخمینهای فعلی درباره قدرت محاسباتی چین را تغییر دهد و نشان دهد که امکان ساخت مدلهای پیشرفته با منابع کمتر وجود دارد.»
م/110*
نظر شما