چینی‌ها با هوش مصنوعی جدید خود فصل جدیدی در رقابت جهانی آغاز کردند

استارتاپ چینی دیپ‌سیک با استفاده از منابع محدود و تغییرات بنیادی در ساختار مدل‌های هوش مصنوعی، مدلی ارائه کرده که در بسیاری از معیارها از نمونه‌های پیشرفته غربی خود پیشی می‌گیرد.

به گزارش تابش کوثر، روز ۲۰ ژانویه، آزمایشگاه تحقیقاتی ناشناخته‌ای از چین تحت عنوان دیپ‌سیک، یک مدل متن‌باز به نام دیپ‌سیک-R1 منتشر کرد که توجه بسیاری را در سیلیکون ولی به خود جلب کرده است. بر اساس مقاله‌ای که توسط این شرکت منتشر شده، مدل دیپ‌سیک-R1 توانسته است در معیارهای ریاضی و استدلالی، مدل‌های پیشرو از جمله OpenAI o1 را پشت سر بگذارد.
مارینا ژانگ، استاد دانشگاه فناوری سیدنی، در این باره می‌گوید: «برخلاف بسیاری از شرکت‌های چینی که به سخت‌افزار پیشرفته متکی هستند، دیپ‌سیک بر بهینه‌سازی منابع از طریق نرم‌افزار تمرکز کرده است. این شرکت با استفاده از روش‌های متن‌باز، تخصص جمعی را به کار گرفته و نوآوری‌های مشترک را تقویت کرده است.»
دیپ‌سیک ابتدا به عنوان شاخه‌ای از صندوق پوشش ریسک High-Flyer شروع به کار کرد. لیانگ ونفنگ، بنیان‌گذار دیپ‌سیک و فارغ‌التحصیل علوم کامپیوتر، در سال ۲۰۲۳ تصمیم گرفت منابع این صندوق را به توسعه مدل‌های پیشرفته هوش مصنوعی اختصاص دهد. لیانگ در مصاحبه‌ای با نشریه ۳۶Kr گفت: «این تصمیم صرفاً ناشی از کنجکاوی علمی بود و انگیزه‌ای تجاری نداشت.»
تیم تحقیقاتی دیپ‌سیک از دانشجویان دکترا از دانشگاه‌های برتر چین تشکیل شده که با وجود کمبود تجربه صنعتی، توانسته‌اند در محیطی مشارکتی به تحقیق بپردازند. لیانگ معتقد است جوانان برای انجام تحقیقات علمی با سرمایه‌گذاری بالا و سود کم، مناسب‌تر هستند.
محدودیت‌های صادراتی آمریکا که دسترسی چین به تراشه‌های پیشرفته را محدود کرده، دیپ‌سیک را به یافتن روش‌های بهینه‌تر برای آموزش مدل‌های هوش مصنوعی سوق داده است. وندی چانگ، تحلیلگر مؤسسه Mercator، می‌گوید: «دیپ‌سیک با استفاده از روش‌های ابتکاری مانند طرح‌های ارتباطی بین تراشه‌ها و کاهش حافظه مورد نیاز، توانسته مدلی بسازد که با یک‌دهم قدرت محاسباتی مدل Llama 3.1 متا آموزش دیده است.»
دیپ‌سیک با انتشار متن‌باز این نوآوری‌ها، در جامعه جهانی هوش مصنوعی اعتبار بسیاری کسب کرده است. به گفته چانگ، «این موفقیت می‌تواند تخمین‌های فعلی درباره قدرت محاسباتی چین را تغییر دهد و نشان دهد که امکان ساخت مدل‌های پیشرفته با منابع کمتر وجود دارد.»

م/110*

کد خبر 140318

برچسب‌ها

نظر شما

شما در حال پاسخ به نظر «» هستید.
captcha