متا از مدل‌های جدید هوش مصنوعی «لاما ۴» رونمایی کرد

شرکت متا در اقدامی غافلگیرکننده، روز شنبه ۵ آوریل از نسل جدید مدل‌های هوش مصنوعی خانواده لاما با نام «لاما ۴» رونمایی کرد.

به گزارش تابش کوثر، این مجموعه شامل سه مدل جدید به نام‌های «اسکات»، «مَوریک» و «بیهِموث» است و گامی بلند در مسیر تلاش متا برای شکل‌دهی به آینده هوش مصنوعی باز به شمار می‌رود.
مدل‌های لاما ۴ بر پایه معماری جدیدی به نام «ترکیب کارشناسان» (Mixture of Experts) توسعه یافته‌اند؛ رویکردی که با تفویض وظایف به بخش‌های تخصصی در مدل، بهره‌وری بالاتری را وعده می‌دهد.
به گفته متا، مدل «مَوریک» که به عنوان دستیار عمومی پرچم‌دار این مجموعه معرفی شده، در آزمون‌های مربوط به برنامه‌نویسی، استدلال و پردازش تصویر، از GPT-4o شرکت OpenAI و Gemini 2.0 گوگل پیشی گرفته است.
با این حال، بر اساس گزارش تِک‌کِرانچ، این مدل در مقایسه با نسخه‌های پیشرفته‌تر مانند GPT-4.5 و Gemini 2.5 Pro عملکرد ضعیف‌تری دارد.
مدل‌های اسکات و مَوریک در حال حاضر به‌طور رایگان از طریق وب‌سایت متا و پلتفرم‌هایی چون Hugging Face در دسترس هستند.
اما استفاده از این مدل‌ها برای شرکت‌ها و توسعه‌دهندگان ساکن اتحادیه اروپا ممنوع اعلام شده است؛ اقدامی که به‌نظر می‌رسد در واکنش به قوانین سخت‌گیرانه این منطقه در زمینه حاکمیت هوش مصنوعی و حفظ حریم داده‌ها صورت گرفته باشد.
متا پیش‌تر چارچوب نظارتی اتحادیه اروپا را «دست‌وپاگیر و مانع نوآوری» توصیف کرده بود.
شتاب رقابت در دنیای متن‌باز
رونمایی از لاما ۴ در ادامه موجی از تحرکات در عرصه هوش مصنوعی متن‌باز انجام شده است.
برخی از این تحرکات با ظهور سریع آزمایشگاه چینی DeepSeek و موفقیت مدل‌های آن از جمله R1 و V3 آغاز شد؛ مدل‌هایی که رقیبی جدی برای لاما ۲ متا به شمار می‌رفتند.
در پی آن، متا با تشکیل «اتاق‌های جنگ» داخلی، توسعه لاما ۴ را سرعت بخشیده تا به مزیت‌های DeepSeek پاسخ دهد.
مدل اسکات سبک‌ترین گزینه این مجموعه است و با داشتن ۱۷ میلیارد پارامتر فعال و پنجره متنی ۱۰ میلیون توکنی، قابلیت پردازش اسناد بلند و کدهای پیچیده را دارد.
این مدل برای اجرای روان روی یک پردازنده Nvidia H100 طراحی شده و در حوزه‌های دانشگاهی، تحلیل داده‌های سازمانی و امور حقوقی کاربرد دارد.
مَوریک با داشتن ۴۰۰ میلیارد پارامتر کل و ۱۷ میلیارد پارامتر فعال در میان ۱۲۸ کارشناس، برای وظایف عمومی‌تری چون تولید محتوا و درک زبان طراحی شده و نیازمند زیرساخت‌های محاسباتی پیشرفته‌ای نظیر سامانه‌های DGX انویدیا است.
در حال حاضر مدل بیهموث همچنان در مرحله آموزش قرار دارد.
به گفته متا، این مدل با ۲۸۸ میلیارد پارامتر فعال و در مجموع نزدیک به دو تریلیون پارامتر، یکی از بزرگ‌ترین مدل‌های هوش مصنوعی معرفی‌شده در جهان است.
آزمایش‌های اولیه نشان می‌دهند که بیهموث در حل مسائل پیچیده ریاضی و علمی توانایی پیشی گرفتن از مدل‌هایی چون GPT-4.5، Claude 3.7 Sonnet و Gemini 2.0 Pro را دارد.
با این حال، Gemini 2.5 Pro همچنان در برخی شاخص‌ها جلوتر است.

م/۱۱۰*

کد خبر 140862

برچسب‌ها

نظر شما

شما در حال پاسخ به نظر «» هستید.
captcha