آخرین مطالب

پربحث‌ترین

پربازدید‌ترین

۳۱ فروردین ۱۴۰۴ - ۱۱:۱۳

زنده شدن امیدها برای دستیابی به هوش مصنوعی با مقیاس کوچک

مدل جدید بیت‌نت b۱.۵۸ از مایکروسافت نشان می‌دهد که هوش مصنوعی می‌تواند با دقت پایین، منابع کمتر و بدون نیاز به سخت‌افزار گران‌قیمت، همچنان عملکردی رقابتی داشته باشد.

به گزارش تابش کوثر، گروه هوش مصنوعی عمومی مایکروسافت از مدل زبانی جدیدی با معماری ساده‌شده رونمایی کرده است که تنها از سه مقدار وزنی -۱، ۰ و +۱ استفاده می‌کند. پژوهشگران اعلام کردند: «این مدل با کاهش چشمگیر پیچیدگی محاسباتی، قادر است به‌راحتی روی یک پردازنده معمولی اجرا شود».

مایکروسافت با معرفی مدلی «۱ بیتی» نشان داد اجرای مدل‌های زبان بزرگ بدون GPU ممکن است.

در حالی که مدل‌های رایج هوش مصنوعی به اعداد ۱۶ یا ۳۲ بیتی برای وزن‌دهی متکی هستند، بیت‌نت b۱.۵۸ تنها با میانگین ۱.۵۸ بیت برای هر وزن عمل می‌کند. این موضوع نیاز به حافظه را به ۰.۴ گیگابایت کاهش داده است، رقمی که به‌مراتب کمتر از مدل‌های مشابه متن‌باز است که بین ۲ تا ۵ گیگابایت حافظه نیاز دارند.

به لطف این ساده‌سازی، عملیات داخلی مدل در زمان اجرا نیز بسیار بهینه‌تر انجام می‌شود. تیم تحقیقاتی اعلام کرد: «بیت‌نت با استفاده از جمع‌های ساده به‌جای ضرب‌های سنگین، مصرف انرژی را تا ۹۶ درصد نسبت به مدل‌های دقت کامل کاهش می‌دهد».

نکته مهم دیگر، آموزش مدل از ابتدا با وزن‌های ساده است. برخلاف بسیاری از پروژه‌های مشابه که کوانت‌سازی را پس از آموزش انجام می‌دهند، بیت‌نت b۱.۵۸ از ابتدا با این ساختار آموزش دیده است. پژوهشگران تأکید کردند: «این رویکرد باعث می‌شود عملکرد مدل به سطح مدل‌های پایه‌اش بسیار نزدیک بماند».

آزمایش‌ها نشان داده‌اند که این مدل، در بنچمارک‌های رایج مربوط به استدلال، ریاضیات و دانش عمومی، عملکردی نزدیک به مدل‌های حجیم‌تر دارد. پژوهشگران اضافه کردند: «بیت‌نت در کلاس حجمی خود، عملکردی در حد مدل‌های پیشرو دارد و در عین حال به‌طور چشمگیری بهینه‌تر است».

با این حال، هنوز مشخص نیست چرا چنین ساختار ساده‌ای با این سطح از موفقیت همراه شده است. محققان گفته‌اند: «درک عمیق‌تر دلایل کارایی بالای آموزش ۱ بیتی در مقیاس وسیع، همچنان نیاز به پژوهش‌های بیشتر دارد».

این دستاورد جدید، راه را برای توسعه مدل‌هایی هموار می‌کند که بتوانند بدون وابستگی به سخت‌افزار گران‌قیمت، در دستگاه‌های سبک و کم‌مصرف نیز اجرا شوند. شاید مدل‌های دقت کامل امروز، همان خودروهای پرمصرفی باشند که در دنیای آینده دیگر ضرورتی برای استفاده از آن‌ها نباشد.

م/۱۱۰*

کد خبر 140982

برچسب‌ها

نظر شما

شما در حال پاسخ به نظر «» هستید.

نام

ایمیل

نظر شما *

* لطفا متن تصویر را در جعبه متن وارد کنید

آخرین مطالب

جنگ یا نرخ بهره؟ مورگان استنلی می‌گوید طلا از کدام می‌ترسد

روبن آموریم از منچستریونایتد اخراج شد

فنلاند از مهدکودک با اخبار جعلی می‌جنگد

هوش مصنوعی و بحران اقلیمی؛ نجات‌بخش یا تهدیدی تازه؟

از کار افتادن فضاپیمای ناسا در مدار مریخ

کودتای غیرقانونی در ونزوئلا

رژیم‌های سم‌زدا؛ پرطرفدار بدون پشتوانه علمی

آتش‌سوزی مرگبار پیست اسکی سوئیس

بازگرداندن لیونل مسی؟

هشدار ۱۰ کشور درباره «وضعیت فاجعه‌بار» غزه

پربحث‌ترین

مرد دیوانه کودک ۱۸ ماهه ایرانی-افغان را در فرودگاه مسکو به زمین کوبید

قهرمان یخ‌نوردی ایران در جریان انجام تمرینات سقوط کرد

رونمایی از هوش مصنوعی جدید چینی، بازار فناوری جهانی را به لرزه درآورد

بی نظارتی بر مدارس هزینه سرویس را تا پنجاه درصد بالا برد

بامبو؛ مصالح سبز آینده در ساخت‌وساز مقاوم و پایدار جهان

ایران قهرمان جام جهانی فوتبال هفت‌نفره شد

آزادی دو دانشجوی ایرانی بازداشت‌شده در کازان روسیه

ظرفیت تولید برق چین به ۳.۱۹ میلیارد کیلووات رسید

گسترش آگاهی‌بخشی و خدمات رایگان برای کنترل ایدز

ساخت کاتالوگ سلول‌های بدن انسان

پربازدید‌ترین

آمریکا به 10 فوتبالیست ایران ویزا نداد

نصب نخستین توربین بادی سیمانی ساخته شده با فناوری بومی در زابل

مرد دیوانه کودک ۱۸ ماهه ایرانی-افغان را در فرودگاه مسکو به زمین کوبید

نخستین قطار باری مستقیم چین به ایران وارد آپرین شد

نیمار به سانتوس بازمی‌گردد

کشف «رنگی جدید» که هیچ‌کس تابه حال آن را ندیده

تغییر نام خلیج مکزیک به «خلیج آمریکا» با استقبال جهانی مواجه نشد

کشف پروتئین محافظی که به رشد مجدد مو در بزرگسالان کمک می‌کند

اسطوره فوتبال جمهوری چک مربی الشباب عربستان شد

تولید برق در شب با نور ماه

زنده شدن امیدها برای دستیابی به هوش مصنوعی با مقیاس کوچک

برچسب‌ها

نظر شما