هوش مصنوعی جدید اوپن‌اِی‌آی به گفته پزشکان «در سطح نابغه» عمل می‌کند

 شرکت اوپن‌اِی‌آی روز چهارشنبه دو مدل جدید از خانواده هوش مصنوعی خود را معرفی کرد که توانایی استدلال مرحله‌به‌مرحله دارند و برای اولین‌بار می‌توانند به‌طور همزمان از تمام ابزارهای چت‌جی‌پی‌تی از جمله وب‌گردی، کدنویسی، تحلیل تصویر و تولید تصویر استفاده کنند

به گزارش تابش کوثر، مدل o۳ پیش‌تر در ماه دسامبر معرفی شده بود، اما تنها نسخه‌های ضعیف‌تری مثل «o۳-مینی» در دسترس بودند. حالا این مدل‌ها جایگزین نسخه‌های قبلی یعنی o۱ و o۳-مینی شده‌اند.

از امروز کاربران نسخه‌های پلاس، پرو و تیم چت‌جی‌پی‌تی می‌توانند به این مدل‌ها دسترسی داشته باشند. کاربران سازمانی و آموزشی هم از هفته آینده به آن‌ها دسترسی پیدا می‌کنند. کاربران رایگان نیز با انتخاب گزینه «Think» می‌توانند از مدل o۴-مینی استفاده کنند.

سم آلتمن، مدیرعامل اوپن‌اِی‌آی، در توییتر نوشت: «انتظار داریم مدل o۳-pro را در چند هفته آینده برای کاربران نسخه Pro منتشر کنیم.»

اوپن‌اِی‌آی می‌گوید این مدل‌ها هوشمندترین نسخه‌هایی هستند که تاکنون ساخته‌اند. همچنین اعلام کرده که این مدل‌ها نسبت به نسخه‌های قبلی هزینه‌ کمتر و کارایی بیشتری دارند. مدل o۳ برای تحلیل‌های پیچیده طراحی شده و مدل o۴-مینی که نسخه سبک‌تر مدل بعدی یعنی o۴ است، برای سرعت و صرفه‌جویی در منابع بهینه‌سازی شده.

هر دو مدل چندوجهی هستند؛ یعنی می‌توانند با متن و تصویر به‌صورت همزمان کار کنند و حتی با تصاویر «فکر کنند»، نه اینکه فقط آن‌ها را تحلیل کنند. این توانایی به آن‌ها امکان می‌دهد با تصاویر دست‌نویس، نمودارهای کتاب‌های درسی یا حتی عکس‌های بی‌کیفیت نیز تعامل داشته باشند.

آنچه این مدل‌ها را از نسخه‌های دیگر مثل GPT-4.5 یا GPT-4o متمایز می‌کند، استفاده از نوعی فرآیند تفکر شبیه‌سازی‌شده است که به آن‌ها کمک می‌کند مراحل حل مسئله را به‌صورت گام‌به‌گام طی کنند. برای مثال، در پاسخ به پرسشی درباره آینده مصرف انرژی در کالیفرنیا، مدل می‌تواند خودش داده‌ها را جست‌وجو کند، کد بنویسد، نمودار تولید کند و تحلیل ارائه دهد.

گرگ بروکمن، رئیس اوپن‌اِی‌آی، در مراسم معرفی گفت: «این اولین مدل‌هایی هستند که پژوهشگران برجسته می‌گویند واقعاً ایده‌های نو و مفید تولید می‌کنند.»

دکتر دریا اونوتماز، ایمنی‌شناس، در توییتر نوشت: «مدل o۳ در سطح نابغه یا نزدیک به آن ظاهر شده. وقتی سوالات پیچیده پزشکی می‌پرسم، جواب‌هایش انگار از زبان یک فوق‌تخصص می‌آید.»

اوپن‌اِی‌آی می‌گوید مدل o۳ نسبت به مدل قبلی خود یعنی o۱، در وظایف دشوار ۲۰ درصد اشتباهات کمتری دارد و در برنامه‌نویسی، مشاوره تجاری و ایده‌پردازی خلاقانه عملکرد خوبی نشان داده.

در آزمون AIME مدل o۴-مینی به دقت ۹۲.۷ درصد رسیده و مدل o۳ هم در آزمون SWE-Bench Verified برای برنامه‌نویسی ۶۹.۱ درصد دقت کسب کرده است. همچنین مدل o۳ در آزمون بصری MMMU موفق به کسب ۸۲.۹ درصد شده است.

با این حال، برخی کارشناسان هشدار داده‌اند که نباید بدون راستی‌آزمایی مستقل به نتایج این مدل‌ها اعتماد کامل کرد. برای مثال، آزمایشگاه Transluce گزارش داده که مدل o۳ گاهی اطلاعات نادرست درباره توانایی‌های خودش ارائه می‌دهد.

در بخش قیمت‌گذاری، استفاده از مدل o۳ از طریق API معادل ۱۰ دلار برای هر یک میلیون توکن ورودی و ۴۰ دلار برای خروجی است. این قیمت نسبت به مدل قبلی یعنی o۱ کاهش یافته. مدل o۴-مینی هم ۱.۱۰ دلار برای ورودی و ۴.۴۰ دلار برای خروجی قیمت‌گذاری شده است.

اوپن‌اِی‌آی همچنین از ابزار جدیدی به نام Codex CLI رونمایی کرده که نوعی دستیار کدنویسی است و از طریق ترمینال به کدهای محلی کاربر متصل می‌شود. این ابزار شباهت زیادی به Claude Code دارد که شرکت Anthropic در نسخه Claude 3.7 معرفی کرده بود.

هم‌زمان با معرفی Codex CLI، اوپن‌اِی‌آی یک برنامه کمک‌هزینه یک میلیون دلاری هم اعلام کرده که به پروژه‌هایی که از این ابزار استفاده کنند، اعتبار API ارائه می‌دهد.

م/۱۱۰*

کد خبر 140957

نظر شما

شما در حال پاسخ به نظر «» هستید.
captcha