به گزارش تابش کوثر، مدل o۳ پیشتر در ماه دسامبر معرفی شده بود، اما تنها نسخههای ضعیفتری مثل «o۳-مینی» در دسترس بودند. حالا این مدلها جایگزین نسخههای قبلی یعنی o۱ و o۳-مینی شدهاند.
از امروز کاربران نسخههای پلاس، پرو و تیم چتجیپیتی میتوانند به این مدلها دسترسی داشته باشند. کاربران سازمانی و آموزشی هم از هفته آینده به آنها دسترسی پیدا میکنند. کاربران رایگان نیز با انتخاب گزینه «Think» میتوانند از مدل o۴-مینی استفاده کنند.
سم آلتمن، مدیرعامل اوپناِیآی، در توییتر نوشت: «انتظار داریم مدل o۳-pro را در چند هفته آینده برای کاربران نسخه Pro منتشر کنیم.»
اوپناِیآی میگوید این مدلها هوشمندترین نسخههایی هستند که تاکنون ساختهاند. همچنین اعلام کرده که این مدلها نسبت به نسخههای قبلی هزینه کمتر و کارایی بیشتری دارند. مدل o۳ برای تحلیلهای پیچیده طراحی شده و مدل o۴-مینی که نسخه سبکتر مدل بعدی یعنی o۴ است، برای سرعت و صرفهجویی در منابع بهینهسازی شده.
هر دو مدل چندوجهی هستند؛ یعنی میتوانند با متن و تصویر بهصورت همزمان کار کنند و حتی با تصاویر «فکر کنند»، نه اینکه فقط آنها را تحلیل کنند. این توانایی به آنها امکان میدهد با تصاویر دستنویس، نمودارهای کتابهای درسی یا حتی عکسهای بیکیفیت نیز تعامل داشته باشند.
آنچه این مدلها را از نسخههای دیگر مثل GPT-4.5 یا GPT-4o متمایز میکند، استفاده از نوعی فرآیند تفکر شبیهسازیشده است که به آنها کمک میکند مراحل حل مسئله را بهصورت گامبهگام طی کنند. برای مثال، در پاسخ به پرسشی درباره آینده مصرف انرژی در کالیفرنیا، مدل میتواند خودش دادهها را جستوجو کند، کد بنویسد، نمودار تولید کند و تحلیل ارائه دهد.
گرگ بروکمن، رئیس اوپناِیآی، در مراسم معرفی گفت: «این اولین مدلهایی هستند که پژوهشگران برجسته میگویند واقعاً ایدههای نو و مفید تولید میکنند.»
دکتر دریا اونوتماز، ایمنیشناس، در توییتر نوشت: «مدل o۳ در سطح نابغه یا نزدیک به آن ظاهر شده. وقتی سوالات پیچیده پزشکی میپرسم، جوابهایش انگار از زبان یک فوقتخصص میآید.»
اوپناِیآی میگوید مدل o۳ نسبت به مدل قبلی خود یعنی o۱، در وظایف دشوار ۲۰ درصد اشتباهات کمتری دارد و در برنامهنویسی، مشاوره تجاری و ایدهپردازی خلاقانه عملکرد خوبی نشان داده.
در آزمون AIME مدل o۴-مینی به دقت ۹۲.۷ درصد رسیده و مدل o۳ هم در آزمون SWE-Bench Verified برای برنامهنویسی ۶۹.۱ درصد دقت کسب کرده است. همچنین مدل o۳ در آزمون بصری MMMU موفق به کسب ۸۲.۹ درصد شده است.
با این حال، برخی کارشناسان هشدار دادهاند که نباید بدون راستیآزمایی مستقل به نتایج این مدلها اعتماد کامل کرد. برای مثال، آزمایشگاه Transluce گزارش داده که مدل o۳ گاهی اطلاعات نادرست درباره تواناییهای خودش ارائه میدهد.
در بخش قیمتگذاری، استفاده از مدل o۳ از طریق API معادل ۱۰ دلار برای هر یک میلیون توکن ورودی و ۴۰ دلار برای خروجی است. این قیمت نسبت به مدل قبلی یعنی o۱ کاهش یافته. مدل o۴-مینی هم ۱.۱۰ دلار برای ورودی و ۴.۴۰ دلار برای خروجی قیمتگذاری شده است.
اوپناِیآی همچنین از ابزار جدیدی به نام Codex CLI رونمایی کرده که نوعی دستیار کدنویسی است و از طریق ترمینال به کدهای محلی کاربر متصل میشود. این ابزار شباهت زیادی به Claude Code دارد که شرکت Anthropic در نسخه Claude 3.7 معرفی کرده بود.
همزمان با معرفی Codex CLI، اوپناِیآی یک برنامه کمکهزینه یک میلیون دلاری هم اعلام کرده که به پروژههایی که از این ابزار استفاده کنند، اعتبار API ارائه میدهد.
م/۱۱۰*
نظر شما