نتایج یک تحقیق جدید نشان می‌دهد چت‌بات‌های هوش مصنوعی که به‌عنوان ابزارهای پزشکی معرفی می‌شوند، در آزمون‌های شناختی عملکرد ضعیفی دارند.

به گزارش تابش کوثر ، در مجله پزشکی بریتانیا منتشر شده است نشان می‌دهد چت‌بات‌های پیشرفته هوش مصنوعی در انجام آزمون‌های تشخیص زوال شناختی نتایج ناامیدکننده‌ای داشته‌اند. این آزمون‌ها که برای شناسایی علائم اولیه زوال عقل طراحی شده‌اند، نشان می‌دهند که این فناوری در بخش‌های کلیدی مانند مهارت‌های دیداری و عملکرد اجرایی دچار ضعف‌های جدی است.
در این تحقیق، مدل‌های معروف هوش مصنوعی شامل چت‌جی‌پی‌تی نسخه ۴ و ۴اُ از شرکت اوپن‌ای‌آی، کلود ۳.۵ از آنتروپیک و جمینی نسخه‌های ۱ و ۱.۵ از آلفابت مورد ارزیابی قرار گرفتند. برای سنجش این مدل‌ها از آزمون استاندارد «ارزیابی شناختی مونترال» (MoCA) استفاده شد که در بیماران انسانی برای تشخیص علائم زوال عقل به کار می‌رود.
بر اساس نتایج، چت‌جی‌پی‌تی ۴اُ با امتیاز ۲۶ از ۳۰ بهترین عملکرد را داشت. پس از آن چت‌جی‌پی‌تی ۴ و کلود با امتیاز ۲۵ قرار گرفتند. در مقابل، جمینی نسخه ۱.۰ تنها موفق به کسب امتیاز ۱۶ شد.
تمام مدل‌ها در بخش‌هایی مانند مهارت‌های دیداری-فضایی و وظایف اجرایی ضعیف عمل کردند. برای مثال، آن‌ها در کشیدن یک ساعت ساده یا ترسیم مسیر بین اعداد و حروف به ترتیب مشخص دچار مشکل شدند. مدل‌های جمینی همچنین نتوانستند وظایف مرتبط با حافظه مانند یادآوری چند کلمه ساده را به درستی انجام دهند.
محققان تأکید کردند که با وجود پیشرفت‌های چشمگیر در هوش مصنوعی، این فناوری همچنان در وظایف پیچیده شناختی و درک تصویری دچار محدودیت است. این نقاط ضعف می‌تواند استفاده از هوش مصنوعی را در حوزه پزشکی، به‌خصوص در تشخیص بیماری‌های عصبی مانند زوال عقل، با چالش جدی روبه‌رو کند.
نویسندگان این تحقیق می‌گویند: «یافته‌های ما نشان می‌دهد که نه‌تنها هوش مصنوعی به این زودی جایگزین پزشکان نخواهد شد، بلکه ممکن است با مدل‌هایی روبه‌رو شویم که خود دچار علائم اختلال شناختی هستند.»
این نتایج زنگ خطری برای استفاده بی‌چون‌وچرا از چت‌بات‌ها در تشخیص‌های پزشکی است و نشان می‌دهد هوش مصنوعی هنوز راه درازی برای رسیدن به سطح توانایی‌های شناختی انسان در پیش دارد.
 
م/110*
 
کد خبر 130634