آخرین مطالب

پربحث‌ترین

پربازدید‌ترین

۳۰ بهمن ۱۴۰۳ - ۱۴:۵۵

حمله «دارک‌مایند»: روش جدید برای نفوذ به مدل‌های هوش مصنوعی

پژوهشگران دانشگاه سنت‌لوئیس از روشی جدید برای حمله به مدل‌های زبانی بزرگ (LLM) پرده برداشته‌اند که می‌تواند بدون جلب توجه، پاسخ‌های این مدل‌ها را دستکاری کند.

به گزارش تابش کوثر، با گسترش استفاده از مدل‌های زبانی بزرگ (LLM) در حوزه‌های مختلف، نگرانی‌هایی درباره ضعف‌های امنیتی این فناوری افزایش یافته است. در همین راستا، «ژن گُو» و «رضا تورانی»، پژوهشگران دانشگاه سنت‌لوئیس، روشی جدید به نام «دارک‌مایند» را معرفی کرده‌اند که می‌تواند به‌طور پنهانی فرآیند تولید متن در این مدل‌ها را دستکاری کند.
تورانی، نویسنده ارشد این پژوهش، به «تک‌اکسپلور» گفته است: «مطالعه ما از افزایش محبوبیت مدل‌های هوش مصنوعی شخصی‌سازی‌شده الهام گرفته است، مانند مدل‌های موجود در GPT Store شرکت OpenAI، Gemini 2.0 گوگل و HuggingChat که هزاران مدل سفارشی را میزبانی می‌کنند.» او افزود: «در حالی که این مدل‌ها قابلیت‌های گسترده‌ای دارند، اما امنیت آن‌ها در برابر حملات نوظهور همچنان مورد بررسی قرار نگرفته است.»
پژوهشگران دریافته‌اند که «دارک‌مایند» برخلاف حملات متداول، نیازی به تغییر مستقیم درخواست‌های کاربران ندارد و از «فرآیند استدلالی» مدل‌ها برای فعال‌سازی خود بهره می‌برد. این روش از «محرک‌های پنهان» استفاده می‌کند که در ظاهر نامرئی‌اند اما در مراحل میانی استدلال فعال شده و خروجی را تغییر می‌دهند.
گُو، نویسنده اول این پژوهش، توضیح داده است: «این حمله در شرایط عادی غیرفعال باقی می‌ماند و تنها زمانی که الگوهای خاصی در استدلال مدل رخ دهد، فعال می‌شود.» وی تأکید کرد که این روش به دلیل عملکرد مخفیانه‌اش، توسط فیلترهای امنیتی رایج شناسایی نمی‌شود.
آزمایش‌های اولیه نشان داده‌اند که «دارک‌مایند» می‌تواند بر انواع وظایف زبانی، از جمله استدلال ریاضی، استدلال عمومی و پردازش نمادین تأثیر بگذارد. تورانی هشدار داده است که «این روش حتی در مدل‌های پیشرفته‌ای مانند GPT-4o، O1 و LLaMA-3 نیز موثر است و افراد بدون دانش تخصصی هم می‌توانند از آن برای سوءاستفاده استفاده کنند.»
با توجه به اینکه LLMها در خدمات حساس مانند بانکداری و مراقبت‌های بهداشتی ادغام شده‌اند، حملاتی مانند «دارک‌مایند» می‌توانند امنیت این سیستم‌ها را به خطر بیندازند. گُو تأکید کرده است که «هرچه مدل زبانی قوی‌تر باشد، در برابر این حمله آسیب‌پذیرتر است، زیرا از قدرت استدلال خود برای اجرای محرک‌های مخفی بهره می‌برد.»
پژوهشگران اکنون در حال توسعه مکانیزم‌های دفاعی جدید برای مقابله با این نوع حملات هستند. تورانی گفت: «تحقیقات آینده ما بر روی روش‌هایی مانند بررسی سازگاری استدلال و شناسایی محرک‌های مخفی متمرکز خواهد بود تا امنیت مدل‌های زبانی تقویت شود.»

م/۱۱۰*

کد خبر 140522

برچسب‌ها

نظر شما

شما در حال پاسخ به نظر «» هستید.

نام

ایمیل

نظر شما *

* لطفا متن تصویر را در جعبه متن وارد کنید

آخرین مطالب

اعلام حمایت کره جنوبی از صنعت نیمه‌هادی در برابر تهدیدهای تجاری آمریکا

فیفا برای نخستین‌بار دوربین بدن‌پوش را در جام جهانی باشگاه‌ها آزمایش می‌کند

انجام سی‌تی اسکن‌ می‌تواند خطر سرطان را افزایش دهد

هشدار نسبت به حذف احتمالی کاربران ایرانی از آینده هوش مصنوعی

گواهی معاینه فنی همه مراکز کشور معتبر است

انتقاد از سیاست‌های تعرفه‌ای جدید و فشار بر دوش مصرف‌کنندگان ایرانی

الزام ارسال تصویر مدارک هویتی برای ثبت‌نام سجامی حذف شد

استان‌های غربی کشور در وضعیت هشدار گردوغبار

بازگشت زودهنگام واحد گازی نکا به مدار تولید برق برای تابستان

مواد شیمیایی موجود در تشک‌ کودکان می‌تواند به رشد مغزی آسیب بزند

پربحث‌ترین

زورگیری‌های محترمانه در بازار تهران

ادامه امدادرسانی‌ به سیل‌زدگان سیستان و بلوچستان

منتخبان مراقب باشند کام ملت تلخ نشود

پردازنده ۳ بعدی محقق ایرانی ارتباطات بی سیم را متحول می‌کند

تخفیف ۵درصدی خوراک برای پتروشیمی‌ها با تخصیص ۴۰ درصد از درآمد

سفرهای نوروزی و کارت سوخت شخصی

افزایش مسمومیت با شوینده‌های خانگی

فایده یوگا برای مغز زنان در معرض خطر آلزایمر

منوچهر والی‌زاده به بخش عمومی منتقل شد

اتصال مستقیم گوشی سامسونگ به اینترنت ماهواره‌ای اسپیس ایکس

پربازدید‌ترین

نصب نخستین توربین بادی سیمانی ساخته شده با فناوری بومی در زابل

عرضه نخستین میکرو داروی ترک اعتیاد در ایران

اولین آپارتمان مسکونی ۱۸۰۰ سال قبل در ایران ساخته شد

احتمال جاسوسی برخی سرخ‌کن‌های بدون روغن از کاربران

آزمون و طارمی در میان برترین گلزنان جهان

زمان مرحله دوم ثبت‌نام حج تمتع ۱۴۰۳ اعلام شد

سنگ پادری گنجینه ۱ میلیون یورویی از آب درآمد

کشف پروتئین محافظی که به رشد مجدد مو در بزرگسالان کمک می‌کند

من به دو تا از ائمه وابستگی دارم/مادرم چادری و من پوشش دیگری دارم /بعد از دو شکست مدال المپیک را گرفتم

رونمایی‌از دستگاه جدید و پیشرفته تولید تراشه درهلند

حمله «دارک‌مایند»: روش جدید برای نفوذ به مدل‌های هوش مصنوعی

برچسب‌ها

نظر شما