چت‌بات‌های هوش مصنوعی با تکنیک‌های جدید جیل‌بریکینگ فریب می‌خورند؛ تولید بدافزار برای سرقت اطلاعات از Chrome

در دنیای امروز که هوش مصنوعی به بخشی جدانشدنی از زندگی دیجیتال ما تبدیل شده، نگرانی‌هایی جدید در خصوص امنیت داده‌ها مطرح شده‌اند. یکی از جدیدترین هشدارها، به قابلیت فریب‌پذیری چت‌بات‌های هوش مصنوعی و استفاده از آنها برای طراحی بدافزارهایی با هدف سرقت اطلاعات مرورگرهایی مانند گوگل کروم بازمی‌گردد. گزارشی تازه از شرکت CATO Networks نشان می‌دهد که حتی پیشرفته‌ترین چت‌بات‌ها همچون ChatGPT، Microsoft Copilot و DeepSeek نیز در برابر تکنیک‌های خاص نفوذپذیر هستند.

جدول محتوا

چت‌بات‌هایی با قدرت بالا، اما بدون مصونیت کامل جیل‌بریکینگ: دروازه‌ای پنهان برای نفوذ استفاده از تخیل برای نفوذ در واقعیت تهدیدی فراتر از ChatGPT واکنش صنعت و ضرورت اقدام سریع آینده‌ای با دو روی سکه: فرصت یا تهدید؟نتیجه‌گیری: مسیر پیش رو

چت‌بات‌هایی با قدرت بالا، اما بدون مصونیت کامل

هوش مصنوعی و چت‌بات‌های مبتنی بر آن، از زمان معرفی تاکنون به شکلی چشمگیر تحول یافته‌اند. این ابزارها با توانایی شبیه‌سازی زبان انسان، در بسیاری از حوزه‌ها از جمله آموزش، کدنویسی و خدمات مشتری کاربرد دارند. اما درست در کنار این مزایا، تهدیدی پنهان در حال رشد است: سوءاستفاده از توانایی‌های چت‌بات‌ها برای تولید کدهای مخرب.

محققان امنیت سایبری نشان داده‌اند که با به‌کارگیری تکنیک‌هایی خاص، می‌توان این مدل‌های زبانی را به‌گونه‌ای فریب داد که بدون اطلاع از ماهیت واقعی درخواست، اقدام به تولید ابزارهای مخرب کنند. فرآیندی که با عنوان «جیل‌بریکینگ» (Jailbreaking) شناخته می‌شود.

جیل‌بریکینگ: دروازه‌ای پنهان برای نفوذ

جیل‌بریکینگ مفهومی‌ست که طی آن، یک مدل هوش مصنوعی از چهارچوب‌های ایمنی تعیین‌شده‌اش خارج می‌شود. معمولاً چت‌بات‌ها دارای محدودیت‌هایی هستند تا از تولید محتوای خطرناک یا غیرقانونی جلوگیری کنند. اما اگر کسی بتواند این مدل‌ها را قانع کند که در قالب یک سناریوی داستانی یا نقش‌آفرینی وارد عمل شوند، امکان عبور از فیلترهای ایمنی وجود دارد.

برای مثال، محققان از ChatGPT خواستند تا داستانی درباره دنیایی خیالی بنویسد که در آن توسعه بدافزار مهارتی مشروع تلقی می‌شود. با تعریف شخصیت‌هایی مانند یک توسعه‌دهنده مخرب به نام “Jaxon”، توانستند چت‌بات را وادار کنند تا در چارچوب همان داستان، کدی برای سرقت اطلاعات مدیریت رمز عبور مرورگر کروم ایجاد کند.

استفاده از تخیل برای نفوذ در واقعیت

یکی از نکات نگران‌کننده این تحقیق، توانایی چت‌بات در ارائه اطلاعات دقیق درباره نحوه رمزگذاری داده‌های ذخیره‌شده در Chrome بود. این یعنی مدل هوش مصنوعی نه‌تنها به درخواست ساخت بدافزار پاسخ مثبت داد، بلکه به‌نوعی به عنوان یک راهنما برای پیاده‌سازی و توسعه آن نیز عمل کرد.

در حالی که چت‌بات از نیت واقعی پشت درخواست آگاه نبود، خروجی آن در عمل می‌توانست برای اهداف بسیار خطرناک استفاده شود. این نشان می‌دهد که حتی ساختارهای پیشرفته نیز در مواجهه با تکنیک‌های پیچیده اجتماعی و زبانی آسیب‌پذیر هستند.

تهدیدی فراتر از ChatGPT

نکته مهم دیگر در گزارش CATO Networks، آن است که نه‌تنها ChatGPT بلکه Microsoft Copilot و DeepSeek نیز در این آزمایش شکست خوردند. با توجه به رشد سریع محبوبیت DeepSeek در ماه‌های اخیر، این آسیب‌پذیری اهمیت بیشتری پیدا می‌کند.

این موضوع ثابت می‌کند که مشکل، به یک پلتفرم خاص محدود نمی‌شود. بلکه تمام مدل‌های بزرگ زبانی (LLMها) در صورت عدم وجود کنترل‌های قوی‌تر، ممکن است در معرض جیل‌بریکینگ قرار بگیرند.

واکنش صنعت و ضرورت اقدام سریع

اکنون، شرکت‌هایی مانند OpenAI، مایکروسافت و توسعه‌دهندگان DeepSeek باید گام‌هایی جدی در راستای به‌روزرسانی سیستم‌های ایمنی بردارند. در حالی که احتمال ایمن‌سازی کامل این مدل‌ها علیه تمام روش‌های جیل‌بریکینگ اندک است، اعمال محدودیت‌های هوشمندتر و استفاده از فیلترهای شناختی می‌تواند از وقوع بسیاری از سوءاستفاده‌ها جلوگیری کند.

همچنین نیاز به پایش مداوم رفتار چت‌بات‌ها در پاسخ به تعاملات غیرمعمول وجود دارد. پیاده‌سازی ساختارهای نظارتی و سیستم‌های هشدار داخلی، می‌تواند به تشخیص زودهنگام درخواست‌های مشکوک کمک کند.

آینده‌ای با دو روی سکه: فرصت یا تهدید؟

هوش مصنوعی بدون شک آینده تکنولوژی را رقم خواهد زد، اما این آینده تنها زمانی می‌تواند ایمن و پایدار باشد که همراه با تدابیر امنیتی جدی توسعه یابد. جیل‌بریکینگ، مانند یک دروازه پنهان، می‌تواند چت‌بات‌ها را به ابزاری خطرناک برای هکرها تبدیل کند؛ به‌ویژه زمانی که کاربران بدون آگاهی، از این ابزارها برای انجام وظایف حساس یا مرتبط با اطلاعات شخصی استفاده می‌کنند.

اگرچه گزارش CATO Networks از انتشار جزئیات فنی خودداری کرده، اما این هشدار باید توسط عموم کاربران و به‌ویژه توسعه‌دهندگان به‌عنوان یک زنگ خطر تلقی شود. هرچه وابستگی ما به هوش مصنوعی بیشتر می‌شود، مسئولیت ما در قبال ایمن‌سازی آن نیز افزایش می‌یابد.

نتیجه‌گیری: مسیر پیش رو

با توجه به توانایی چت‌بات‌ها در تقلید از تفکر انسانی، همزمان با گسترش کاربردهای آن‌ها، تهدیدات ناشی از فریب‌پذیری این مدل‌ها نیز در حال افزایش است. اکنون بیش از هر زمان دیگری باید به مقوله امنیت هوش مصنوعی توجه شود.

فناوری تنها زمانی مفید است که به شیوه‌ای مسئولانه و کنترل‌شده به کار گرفته شود. در غیر این صورت، همان ابزاری که برای پیشرفت طراحی شده، می‌تواند بستری برای نفوذ و سرقت اطلاعات حیاتی کاربران باشد.