بررسیهای جدید نشان میدهند که مدل هوش مصنوعی دیپسیک (DeepSeek) در 74.2 درصد از پاسخهای خود، شباهت سبکی قابلتوجهی با خروجیهای ChatGPT دارد. این یافتهها، گمانهزنیهایی درباره احتمال استفاده این مدل از دادههای OpenAI در فرایند آموزش خود ایجاد کردهاند.
کشف شباهتهای سبکی در خروجیهای DeepSeek
بر اساس گزارش منتشر شده در Forbes، این تحقیق توسط شرکت Copyleaks، فعال در زمینه شناسایی محتوای مبتنیبر هوش مصنوعی، انجام شده است. این شرکت از فناوریهای پیشرفته برای تحلیل سبک نوشتاری مدلهای زبانی مختلف مانند OpenAI، کلود، جمینای، LLaMA و DeepSeek استفاده کرده است. نتیجه این تحلیل نشان میدهد که درحالیکه بیشتر مدلهای زبانی اثر انگشت سبکی منحصربهفردی دارند، خروجیهای دیپسیک به طرز معناداری با پاسخهای ChatGPT همخوانی دارند.
شای نیسان، رئیس بخش علم داده Copyleaks، این یافتهها را به روش تشخیص دستخط تشبیه کرده و تأکید کرده است که نتیجه این تحقیق، هرچند تعجبآور، اما بسیار مهم است.
چالش حقوقی؛ آیا دیپسیک از دادههای OpenAI استفاده کرده است؟
این شباهت سبکی لزوماً به معنی استفاده غیرمجاز دیپسیک از دادههای OpenAI نیست، اما سؤالاتی جدی درباره روش آموزش و منابع دادهای این مدل ایجاد میکند. اگر مشخص شود که DeepSeek بدون مجوز از خروجیهای OpenAI برای آموزش مدل خود استفاده کرده، این مسئله میتواند نقض حقوق مالکیت فکری محسوب شده و پیامدهای قانونی برای این شرکت داشته باشد.
با توجه به اینکه صنعت هوش مصنوعی هنوز چارچوبهای مشخصی برای شفافسازی دادههای آموزشی ندارد، چنین مسائلی بر ضرورت تدوین مقرراتی دقیق برای جلوگیری از سوءاستفاده از دادههای دیگران تأکید میکند.
چالشهای اخلاقی و قانونی توسعه هوش مصنوعی
در سالهای اخیر، شرکتهای توسعهدهنده مدلهای هوش مصنوعی بهطور مداوم با انتقادات مربوط به استفاده از دادههای آموزشی بدون کسب اجازه روبهرو بودهاند. حتی OpenAI نیز پیشتر به دلیل استفاده از محتوای وب بدون مجوز مستقیم مورد انتقاد قرار گرفته بود. اما حالا، شباهتهای بین خروجیهای دیپسیک و ChatGPT میتواند بحث حقوق مالکیت فکری را وارد مرحلهای پیچیدهتر کند.
Copyleaks تأکید دارد که روشهای غربالگری آنها برای تشخیص تفاوتهای ظریف در سبک نوشتاری طراحی شدهاند، و این میزان شباهت را نمیتوان صرفاً نتیجه استفاده از دادههای مشابه دانست. به بیان دیگر، اگرچه مدلهای زبانی ممکن است به دلیل استفاده از منابع مشترک به سبکهای مشابهی دست یابند، اما اثر انگشت سبکی هر مدل باید منحصربهفرد باشد.
آینده تنظیمگری در هوش مصنوعی
در حالی که هنوز مشخص نیست DeepSeek بهطور مستقیم از خروجیهای OpenAI استفاده کرده یا خیر، این مسئله احتمالاً در آینده نزدیک یکی از موضوعات اصلی در حوزه قانونگذاری و توسعه هوش مصنوعی خواهد بود.
شرکت DeepSeek تاکنون در برابر این ادعاها سکوت کرده و پاسخ رسمی ارائه نکرده است. اما با توجه به رشد سریع مدلهای زبانی و چالشهای قانونی و اخلاقی پیرامون آنها، احتمالاً در آینده نزدیک شاهد تلاشهای بیشتری برای ایجاد شفافیت در فرایندهای آموزشی هوش مصنوعی خواهیم بود.