دیپ‌سیک در سایه ChatGPT؟ بررسی شباهت 74 درصدی پاسخ‌ها و چالش‌های مالکیت فکری

منتشر شده 15 اسفند 1403 ساعت 12:10 زمان مطالعه: 3 دقیقه

بررسی‌های جدید نشان می‌دهند که مدل هوش مصنوعی دیپ‌سیک (DeepSeek) در 74.2 درصد از پاسخ‌های خود، شباهت سبکی قابل‌توجهی با خروجی‌های ChatGPT دارد. این یافته‌ها، گمانه‌زنی‌هایی درباره احتمال استفاده این مدل از داده‌های OpenAI در فرایند آموزش خود ایجاد کرده‌اند.

جدول محتوا

کشف شباهت‌های سبکی در خروجی‌های DeepSeek چالش حقوقی؛ آیا دیپ‌سیک از داده‌های OpenAI استفاده کرده است؟چالش‌های اخلاقی و قانونی توسعه هوش مصنوعی آینده تنظیم‌گری در هوش مصنوعی

کشف شباهت‌های سبکی در خروجی‌های DeepSeek

بر اساس گزارش منتشر شده در Forbes، این تحقیق توسط شرکت Copyleaks، فعال در زمینه شناسایی محتوای مبتنی‌بر هوش مصنوعی، انجام شده است. این شرکت از فناوری‌های پیشرفته برای تحلیل سبک نوشتاری مدل‌های زبانی مختلف مانند OpenAI، کلود، جمینای، LLaMA و DeepSeek استفاده کرده است. نتیجه این تحلیل نشان می‌دهد که درحالی‌که بیشتر مدل‌های زبانی اثر انگشت سبکی منحصربه‌فردی دارند، خروجی‌های دیپ‌سیک به طرز معناداری با پاسخ‌های ChatGPT همخوانی دارند.

شای نیسان، رئیس بخش علم داده Copyleaks، این یافته‌ها را به روش تشخیص دست‌خط تشبیه کرده و تأکید کرده است که نتیجه این تحقیق، هرچند تعجب‌آور، اما بسیار مهم است.

چالش حقوقی؛ آیا دیپ‌سیک از داده‌های OpenAI استفاده کرده است؟

این شباهت سبکی لزوماً به معنی استفاده غیرمجاز دیپ‌سیک از داده‌های OpenAI نیست، اما سؤالاتی جدی درباره روش آموزش و منابع داده‌ای این مدل ایجاد می‌کند. اگر مشخص شود که DeepSeek بدون مجوز از خروجی‌های OpenAI برای آموزش مدل خود استفاده کرده، این مسئله می‌تواند نقض حقوق مالکیت فکری محسوب شده و پیامدهای قانونی برای این شرکت داشته باشد.

با توجه به اینکه صنعت هوش مصنوعی هنوز چارچوب‌های مشخصی برای شفاف‌سازی داده‌های آموزشی ندارد، چنین مسائلی بر ضرورت تدوین مقرراتی دقیق برای جلوگیری از سوءاستفاده از داده‌های دیگران تأکید می‌کند.

چالش‌های اخلاقی و قانونی توسعه هوش مصنوعی

در سال‌های اخیر، شرکت‌های توسعه‌دهنده مدل‌های هوش مصنوعی به‌طور مداوم با انتقادات مربوط به استفاده از داده‌های آموزشی بدون کسب اجازه روبه‌رو بوده‌اند. حتی OpenAI نیز پیش‌تر به دلیل استفاده از محتوای وب بدون مجوز مستقیم مورد انتقاد قرار گرفته بود. اما حالا، شباهت‌های بین خروجی‌های دیپ‌سیک و ChatGPT می‌تواند بحث حقوق مالکیت فکری را وارد مرحله‌ای پیچیده‌تر کند.

Copyleaks تأکید دارد که روش‌های غربالگری آن‌ها برای تشخیص تفاوت‌های ظریف در سبک نوشتاری طراحی شده‌اند، و این میزان شباهت را نمی‌توان صرفاً نتیجه استفاده از داده‌های مشابه دانست. به بیان دیگر، اگرچه مدل‌های زبانی ممکن است به دلیل استفاده از منابع مشترک به سبک‌های مشابهی دست یابند، اما اثر انگشت سبکی هر مدل باید منحصربه‌فرد باشد.

آینده تنظیم‌گری در هوش مصنوعی

در حالی که هنوز مشخص نیست DeepSeek به‌طور مستقیم از خروجی‌های OpenAI استفاده کرده یا خیر، این مسئله احتمالاً در آینده نزدیک یکی از موضوعات اصلی در حوزه قانون‌گذاری و توسعه هوش مصنوعی خواهد بود.

شرکت DeepSeek تاکنون در برابر این ادعاها سکوت کرده و پاسخ رسمی ارائه نکرده است. اما با توجه به رشد سریع مدل‌های زبانی و چالش‌های قانونی و اخلاقی پیرامون آن‌ها، احتمالاً در آینده نزدیک شاهد تلاش‌های بیشتری برای ایجاد شفافیت در فرایندهای آموزشی هوش مصنوعی خواهیم بود.

تگ شده: اخبار تکنولوژی