تحقیقات اخیر نشان می‌دهد که شرکت اپل، انویدیا و Anthropic بدون مجوز از داده‌ها و زیرنویس ویدیوهای یوتیوب برای آموزش مدل‌های هوش مصنوعی خود استفاده کرده‌اند.براساس این تحقیقات که توسط وب‌سایت Proof New...

تحقیقات اخیر نشان می‌دهد که شرکت اپل، انویدیا و Anthropic بدون مجوز از داده‌ها و زیرنویس ویدیوهای یوتیوب برای آموزش مدل‌های هوش مصنوعی خود استفاده کرده‌اند.

براساس این تحقیقات که توسط وب‌سایت Proof News انجام شده است، مجموعه داده‌ استفاده‌شده برای آموزش مدل‌های هوش مصنوعی شامل زیرنویس ۱۷۳,۰۰۰ ویدیو یوتیوب می‌باشد. آن‌طور که پیداست یک کمپانی به نام EleutherAI آن‌‌ها را از ۴۸,۰۰۰ کانال در این پلتفرم استخراج کرده و سپس در اختیار شرکت اپل، انویدیا و Anthropic قرار داده است.

البته هیچ ویدیو یا عکسی از یوتیوب در این مجموعه داده وجود ندارد بلکه فقط از زیرنویس ویدیوهای یوتیوبرهای بزرگ همچون Marques Brownlee و MrBeast در کنار ناشران بزرگ خبری مانند نیویورک تایمز، BBC و ABC News استفاده شده است.

Marques Brownlee با انتشار پستی در شبکه اجتماعی ایکس نوشته است:

اپل از داده‌های چند شرکت برای آموزش هوش مصنوعی خود استفاده کرده است. یکی از آن‌ها حجم زیادی از داده‌ها و زیرنویس ویدیوهای یوتیوب مانند محتوای کانال من را استخراج کرده است؛ البته اپل از پذیرفتن اشتباه خود اجتناب می‌کند زیرا جزو شرکت‌های استخراج‌کننده این داده‌ها نیست.

سخنگوی گوگل در این رابطه به وب‌سایت Engadget گفته است که سخنان پیشین مدیرعامل یوتیوب درباره نقض شرایط خدمات این پلتفرم در اثر استفاده از داده‌های آن برای آموزش مدل‌های هوش مصنوعی همچنان درست است. لازم به ذکر است که تاکنون هیچ یک از شرکت‌های فعال در حوزه هوش مصنوعی درباره داده‌هایی که برای آموزش مدل‌های خود استفاده می‌کنند، توضیحات شفافی ارائه نداده‌اند.

برخی از هنرمندان و عکاسان در اوایل ماه جاری اپل را به دلیل عدم اشاره به منبع داده‌های استفاده‌شده برای آموزش هوش مصنوعی Apple Intelligence مورد انتقاد قرار دادند؛ این هوش مصنوعی قرار است امسال برای میلیون‌ها دستگاه اپل عرضه شود. می‌توان گفت که یوتیوب به عنوان بزرگترین پلتفرم ذخیره‌سازی ویدیوهای جهان، منبع مناسبی برای استخراج داده‌هایی نظیر زیرنویس، فایل‌های صوتی، ویدیوها و تصاویر برای آموزش مدل‌های هوش مصنوعی محسوب می‌شود.

البته میرا موراتی، مدیر ارشد فناوری شرکت OpenAI در اوایل امسال به نیویورک تایمز درباره استفاده از ویدیوهای یوتیوب برای آموزش هوش مصنوعی Sora که یک ابزار تولید ویدیو می‌باشد گفت که تمام داده‌های استفاده‌شده توسط این شرکت در دسترس عموم مردم بودند یا دارای مجوز هستند.

ساندار پیچای، مدیرعامل شرکت آلفابت نیز پیش از این گفته بود شرکت‌هایی که از داده‌های یوتیوب برای آموزش مدل‌های هوش مصنوعی خود استفاده می‌کنند درواقع شرایط خدمات و قوانین این پلتفرم را نقض کرده‌اند.

منبع : منبع