تحقیقات اخیر نشان میدهد که شرکت اپل، انویدیا و Anthropic بدون مجوز از دادهها و زیرنویس ویدیوهای یوتیوب برای آموزش مدلهای هوش مصنوعی خود استفاده کردهاند.
براساس این تحقیقات که توسط وبسایت Proof News انجام شده است، مجموعه داده استفادهشده برای آموزش مدلهای هوش مصنوعی شامل زیرنویس ۱۷۳,۰۰۰ ویدیو یوتیوب میباشد. آنطور که پیداست یک کمپانی به نام EleutherAI آنها را از ۴۸,۰۰۰ کانال در این پلتفرم استخراج کرده و سپس در اختیار شرکت اپل، انویدیا و Anthropic قرار داده است.
البته هیچ ویدیو یا عکسی از یوتیوب در این مجموعه داده وجود ندارد بلکه فقط از زیرنویس ویدیوهای یوتیوبرهای بزرگ همچون Marques Brownlee و MrBeast در کنار ناشران بزرگ خبری مانند نیویورک تایمز، BBC و ABC News استفاده شده است.
Marques Brownlee با انتشار پستی در شبکه اجتماعی ایکس نوشته است:
اپل از دادههای چند شرکت برای آموزش هوش مصنوعی خود استفاده کرده است. یکی از آنها حجم زیادی از دادهها و زیرنویس ویدیوهای یوتیوب مانند محتوای کانال من را استخراج کرده است؛ البته اپل از پذیرفتن اشتباه خود اجتناب میکند زیرا جزو شرکتهای استخراجکننده این دادهها نیست.
سخنگوی گوگل در این رابطه به وبسایت Engadget گفته است که سخنان پیشین مدیرعامل یوتیوب درباره نقض شرایط خدمات این پلتفرم در اثر استفاده از دادههای آن برای آموزش مدلهای هوش مصنوعی همچنان درست است. لازم به ذکر است که تاکنون هیچ یک از شرکتهای فعال در حوزه هوش مصنوعی درباره دادههایی که برای آموزش مدلهای خود استفاده میکنند، توضیحات شفافی ارائه ندادهاند.
برخی از هنرمندان و عکاسان در اوایل ماه جاری اپل را به دلیل عدم اشاره به منبع دادههای استفادهشده برای آموزش هوش مصنوعی Apple Intelligence مورد انتقاد قرار دادند؛ این هوش مصنوعی قرار است امسال برای میلیونها دستگاه اپل عرضه شود. میتوان گفت که یوتیوب به عنوان بزرگترین پلتفرم ذخیرهسازی ویدیوهای جهان، منبع مناسبی برای استخراج دادههایی نظیر زیرنویس، فایلهای صوتی، ویدیوها و تصاویر برای آموزش مدلهای هوش مصنوعی محسوب میشود.
البته میرا موراتی، مدیر ارشد فناوری شرکت OpenAI در اوایل امسال به نیویورک تایمز درباره استفاده از ویدیوهای یوتیوب برای آموزش هوش مصنوعی Sora که یک ابزار تولید ویدیو میباشد گفت که تمام دادههای استفادهشده توسط این شرکت در دسترس عموم مردم بودند یا دارای مجوز هستند.
ساندار پیچای، مدیرعامل شرکت آلفابت نیز پیش از این گفته بود شرکتهایی که از دادههای یوتیوب برای آموزش مدلهای هوش مصنوعی خود استفاده میکنند درواقع شرایط خدمات و قوانین این پلتفرم را نقض کردهاند.
15th November 24