با این مدل هوش مصنوعی افراد را در تصاویر ثابت به حرکت دربیاورید [تماشا کنید]|تکلی

شرکت‌های مختلفی در حال توسعه ابزارهای هوش مصنوعی مولد هستند. یکی از آن‌ها شرکت چینی علی‌بابا است که روی مدل هوش مصنوعی Animate Anyone کار می‌کند. این مدل می‌تواند افراد را در عکس‌ها به حرکت دربیاورد. اگرچه این مدل هنوز عرضه نشده است، اما یک مدل مشابه آن به‌نام MagicAnimate ساخته شده و همین حالا در دسترس قرار دارد.

اگر هیچ ایده‌ای درباره تدوین ویدیو یا جلوه‌های بصری کامپیوتری ندارید، اما می‌خواهید یک نفر را در یک تصویر ثابت به حرکت دربیاورید، مدل Animate Anyone برای شما در دست توسعه قرار دارد. علی‌بابا می‌گوید این مدل هوش مصنوعی می‌تواند به بهترین شکل ممکن تصاویر را به ویدیو تبدیل کند.

ویدیوهایی از نحوه عملکرد مدل هوش مصنوعی Animate Anyone منتشر شده است که متحرک‌سازی افراد در تصاویر را نشان می‌دهد. تیم سازنده این مدل در واکنش به درخواست‌های عمومی برای انتشار آن وعده داده است که در آینده دمو و کد منبع آن را در اختیار علاقه‌مندان قرار دهد.

این مدل ظاهراً از ترکیب مدل‌های Diffusion با فریم‌ورک جدیدی موسوم به ReferenceNet استفاده می‌کند. برای انجام این کار، یک تصویر مرجع به‌عنوان ورودی دریافت می‌شود و بخش‌های مختلف آن برای حرکت به شکل خاصی هدایت می‌شود. سپس شکاف میان این حرکات توسط هوش مصنوعی پر می‌شود تا ویدیویی پیوسته به دست مخاطب برسد.

مدل MagicAnimate همین حالا برای تبدیل تصویر به ویدیو در دسترس است

در شرایطی که این مدل هنوز منتشر نشده است، یک مدل دیگر با کارکرد مشابه به‌نام MagicAnimate منتشر شده که البته این کار را با اندکی تفاوت انجام می‌دهد. وجه تمایز این مدل هوش مصنوعی بهبود «پیوستگی جسمانی» و حفظ هویت شخص حاضر در تصویر است. در نتیجه، خروجی کار در ویدیوهای طولانی‌تر روان‌تر به‌نظر می‌رسد و جزئیات بهتری را در فریم‌ها حفظ می‌کند.

بااین‌حال، مدل هوش مصنوعی MagicAnimate نسبت به Animate Anyone دقت کمتری دارد. در این مدل بخش‌هایی از تصویر مرجع در برخی از فریم‌های خروجی 100 درصد با اصل تصویر مطابقت ندارد. منتها عرضه این مدل گام مهمی در زمینه بهینه‌سازی و ترویج این ابزارهای هوش مصنوعی محسوب می‌شود.

منبع : منبع