شرکتهای مختلفی در حال توسعه ابزارهای هوش مصنوعی مولد هستند. یکی از آنها شرکت چینی علیبابا است که روی مدل هوش مصنوعی Animate Anyone کار میکند. این مدل میتواند افراد را در عکسها به حرکت دربیاورد. اگرچه این مدل هنوز عرضه نشده است، اما یک مدل مشابه آن بهنام MagicAnimate ساخته شده و همین حالا در دسترس قرار دارد.
اگر هیچ ایدهای درباره تدوین ویدیو یا جلوههای بصری کامپیوتری ندارید، اما میخواهید یک نفر را در یک تصویر ثابت به حرکت دربیاورید، مدل Animate Anyone برای شما در دست توسعه قرار دارد. علیبابا میگوید این مدل هوش مصنوعی میتواند به بهترین شکل ممکن تصاویر را به ویدیو تبدیل کند.
ویدیوهایی از نحوه عملکرد مدل هوش مصنوعی Animate Anyone منتشر شده است که متحرکسازی افراد در تصاویر را نشان میدهد. تیم سازنده این مدل در واکنش به درخواستهای عمومی برای انتشار آن وعده داده است که در آینده دمو و کد منبع آن را در اختیار علاقهمندان قرار دهد.
این مدل ظاهراً از ترکیب مدلهای Diffusion با فریمورک جدیدی موسوم به ReferenceNet استفاده میکند. برای انجام این کار، یک تصویر مرجع بهعنوان ورودی دریافت میشود و بخشهای مختلف آن برای حرکت به شکل خاصی هدایت میشود. سپس شکاف میان این حرکات توسط هوش مصنوعی پر میشود تا ویدیویی پیوسته به دست مخاطب برسد.
مدل MagicAnimate همین حالا برای تبدیل تصویر به ویدیو در دسترس است
در شرایطی که این مدل هنوز منتشر نشده است، یک مدل دیگر با کارکرد مشابه بهنام MagicAnimate منتشر شده که البته این کار را با اندکی تفاوت انجام میدهد. وجه تمایز این مدل هوش مصنوعی بهبود «پیوستگی جسمانی» و حفظ هویت شخص حاضر در تصویر است. در نتیجه، خروجی کار در ویدیوهای طولانیتر روانتر بهنظر میرسد و جزئیات بهتری را در فریمها حفظ میکند.
بااینحال، مدل هوش مصنوعی MagicAnimate نسبت به Animate Anyone دقت کمتری دارد. در این مدل بخشهایی از تصویر مرجع در برخی از فریمهای خروجی 100 درصد با اصل تصویر مطابقت ندارد. منتها عرضه این مدل گام مهمی در زمینه بهینهسازی و ترویج این ابزارهای هوش مصنوعی محسوب میشود.
منبع : منبع
2nd December 24