کشور چین از اولین مدل هوش مصنوعی تبدیل متن به ویدئو خود با نام Vidu رونمایی کرد. هوش مصنوعی Vidu میتواند ویدیویی با کیفیت بالا و مدت زمان ۱۶ ثانیه بسازد.
هوش مصنوعی Vidu میتواند رقیب خوبی برای هوش مصنوعی Sora که توسط شرکت OpenAI توسعه یافته است، باشد. این هوش مصنوعی کشور چین در انجمن Zhongguancun 2024 در شهر پکن رونمایی شد و رقابت هوش مصنوعی در سطح جهانی را وارد مرحلهی تازهای کرد.
هوش مصنوعی Vidu که توسط شرکت چینی Shengshu Technology و با همکاری محققان دانشگاه چینهوا توسعه داده شده است، میتواند ویدیویی با کیفیت بالا به مدت ۱۶ ثانیه و وضوح ۱۰۸۰p تنها با یک کلیک خلق کند. به گفتهی این شرکت، این اولین مدل بزرگ ویدئویی کشور چین با مدت زمان طولانی، ثبات خوب و قابلیتهای پویا است و به سطح هوش مصنوعی Sora بسیار نزدیک است.
هوش مصنوعی Sora یک مدل هوش مصنوعی مولد است که در اوایل سال جاری توسط شرکت OpenAI توسعه یافته است. این هوش مصنوعی با توانایی خود در ساخت صحنههای واقعی و تخیلی از دستورالعملهای متنی، نام شرکت OpenAI را بیش از پیش بر سر زبانها انداخته است.
هوش مصنوعی Vidu برای تبدیل توضیحات متنی به ویدیوهای پویا و با کیفیت طراحی شده است. این مدل هوش مصنوعی متن به ویدیو، چیزی بیش از تفسیر بصری محتوا در سطح پایه انجام میدهد. این هوش مصنوعی میتواند با طیف کاملی از صحنهها، شخصیتها و اقدامات، بر اساس متن ورودی ویدئو ایجاد کند و ویدئوها را به طرز چشمگیری به واقعیت نزدیک کند.
طی یک نمایش زنده، هوش مصنوعی Vidu توانست فیزیک دنیای واقعی را تقلید کند و صحنههایی را خلق کند که از قوانین فیزیک واقعی پیروی میکنند، از جمله افکتهای نور، سایههای واقع گرایانه و حالات دقیق چهرههایی که بر اساس متن ورودی خلق شده بودند. علاوه بر این، این هوش مصنوعی میتواند عکسهای متحرک پیچیدهای را به جای عکسهای ایستا تولید کند و در مقایسه با هوش مصنوعی Sora، عناصر چینی مانند پاندا و اژدها را درک و تولید کند.
18th November 24