اپل مدعی شد در نوشتن شرح تصاویر پاسخگویی به سوالات بصری و استنتاج زبان طبیعی در مدلهای خود به پیشرفتهای جدیدی دست پیدا کرده است.
به گزارش سرویس اخبار فناوری و تکنولوژی تکنا، محققان اپل برای آموزش مدلهای زبان بزرگ روی متن و تصویر روشهای جدیدی را ابداع کردهاند که از طریق آن سیستمهای هوش مصنوعی با قدرت و انعطاف پذیری بیشتر توسعه مییابند. اپل در مقاله تحقیقاتی خود اعلام کرد انواع مختلفی دادههای آموزشی و معماریهای متنوع به صورت ترکیبی برای آموزش هوش مصنوعی استفاده کرده و این دادهها باعث پیشرفت عملکرد این سیستم در طیف وسیعی از معیارهای هوش مصنوعی خواهد شد.
محققان اپل در این مورد اعلام کردند: تلاش کردیم تا در مقیاس بزرگ برای پیش آموزش چند وجهی از ترکیبی دقیق مربوط به تصویر، کپشن، متن، تصویر مداخلهای و دادههای متنی استفاده کرده و به پیشرفتهای مهم دست پیدا کنیم.
آموزش این مدلها بر اساس دادههای متنی همراه با اطلاعات بصری و زبانی انجام گرفته و مدلهای جدید اپل توانستهاند برتریهایی در وظایفی از قبیل نوشتن، شرح تصاویر، پاسخگویی به سوالات بصری و یا استنتاج زبان طبیعی داشته باشند. به گفته محققان اپل انتخاب رمزگذار تصویر و همچنین وضوح تصاویر به عنوان ورودی روی عملکرد مدلها تاثیر زیادی خواهد داشت.
این محققان معتقدند بزرگترین مدل ساخته شده با ۳۰ میلیارد پارامتر اکنون در درک زمینه تصاویر توانایی خیره کنندهای داشته و طبق این شرایط و بر اساس تصاویر ورودی میتواند استدلال چند مرحلهای از خود ارائه دهد. در حالی تحقیقات بیشتر روی مدلهای جدید اپل ادامه پیدا میکند که این شرکت به دنبال سرمایهگذاریهای بیشتر در زمینه هوش مصنوعی است تا بتواند از رقبایی مانند مایکروسافت آمازون و گوگل در ادغاب این قابلیتها پیشی گرفته و رقابت مناسبی را با آنها انجام دهد. در حال حاضر این شرکت روی یک مدل زبانی بزرگ به نام Ajax و یک چت بات به نام Apple GPT برای استفاده داخلی کار می کند.
پیشنهاد ویژه : سرور HP |
پیشنهاد ویژه : تعمیر کامپیوتر تهران |
پیشنهاد ویژه : ترجمه رسمی آلمانی |
پیشنهاد ویژه |
پیشنهاد ویژه |
پیشنهاد ویژه |
23rd November 24