گوگل از Gemini رونمایی کرد؛ انقلابی در دنیای هوش مصنوعی|تکلی

عرضه مدل هوش مصنوعی جدید جمینای (Gemini) به گفته مدیرعامل گوگل آغازگر عصر جدیدی برای این شرکت خواهد بود که از آن به‌عنوان «عصر جمینای» نام برده شده است. این مدل در نسخه‌های مختلفی عرضه خواهد شد و می‌خ...

گوگل اولین‌بار در رویداد توسعه‌دهندگان 2023 خود به مدل هوش مصنوعی جمینای اشاره کرده بود و حالا رسماً از عرضه آن خبر داده است. این مدل یک نسخه سبک به‌نام Gemini Nano دارد که می‌تواند به‌صورت آفلاین روی دستگاه‌های اندرویدی اجرا شود.

مدل دوم قدرت بیشتری دارد و با نام Gemini Pro به‌زودی در سرویس‌های هوش مصنوعی گوگل پیاده‌سازی خواهد شد و از امروز در چت‌بات بارد فعال است. نسخه سوم جمینای با نام Gemini Ultra، قدرتمندترین مدل زبانی بزرگی است که گوگل تابه‌حال خلق کرده و ظاهراً بیشتر برای دیتاسنترها و کاربردهای سازمانی طراحی شده است.

مدل هوش مصنوعی جمینای پرو در حال حاضر در بارد پیاده‌سازی می‌شود، و کاربران پیکسل 8 پرو هم می‌توانند با جمینای نانو از ویژگی‌های جدیدی برخوردار شوند. جمینای اولترا قرار است از سال آینده میلادی عرضه شود. توسعه‌دهندگان و مصرف‌کنندگان سازمانی می‌توانند از 13 دسامبر از طریق Generative AI Studio یا Vertex AI در گوگل کلود به جمینای پرو دسترسی پیدا کنند.

مدل هوش مصنوعی Gemini گوگل در حال حاضر فقط به زبان انگلیسی در دسترس است و سایر زبان‌ها در آینده برای آن فعال می‌شود. «ساندار پیچای»، مدیرعامل گوگل می‌گوید این مدل در نهایت در موتور جستجو، سرویس تبلیغات، مرورگر کروم و دیگر محصولات این شرکت پیاده‌سازی خواهد شد. این مدل آینده گوگل را رقم خواهد زد.

مقایسه مدل هوش مصنوعی Gemini گوگل با GPT-4

«دمیس هاسابیس»، مدیرعامل دیپ‌مایند که در توسعه Gemini نقش اساسی داشته است، می‌گوید آن‌ها بنچمارک‌های زیادی را روی این مدل انجام داده‌اند. در واقع از بین 32 بنچمارک مهمی که روی جمینای انجام شده است، این مدل در 30 مورد جلوتر از رقبا بوده است.

آشکارترین برتری جمینای در بنچمارک‌ها به توانایی درک و تعامل با صوت و ویدیو برمی‌گردد. قابلیت چندوجهی ظاهراً از ابتدا یکی از اهداف توسعه جمینای بوده و گوگل قصد نداشته است تا مانند OpenAI برای امور مختلف مدل‌های گوناگونی مثل DALL-E یا Whisper بسازد.

جمینای نانو در حال حاضر فقط می‌تواند ورودی و خروجی متنی داشته باشد، اما نسخه قدرتمند آن یعنی اولترا قادر به کار با متن، تصویر، ویدیو و صدا است. هاسابیس می‌گوید در آینده قابلیت‌های بیشتری مثل تشخیص لمس و حرکت هم توسط این مدل هوش مصنوعی قابل درک خواهد بود.

گوگل در زمینه کدنویسی ظاهراً تمرکز ویژه‌ای روی جمینای داشته است. این مدل هوش مصنوعی از سیستم تولید کد جدید AlphaCode 2 استفاده می‌کند که این شرکت می‌گوید می‌تواند 85 درصد بهتر از رقبا و 50 درصد بهتر از نسل قبلی خود کدنویسی کند.

مدل هوش مصنوعی Gemini از نظر مصرف انرژی هم ظاهراً بسیار بهینه است. گوگل این مدل را روی واحد پردازش تنسور (TPU) خودش آموزش داده تا نسبت به مدل‌های قبلی ازجمله PaLM سریع‌تر و ارزان‌تر باشد. این شرکت در کنار این مدل از نسخه جدید سیستم TPU موسوم به TPU v5p هم پرده برداشته که یک سیستم رایانش مخصوص دیتاسنترهاست و در زمینه آموزش و اجرای مدل‌های زبانی بزرگ می‌تواند مورد استفاده قرار گیرد.

گوگل می‌گوید تلاش زیادی کرده است تا از ایمنی و مسئولیت‌پذیری Gemini مطمئن شود و آزمایش‌های زیادی را در این زمینه انجام داده است. بااین‌حال، باید منتظر بمانیم تا ببینیم این مدل در جهان واقعی چه عملکردی از خود نشان خواهد داد.

ساندار پیچای و دمیس هاسابیس ظاهراً اعتقاد دارند که راه‌اندازی هوش مصنوعی Gemini آغازگر پروژه‌ای بزرگ‌تر و گامی در مسیر تغییر است. این همان مدلی است که گوگل سال‌ها در حال توسعه آن بوده و حالا برای تغییر صحنه رقابت با OpenAI به آن نیاز دارد.

منبع : منبع