گوگل یکی از اولین شرکتهایی بود که به هوش مصنوعی مولد روی آورد و برای رقابت با رقبایی مانند ChatGPT و Bing Chat چت ربات اختصاصی خودش را با نام Bard عرضه کرد. این شرکت همچنین شروع به تست قابلیت نمایش پاسخهای هوش مصنوعی در کنار نتایج جستجو کرده است.
اما گوگل در حال انجام کارهای مهمتری نیز در زمینه هوش مصنوعی است و میخواهد مدلهای یادگیری ماشین خود را توسعه بدهد. شما احتمالا چند سال پیش درباره مدل Google LaMDA شنیدهاید، اما گوگل هماکنون از مدل پیشرفتهتر PalM 2 در محصولات هوش مصنوعی خود استفاده میکند.
ما در اینجا قصد داریم نگاهی دقیقتر به PalM 2 و تفاوتهای آن با مدلهای قبلی گوگل بیندازیم. ما سپس آن را با GPT-4 به عنوان بهترین مدل زبانی موجود مقایسه خواهیم کرد.
PalM 2 چیست و چگونه کار میکند؟
PalM مخفف Pathways Language Model است که به معنای استفاده از هوش مصنوعی Pathways گوگل برای کمک به آموزش مدلهای یادگیری ماشین است. این مدل در واقع بخشی از برنامه بزرگ گوگل برای دستیابی به هوش مصنوعی عمومی یا AGI است.
گوگل گفته است که مدل Pathways میتواند هوش مصنوعی چندوجهی فراتر از متن ارائه کند. به گفتهی این شرکت:
Pathways میتواند راهکارهای چندوجهی را که شامل درک بینایی، شنوایی و زبان میشوند به طور همزمان فعال کند. بنابراین، این پلتفرم میتواند بهطور همزمان کلمه “پلنگ” یا صدای کسی که میگوید “پلنگ” یا ویدئویی از دویدن “پلنگ” را نشان میدهد پردازش کند و به مفهوم “پلنگ” برسد. به همینخاطر، این مدل مستعد اشتباهات کمتری است.
گوگل برای اولین بار در سال ۲۰۲۲ در مورد PalM صحبت کرد. آن موقع گوگل هنوز محصولی با استفاده از این مدل عرضه نکرده بود. اما حالا با شدت گرفتن رقابت در زمینه هوش مصنوعی، این شرکت چت بات Bard را به مدل PalM 2 ارتقا داده است. این مدل برخلاف مدل LaMDA که جایگزین آن شده است، به بیش از ۱۰۰ زبان زنده دنیا آموزش دیده است و حتی در زمینههایی مثل کدنویسی، استدلال منطقی و محاسبات ریاضی عملکرد بسیار بهتری دارد.
- هوش مصنوعی در حال تسخیر جهان است؛ آیا برای آن آماده اید؟
- ۶ روش برای مقابله با هوش مصنوعی در زمینه نویسندگی
مدل یادگیری ماشین LaMDA گوگل در مجموع دارای ۱۳۷ میلیارد پارامتر و ۱.۵۶ تریلیون کلمه است، در حالیکه PalM 2 از روش جدیدی به نام Compute-optimal scaling بهره میبرد که منجر به نتایج بهتری با پارامترهای کمتر و دادههای آموزشی کوچکتر میشود.
گوگل هنوز درباره ارائه قابلیتهای چندوجهی برای محصولات هوش مصنوعی خود مثل Bard قولی نداده است. اما احتمالا مدل زبانی Gemini از فرمتهای ترکیبی تصویر، صدا، ویدیو و موارد دیگر پشتیبانی خواهد کرد.
PalM 2 در برابر PalM و LaMDA
مدل PaLM 2 توانسته قابلیتهای بیشتری به Bard اضافه کند. این چت بات هنگامی که برای اولین بار در اوایل سال ۲۰۲۳ با مدل زبانی LaMDA معرفی شد قابلیتهای چندان زیادی نداشت، اما حالا با انتقال به PalM 2، بسیار پیشرفته شده است.
گوگل با انتشار یک گزارش ۹۲ صفحهای، نحوه بهبود PalM 2 را نسبت به مدلهای قبلی آن توضیح داده است. ما در ادامه بهطور خلاصه نگاهی به بهبودهای این مدل نسبت به مدلهای قبلی انداختهایم:
- PalM 2 بر پایه ترکیبی از زبانها آموزش یافته است و دادههای آموزشی آن شامل متون غیر انگلیسی زیادی میشود. این مدل همچنین عملکرد بهتری در تستهای زبان خارجی نسبت به LaMDA و نسل اول PalM دارد.
- PalM 2 توانایی استدلال منطقی بهتری نسبت به مدلهای قبلی خود دارد و حتی در برخی تستها توانسته با GPT-4 رقابت کند.
- چت ربات Bard اکنون با بهرهگیری از مدل PalM 2 قادر است کد بنویسد و از آنها اشکالزدایی کند. مدلهای قبلی گوگل چنین قابلیتی نداشتند.
- PalM 2 میتواند ترجمههای بهتری نسبت به مدلهای قبلی ارائه کند. حتی میتوان گفت که در برخی زبانهای خاص مثل پرتغالی و چینی عملکرد بهتری از Google Translate دارد.
- پلتفرم Pathways با بهرهگیری از مدل زبانی جدید PaLM 2 کارآمدتر شده است. این ویژگی باعث شده تا استفاده از آن در سرویسهای مختلف گوگل مثل جیمیل مقرون به صرفهتر باشد.
- گوگل قادر است PalM 2 را برای موارد استفاده خاص تنظیم کند. مثلا مدل Sec-PaLM قادر به تشخیص باگهای امنیتی است یا مدل Med-PaLM قابلیت پاسخ به پرسشهای پزشکی را دارد.
چگونه PalM 2 گوگل با GPT LLM شرکت OpenAI قابل مقایسه است؟
OpenAI به عنوان خالق ChatGPT توانسته قابلیتهای بیشتری نسبت به سایر مدلهای زبانی ارائه کند. اما سوال اینجاست که آیا گوگل با معرفی PalM 2 موفق به ربودن گوی سبقت از این شرکت خواهد شد؟ طبق گزارش فنی گوگل، PalM 2 در تستهای مختلف عملکرد بهتری داشته است. اما باید توجه داشت که تستهای آزمایشگاهی لزوما به معنای عملکرد بهتر در دنیای واقعی نیست.
به همینخاطر، ما برای اینکه بدانیم کدامیک از آنها عملکرد واقعا بهتری دارند از چتباتهای Bard و Bing دو معما پرسیدیم. همانطور که میدانید مایکروسافت از مدل زبانی GPT-4 شرکت OpenAI در چت بات بینگ استفاده میکند.
نتیجه اولین معمایی که پرسیدیم اینگونه شد. همانطور که در اسکرینشاتها میبینید PalM 2 و GPT-4 هر دو توانستند معما را به درستی حل کنند. PalM 2 حتی یک راه حل جایگزین به ما داد که GPT-4 چنین کاری را نکرد.
با اینحال، چت بات Bard گوگل از حل معمای دیگر خودداری کرد، اما Bing Chat راه حل دقیقی برای آن ارائه داد. هرچند این دو نمونه نمیتواند تمام قابلیتهای PalM 2 را تست کند، اما نشان میدهد که گوگل هنوز کار بیشتری برای انجام دارد.
گوگل چگونه از PalM 2 استفاده خواهد کرد؟
گوگل در کنفرانس توسعه دهندگان I/O 2023 خود توضیحاتی درباره آینده PalM 2 و پیشرفتهای هوش مصنوعی داد. این مدل زبانی علاوه بر قابلیتهایی که بدانها اشاره شد خواهد توانست کارهای دیگری، از قابلیت جدید Help me Write در گوگل داکز و جیمیل گرفته تا تولید تصاویر با هوش مصنوعی در اسلایدها را بهبود ببخشد. این بهبودها تحت عنوان Duet AI برای ورکاسپیس گوگل در ماههای آینده ارائه خواهند شد.
گوگل همچنین روی نسخهای از PalM 2 برای استفاده در گوشیهای هوشمند کار میکند. این مدل هماکنون با نام رمز Gecko در حال توسعه است و روزی امکان استفاده از هوش مصنوعی مولد را بهطور آفلاین در گوشیها هوشمند فراهم خواهد کرد.
همچنین توسعهدهندگان اپلیکیشن اکنون میتوانند جهت کارهای برنامهنویسی خود از طریق API به PalM 2 دسترسی داشته باشند. این به معنای آن است که سایر شرکتها ممکن است از مدل زبانی بزرگ گوگل در محصولات خود استفاده کنند.
سوالات متداول
Google Palm 2 چیست؟
Google Palm 2 مدل زبان بزرگی است که چت بات هوش مصنوعی Bard و سایر سرویسهای گوگل مثل جیمیل از آن بهره میبرند.
آیا Med-PaLM 2 برای استفاده قابل دسترس است؟
گوگل هنوز Med-PaLM 2 را بهطور عمومی عرضه نکرده است. ظاهرا ابتدا گروه کوچکی از تستکنندگان قابلاعتماد اجازه دسترسی به آن خواهند داشت.
منبع: Androidauthority
19th November 24