گوگل دیپمایند در حال ساخت یک گیمر بهتر نیست؛ بلکه در حال ساخت مغزی بهتر است. پروژه SIMA یا Scalable Instructable Multiworld Agent، اکنون در نسل دوم خود با نام SIMA 2، از دنیای پیچیده و آزاد بازیهای سهبعدی ویدئویی—همان جهانهایی که بازیکنان در آنها در Valheim قلعه میسازند یا در No Man’s Sky کهکشانها را کاوش میکنند—به عنوان یک محیط آزمایشی برای توسعه هوش مصنوعی عمومی (AGI) استفاده میکند.
با استفاده از SIMA 2 که توسط مدل پیشرفته Gemini پشتیبانی میشود، گوگل هوش مصنوعی خود را از یک دستیار منفعل دستورپذیر به یک همکار فعال و استدلالگر ارتقا داده است؛ گامی کلیدی در مسیر توسعه هوش مصنوعی کاملاً عمومی.
فراتر از یک بازی واحد
سالها، دستاوردهای هوش مصنوعی در بازی محدود به تخصصی شدن در یک محیط خاص بود. AlphaGo در بازی گو تسلط یافت و AlphaStar در بازی استراتژی StarCraft II به موفقیت رسید. اما توانایی آنها به یک محیط ساختاریافته محدود بود.
دنیای واقعی، چه فیزیکی و چه مجازی، پر از آشوب است و اینجاست که SIMA 2 وارد میشود. این عامل طوری طراحی شده که مانند یک بازیکن انسانی عمل کند: صفحه بازی را مشاهده میکند، دستورات زبان طبیعی را پردازش میکند و با استفاده از کیبورد و موس مجازی عمل میکند—بدون دسترسی به کد داخلی بازی.
پیشرفت کلیدی: یادگیری انتقالی
SIMA 2 بر اساس یادگیری از مجموعهای متنوع از بازیهای تجاری، شامل بازیهای بقا، ساخت و ساز و کاوش مانند Goat Simulator 3، Valheim و Satisfactory، مفاهیم انتزاعی را یاد میگیرد. به عنوان مثال، اگر مفهوم “استخراج معدن” را در یک بازی فراگیرد، میتواند آن را به “برداشت محصول” در بازیای کاملاً متفاوت اعمال کند.
“SIMA 2 یک تغییر بزرگ و بهبود در تواناییها نسبت به SIMA 1 است. این یک عامل عمومیتر است که میتواند وظایف پیچیده را در محیطهای دیدهنشده انجام دهد.”
– جو مارینو، دانشمند ارشد تحقیقاتی در دیپمایند
تحول به همکاری استدلالی
موتور اصلی پیشرفت چشمگیر SIMA 2 مدل Gemini 2.5 flash-lite است. این یکپارچگی، عامل را از یک دستیار اجرای دستور ساده به یک همکار مکالمهای ارتقا میدهد:
-
درک اهداف انتزاعی: SIMA 2 میتواند یک هدف کلی مثل “ساخت یک پناهگاه ایمن” را به مراحل عملی تقسیم کند و مفهوم “ایمن” را به معنای “دیوارهای بلند و در” تفسیر کند.
-
ارتباط چندرسانهای: عامل میتواند بیش از متن ساده را تفسیر کند؛ کاربران میتوانند با ایموجی، طراحی روی صفحه یا حتی به زبانهای مختلف با آن ارتباط برقرار کنند.
-
توضیح نیتها: SIMA 2 میتواند برنامهها و مراحل میانی خود را توضیح دهد، و یک گفتگوی شفاف و مشارکتی ایجاد کند.
هوش مصنوعی که خود را آموزش میدهد
یکی از پیشرفتهای بنیادی SIMA 2، چرخه خودبهبودی مستقل آن است.
SIMA اولیه به شدت به دادههای بازی ثبتشده انسان وابسته بود. SIMA 2 از این دادهها استفاده میکند اما سپس وارد حالت یادگیری خودگردان میشود:
-
ایجاد وظایف جدید: عامل اهداف نو و پیچیدهتری برای خود تعیین میکند.
-
تلاش و امتیازدهی: وظایف را خود بهصورت مستقل انجام میدهد و عملکرد خود را ارزیابی میکند.
-
بهبود مدل: دادههای تجربه تولیدشده توسط خود عامل برای آموزش نسخه بعدی SIMA 2 استفاده میشود، به این ترتیب عامل از اشتباهات خود یاد میگیرد.
این توانایی برای سازگاری سریع و یادگیری در بازیهای جدید یا حتی جهانهای سهبعدی تولیدشده توسط AI سطحی از تعمیمپذیری ایجاد میکند که فراتر از معیارهای پیشین است. نرخ موفقیت در وظایف پیچیده نسبت به نسخه اول SIMA دو برابر شده است.
فراتر از صفحه نمایش
برای دیپمایند، SIMA تنها یک ابزار بازی نیست؛ بلکه یک روبات مجازی است. مهارتهایی که در محیط سهبعدی شبیهسازیشده فرا میگیرد—مانند ناوبری، استفاده از ابزار، درک دستورالعملهای پیچیده و اجرای وظایف مشارکتی—همان بلوکهای سازنده مورد نیاز برای توسعه روباتهای فیزیکی پیشرفته و عمومی هستند.
بازیهای ویدئویی یک محیط ایمن، مقیاسپذیر و نامحدود برای آزمایش این عوامل فراهم میکنند. هر بار که SIMA 2 در Valheim یک درخت میبرد یا در No Man’s Sky یک فضاپیما را تعمیر میکند، در حال تمرین مهارتهای اساسی برای دستیاران AI آینده در دنیای واقعی است.
هرچند SIMA 2 هنوز نسخه پیشنمایش تحقیقاتی است و برای عموم در دسترس نیست، هدف گوگل دیپمایند روشن است: با بهرهگیری از قدرت استدلال Gemini و آموزش عامل خود در چندجهانی هوش مصنوعی، آنها تنها به دنبال پیروزی در یک بازی نیستند؛ بلکه زمینه را برای عاملان AI عمومی و مفید که قادر به فعالیت در محیطهای پیچیده و غیرقابل پیشبینی دنیای واقعی هستند، فراهم میکنند.
source