گوگل دیپ‌مایند در حال ساخت یک گیمر بهتر نیست؛ بلکه در حال ساخت مغزی بهتر است. پروژه SIMA یا Scalable Instructable Multiworld Agent، اکنون در نسل دوم خود با نام SIMA 2، از دنیای پیچیده و آزاد بازی‌های سه‌بعدی ویدئویی—همان جهان‌هایی که بازیکنان در آن‌ها در Valheim قلعه می‌سازند یا در No Man’s Sky کهکشان‌ها را کاوش می‌کنند—به عنوان یک محیط آزمایشی برای توسعه هوش مصنوعی عمومی (AGI) استفاده می‌کند.

با استفاده از SIMA 2 که توسط مدل پیشرفته Gemini پشتیبانی می‌شود، گوگل هوش مصنوعی خود را از یک دستیار منفعل دستورپذیر به یک همکار فعال و استدلال‌گر ارتقا داده است؛ گامی کلیدی در مسیر توسعه هوش مصنوعی کاملاً عمومی.


فراتر از یک بازی واحد

سال‌ها، دستاوردهای هوش مصنوعی در بازی محدود به تخصصی شدن در یک محیط خاص بود. AlphaGo در بازی گو تسلط یافت و AlphaStar در بازی استراتژی StarCraft II به موفقیت رسید. اما توانایی آن‌ها به یک محیط ساختاریافته محدود بود.

دنیای واقعی، چه فیزیکی و چه مجازی، پر از آشوب است و اینجاست که SIMA 2 وارد می‌شود. این عامل طوری طراحی شده که مانند یک بازیکن انسانی عمل کند: صفحه بازی را مشاهده می‌کند، دستورات زبان طبیعی را پردازش می‌کند و با استفاده از کیبورد و موس مجازی عمل می‌کند—بدون دسترسی به کد داخلی بازی.

پیشرفت کلیدی: یادگیری انتقالی

SIMA 2 بر اساس یادگیری از مجموعه‌ای متنوع از بازی‌های تجاری، شامل بازی‌های بقا، ساخت و ساز و کاوش مانند Goat Simulator 3، Valheim و Satisfactory، مفاهیم انتزاعی را یاد می‌گیرد. به عنوان مثال، اگر مفهوم “استخراج معدن” را در یک بازی فراگیرد، می‌تواند آن را به “برداشت محصول” در بازی‌ای کاملاً متفاوت اعمال کند.

“SIMA 2 یک تغییر بزرگ و بهبود در توانایی‌ها نسبت به SIMA 1 است. این یک عامل عمومی‌تر است که می‌تواند وظایف پیچیده را در محیط‌های دیده‌نشده انجام دهد.”
– جو مارینو، دانشمند ارشد تحقیقاتی در دیپ‌مایند


تحول به همکاری استدلالی

موتور اصلی پیشرفت چشمگیر SIMA 2 مدل Gemini 2.5 flash-lite است. این یکپارچگی، عامل را از یک دستیار اجرای دستور ساده به یک همکار مکالمه‌ای ارتقا می‌دهد:

  • درک اهداف انتزاعی: SIMA 2 می‌تواند یک هدف کلی مثل “ساخت یک پناهگاه ایمن” را به مراحل عملی تقسیم کند و مفهوم “ایمن” را به معنای “دیوارهای بلند و در” تفسیر کند.

  • ارتباط چندرسانه‌ای: عامل می‌تواند بیش از متن ساده را تفسیر کند؛ کاربران می‌توانند با ایموجی، طراحی روی صفحه یا حتی به زبان‌های مختلف با آن ارتباط برقرار کنند.

  • توضیح نیت‌ها: SIMA 2 می‌تواند برنامه‌ها و مراحل میانی خود را توضیح دهد، و یک گفتگوی شفاف و مشارکتی ایجاد کند.


هوش مصنوعی که خود را آموزش می‌دهد

یکی از پیشرفت‌های بنیادی SIMA 2، چرخه خودبهبودی مستقل آن است.

SIMA اولیه به شدت به داده‌های بازی ثبت‌شده انسان وابسته بود. SIMA 2 از این داده‌ها استفاده می‌کند اما سپس وارد حالت یادگیری خودگردان می‌شود:

  1. ایجاد وظایف جدید: عامل اهداف نو و پیچیده‌تری برای خود تعیین می‌کند.

  2. تلاش و امتیازدهی: وظایف را خود به‌صورت مستقل انجام می‌دهد و عملکرد خود را ارزیابی می‌کند.

  3. بهبود مدل: داده‌های تجربه تولیدشده توسط خود عامل برای آموزش نسخه بعدی SIMA 2 استفاده می‌شود، به این ترتیب عامل از اشتباهات خود یاد می‌گیرد.

این توانایی برای سازگاری سریع و یادگیری در بازی‌های جدید یا حتی جهان‌های سه‌بعدی تولیدشده توسط AI سطحی از تعمیم‌پذیری ایجاد می‌کند که فراتر از معیارهای پیشین است. نرخ موفقیت در وظایف پیچیده نسبت به نسخه اول SIMA دو برابر شده است.


فراتر از صفحه نمایش

برای دیپ‌مایند، SIMA تنها یک ابزار بازی نیست؛ بلکه یک روبات مجازی است. مهارت‌هایی که در محیط سه‌بعدی شبیه‌سازی‌شده فرا می‌گیرد—مانند ناوبری، استفاده از ابزار، درک دستورالعمل‌های پیچیده و اجرای وظایف مشارکتی—همان بلوک‌های سازنده مورد نیاز برای توسعه روبات‌های فیزیکی پیشرفته و عمومی هستند.

بازی‌های ویدئویی یک محیط ایمن، مقیاس‌پذیر و نامحدود برای آزمایش این عوامل فراهم می‌کنند. هر بار که SIMA 2 در Valheim یک درخت می‌برد یا در No Man’s Sky یک فضاپیما را تعمیر می‌کند، در حال تمرین مهارت‌های اساسی برای دستیاران AI آینده در دنیای واقعی است.


هرچند SIMA 2 هنوز نسخه پیش‌نمایش تحقیقاتی است و برای عموم در دسترس نیست، هدف گوگل دیپ‌مایند روشن است: با بهره‌گیری از قدرت استدلال Gemini و آموزش عامل خود در چندجهانی هوش مصنوعی، آن‌ها تنها به دنبال پیروزی در یک بازی نیستند؛ بلکه زمینه را برای عاملان AI عمومی و مفید که قادر به فعالیت در محیط‌های پیچیده و غیرقابل پیش‌بینی دنیای واقعی هستند، فراهم می‌کنند.

source

توسط expressjs.ir