شرکت OpenAI بهتازگی از ابزار هوش مصنوعی جدیدی با نام ChatGPT Agent رونمایی کرده که گامی بزرگ در مسیر ارتقای دستیاران مجازی به حساب میآید. برخلاف چتباتهای سادهای که صرفاً به پرسشها پاسخ میدهند، این ابزار جدید توانایی انجام وظایف واقعی بهجای کاربر را دارد. بهعنوان مثال، میتواند تقویم شما را مدیریت کند، پرزنتیشن بسازد، در وب جستوجو کند، کدنویسی انجام دهد و حتی به برنامههای ثالث متصل شود.
این ویژگی در حال حاضر برای مشترکان پلنهای Pro، Plus و Team در دسترس قرار گرفته و کاربران میتوانند از طریق منوی ابزارهای ChatGPT با فعال کردن گزینه Agent Mode آن را راهاندازی کنند.
ChatGPT Agent چه کارهایی میتواند انجام دهد؟
این عامل (Agent) ترکیبی از قابلیتهای ابزارهای فعلی OpenAI است. برای مثال:
-
وبگردی هوشمند مشابه ابزار Operator
-
توانایی تحقیق عمیق مانند ابزار Deep Research که میتواند دهها وبسایت را مرور و خلاصهسازی کند
-
اتصال به برنامههای شخص ثالث مانند Gmail و GitHub از طریق ChatGPT Connectors
بر اساس اعلام OpenAI، کاربران میتوانند از این ابزار درخواستهایی نظیر موارد زیر داشته باشند:
-
«برنامهریزی و خرید مواد لازم برای تهیه صبحانه ژاپنی برای چهار نفر»
-
«تحلیل سه رقیب و ساخت یک ارائه اسلایدی»
چنین درخواستهایی نیازمند جستوجوی آنلاین، برنامهریزی مرحلهای و اجرای اقدامات واقعی هستند، کاری که این عامل از پس آن برمیآید.
عملکرد چشمگیر در آزمونهای استاندارد
OpenAI اعلام کرده مدلی که ChatGPT Agent را پشتیبانی میکند، در آزمونهای مختلف عملکرد چشمگیری داشته است. این مدل در آزمون Humanity’s Last Exam موفق به کسب امتیاز ۴۱.۶٪ شده که تقریباً دو برابر امتیاز مدلهای o3 و o4-mini این شرکت است.
ایمنی و کنترل محتوا
برای جلوگیری از سوءاستفاده، OpenAI سامانههای نظارتی دقیقی را برای این ابزار در نظر گرفته است. برای نمونه:
-
اگر تشخیص داده شود که درخواست کاربر با موضوعات زیستی مرتبط است، پاسخ عامل از یک مرحله بررسی امنیتی اضافی عبور میکند.
-
ویژگی حافظه (Memory) نیز در این ابزار غیرفعال شده تا مکالمات قبلی ذخیره نشوند و ریسکهای احتمالی کاهش یابد.
جمعبندی
ابزار ChatGPT Agent نقطه عطفی در تکامل هوش مصنوعی کاربردی است. این ابزار فراتر از پاسخگویی، توان انجام فعالیتهای چندمرحلهای و ترکیبی را دارد و میتواند همچون یک دستیار دیجیتال واقعی فکر کند، برنامهریزی کند و عمل نماید. هرچند هنوز برای ارزیابی عملکرد واقعی آن زود است، اما پتانسیل آن بسیار امیدوارکننده به نظر میرسد.