عامل جدید ChatGPT می‌تواند کنترل کامل یک کامپیوتر را به عهده بگیرد

عامل جدید ChatGPT از راه رسید. شرکت OpenAI  روی یکی از داغ‌ترین گرایش‌های فعلی در هوش مصنوعی، یعنی «عامل‌های هوشمند»،…
عامل جدید ChatGPT می‌تواند کنترل کامل یک کامپیوتر را به عهده بگیرد

عامل جدید ChatGPT از راه رسید. شرکت OpenAI  روی یکی از داغ‌ترین گرایش‌های فعلی در هوش مصنوعی، یعنی «عامل‌های هوشمند»، متمرکز شده است. ابزارهایی که فراتر از چت‌بات‌ها رفته و قادرند وظایف پیچیده و چندمرحله‌ای را به‌جای کاربر انجام دهند. این شرکت به‌تازگی ابزاری به نام ChatGPT Agent معرفی کرد که آن را وسیله‌ای معرفی می‌کند که می‌تواند از طریق یک رایانه مجازی اختصاصی، انجام امور را به‌طور مستقل برعهده بگیرد.

قابلیت‌های عامل جدید ChatGPT

در جریان یک جلسه زنده، یاش کومار و ایسا فالفورد، به‌ترتیب مدیر محصول و مدیر تحقیقات ChatGPT Agent، اعلام کردند که این ابزار با استفاده از مدلی جدید ساخته شده که OpenAI به‌طور ویژه برای این محصول طراحی کرده است. شرکت اعلام کرد این ابزار جدید توانایی‌هایی نظیر بررسی تقویم کاربر برای اطلاع‌رسانی درباره جلسات کاری آینده، برنامه‌ریزی و خرید اقلام مورد نیاز (مثلا برای تهیه صبحانه خانوادگی)، و تهیه اسلایدهایی بر مبنای تحلیل رقبا را داراست.

مدلی که ChatGPT Agent بر پایه آن ساخته شده، روی انجام کارهای دشواری آموزش دیده که مستلزم بهره‌گیری همزمان از چند ابزار مختلف هستند، از جمله مرورگر متنی، مرورگر تصویری و ترمینالی که کاربر می‌تواند داده‌هایش را در آن وارد کند. این آموزش از طریق یادگیری تقویتی صورت گرفته؛ روشی که برای تمامی مدل‌های استدلالی OpenAI نیز استفاده شده است. این شرکت اعلام کرده که ChatGPT Agent ترکیبی است از قابلیت‌های دو ابزار دیگر این شرکت به نام‌های Operator و Deep Research.

آپدیت جدید ChatGPT

برای ساخت این ابزار جدید، تیم‌های Operator و Deep Research با یکدیگر ادغام شده و تیمی مشترک ایجاد کرده‌اند. کومار و فالفورد گفتند این گروه جدید بین 20 تا 35 عضو از بخش‌های محصول و تحقیق را شامل می‌شود. در نمایش زنده، کومار و فالفورد چند کاربرد ممکن از ChatGPT Agent را به تصویر کشیدند، از جمله اینکه از آن خواسته شد برنامه‌ای برای یک قرار ملاقات تنظیم کند. این کار از طریق اتصال به تقویم گوگل برای شناسایی زمان‌های آزاد کاربر و سپس بررسی سرویس OpenTable برای یافتن رستوران‌های مناسب صورت گرفت. همچنین نشان دادند که کاربر می‌تواند در حین انجام وظیفه، روند را متوقف کرده و مثلاً دسته جدیدی از رستوران‌ها را به جستجو اضافه کند. نمونه‌ای دیگر نیز نحوه تهیه گزارشی تحقیقی درباره رشد چشمگیر محبوبیت عروسک‌های لبوبو در مقایسه با عروسک‌های بینی را نمایش داد.

فالفورد عنوان کرد که استفاده از این ابزار در خرید آنلاین را ترجیح می‌دهد، زیرا ترکیب فناوری‌های موجود در Deep Research و Operator عملکرد به‌مراتب جامع‌تر و مؤثرتری نسبت به استفاده صرف از Operator ارائه می‌دهد. از سوی دیگر، کومار توضیح داد که خودش از ChatGPT Agent برای خودکارسازی وظایف روزمره استفاده می‌کند.

کومار توضیح داد که از آنجا که عامل جدید ChatGPT  به «یک رایانه کامل» دسترسی دارد نه صرفاً یک مرورگر، دامنه ابزارهای آن به‌طور قابل‌توجهی گسترش یافته است. با این حال، طبق محتوای دمو، این ابزار ممکن است در برخی وظایف با کندی مواجه شود. در پاسخ به پرسشی درباره تأخیر عملکرد، کومار اظهار داشت که تیم‌شان بیشتر بر «بهینه‌سازی وظایف دشوار» تمرکز دارد و کاربران قرار نیست به‌صورت فعال نظاره‌گر روند کار باشند.

قابلیت مکالمه صوتی رایگان با ChatGPTقابلیت مکالمه صوتی رایگان با ChatGPT

فالفورد در این‌باره گفت:

حتی اگر انجام وظیفه 15 دقیقه یا نیم ساعت زمان ببرد، باز هم نسبت به زمانی که خودتان صرف انجام آن می‌کنید، بسیار سریع‌تر خواهد بود.

او افزود که تیم جستجوی OpenAI بیشتر روی مواردی با تأخیر پایین تمرکز دارد. همچنین پیش از انجام هرگونه اقدام بازگشت‌ناپذیری نظیر ارسال ایمیل یا ثبت رزرو، ChatGPT Agent از کاربر اجازه خواهد گرفت.

در پاسخ به پرسشی مبنی بر اینکه آیا ابزار قادر به انجام تراکنش‌های مالی هست یا نه، کومار گفت که چنین عملکردهایی در حال حاضر غیرفعال شده‌اند و تدبیر امنیتی اضافه‌ای به نام Watch Mode نیز در نظر گرفته شده که در آن اگر کاربر وارد وب‌سایت‌هایی از دسته خاص، مانند صفحات مالی شود، نباید از زبانه‌ای که ChatGPT Agent در آن فعال است خارج شود؛ در غیر این صورت عملکرد ابزار متوقف می‌شود.

عرضه این ابزار از امروز برای کاربران نسخه‌های Pro و Plus و Team آغاز می‌شود؛ کافی است در منوی ابزارها agent mode را انتخاب کرده یا فرمان «/agent» را تایپ کنید. OpenAI اعلام کرده که این قابلیت در تابستان پیش رو برای کاربران نسخه‌های Enterprise و Education نیز در دسترس خواهد بود.

مفهوم عامل‌های هوش مصنوعی سال‌هاست که یکی از موضوعات پرسر و صدای این صنعت به‌شمار می‌رود. اصطلاح «عامل هوش مصنوعی» در سال 2023 در میان سرمایه‌گذاران و مدیران فناوری رواج یافت و به‌سرعت گسترش پیدا کرد، به‌ویژه پس از آنکه شرکت مالی Klarna در فوریه 2024 اعلام کرد تنها در یک ماه، عامل هوش مصنوعی اختصاصی‌اش دو سوم گفت‌وگوهای پشتیبانی مشتریان را انجام داده که معادل عملکرد 700 نیروی انسانی تمام‌وقت بوده است. از آن پس، مدیران اجرایی شرکت‌هایی چون آمازون، متا، گوگل و دیگران بارها در نشست‌های درآمدی خود درباره اهدافشان در زمینه عامل‌های هوشمند صحبت کردند. شرکت‌های فعال در حوزه هوش مصنوعی نیز از آن زمان شروع به جذب نیرو به‌منظور پیشبرد این اهداف کرده‌اند.

منبع خبر

بیا تو صدا