ChatGPT навчився виконувати завдання замість людини

OpenAI запустила нового всеохоплюючого агента штучного інтелекту в ChatGPT, який може автономно виконувати різноманітні обчислювальні завдання від імені користувача.

Як заявляє компанія, агент може автоматично керувати календарем, створювати редаговані презентації та слайди, а також виконувати код.

Агент ChatGPT інтегрує функції кількох попередніх агентських систем: здатність оператора взаємодіяти з веб-сайтами одним кліком та вміння Deep Research збирати дані з численних джерел для створення стислих аналітичних звітів.

Користувачі можуть керувати агентом через простий мовний інтерфейс. Спочатку цей інструмент доступний користувачам із підписками Pro, Plus та Team. Щоб увімкнути його, просто виберіть «режим агента» в меню ChatGPT.

Новий агент сумісний з конекторами ChatGPT, що дозволяє інтеграцію з Gmail, GitHub та іншими програмами для виконання запитів. Він також має доступ до терміналу та може взаємодіяти з API .

Поточні програми включають організацію та закупівлю інгредієнтів для японського сніданку на чотирьох, проведення аналізу конкурентів та створення презентації на основі отриманих результатів.

Тестування

Базова модель агента чудово показує результати в різних бенчмарках. В «Останньому іспиті людства», одному з найскладніших тестів, що містить тисячі запитань з понад 100 дисциплін, агент ChatGPT досяг результату 41,6%, що вдвічі перевищує результати моделей o3 та o4-mini.

ChatGPT навчився виконувати завдання замість людини

Порівняння моделей в «Останньому іспиті людства». Джерело: OpenAI.

У складному математичному бенчмарку FrontierMath агент показав продуктивність 27,4%. Попередній найвищий бал мав o4-mini – 6,3%.

Безпека

OpenAI підкреслив важливість безпеки для нового агента через його широкі можливості, які можуть бути використані зловмисниками.

У звіті про систему зазначено, що модель має «високий потенціал» у сфері біологічної та хімічної зброї, що свідчить про те, що вона теоретично може покращити існуючі методи заподіяння шкоди. Хоча прямих доказів загрози немає, компанія вживає запобіжних заходів:

  • онлайн-моніторинг — усі запити користувачів проходять процес класифікації, щоб визначити, чи стосуються вони біологічних суб’єктів. Якщо так, відповідь додатково перевіряється на наявність потенційних загроз;
  • Функцію пам’яті вимкнено, щоб запобігти витокам даних, спричиненим шкідливими вставками в підказки.

Варто зазначити, що в липні повідомлялося, що OpenAI посилила безпеку своїх систем у відповідь на загрози корпоративного шпигунства з боку китайських конкурентів.

Источник

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *