ШІ-стартап OpenAI представив нову велику мовну модель o1, навчену методом з підкріпленням для виконання складних міркувань.
We're releasing a preview of OpenAI o1—a new series of AI models designed to spend more time thinking before they respond.
These models can reason through complex tasks and solve harder problems than previous models in science, coding, and math. https://t.co/peKzzKX1bu
— OpenAI (@OpenAI) September 12, 2024
Нейромережа вміє думати — вона здатна створити довгий внутрішній ланцюжок думок під час аналізу питання, стверджує компанія.
o1 уникає деяких «пасток міркувань», оскільки здатна ефективно перевіряти сама себе, витрачаючи більше часу на аналіз частин питання. Модель здатна підійти до аналізу завдання цілісно, плануючи та виконуючи низку дій протягом тривалого часу.
Новий інструмент OpenAI підходить для розв’язання завдань, що передбачають наявність кількох підзадач. Наприклад, виявлення привілейованих листів або проведення мозкового штурму маркетингової стратегії.
For example, last month at the 2024 Association for Computational Linguistics conference, the keynote by @rao2z was titled “Can LLMs Reason & Plan?” In it, he showed a problem that tripped up all LLMs. But @OpenAI o1-preview can get it right, and o1 gets it right almost always pic.twitter.com/Rn3WDXzu9k
— Noam Brown (@polynoamial) September 12, 2024
«Процес мислення o1 триває секунди, але ми прагнемо до того, щоб майбутні версії думали годинами, днями або навіть тижнями. Вартість умовиводів буде вищою, але яку ціну ви готові заплатити за нові ліки проти раку? За революційні батареї? За доказ гіпотези Рімана? ШІ може бути більше, ніж чат-боти», — зазначив науковий співробітник OpenAI Ноам Браун.
За інформацією OpenAI, на відбірковому іспиті Міжнародної математичної олімпіади o1 вирішила 83% завдань, GPT-4o — 13%. У конкурентному програмуванні на платформі Codeforces вона показує себе краще за 89% учасників.
Порівняння o1 з GPT-4o у складних тестах міркувань. Джерело: OpenAI.
Нейромережа поєднує в собі сімейство моделей. 12 вересня випущено ранню версію o1-preview, випуск інших планується в майбутньому.
Можливості нової мовної моделі поки що обмежені: вона не може аналізувати веб-сторінки, файли та зображення.
Новий інструмент OpenAI дорожчий за попередника — API o1-preview коштує $15 за 1 млн вхідних токенів (утричі дорожче за GPT-4o) і $60 за 1 млн вихідних (учетверо дорожче за GPT-4o). Вона доступна в ChatGPT корпоративним користувачам Plus або Team.
Нова модель раніше мала кодову назву Strawberry. До цього проєкт називався Q* і розглядався як прорив для створення загального штучного інтелекту, який «може загрожувати людству».
Раніше стало відомо, що OpenAI веде переговори про залучення $6,5 млрд при оцінці в $150 млрд.
Нагадаємо, CEO стартапу Сем Альтман планує реалізувати масштабний проєкт зі створення обладнання та систем для штучного інтелекту на десятки мільярдів доларів.