Модель SIMA від Google DeepMind навчилася грати в дев’ять відеоігор із відкритим світом.
Our research project SIMA is creating a general, natural language instructable, multi 3D game-playing AI agent. The agent can carry out a wide range of tasks in virtual worlds, making AI more adaptable, helpful & fun! https://t.co/u6nkkztded pic.twitter.com/dr8rn2Thwh
— Shane Legg (@ShaneLegg) March 13, 2024
«У рамках нашого дослідницького проєкту SIMA створено ігровий ШІ-агент. Він зможе виконувати широкий спектр завдань у віртуальних світах, стаючи більш адаптованим!», – повідомив на своїй сторінці в Х співзасновник DeepMind Шейн Легг.
No Man’s Sky – приклад відеоігри з відкритим світом, яку нейромережа натренувалася проходити. Ця навичка може стати кроком до створення AGI, що успішно функціонує в реальному світі.
Відеоігри давно використовуються для перевірки прогресу систем штучного інтелекту. Google DeepMind показала майстерність у віртуальних шахах і го. Але в них є очевидні алгоритми перемоги, що робить відносно простим навчання нейромереж.
Ігри з відкритим світом, з абстрактними цілями і сторонньою інформацією складніші для ШІ-систем. Варіативність дій робить їх трохи більш схожими на справжнє життя.
До числа ігор, які вже навчилася проходити ШІ-модель, входять Minecraft, Teardown і Goat Simulator 3.
SIMA може переміщатися в просторі, використовувати предмети й орієнтуватися в інтерфейсі. Також вона вміє здійснювати більш комплексні дії на кшталт управління космічними кораблями або видобутку ресурсів.
Розробники використовували вже наявні моделі розпізнавання відео та зображень для інтерпретації ігрових даних, а потім навчили SIMA співвідносити те, що відбувається на екрані, з певними завданнями.
Щоб отримати цю інформацію, дослідники проводили парні ігри в команді. Одна людина спостерігала за екраном і підказувала іншій, які рухи потрібно зробити.
Також розробники просили людей переглядати свій ігровий процес і описувати рухи миші та клавіатури, які вони здійснювали для проходження гри. Це дало змогу SIMA дізнатися, як дії гравців пов’язані з вирішенням завдань.
«Варто пам’ятати, що для таких компаній, як DeepMind, ці дослідження насправді не про ігри, а про робототехніку. Навігація в 3D-середовищі – засіб досягнення мети. Компанії прагнуть створити ШІ-моделі, здатні сприймати навколишній світ і діяти в ньому», – прокоментував дослідження професор Королівського коледжу Лондона Майкл Кук.
Коли нейромережу навчили на восьми іграх, дослідники виявили, що вона може грати в дев’яту, яку раніше не бачила. Однак результати не відповідали людському рівню.
Нагадаємо, у лютому DeepMind випустила ШІ-модель Genie, що створює ігри за промптом.