Google мав бути лідером у чат-бот-революції, але його випередила OpenAI зі своїм ChatGPT. Як Google розробляв ШІ-чат-боти Bard та Gemini? Forbes переказує головне з матеріалу Wired.
Отримуйте інсайти, що дають перевагу: підпишіться на Forbes Digital та завжди будьте на крок попереду у світі бізнесу.
Від 49 грн на місяць!
У грудні 2022-го компанія Google дала виконавчій директорці Сіссі Шао 100 днів на створення конкурента популярній великій мовній моделі ChatGPT, яку розробила OpenAI Сема Альтмана. Завдання було не з легких – публічний ChatGPT набирав мільйони користувачів, тоді як Google, попри наявність власної мовної моделі LaMDA, тримав її за закритими дверима.
Google втрачав позиції: продажі реклами буксували, інновації гальмували, а голосовий помічник Assistant не викликав ентузіазму навіть у фанатів таймерів. До кінця 2022 року ціна акцій материнської компанії Google – Alphabet – була на 39% нижчою, ніж на кінець 2021-го.
Популярне Категорія Гроші Дата Вчора Раунд №2. Україна отримала пропозицію нової «угоди про надра» від США. Що змінилось та на яких пунктах наполягатиме українська сторона?
Відповідь на кризу була радикальною: об’єднати нові продукти DeepMind у Лондоні та Google Brain у Маунтін-В’ю, створити мовну модель нового покоління під кодовою назвою Gemini і відновити статус Google як лідера в ШІ. Це рішення спровокувало внутрішні суперечки, роботу компанії в нічні зміни та глибоку реструктуризацію. Інженери, маркетологи та юристи працювали понаднормово. Ключове гасло команди Шао: «Якість понад швидкість, але все-таки швидко».
До Bard за 100 днів
Пріоритет був очевидним. За 100 днів вдалося створити Bard, майбутній конкурент ChatGPT, який став внутрішнім проєктом компанії. Команду для цього проєкту відбирали за стратегічним мисленням, емоційним інтелектом і гнучкістю. Часто вони виконували кілька ролей одночасно. Дедлайн у 100 днів змушував знижувати планку безпеки. Деякі працівники, які раніше перевіряли контент на предмет насильства над дітьми, були перекинуті на тестування Bard.
Паралельно із запуском Bard компанія переживала перші масові скорочення у своїй історії – 12 000 посад, тобто 7% штату. Деякі працівники розуміли: хочеш залишитися в компанії – потрібно працювати понаднормово. Інфраструктурна команда звільняла сервери, інженери перекидали ресурси, спалюючи дані й енергію. Однак Bard ще від самого початку «галюцинував» – то плутав інформацію, то видавав фрази, які містили расові стереотипи.
У лютому 2023 року, коли Google тільки-но готувався представити Bard світу, компанія опублікувала рекламне відео: чат-бот як «розумний помічник» відповідав на запитання користувача. Один із запитів був: «Про які нові відкриття телескопа Джеймса Вебба я можу розповісти своїй дев’ятирічній дитині?» У відповіді Bard стверджував, що JWST зробив перше фото екзопланети – і це була фактична помилка.
Насправді перше фото екзопланети зробив не JWST, а Very Large Telescope. Помилку швидко помітили журналісти Reuters. Вона стала вірусною, і внаслідок цього ціна акції Alphabet впала на 9% (приблизно $100 млрд ринкової капіталізації).
У Google паралельно розробляли два ШІ-продукти: DeepMind у Лондоні і Google Brain у Маунтін-В’ю, але вирішили їх об’єднати в один – спершу Bard, а згодом Gemini. Фото Getty Images
Gemini як нова заміна Bard
Після невдачі з Bard Google активізував зусилля навколо розмовного чат-бота Gemini. У квітні 2023 року компанія оголосила про створення нового підрозділу Google DeepMind, яким керував Деміс Хассабіс. Він отримав зелене світло на амбітний проєкт – створити візуально-слухового агента з довгою пам’яттю, здатного супроводжувати користувача в усьому. Технічна команда об’єдналася в новому офісі Gradient Canopy, із суворим контролем доступу навіть для інших працівників Google.
Робота тривала без упину – через вісім часових поясів, у сотнях чатів, із фокусом на швидкість і контроль. Водночас Google скорочував доступ дослідникам, обмежуючи публікації про продукт. Формула тренування Gemini була надто цінною. Але зі збільшенням масштабів з’являлися нові проблеми – модель видавала дивні медичні поради або помилкові висновки на основі зображень. Команда з етики мала обмаль часу, щоб виявити потенційно токсичні сценарії.
Попри всі ризики, у грудні 2023-го Google презентував Gemini. Це справді виглядало як повернення: модель обійшла GPT-4 у більшості тестів, демонструючи потужність в аналізі наукових текстів, відео та юридичних документів. Але свято тривало недовго – одразу почалися спроби масштабувати функціональність: довга пам’ять, генерація подкастів, обробка PDF. Команда почала інтегрувати Gemini у всі продукти компанії.
Деміс Хассабіс і керівник проєкту Google Brain Джефф Дін тепер мали балансувати між запитами різних команд: одним потрібен переклад японською, іншим – аналіз відео. Усе відбувалося на тлі зовнішньої конкуренції, адже ChatGPT і далі випереджав Gemini за кількістю завантажень: 600 млн проти 140 млн, за даними Sensor Tower.
Але головний виклик був не в кількості функцій, а в тому, щоб довести інвесторам і користувачам, що ШІ може приносити прибуток.
У ChatGPT 600 млн завантажень додатку, а у Gemini – 140 млн, за даними Sensor Tower. Фото Getty Images
Етичні проблеми
Коли Google запустив генератор зображень як частину Gemini у лютому 2024-го, той не створював расистських чи сексистських зображень, як цього побоювались. Натомість на запит «сенатор США з 1800-х» Gemini показував темношкірих жінок, азійських чоловіків або корінну американку в пір’ї, але жодного білого чоловіка. Були й тривожніші приклади – зображення нацистських солдатів як людей з іншим кольором шкіри.
Ілон Маск, який запустив свій чат-бот Grok 3 у лютому 2025 року, неодноразово писав у X про недоліки Gemini, називаючи цей чат-бот «расистом і сексистом» і виділяючи члена команди Gemini, який, на його думку, несе за це відповідальність. За словами колег, співробітник закрив свої акаунти в соціальних мережах, побоюючись за свою безпеку. Google зупинив здатність Gemini генерувати зображення людей, а акції Alphabet знову впали.
Компанія терміново найняла нових фахівців для створення відділу довіри та безпеки, а Шао посилила внутрішню підтримку й розробила набір публічних принципів для Gemini, які були сформульовані навколо «ви» користувача. Важливим моментом було наголошення на тому, що «відповіді не обов’язково відображають переконання або погляди Google», відповідно до цих принципів.
Це дозволило змістити відповідальність за помилковий результат відповіді чат-бота: «Результати Gemini значною мірою залежать від того, що ви просите зробити. Gemini – це те, що ви робите».
Однак працівники з етичних відділів сумнівалися: час на перевірку скорочувався, а запуск нових функцій пришвидшувався.
Наступний етап – функція AI Overviews у пошуку Google, яка мала синтезувати результати та одразу видавати коротку відповідь. Однак система почала пропонувати поради на кшталт «додайте клей до соусу для піци». Компанія зменшила кількість таких «порад», але не відмовилася від них. Вимкнути функцію вручну користувачі не могли.
В Google наполягали, що більшість користувачів задоволені, але всередині команди точилася боротьба між тими, хто прагнув наздогнати OpenAI, і тими, хто закликав до обережності. Пошукова система, яка раніше асоціювалася з правдивістю, тепер ризикувала стати жертвою власного експерименту з генерацією нісенітниць.
Ще на запуску у Gemini виникли проблеми, коли в порадах користувачам чат-бот почав генерувати нісенітницю. Фото ілюстрацію згенеровано за допомогою ШІ Meta.ai
Квадрильйони замість трильйонів
Попри всі кризи, всередині Gradient Canopy панувала атмосфера азарту. Коли команда Google Labs презентувала подкаст, згенерований Gemini, керівник Google Labs Джош Вудвард не стримував захвату. Інструмент для перетворення тексту на подкасти NotebookLM Audio Overviews став частиною презентації Google I/O на конференції. Хоч увагу привернули інші проєкти, як-от Astra (ШІ-асистент, що бачить реальний світ) та оновлення пошуку, це не зменшило віри команди у свою роботу.
У цю команду знову повірив й інженер-програміст Ноам Шазір, один із творців «трансформерів». У 2021 році він пішов з Google через те, що компанія не хотіла робити чат-бот загальнодоступним, але згодом повернувся на проєкт Gemini. «Організовувати інформацію – це можливість на трильйон доларів. Але трильйон доларів уже не круто, – пояснював він своє рішення. – Круто – це квадрильйон доларів».
Для Шазіра та Хассабіса головна мета – створити штучний загальний інтелект, який мислитиме, плануватиме й допомагатиме людству. Але водночас Google мусить шукати й бізнес-модель. Наразі компанія просуває класичну формулу: ваші дані в обмін на безплатний інструмент.
Конкуренція зростає, енергоспоживання ШІ-моделей колосальне, але прибутки ще не гарантовані. Продукти з довгим контекстом, генерація відео, голосові подкасти – усе це вимагає мільярдів доларів інвестицій і не меншої кількості довіри. Саме її й боїться втратити Google, запускаючи недопрацьовані продукти.
Два роки після «червоного коду» всередині Google промайнули як один довгий день: кризи, скорочення, прориви, нові функції, сподівання та страхи. Компанія змушена балансувати між швидкістю розвитку і контролем, між обережністю і ринковим тиском. І хоча Gemini справді повернула Google у гру, перемога ще не гарантована. У найближчі роки Google може втратити до чверті рекламних доходів через антимонопольні рішення, попереджає аналітик JPMorgan Даг Анмут.