Українська велика мовна модель: бета-запуск заплановано на весну 2026 – Федоров.

Українська державна велика мовна модель (LLM) стане доступною для бета-випробувань весною 2026 року. Фінансування розробки здійснює Київстар, а навчання моделі базується на сімействі моделей Gemma від Google.

Українська LLM вийде в бета-тестування навесні 2026 року - Федоров

Українська державна LLM (велика мовна модель) буде представлена для бета-тестування весною 2026 року, про це у середу повідомив перший заступник прем’єр-міністра – міністр цифрової трансформації Михайло Федоров у Telegram, розповівши, на якому етапі знаходиться процес розробки, інформує УНН.

Державна LLM буде доступна для бета-тестування навесні. Завдання України – потрапити до трійки лідерів серед країн за прогресом у сфері штучного інтелекту у світі. Одним із наймасштабніших кроків є запуск власної великої мовної моделі, яка навчена на унікальних українських даних

– зазначив Федоров.

Хто працює над державною LLM

“Створення LLM вимагає значних ресурсів, а під час війни всі кошти необхідно направляти на оборону. Тому технічним партнером ініціативи виступив Київстар. Компанія вкладає кошти в створення державної великої мовної моделі, а згодом передасть її у власність держави”, – зауважив віцепрем’єр.

За його словами, українська LLM буде навчатися на базі сімейства моделей Gemma від Google – нашого стратегічного партнера. “Це передові технології, які ми адаптуємо до української мови та контексту”, – додав він.

“Якість створення державної LLM буде оцінювати група незалежних фахівців з різних областей, яка буде перевіряти модель на: технічну якість; етичність і безпеку для користувачів; знання української мови; розуміння національного контексту”, – повідомив Федоров.

На якому етапі процес розробки на даний момент

“Наразі триває найважливіша частина роботи – збір інформації для навчання LLM. Для забезпечення високої якості інформації з інтернету недостатньо, тому ми співпрацюємо з державними органами, ЗМІ, університетами та іншими установами – це терабайти унікальних даних”, – розповів Федоров.

Одночасно, за його словами, створюється “правова база, щоб відповідально використовувати дані, які нам надають для навчання моделі”.

Також, повідомив він, “група експертів вже працює над розробкою бенчмарків – тестів для мовної моделі, які допоможуть оцінювати та покращувати її якість”. Це, пояснив віцепрем’єр, “дозволить утримувати у фокусі продуктивність та безпеку мовної моделі”.

Коли очікувати на запуск української LLM

У січні 2026 року ми вже матимемо: першу базу текстів для навчання LLM; вдосконалений токенізатор – інструмент, який поділяє слова на частини, щоб LLM обробляла мову швидше та ефективніше; власні бенчмарки для оцінки якості. Навесні 2026 року плануємо ініціювати бета-тестування. А назву для української LLM оберуть самі українці – у січні розпочнемо голосування в “Дії”. Зробимо Україну державою, де ШІ в пріоритеті

– підсумував Федоров.

Додатково

Минулого року в березні під час оголошення про початок розробки Федоров заявляв, що запуск державної LLМ дасть поштовх масовому виробництву українських інструментів на основі ШІ. За його словами, тисячі продуктів на основі ШІ створені на базі LLM – віртуальні помічники, такі як ChatGPT, генератори тексту, як Notion AI, інструменти для програмування, такі як GitHub Copilot.

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *