Mistral AI представляє модель відкритого аудіо

Французька ініціатива зі штучного інтелекту Mistral AI представила модель розпізнавання мовлення з відкритим кодом під назвою Voxtral.
Представляємо найкращі (та відкриті) моделі розпізнавання мовлення у світі! pic.twitter.com/tUnPcdCrbZ
— Mistral AI (@MistralAI) 15 липня 2025 р.
Цей інструмент розроблений для бізнес-застосунків та призначений для безперешкодної інтеграції у виробничі робочі процеси. Він рекламується як рішення для розвитку практичного мовного інтелекту.
За словами компанії, Voxtral є економічно ефективною альтернативою, ціна якої «менше половини» порівняно з аналогічними продуктами.
Модель може транскрибувати аудіо тривалістю до 30 хвилин і «розуміти» аудіо тривалістю до 40 хвилин, що дозволяє користувачам запитувати про контент, створювати резюме або перетворювати голосові команди на дії, включаючи виклик API або виконання функцій у режимі реального часу.
Voxtral є багатомовним і розпізнає такі мови, як англійська, іспанська, французька, португальська, хінді, німецька, голландська та італійська.
Компанія пропонує дві варіації моделі:
- Voxtral Small — має 24 мільярди параметрів, розроблений для промислового застосування;
- Voxtral Mini — містить 3 мільярди параметрів, ідеально підходить для локального розгортання.
Крім того, окремо пропонується спрощена версія Voxtral Mini Transcribe — дуже доступна та швидка модель, спеціально оптимізована для завдань транскрипції.
Користувачі можуть безкоштовно спробувати Voxtral на Hugging Face або через чат-бота Le Chat. Ціна інтеграції API починається від $0,001 за хвилину.
Mistral AI вважається провідним стартапом у сфері штучного інтелекту в Європі, який готовий конкурувати з фірмами зі США та Китаю. У лютому ініціатива запустила мобільний додаток для iOS та Android.
Варто зазначити, що в січні Mistral AI оголосила про намір провести IPO .
