Mistral AI представляє модель відкритого аудіо

Французька ініціатива зі штучного інтелекту Mistral AI представила модель розпізнавання мовлення з відкритим кодом під назвою Voxtral.

Цей інструмент розроблений для бізнес-застосунків та призначений для безперешкодної інтеграції у виробничі робочі процеси. Він рекламується як рішення для розвитку практичного мовного інтелекту.

За словами компанії, Voxtral є економічно ефективною альтернативою, ціна якої «менше половини» порівняно з аналогічними продуктами.

Модель може транскрибувати аудіо тривалістю до 30 хвилин і «розуміти» аудіо тривалістю до 40 хвилин, що дозволяє користувачам запитувати про контент, створювати резюме або перетворювати голосові команди на дії, включаючи виклик API або виконання функцій у режимі реального часу.

Voxtral є багатомовним і розпізнає такі мови, як англійська, іспанська, французька, португальська, хінді, німецька, голландська та італійська.

Компанія пропонує дві варіації моделі:

  • Voxtral Small — має 24 мільярди параметрів, розроблений для промислового застосування;
  • Voxtral Mini — містить 3 мільярди параметрів, ідеально підходить для локального розгортання.

Крім того, окремо пропонується спрощена версія Voxtral Mini Transcribe — дуже доступна та швидка модель, спеціально оптимізована для завдань транскрипції.

Користувачі можуть безкоштовно спробувати Voxtral на Hugging Face або через чат-бота Le Chat. Ціна інтеграції API починається від $0,001 за хвилину.

Mistral AI вважається провідним стартапом у сфері штучного інтелекту в Європі, який готовий конкурувати з фірмами зі США та Китаю. У лютому ініціатива запустила мобільний додаток для iOS та Android.

Варто зазначити, що в січні Mistral AI оголосила про намір провести IPO .

Источник

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *