Ці звуки ви ніколи не чули: Nvidia представила ШІ-модель для генерації аудіо

26.11.2024
Рубрика:Криптовалюта

Nvidia продемонструвала ШІ-модель для створення музики та аудіо. Вона може змінювати голоси та генерувати нові звуки.

Технологія Fugatto призначена для творців музики, фільмів і відеоігор.

Нейромережа здатна генерувати звукові ефекти та музику за промптами. Наприклад, можна створити «аудіо труби, що гавкає як собака». Як інший приклад названо звук «глибоких басових імпульсів, що гуркочуть, у поєднанні з періодичним високочастотним цифровим щебетанням — немов звук величезної розумної машини, що прокидається».

Відмінною особливістю рішення Nvidia є здатність аналізувати та змінювати наявний звук. Наприклад, вона може зіграну на піаніно мелодію перетворити на спів людини.

«Якщо ми подумаємо про синтетичне аудіо за останні 50 років, то зараз музика звучить інакше завдяки комп’ютерам, синтезаторам. Я думаю, що генеративний ШІ внесе нові можливості в музику, відеоігри та звичайним людям, які хочуть створювати щось нове», — прокоментував віцепрезидент із досліджень у сфері глибокого навчання Nvidia Браян Катандзаро.

Нова модель компанії налаштована на базі даних з відкритих джерел. Фірма обмірковує варіанти її представлення громадськості.

«Будь-яка генеративна технологія завжди несе в собі деякі ризики, тому що люди можуть використовувати її для створення речей, які ми б не хотіли, щоб вони створювали», — наголосив Катандзаро.

Нагадаємо, Google DeepMind анонсувала розробку технології на базі штучного інтелекту для створення саундтреків до відео.

Источник