Як зробити відео для соцмереж із допомогою ШІ: ChatGPT, Midjourney, Runway ML

Чи можна зробити якісне відео для соцмереж, використовуючи виключно інструменти штучного інтелекту? Звичайно. Головне – ШІ потребує максимально конкретної постановки завдання. Що детальніший ваш промпт (завдання для ШІ), то якісніший результат. Forbes Ukraine попросив Starlight Media зробити коротке відео на основі нашої статті Forbes. Які інструменти використовувати, особливості кожного та вартість – в туторіалі від головного операційного директора медіакомпанії Віталія Гусєва та команди Starlight Digital, яку він очолює

Зараз відбуваються значні зміни в індустрії створення контенту. Штучний інтелект трансформував роботу креативної індустрії в більш технологічну. Але, крім інноваційності, ШІ вигідний для творців контенту з точки зору бюджетів. Середня вартість телевізійного контенту – приблизно $22 000 за годину, натомість створеного за допомогою штучного інтелекту – орієнтовно у сім разів дешевша. Найближчим часом ШІ навряд чи замінить телевізійну якість контенту, але вже зараз творчі команди використовують його для генерації віжуалів, у роботі зі сценаріями та для іншого.  

Ми взяли текст Forbes Ukraine про український додаток з гороскопами Nebula. Використовуючи пʼять ШІ-інструментів (ChatGPT, Eleven Labs, Udio, Midjourney, Runway ML), зробили з нього відео для соцмереж на півтори хвилини.

1. Сценарій

ChatGPT – $20 персональний акаунт або $30 Teams акаунт

Як створити сценарій для рілз з великого тексту? Допоможе один із найпростіших і найдоступніших варіантів ChatGPT. Завантажуєте публікацію, прописуєте квоту слів, промпт – «виділити з тексту ключові, головні тези на шість речень» – і отримуєте сценарій. Виокремлювати головне у великих обʼємах інформації – одне з пріоритетних завдань інструментів ШІ. 

І це стосується не лише текстів, є нейронні мережі, які працюють із відео. Наприклад, ви підписані на цікавий наукпоп, але у вас немає двох вільних годин, щоб дивитися документалку. «Зроби мені шорт із цього відео або перекажи в одному абзаці», – ШІ замість вас за секунду передивляється відео, розшифровує і видає головне з тексту.

2. Генерація закадрового голосу

Eleven Labs – від $11 на місяць

На сьогоднішній день – один із найкращих інструментів. Він майже ідеально працює з англійською мовою, проте з українською часом виникають складнощі – не розуміє наголосів, наприклад, і не має інструментів, які б це коригували. Тому використовуємо технологічні прийоми: ставимо в тексті значок наголосу за допомогою клавіатури, або робимо літеру великою. Якщо і ці варіанти не працюють, редагуємо текст, заміняємо «незручне» слово на інше.

Що стосується інтонації та посилу, в інформативній подачі краще працюють робоголоси. Якщо закадровий голос має бути більш експресивним, на платформі Eleven Labs для цього є окремі інструменти.

П'ять інструментів ШІ та одна людина. Як створити відео для соцмереж, використовуючи виключно інструменти штучного інтелекту – гайд від Starlight Media /Фото 1

Врахуйте, що варіативність кожної генерації буде різною. Так працюють усі інструменти ШІ. І навіть одне й те ж речення «Привіт, я Марія» при кожному наступному запиті буде мати різні інтонацію, наголоси та швидкість.

Є pre-made голоси, які пропонує сама платформа, або можна згенерувати власний голос – обрати стать, діапазон віку (молодий, середній, похилий) і акцент. Також він може клонувати голос. Ви робите запис на хвилину тексту, а потім використовуєте свій голос для начитування. Навіть певні особливості та інтонації будуть збережені. В такому разі, до речі, українське начитування стане більш досконалим.

3. Генерація музичного супроводу

Udio – безкоштовно

Відносно новий інструмент, але серед альтернативних – найкращий. Головне – максимально якісно задати промпт. Робимо запит на музику для рілз про астрологію, і Udio пропонує варіанти. Якщо розумієте, що це зовсім «не звідти», то потрібно задіяти вокабуляр. Описати музику словами, щоб максимально чітко дати завдання ШІ, це найскладніше. Треба мати музичну освіту, знати сольфеджіо та інші тонкощі. Шукаємо вихід – звертаємось до ChatGPT і просимо: «Створи мені промпт для генерації музичної композиції, яка була б доречною для рілз, про магію, карти таро та астрологію». 

Генерація музики в Udio відбувається в декілька етапів. Основний текстовий промпт створює середину музичного треку. Якщо вона вас задовольняє, переходимо до створення початку й кінцівки треку. 

За допомогою Udio можна створювати як інструментальні композиції, так і вокальні. Для вокальних композицій лірику можна використовувати як власну, так і задавати промпт для написання ШІ-інструментом.

4. Генерація зображень

Midjourney – $30 на місяць

Для рілз Forbes наш гуру серед експертів, головний режисер ШІ Владислав, використав як фактичний матеріал – скриншоти з сайту, застосунку Nebula, фото СЕО та його команди, так і створені ШІ – це екстрасенси, віщунки та інші зображення на магічну тему. Для цього ми попрацювали з одним із кращих генераторів зображень – Midjourney.

Перевага інструмента в тому, що він надає найбільш стилістично якісні зображення. Якщо бажаєте віжуал, наближений до кіношного стилю, то він вам такий і видасть. Реалістичний, акварельний. У стилях Midjourney розбирається справді добре.

як працює Midjourney

Як Midjourney генерує фото

П'ять інструментів ШІ та одна людина. Як створити відео для соцмереж, використовуючи виключно інструменти штучного інтелекту – гайд від Starlight Media /Фото 2

П'ять інструментів ШІ та одна людина. Як створити відео для соцмереж, використовуючи виключно інструменти штучного інтелекту – гайд від Starlight Media /Фото 3

П'ять інструментів ШІ та одна людина. Як створити відео для соцмереж, використовуючи виключно інструменти штучного інтелекту – гайд від Starlight Media /Фото 4

П'ять інструментів ШІ та одна людина. Як створити відео для соцмереж, використовуючи виключно інструменти штучного інтелекту – гайд від Starlight Media /Фото 5

Що цей ШІ-інструмент не може? Розуміти складні запити. Якщо задати промпт «жінка в червоній сукні з філіжанкою кави, а поруч руда кицька», то він або пропустить каву, або кицьку, або сукня буде блакитною. Для «настроєвих» зображень, на кшталт астрології, Midjourney спрацює добре. 

Він зберігає зображення в різних параметрах, як-от 16х9, 3х4, 1х1, 9х16, будь-яке. Також є інструменти, які дають можливість використовувати перший імідж, створений в певному стилі, як референс для всіх подальших зображень. 

5. Анімація зображень

Runway ML – $100 на місяць (варто брати найкращу підписку, щоб не обмежуватися кількістю генерацій)

Імідж, який ми зробили з Midjourney, є першим кадром нашого анімаційного відео. Використовуємо його як референс, завантажуємо в Runway та працюємо з ним.

Ставимо завдання: голова буде повертатися вправо, рука підніматися або сонце наближатися. Проте це той інструмент, де все працює, як лотерея. Зробивши певні маніпуляції, виділивши зони, задавши рух камери, ми натискаємо «генерація» – і отримуємо результат. І він нас може або влаштувати, або ні. Тоді коригуємо запит до того моменту, поки анімація не стане такою, як треба. З часом приходить досвід, які дії допомагають зробити анімацію максимально коректною.

П'ять інструментів ШІ та одна людина. Як створити відео для соцмереж, використовуючи виключно інструменти штучного інтелекту – гайд від Starlight Media /Фото 6

Як Runway ML оживляє зображення.

П'ять інструментів ШІ та одна людина. Як створити відео для соцмереж, використовуючи виключно інструменти штучного інтелекту – гайд від Starlight Media /Фото 7

Найкраще анімувати зображення, подане крупним планом, – портретне фронтальне фото людини. Можна використати інструмент ліпсінгу. Таким чином, СЕО Nebula Федоров «розказав» у нашому рілз, скільки грошей заробила компанія за останній рік. Для генерації голосу ми задіяли раніше згаданий Eleven Labs. Так ми показали, що начебто брали у нього інтервʼю. 

Про що варто знати, використовуючи інструменти ШІ для створення контенту

Жоден інструмент не буде з вами працювати, якщо тема стосується насилля чи чогось аморального. Треба розуміти, що у випадку з ШІ працює «презумпція винуватості». В кожному вашому запиті одразу шукатиметься щось, що ви хочете зробити неетично, – чи порнографічні матеріали, чи зображення насилля. Ви хочете згенерувати картинку, де дві жінки тримаються за руки, ШІ подумає, що це може бути лесбійське порно. Чи можна цього уникнути? У такому випадку легше буде змиритися та шукати інше рішення.

Источник

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *