Как бесплатно создать ИИ-мультфильм: подробная инструкция
ИИ-видео заполонили соцсети: истории мультяшных персонажей превращаются в целые сериалы, которые наверняка попадались каждому. Но как делать такие ролики бесплатно? Youth.kz показывает, какие AI-инструменты помогут в этом деле.
Для создания ИИ-мультфильма мы будем использовать 3 нейросети: Gemini – для генерации картинок, Qwen – для того, чтобы эти картинки оживить и Eleven Labs для озвучки. Также нам понадобится программа CapCut для монтажа.
Шаг 1. Сценарий
Перед тем, как создавать будущий шедевр, нужно определиться со сценарием. Главный нюанс – в нем нужно прописать каждый кадр. Длительность кадра составляет 5 секунд, так что мы должны описать все действия, которые будут происходить в мультфильме в этот отрезок времени.
Написать сценарий можно самостоятельно или объяснить примерный концепт любому чат-боту со следующим промтом:
«Сделай мне сценарий для ИИ-мультфильма продолжительностью в 30 секунд. Опиши, что будет происходить в каждом кадре следующие 5 секунд».
Мы придумали небольшую историю с тремя персонажами: Клубникой, Бананом и Яблоком. Такие образы часто встречаются в подобных мультфильмах.
Шаг 2. Генерация кадров
Далее нужно сгенерировать главных героев. Для этого мы выбрали Gemini от Google. Создать арты может и ChatGPT, но плюс Gemini в том, что у него нет ограничений по генерации изображений.
Нажимаем на плюсик в строке запроса и выбираем «создание изображений».
Далее детально описываем персонажа. Нужно прописать не только внешний вид, но и локацию, а также стиль рисовки и разрешение изображения.
Пример промта:
«Антропоморфный банановый мужчина в мультяшном стиле, в человеческом теле, в строгом костюме, в супермаркете, доброжелательный, качество Pixar, вертикальное разрешение 9:16».
После этого ИИ выдает результат, который можно редактировать дополнительными запросами. Например, попросить добавить или убрать какие-то элементы. В таком стиле создаем всех действующих лиц видео, не забывая указать локацию.
На всякий случай просим Gemini запомнить этих персонажей и создавать с ними сцены, которые мы отправим.
Далее копируем кадры из нашего сценария и отправляем в нейросеть.
Например:
«Клубника направляется к выходу из магазина с сумкой. Яблоко-охранник преграждает путь. Клубника выглядит испуганной».
И так мы просим сгенерировать каждый кадр.
Шаг 3. Создание видео
После создания всех исходников, переходим в чат-бот Qwen. В отличие от Grok, или других инструментов с генерацией видео, Qwen полностью бесплатный. Он не требует подписки или других пополнений. Да, есть ограничения в виде 5 генераций видео, но оно сбрасывается каждые 10 часов. К тому же, обойти его довольно просто – создав несколько аккаунтов, используя разные почтовые учетные записи.
В строке запроса нажимаем на плюсик и выбираем Create Video. Загружаем кадр и детально описываем, что должно произойти. Сделать это можно самостоятельно, но нейросеть не очень хорошо понимает русский язык. К тому же, любые неточности могут испортить кадр – персонажи сделают не то, что нужно или ИИ вовсе начнет галлюцинировать.
Так что лучший вариант – попросить Gemini составить точный промт на английском языке:
«Можешь ли ты составить детальный промт для перевода наших фото в видео. Я буду делать это в другой нейросети. Сделай так для каждой сцены, которую мы создали».
После чего чат-бот выдает детальные описания каждой сцены.
Вставляем нужную сцену в Qwen с соответствующим изображением и спустя несколько минут получаем 5-секундное видео. Повторяем это со всеми кадрами.
Важный момент: не обращайте внимания на озвучку, которую создаст Qwen. Позже мы удалим ее и добавим качественный вариант.
Шаг 3. Монтаж и озвучка
Далее загружаем исходники в CatCup, расставляем кадры по местам и удаляем аудио-дорожку. Правой кнопкой мыши нажимаем на видео – извлечь звук. После – удаляем дорожку с некачественной озвучкой.
Переходим в Eleven Labs для озвучки и выбираем нужный голос. Его можно детально настроить в панели справа.
Вводим реплики в текстовую строку и нажимаем Generate Speech. Скачиваем готовый результат и добавляем в CatCup. Подставляем голос под нужные фрагменты видео и наш мультфильм готов. Далее нажимаем «экспорт» и получаем готовый результат.