Как бесплатно создать ИИ-мультфильм: подробная инструкция

03.06.2026, 05:26

Ринат Валиуллин

ИИ-видео заполонили соцсети: истории мультяшных персонажей превращаются в целые сериалы, которые наверняка попадались каждому. Но как делать такие ролики бесплатно? Youth.kz показывает, какие AI-инструменты помогут в этом деле.

Для создания ИИ-мультфильма мы будем использовать 3 нейросети: Gemini – для генерации картинок, Qwen – для того, чтобы эти картинки оживить и Eleven Labs для озвучки. Также нам понадобится программа CapCut для монтажа.

Шаг 1. Сценарий

Перед тем, как создавать будущий шедевр, нужно определиться со сценарием. Главный нюанс – в нем нужно прописать каждый кадр. Длительность кадра составляет 5 секунд, так что мы должны описать все действия, которые будут происходить в мультфильме в этот отрезок времени.

Написать сценарий можно самостоятельно или объяснить примерный концепт любому чат-боту со следующим промтом:

«Сделай мне сценарий для ИИ-мультфильма продолжительностью в 30 секунд. Опиши, что будет происходить в каждом кадре следующие 5 секунд».

Мы придумали небольшую историю с тремя персонажами: Клубникой, Бананом и Яблоком. Такие образы часто встречаются в подобных мультфильмах.

Шаг 2. Генерация кадров

Далее нужно сгенерировать главных героев. Для этого мы выбрали Gemini от Google. Создать арты может и ChatGPT, но плюс Gemini в том, что у него нет ограничений по генерации изображений.

Нажимаем на плюсик в строке запроса и выбираем «создание изображений».

Далее детально описываем персонажа. Нужно прописать не только внешний вид, но и локацию, а также стиль рисовки и разрешение изображения.

Пример промта:

«Антропоморфный банановый мужчина в мультяшном стиле, в человеческом теле, в строгом костюме, в супермаркете, доброжелательный, качество Pixar, вертикальное разрешение 9:16».

После этого ИИ выдает результат, который можно редактировать дополнительными запросами. Например, попросить добавить или убрать какие-то элементы. В таком стиле создаем всех действующих лиц видео, не забывая указать локацию.

На всякий случай просим Gemini запомнить этих персонажей и создавать с ними сцены, которые мы отправим.

Далее копируем кадры из нашего сценария и отправляем в нейросеть.

Например:

«Клубника направляется к выходу из магазина с сумкой. Яблоко-охранник преграждает путь. Клубника выглядит испуганной».

И так мы просим сгенерировать каждый кадр.

Шаг 3. Создание видео

После создания всех исходников, переходим в чат-бот Qwen. В отличие от Grok, или других инструментов с генерацией видео, Qwen полностью бесплатный. Он не требует подписки или других пополнений. Да, есть ограничения в виде 5 генераций видео, но оно сбрасывается каждые 10 часов. К тому же, обойти его довольно просто – создав несколько аккаунтов, используя разные почтовые учетные записи.

В строке запроса нажимаем на плюсик и выбираем Create Video. Загружаем кадр и детально описываем, что должно произойти. Сделать это можно самостоятельно, но нейросеть не очень хорошо понимает русский язык. К тому же, любые неточности могут испортить кадр – персонажи сделают не то, что нужно или ИИ вовсе начнет галлюцинировать.

Так что лучший вариант – попросить Gemini составить точный промт на английском языке:

«Можешь ли ты составить детальный промт для перевода наших фото в видео. Я буду делать это в другой нейросети. Сделай так для каждой сцены, которую мы создали».

После чего чат-бот выдает детальные описания каждой сцены.

Вставляем нужную сцену в Qwen с соответствующим изображением и спустя несколько минут получаем 5-секундное видео. Повторяем это со всеми кадрами.

Важный момент: не обращайте внимания на озвучку, которую создаст Qwen. Позже мы удалим ее и добавим качественный вариант.

Шаг 3. Монтаж и озвучка

Далее загружаем исходники в CatCup, расставляем кадры по местам и удаляем аудио-дорожку. Правой кнопкой мыши нажимаем на видео – извлечь звук. После – удаляем дорожку с некачественной озвучкой.

Переходим в Eleven Labs для озвучки и выбираем нужный голос. Его можно детально настроить в панели справа.

Вводим реплики в текстовую строку и нажимаем Generate Speech. Скачиваем готовый результат и добавляем в CatCup. Подставляем голос под нужные фрагменты видео и наш мультфильм готов. Далее нажимаем «экспорт» и получаем готовый результат.