Создать качественное видео можно без камеры, актёров и монтажа в сложных программах.
Главное — правильно выстроить процесс и корректно промптить GPT.
ChatGPT становится основным инструментом, который помогает придумать идею, написать сценарий, подготовить промпты, а потом адаптировать текст под озвучку и монтаж.


Меня зовут Паша Захаров, я автор Telegram-канала Цифровая рефлексия, в котором делюсь своими наблюдениями и рефлексирую на темы роста в диджитале и найме.

Ниже — подробный разбор, как собрать AI-видео с нуля:
от истории до финального клипа, который можно выложить в Reels, Shorts или иные органик-каналы.

Поехали.

1. Идея и сценарий: с чего начинается хорошее видео

Хорошее видео начинается не с одной фразы, а с структурированной истории.
Обычно это 4–6 сцен, где есть завязка, развитие, кульминация и финал.
Каждая сцена — это эмоция + действие + визуальный образ.

Если всё начинается с общей идеи — распишите её как историю.
Например, не “корабль тонет”, а:

«Корабль отправляется в плавание под ясным небом, не зная, что впереди ночь, которая всё изменит»

Так уже есть контраст, сюжет и настроение.

Далее, сценарий.

Запрос в GPT:

Помоги составить сценарий для короткого видео в 5 сцен в духе фильма «Титаник».
Опиши каждую сцену с деталями: место, действие, свет, звук, настроение, эмоцию.

Пример результата:

  1. Закат, корабль идёт по спокойной воде, золотое отражение.

  2. Девушка стоит у перил, ветер, лёгкая тревога.

  3. Ночь. Слышно, как где-то скрипит металл, предчувствие.

  4. Паника, вода в коридорах, мигает свет, шум и хаос.

  5. Тишина. Кольцо падает в воду, камера замедляется.

Советы:

  • Добавляйте второстепенные звуки и свет (например, “звуки ветра”, “мерцающий огонь”) — они влияют на атмосферу видео.

  • Лучше сразу продумать смену настроения: от спокойствия к тревоге, от хаоса к тишине.

  • Если GPT написал шаблонно — просите добавить деталей:

Добавь контраст в настроении между сценами”
“Опиши чувства героев без лишней драмы”

  • Не бойтесь длины — чем конкретнее описан��е, тем точнее визуализация на следующих этапах.

2. Подготовка визуалов через Midjourney

После сценария переходите к визуалам.
Задача — превратить каждую сцену в кадр с правильным светом и атмосферой.
Для этого используйте GPT как переводчика между “историей” и “кадром”.

Запрос в GPT:

Напиши для каждой сцены промпт для Midjourney в кинематографичном стиле, с единым освещением, цветом и реализмом.

Пример промптов:

  1. The Titanic sailing across calm ocean at sunset, golden reflections, cinematic composition, drone shot, 4k, warm light, detailed texture

  2. A young woman on deck, wind blowing her hair, soft evening light, thoughtful look, 35mm film still, shallow depth of field

  3. Night ocean, iceberg ahead, cold blue light, quiet tension, cinematic realism

  4. Flooded corridor inside a ship, flickering lights, people running, chaos, realistic water texture, dramatic atmosphere

  5. A golden ring sinking underwater, soft rays of light, still silence, cinematic clarity, 4k close-up

Практические советы:

  • Используйте одни и те же описания света и цвета в каждом промпте (golden light, cinematic, film look) — так картинки будут смотреться как единое видео.

  • Избегайте “лишних” слов вроде beautiful, stunning, gorgeous — они портят реализм.

  • Для вертикальных видео добавляйте --ar 9:16, для горизонтальных — --ar 16:9.

  • Уточняйте стиль: realistic, film grain, natural light, moody.

  • Если картинка выглядит “пластиковой”, добавьте в запрос:

"soft shadows, less contrast, natural tones”.

3. Анимация через Kling и Sora

Когда кадры готовы, нужно добавить движение.

Kling — делает из статичных картинок плавное движение.

Подходит для портретов, пейзажей, панорам.
Хорошо работает, если нужно лёгкое движение камеры.

Запрос в GPT:

Составь короткие промпты для Kling по этим сценам.
Пусть камера двигается плавно, свет естественный, без резких эффектов.

Примеры:

  • camera slowly moves forward above the ocean, warm light reflections

  • slow zoom in on woman’s face, soft wind, emotional atmosphere

  • handheld camera in corridor, flickering lights, water splashing, chaos

Советы:

  • Промпты делайте короткими (до 12 слов).

  • Избегайте лишних прилагательных — Kling лучше работает, когда вы описываете действие камеры, а не “красоту”.

  • Используйте слова: drone, zoom in/out, pan left/right, rotate slowly, natural motion.

  • Если кадр дёргается — добавьте “steady camera, slow movement”.

Sora — создаёт видео с нуля по описанию.
Она подходит, если нужно показать динамику — движение корабля, воду, ветер, панику.

Запрос в GPT:

Напиши промпты для Sora для этих сцен.
Видео должно быть реалистичным, 6–8 секунд, без карикатурных движений.

Примеры:

  • The Titanic sailing through calm ocean at sunset, gentle waves, cinematic motion, 4k realistic water texture, --duration 8s

  • A woman standing on deck, hair moving in wind, camera slowly circling around her, film look, 35mm, --duration 6s

  • Flooded corridor inside the ship, people running, water splashing, camera shaking lightly, realistic lighting, --duration 8s

Советы:

  • Для реализма добавляйте film grain, cinematic lighting, realistic water texture.

  • Для мягкости — slow motion, shallow focus, natural motion.

  • Проверяйте длину: если видео рвётся, уменьшите --duration.-

  • Важно, чтобы у всех сцен была одна температура цвета — иначе монтаж “ломается”.

4. Текст и озвучка через ElevenLavs

После визуалов и анимации нужен текст — короткий, точный и ритмичный.
Он должен дополнять видео

Запрос в GPT:

Напиши короткий ��екст для озвучки к этому видео (до 25 секунд), спокойный, с эмоцией и паузами.

Советы:

  • Текст лучше делить на 3–4 короткие фразы.

  • Делайте паузы — они важнее длинных предложений.

  • Под каждую фразу можно задать тайминг

Если не хочется накладывать текст, то можно попросить GPT предложить подходящую музыку исходя из сценария.

Озвучка через ElevenLabs

Здесь важно не просто “синтезировать”, а подобрать тембр, ритм и эмоцию. С этим также может помочь GPT:

Подбери стиль речи, тембр и эмоцию для озвучки текста:
Видео — короткое, драматичное, в духе фильмов о море и воспоминаниях.
Опиши, каким должен быть голос (тембр, скорость, интонация) и с каким акцентом это лучше прочитать для ElevenLabs.

Советы по ElevenLabs:

  • Мужской голос с низким тембром — для драмы.

  • Женский мягкий — для ностальгии и спокойствия.

  • Используйте stability 20–30%, clarity 70–80% — так звучание будет естественным.

  • Делайте несколько дублей — иногда “неидеальный” вариант звучит живее.

  • Если нужно больше эмоции — уменьшите stability, если нужно чётче — увеличьте clarity.

  • Озвучку делайте чуть медленнее обычного темпа — нейросети любят дыхание и паузы.

5. Монтаж и структура видео через CapCut

Когда у вас готовы видеофрагменты (из Kling или Sora), картинки, текст и озвучка — начинается самая важная часть: монтаж.

CapCut — оптимальный вариант: бесплатный, простой и позволяет добиться кинематографичного результата, если знать пару приёмов.

Запрос в GPT:

Разбей сценарий по таймингам для видео длиной 30 секунд.
Добавь рекомендации по темпу каждой сцены: где ускорить, где замедлить.

  • 0:00–0:06 — закат и корабль, плавный темп.

  • 0:06–0:10 — девушка у перил, лёгкое движение камеры.

  • 0:10–0:18 — ночь и столкновение, быстрый монтаж.

  • 0:18–0:25 — паника, мерцание, хаос.

  • 0:25–0:30 — кольцо падает, тишина, длинный кадр.

Советы:

  • Формат: 9:16 для вертикальных видео, 16:9 для YouTube.

  • Качество: выстави 1080p или 4K, 30 fps (60 fps — если движение плавное).

  • Bitrate: 20–25 Mbps для 1080p, 40–50 Mbps для 4K.

  • Цвет: понизь насыщенность на 10–15%, добавь лёгкий фильтр “Cinematic” или “Warm Light”, выровняй яркость между сценами.

  • Стабилизация: включи Auto Stabilization, если камера дрожит.

  • Звук: голос громче музыки на 3–5 dB, добавь плавные Fade In/Out и лёгкий Reverb.

  • Переходы: используй простые Fade или Cross Dissolve, не длиннее 0.3 сек.

  • Финал: добавь 1 секунду тишины, проверь, чтобы свет, звук и ритм совпадали перед экспортом.

6. Общие советы и лайфхаки

  • Готовьте сценарий подробно. Чем детальнее описание сцен, тем меньше исправлений потом.

  • Держите стиль. Один фильтр, одна палитра, один свет — это создаёт эффект фильма.

  • Не бойтесь правок. Даже 2–3 итерации GPT дают качественно лучший результат.

  • Работайте сериями. Один стиль, разные сюжеты — это быстро создаёт узнаваемость.

  • Делайте референсы. В запросе к GPT можно написать:

“Сделай сценарий в стиле фильмов Нолана / ‘Прометей’ / ‘Дюнк’.”
Это помогает задать правильный визуальный ритм.

  • Озвучку и текст делайте последними. Тогда она ляжет на готовый темп видео, а не наоборот.

  • Делайте версию без звука. Часто ролики смотрят без звука, поэтому важен визуальный смысл.

  • Не бойтесь экспериментировать. Поменяйте свет, угол камеры, темп — даже мелкие детали влияют на восприятие.

Итог

ChatGPT помогает выстроить весь процесс: от сценария и промптов до текста и монтажа.
Midjourney — для визуалов, Kling и Sora — для движения, ElevenLabs — для озвучки, CapCut — для финальной сборки.

Главное — точные запросы, единый стиль и внимание к деталям.
Если держать контроль за светом, звуком и ритмом, видео будет выглядеть собранно и качественно, независимо от инструментов.

Спасибо, что дочитали! Надеюсь, что было полезно и интересно. До скорых встреч.

Комментарии (0)