Если Veo 2 произвел на вас впечатление, то Veo 3 вас просто поразит.

Google IO 2025 завершилась, и это была абсолютная масса анонсов в сфере ИИ. Многие люди, включая меня, до сих пор поднимают челюсти с пола. Но из всех анонсов Veo 3 - один из самых захватывающих для меня.

Об остальных анонсах я расскажу в отдельном посте, а пока давайте сосредоточимся на новейшей генеративной видеомодели Google.

Что нового в Veo 3

Вот краткий обзор основных обновлений:

  • Улучшено качество и физический рендеринг при генерации видео по текстовым и графическим промптам

  • Большее разрешение при выводе в 4K

  • Улучшенное соблюдение промптов, что означает более точные ответы на ваши инструкции

  • Автоматическое добавление речи, например, диалогов и закадрового голоса.

  • Встроенная функция генерации звука, например музыки и звуковых эффектов.

Да, Veo 3 теперь может автоматически добавлять диалоги. Для меня это самая потрясающая функция из всех. Вероятно, она стала возможной благодаря работе DeepMind над созданием искусственного интеллекта для преобразования видео в аудио, о которой было объявлено в июне прошлого года.

Если вы хотите увидеть, насколько он действительно хорош, Google DeepMind поделилась несколькими примерами видео с диалогами персонажей в этом посте в X:

Глядя на примеры видеороликов, я думаю, что мы уже наблюдаем следующее поколение ИИ-кинопроизводства.

Мы вступаем в эпоху ИИ-кинопроизводства 2.0

Прошли те времена, когда вам приходилось генерировать видео на одной платформе, например Kling, писать сценарий с помощью ChatGPT, отправлять его в другой инструмент для работы со звуком, например ElevenLabs, а затем запускать отдельную ИИ-модель, чтобы синхронизировать губы с голосом.

Это был сложный рабочий процесс, который мог занять несколько часов, а то и дней. И это еще не считая стоимости использования пяти различных инструментов и подписок.

В Veo 3 все это объединено в единый конвейер. Один промпт. Один инструмент. И каким-то образом он объединяет все вместе - визуально и на слух.

Возьмем, к примеру, эту сцену:

Промпт: A medium shot frames an old sailor, his knitted blue sailor hat casting a shadow over his eyes, a thick grey beard obscuring his chin. He holds his pipe in one hand, gesturing with it towards the churning, grey sea beyond the ship’s railing. “This ocean, it’s a force, a wild, untamed might. And she commands your awe, with every breaking light”

Только посмотрите, как кинематографична эта сцена, как выразителен персонаж и как хорошо двигаются его губы. Такое ощущение, что вы смотрите, как настоящий актер произносит реплику.

Понимание физического мира также невероятно хорошо. Посмотрите, как этот бумажный кораблик плывет по воде и падает в дренаж.

A paper boat sets sail in a rain-filled gutter. It navigates the current with unexpected grace. It voyages into a storm drain, continuing its journey to unknown waters.

Мне трудно понять, что все это сгенерировано искусственным интеллектом. Никаких инструментов для цифрового моделирования, никаких часов рендеринга и никаких 3D-художников.

В этот момент трудно не представить себе общую картину. Мы приближаемся к миру, в котором целые анимационные короткометражные фильмы или даже полнометражные картины можно будет создавать, просто написав промпт. Не сотни часов работы в Blender или AutoCAD. Не команда художников. Только идея и подходящий инструмент.

На Google IO был показан пример сгенерированной ИИ сцены разговора совы и скунса.

Представляете, как мы близки к тому, чтобы, написав всего один промпт, создать целый фильм? Это немного пугает, но в то же время невероятно захватывает.

Будущее кинопроизводства с помощью ИИ

Google добавила в Veo 3 функции, которые действительно делают его подходящим для реальных съемок. Некоторые из новых возможностей, созданных для кинематографистов, включают:

  • Использование «ингредиентов», предоставленных режиссером (персонажи, сцены или стили), и сохранение их согласованности на протяжении всего видео.

  • Режиссеры могут управлять Veo с помощью точных инструкций для камеры и вести съемку по определенной схеме.

  • Эти возможности помогают режиссерам свободно выражать свои идеи с помощью Veo.

Компания Google объединила усилия с режиссером Дарреном Аронофски и кинематографистом Элизой Макнитт, а также с их новыми предприятиями по созданию историй «Primordial Soup» и «Ancestra», чтобы сформировать возможности Veo для удовлетворения потребностей авторов.

Google представила ИИ-генератор видео Veo 3
Google представила ИИ-генератор видео Veo 3

«Это история, которая охватывает всю историю Вселенной. Но на самом деле это история о маме и о том, что происходит, когда ее ребенок рождается с дырой в сердце. Мы сняли очень эмоциональные спектакли, а затем создали видео, которое никогда не смогли бы снять иначе». - Элиза МакНитт

Она сочетает живое исполнение с видео, сгенерированным Veo, например, микроскопическими мирами и космическими событиями, что позволяет ей придать кинематографический масштаб и эмоции глубоко личной истории.

ИИ в наши дни развивается очень быстро.

Генеративные медиа расширяют границы творчества. Google тесно сотрудничает с творческим сообществом, чтобы создать технологию, способствующую творческому процессу.

Это касается не только кинематографа.

Jellyfish, известная компания в области цифрового маркетинга, входящая в состав The Brandtech Group, интегрировала Veo в свою высокоэффективную маркетинговую ИИ-платформу Pencil и объединила усилия с Japan Airlines, чтобы предложить генерируемые ИИ развлечения на борту самолета.

Вот пример видеорекламы, созданной с помощью Veo 3:

Вот что сказал Дэвид Джонс, генеральный директор Brandtech:

«Благодаря такому изменению контроля и качества ранее невозможные идеи превращаются в реальный маркетинговый контент за считанные минуты».

По его словам, кампании, созданные с помощью Veo, сократили затраты на производство на 50% и значительно сократили сроки изготовления. Это не просто незначительное улучшение - это перестройка целой отрасли.

Я не удивлюсь, если в скором времени на эту технологию перейдут и другие бренды.

Новый инструмент для создания фильмов с использованием искусственного интеллекта

Наряду с Veo 3 компания Google также запустила инструмент под названием Flow. Он помогает создавать кинематографические клипы, плавно переводить их в сцены и обеспечивать достаточную согласованность, чтобы рассказать историю.

Flow - это инструмент для создания кинематографических роликов, разработанный специально для самых продвинутых моделей Google Deepmind - Veo, Imagen и Gemini.

Вы можете генерировать видеоклипы различными способами:

  • Text to Video. Создание с помощью текстового промпта

  • Frames to Video. Загрузите или сгенерируйте изображения для использования в качестве начальных и/или конечных кадров

  • Ingredients to Video. Загрузите или создайте изображения для использования в качестве предметных или стилевых референсов

Google представила ИИ-генератор видео Veo 3
Google представила ИИ-генератор видео Veo 3

Вот список всех возможностей Flow:

Google представила ИИ-генератор видео Veo 3
Google представила ИИ-генератор видео Veo 3

Я изучу Flow и напишу обзор с примерами в отдельном посте. Пока же вы можете изучить некоторые часто задаваемые вопросы здесь. Вы также можете посмотреть здесь некоторые из лучших ИИ-фильмов, созданных с помощью Flow.

Как получить доступ к Veo 3

Есть несколько способов попробовать Veo 3 прямо сейчас:

  • Теперь он доступен в Google AI Studio. Просто откройте вкладку Generate Media и выберите Veo 3, чтобы начать создавать видео.

  • Он также доступен через новый ИИ-инструмент Google для создания фильмов - Flow. Обратите внимание, что для его использования требуется подписка на Google AI.

  • Veo 3 находится в закрытом режиме предварительного просмотра на Vertex AI и станет более доступным в ближайшие недели.

А вот для разработчиков публичного API пока нет. Google говорит, что он появится в Vertex AI в «ближайшие несколько недель», но мы уже слышали об этом раньше. Я надеюсь, что такие сервисы, как Fal AI или Replicate, тоже получат доступ.

На данный момент Veo 3 доступен только в США и только если вы являетесь пользователем тарифного плана Google AI Ultra.

Вот подробная информация о ценах и о том, что входит в каждую подписку:

Google представила ИИ-генератор видео Veo 3
Google представила ИИ-генератор видео Veo 3

И да... Google AI Ultra стоит 250 долларов в месяц.

После просмотра всех анонсов на Google IO 2025 я был просто потрясен. Google только что доказала, что лидирует в гонке ИИ. Veo 3 - это не просто небольшое обновление по сравнению с Veo 2. Звук и диалоговые функции - это очень важно. Они могут многое изменить в мире ИИ-кино и рекламы.

Также они представили новый инструмент под названием Flow, с помощью которого можно создавать полноценные сцены и сохранять согласованность действий. Это очень полезно, если вы пытаетесь рассказать историю или создать что-то с четким направлением.

На данный момент я считаю, что Veo 3 опережает другие видеогенераторы, такие как Runway, Kling и Hunyuan. Качество лучше, промпты работают точнее, и в нем больше функций. Но, зная Google, цены и ограничения на результаты могут стать решающим фактором... Посмотрим, когда он будет полностью развернут во всем мире.

Выбранные примеры видеороликов выглядят великолепно, но я жду, когда смогу попробовать Veo 3, прежде чем делать какие-либо предположения или преждевременно высказывать свои мысли. На данный момент, к сожалению, он доступен только для пользователей из США и требует подписки на Google AI Ultra. Ценник в 250 долларов в месяц очень высокий для обычных пользователей вроде меня.

Я жду, когда появится API, чтобы протестировать его и, возможно, использовать в своих веб-приложениях.

В любом случае, что вы думаете о Veo 3? Напишите об этом в комментариях.

Друзья, буду рад, если вы подпишетесь на мой телеграм-канал про нейросети, чтобы не пропускать анонсы статей, и на канал с гайдами и советами по работе с нейросетями - я стараюсь делиться только полезной информацией.

Комментарии (14)


  1. mrserfr
    21.05.2025 09:27

    • Теперь он доступен в Google AI Studio. Просто откройте вкладку Generate Media и выберите Veo 3, чтобы начать создавать видео.

    У меня недоступен там


    1. NeyroEntuziast Автор
      21.05.2025 09:27

      Еще не раскатали для всех.

      На данный момент Veo 3 доступен только в США и только если вы являетесь пользователем тарифного плана Google AI Ultra.


  1. Yuriy_krd
    21.05.2025 09:27

    Все, пусть голливуд закрывают ) мы теперь сами дома сможем себе киношек на вечер нагенерить )))


    1. NeyroEntuziast Автор
      21.05.2025 09:27

      Это точно )


  1. gsaw
    21.05.2025 09:27

    Когда ни будь книгу подашь на вход и смотришь фильм.

    Если уже сейчас можно книгу озвучить автоматически. Прямо на смартфоне, с синтетическим голосом, в облаке уже с выражением и придыханием. Следующим этапом была бы, озвучка на разные голоса, что бы каждое действующее лицо своим голосом общалось. Ну и финал, авторы пишут книги и прикладывают свои записи, с описанием мира, героев, окружения и на выходе к книге прилагается сгенерированная аудиокнига и сериал :)


    1. YMA
      21.05.2025 09:27

      То есть, если кто-то решит написать книгу - стоит это делать сразу в виде последовательности промптов? :)


      1. NeyroEntuziast Автор
        21.05.2025 09:27

        Да, если хочет, чтобы его произведение экранизировали )


    1. NeyroEntuziast Автор
      21.05.2025 09:27

      Думаю, все впереди)


    1. andreich
      21.05.2025 09:27

      скиньте сервис для озвучки книг


      1. gsaw
        21.05.2025 09:27

        Да я не знаю таких, да что бы бесплатно. Я просто натыкался на пост на authopr today. Там кто то делал скрипт для chatgpt, что бы делать озвучку для книг. Сгенерированный голос был неплох, хоть и с английским акцентом.


        1. gsaw
          21.05.2025 09:27

          Вот и пост

          https://author.today/post/506125

          И там ссылка на сгенерированный пример.

          https://drive.google.com/file/d/17U4GUpKaAyIXfdZAgKSIbNlP7zULsnra/view

          Звучит неплохо. Наверняка есть сервисы, которые могут целую книгу так перегнать. Но наверное удовольствие не дешёвое.


  1. Arxitektor
    21.05.2025 09:27

    То есть, если кто-то решит написать книгу - стоит это делать сразу в виде последовательности промптов? :)

    Не думаю. Грузим книгу и просим сделать из неё последовательность промтов ).

    Ну то что Google сможет сделать нейронку для генерации видео имея youtube. Я не сомневался. Учитывая что сейчас у нах на серверах в наличии самая большая коллекция видео. Еще и теги и комменты есть ).

    До генерации короткометражки еще конечно далеко ). Ну или нам не показывают.

    Но то что нейронка может в одном процессе и видео и озвучку это круто ). А сможет еще и дубляж делать на куче языков одновременно ). И синхронизацию губ сделать под это дело ). На данный момент виду применение в основном в рекламе. Длинны видео как раз хватит.

    Но все равно немного поражает скорость. И хотелось бы видеть несколько роликов в бесплатном плане на Veo 3 пусть и соложеной генерацией в свободные часы.


    1. NeyroEntuziast Автор
      21.05.2025 09:27

      Все верно, они изначально заточили свой инструмент для использования компаниями


  1. eksamind
    21.05.2025 09:27

    Вот тест, очень неплохо, хотя и очень дорого)
    промт: man wearing traditional Caucasus mountain attire, including a dark cherkesska (a fitted coat with decorative cartridge cases on the chest) and a tall papakha (fur hat), is rapping with fierce passion and conviction. He stands on a dramatic, windswept mountain peak in the Caucasus range, with a vast, panoramic view of snow-capped mountains and deep valleys behind him under a sunrise sky. His gestures are powerful and emphatic as he performs. The style is cinematic, with dynamic camera angles, emphasizing both his raw energy and the majestic, rugged landscape symbolizing freedom. Close-ups show his intense expression.
    https://youtu.be/FSyWCjGWv8c?feature=shared