Google представила Veo 3 — первую ИИ-модель, которая генерирует видео со звуком

  • 22.05.2025 12:30
  • 4.3k+

Недолгая история немого ИИ-видео подошла к концу. На конференции I/O 2025 Google представила модель Veo 3 — первую версию генеративного ИИ, которая создаёт видео по тексту вместе со звуком.

В отличие от других решений, модель не требует дополнительных указаний для создания звуков: она анализирует содержимое кадров и автоматически подбирает звуковое сопровождение.
Veo 3 синхронизирует изображение с аудиодорожкой, добавляя звуковые эффекты, фоновые шумы и даже диалоги. Пользователи могут описывать персонажей, обстановку и то, как должны звучать реплики, сообщил руководитель Google DeepMind Демис Хассабис.
Компания не раскрывает, на каких данных обучали Veo 3. Однако, по информации TechCrunch, в разработке могли использоваться материалы с YouTube. Ранее Google уже заявляла, что контент платформы «может» применяться для тренировки ИИ-моделей.
В отличие от аналогов от OpenAI, Runway, Alibaba и других разработчиков, Veo 3 поддерживает полноценное звуковое сопровождение. В основе технологии — система video-to-audio, ранее разработанная в DeepMind. Она анализирует видео на уровне пикселей и подбирает подходящий звук.
Все ролики, созданные с помощью Veo 3, автоматически помечаются встроенным невидимым водяным знаком SynthID — для защиты от дипфейков и дезинформации.
Тем временем многие художники и аниматоры выражают обеспокоенность. По данным исследования, заказанного Гильдией аниматоров США, к 2026 году ИИ может вытеснить около 100 тысяч рабочих мест в киноиндустрии, на телевидении и в анимации.
Veo 3 уже доступна в приложении Gemini для подписчиков тарифа AI Ultra стоимостью $249 в месяц.


вчера 23:03
1.4k+

OpenAI запустила новый генератор изображений ChatGPT Images

Компания OpenAI запустила ChatGPT Images — новую модель на базе GPT-5.2 для создания и редактирования изображения по текстовым описаниям. Главная цель разработки — сохранять детали и делать картинки максимально реалистичными...

17.12.2025 12:19
3.9k+

ОБСЕ провела для туркменских блогеров курс по фактчекингу

В Центре ОБСЕ в Ашхабаде состоялся обучающий курс по медийной и правовой грамотности, ориентированный на местных блогеров и создателей контента. Целью мероприятия стало повышение «цифрового иммунитета» общества и минимизация рисков, связанных с распространением недостоверной информации, сообщает издание «Золотой век»...

15.12.2025 16:39
2.1k+

В Android появится функция видеосвязи с экстренными службами для быстрой оценки ситуации

Компания Google анонсировала функцию Android Emergency Live Video, которая даёт владельцам Android-смартфонов возможность транслировать видео с камеры своего устройства непосредственно диспетчерам экстренных служб...

15.12.2025 09:17
1k+

Google Translate получил функцию синхронного перевода речи для всех Android-устройств

Google объявила о крупном обновлении сервиса Google Translate. Главным новшеством стала функция синхронного перевода живой речи, которая теперь работает с любыми моделями наушников. Ранее эта возможность была доступна только владельцам Pixel Buds...