Google представила Veo 3 — первую ИИ-модель, которая генерирует видео со звуком

  • 22.05.2025 12:30
  • 4.2k+

Недолгая история немого ИИ-видео подошла к концу. На конференции I/O 2025 Google представила модель Veo 3 — первую версию генеративного ИИ, которая создаёт видео по тексту вместе со звуком.

В отличие от других решений, модель не требует дополнительных указаний для создания звуков: она анализирует содержимое кадров и автоматически подбирает звуковое сопровождение.
Veo 3 синхронизирует изображение с аудиодорожкой, добавляя звуковые эффекты, фоновые шумы и даже диалоги. Пользователи могут описывать персонажей, обстановку и то, как должны звучать реплики, сообщил руководитель Google DeepMind Демис Хассабис.
Компания не раскрывает, на каких данных обучали Veo 3. Однако, по информации TechCrunch, в разработке могли использоваться материалы с YouTube. Ранее Google уже заявляла, что контент платформы «может» применяться для тренировки ИИ-моделей.
В отличие от аналогов от OpenAI, Runway, Alibaba и других разработчиков, Veo 3 поддерживает полноценное звуковое сопровождение. В основе технологии — система video-to-audio, ранее разработанная в DeepMind. Она анализирует видео на уровне пикселей и подбирает подходящий звук.
Все ролики, созданные с помощью Veo 3, автоматически помечаются встроенным невидимым водяным знаком SynthID — для защиты от дипфейков и дезинформации.
Тем временем многие художники и аниматоры выражают обеспокоенность. По данным исследования, заказанного Гильдией аниматоров США, к 2026 году ИИ может вытеснить около 100 тысяч рабочих мест в киноиндустрии, на телевидении и в анимации.
Veo 3 уже доступна в приложении Gemini для подписчиков тарифа AI Ultra стоимостью $249 в месяц.


29.07.2025 11:30
904

В YouTube Shorts появились инструменты для генерации видео из фото и текста

YouTube представил новые инструменты на базе искусственного интеллекта для упрощения создания коротких вертикальных видео Shorts. Об этом сообщается в блоге видеосервиса. Среди нововведений — функция преобразования фотографий в видеоклипы, видеоэффекты с ИИ-анимацией, а также редактор AI Playground, который позволяет генерировать видео, изображения и музыку на основе текстовых подсказок...

27.07.2025 20:19
2.6k+

Google DeepMind обучила ИИ восстанавливать утраченные части латинских надписей

Компания Google DeepMind создала открытую нейросеть Aeneas, способную восстанавливать утраченные фрагменты древних латинских надписей. Информация опубликована на официальном сайте проекта. Разработка ориентирована на помощь историкам и эпиграфистам в интерпретации поврежденных памятников римской письменности...

26.07.2025 18:21
2.8k+

В ChatGPT появится режим для помощи в учёбе и подготовки к экзаменам

В веб-приложении ChatGPT анонсирована новая функция под названием «Совместное обучение» (Study Together), которая будет доступна пользователям в ближайшее время. Информация об этом размещена в разделе «Учись и изучай»...

25.07.2025 11:50
4.7k+

Samsung расширила программу обмена смартфонов на Galaxy Z Fold 7: добавлены Pixel 9

Samsung обновила условия программы trade-in для обмена смартфонов пользователей на Galaxy Z Fold 7. В список поддерживаемых устройств добавили линейку Pixel 9, ранее не входившую в программу. Об этом пишет портал Droid-life...