Google представила Veo 3 — первую ИИ-модель, которая генерирует видео со звуком

  • сегодня 12:30
  • 1.6k+

Недолгая история немого ИИ-видео подошла к концу. На конференции I/O 2025 Google представила модель Veo 3 — первую версию генеративного ИИ, которая создаёт видео по тексту вместе со звуком.

В отличие от других решений, модель не требует дополнительных указаний для создания звуков: она анализирует содержимое кадров и автоматически подбирает звуковое сопровождение.
Veo 3 синхронизирует изображение с аудиодорожкой, добавляя звуковые эффекты, фоновые шумы и даже диалоги. Пользователи могут описывать персонажей, обстановку и то, как должны звучать реплики, сообщил руководитель Google DeepMind Демис Хассабис.
Компания не раскрывает, на каких данных обучали Veo 3. Однако, по информации TechCrunch, в разработке могли использоваться материалы с YouTube. Ранее Google уже заявляла, что контент платформы «может» применяться для тренировки ИИ-моделей.
В отличие от аналогов от OpenAI, Runway, Alibaba и других разработчиков, Veo 3 поддерживает полноценное звуковое сопровождение. В основе технологии — система video-to-audio, ранее разработанная в DeepMind. Она анализирует видео на уровне пикселей и подбирает подходящий звук.
Все ролики, созданные с помощью Veo 3, автоматически помечаются встроенным невидимым водяным знаком SynthID — для защиты от дипфейков и дезинформации.
Тем временем многие художники и аниматоры выражают обеспокоенность. По данным исследования, заказанного Гильдией аниматоров США, к 2026 году ИИ может вытеснить около 100 тысяч рабочих мест в киноиндустрии, на телевидении и в анимации.
Veo 3 уже доступна в приложении Gemini для подписчиков тарифа AI Ultra стоимостью $249 в месяц.


20.05.2025 10:44
3.1k+

Это уже выглядит странно… ИИ начал сам придумывать правила общения и язык

Модели искусственного интеллекта на основе больших языковых моделей (LLM) способны самостоятельно вырабатывать социальные нормы и языковые правила. К такому выводу пришли исследователи из Университета Сити Сент-Джордж (Лондон) и ИТ-университета Копенгагена...

20.05.2025 07:46
2.5k+

Bloomberg: OpenAI примет участие в создании крупнейшего дата-центра в ОАЭ

Компания OpenAI, разработчик ChatGPT, планирует принять участие в проекте по созданию нового крупного дата-центра в Объединённых Арабских Эмиратах. По данным агентства Bloomberg, дата-центр будет построен в Абу-Даби, его проектируемая мощность составит 5 гигаватт...

19.05.2025 18:09
1.8k+

YouTube начнет показывать рекламу после ключевых моментов видео

Google вводит новый формат рекламы для YouTube, сообщает TechCrunch со ссылкой на презентацию в Нью-Йорке. Анонсированная компанией технология Peak Points будет показывать рекламу сразу после «пиковых» моментов ролика, когда зритель максимально вовлечен в просмотр...

18.05.2025 16:44
1k+

ИИ-ассистента в Windows 11 можно будет «пробудить», произнеся: «Hey, Copilot!»

Microsoft начала тестирование функции Copilot Voice для Windows 11. Теперь пользователи смогут активировать ИИ-ассистент, произнеся фразу «Hey, Copilot!». Нововведение доступно участникам программы Windows Insider, обновившим приложение Copilot до версии 1...