Google запустила Vertex AI Media Studio — набор инструментов на основе искусственного интеллекта для генерации видео.
Пользователям не понадобятся навыки видеомонтажа или программирования. Весь процесс — от генерации изображения до финального ролика с озвучкой и музыкой — проходит в одном интерфейсе.
Работа начинается с модели Imagen 3, которая создаёт изображение по текстовому описанию. Затем модель Veo 2 превращает его в видео. Пользователь может выбрать стиль движения камеры, например, панораму или съёмку с дрона, а также настроить частоту кадров и длительность ролика. Если в кадре появляются лишние элементы, их можно убрать с помощью функции, похожей на Magic Eraser в смартфонах Pixel.
После создания визуальной части платформа добавляет озвучку через модель синтеза речи Chirp. Для музыкального сопровождения используется модель Lyria, разработанная Google совместно с YouTube и DeepMind. В результате получается готовое к публикации видео, которое выглядит профессионально.
Vertex AI Media Studio интегрирована с платформой Vertex AI, где разработчики работают с моделями семейства Gemini. Эти модели поддерживают задачи с текстом, изображениями и кодом, что позволяет экспериментировать с разными форматами контента. Однако платформа создана не только для специалистов. Её интерфейс прост и понятен даже для новичков, которые хотят быстро сделать видео — от презентаций до роликов для соцсетей.
При этом в Google осознают, что такие инструменты вызывают вопросы об авторском праве и этике. Но в компании считают что спрос на удобные решения для создания контента растёт, особенно среди тех, кто не занимается видео профессионально. Vertex AI Media Studio отвечает на этот запрос, предлагая доступный способ создавать качественные ролики.