Tencent выпустила ИИ-модель для создания 3D-миров из одного изображения

  • сегодня 00:17
  • 887

Китайская компания Tencent представила открытую ИИ-модель HunyuanWorld-Voyager, которая позволяет генерировать видеоряд с 3D-эффектом на основе одного исходного изображения.

Алгоритм формирует до 49 кадров, что составляет около двух секунд видео, и объединяет их в последовательности длительностью несколько минут. При этом создаётся эффект движения камеры в реальном 3D-пространстве: объекты сохраняют свои позиции, а перспектива изменяется корректно.
HunyuanWorld-Voyager одновременно генерирует цветное видео и карты глубины (RGB-D), что позволяет использовать данные для реконструкции трёхмерных облаков точек. В основе работы лежит сопоставление шаблонов с геометрическими ограничениями: каждый кадр преобразуется в точечную 3D-модель, которая затем проецируется обратно в 2D для согласования с новыми изображениями. Такой подход обеспечивает более высокую пространственную согласованность по сравнению с другими ИИ-генераторами видео.
По данным Tencent, обучение модели проводилось на базе более 100 тыс. видеоклипов, в том числе созданных на движке Unreal Engine. По сути, ИИ-алгоритм обучили имитировать движение 3D-камер в среде видеоигр.
Система требует значительных вычислительных ресурсов: не менее 60 ГБ видеопамяти для генерации сцен в разрешении 540p и 80 ГБ — для более высокого качества.
Исходный код HunyuanWorld-Voyager и документация размещены на платформе Hugging Face. Использование алгоритма сопровождается лицензионными ограничениями: модель запрещено применять в странах ЕС, Великобритании и Южной Корее, а коммерческое использование с аудиторией свыше 100 млн пользователей требует отдельного лицензирования.


27.08.2025 15:44
4.9k+

Китай строит первый в мире подводный дата-центр для искусственного интеллекта

В Китае ведется строительство первого в мире подводного центра обработки данных для искусственного интеллекта. Объект находится в 10 км от побережья Шанхая, а его питание будет обеспечивать близлежащая морская ветроэлектростанция, передает Live Science...

22.08.2025 08:10
1k+

Google добавила в Gemini инструмент для озвучивания документов

Разработчики Google внедрили в сервис «Google Документы» новую функцию, позволяющую преобразовывать текст в аудиоформат. Инструмент работает на базе модели искусственного интеллекта Gemini. Опция «Аудио» появилась в меню «Инструменты» в верхней части рабочего пространства...

21.08.2025 16:21
1.7k+

Первый в космосе ИИ-ассистент: Китай вывел на орбиту систему «Укун»

Китайские астронавты на станции «Тяньгун» получили первого ИИ-помощника. Система под названием «Укун», созданная на базе отечественной открытой модели, была доставлена на станцию грузовым кораблем «Тяньчжоу-9» вместе с новыми скафандрами, фруктами и другими запасами...

18.08.2025 09:58
3.1k+

OpenAI вступает в территорию Neuralink. Компания инвестирует в создание мозговых чипов

Американская компания OpenAI и её соучредитель Сэм Альтман собираются инвестировать в стартап Merge Labs, который разрабатывает интерфейсы для мозговых имплантов. Об этом сообщила Financial Times со ссылкой на три анонимных источника...