Tencent выпустила ИИ-модель для создания 3D-миров из одного изображения

  • 11.09.2025 00:17
  • 2.2k+

Китайская компания Tencent представила открытую ИИ-модель HunyuanWorld-Voyager, которая позволяет генерировать видеоряд с 3D-эффектом на основе одного исходного изображения.

Алгоритм формирует до 49 кадров, что составляет около двух секунд видео, и объединяет их в последовательности длительностью несколько минут. При этом создаётся эффект движения камеры в реальном 3D-пространстве: объекты сохраняют свои позиции, а перспектива изменяется корректно.
HunyuanWorld-Voyager одновременно генерирует цветное видео и карты глубины (RGB-D), что позволяет использовать данные для реконструкции трёхмерных облаков точек. В основе работы лежит сопоставление шаблонов с геометрическими ограничениями: каждый кадр преобразуется в точечную 3D-модель, которая затем проецируется обратно в 2D для согласования с новыми изображениями. Такой подход обеспечивает более высокую пространственную согласованность по сравнению с другими ИИ-генераторами видео.
По данным Tencent, обучение модели проводилось на базе более 100 тыс. видеоклипов, в том числе созданных на движке Unreal Engine. По сути, ИИ-алгоритм обучили имитировать движение 3D-камер в среде видеоигр.
Система требует значительных вычислительных ресурсов: не менее 60 ГБ видеопамяти для генерации сцен в разрешении 540p и 80 ГБ — для более высокого качества.
Исходный код HunyuanWorld-Voyager и документация размещены на платформе Hugging Face. Использование алгоритма сопровождается лицензионными ограничениями: модель запрещено применять в странах ЕС, Великобритании и Южной Корее, а коммерческое использование с аудиторией свыше 100 млн пользователей требует отдельного лицензирования.


27.02.2026 21:33
7.4k+

Новая модель Nano Banana 2 от Google получила поддержку 4K и все знания Gemini

Американская компания Google презентовала нейросеть Nano Banana 2. Разработчики называют ее «новейшей, передовой моделью обработки изображений», сообщают «Ведомости». Технология будет внедрена во все сервисы корпорации...

21.02.2026 17:41
1.6k+

Gemini 3.1 Pro оказалась умнее конкурентов, и к тому же заметно дешевле

Google представила новую ИИ-модель Gemini 3.1 Pro, предназначенную для задач, где требуется сложное логическое рассуждение, а не короткий ответ. Модель способна писать приложения, проводить исследования и даже создавать анимации...

21.02.2026 14:09
1k+

Google изменила интерфейс ИИ-поиска после жалоб издателей

Google внесла изменения в отображение гиперссылок в разделах «Обзор от ИИ» (AI Overviews) и «Режиме ИИ» на базе Gemini, сообщает вице-президент по продукту Google Search Робби Стейн. Решение принято на фоне критики со стороны владельцев сайтов, фиксирующих падение поискового трафика...

19.02.2026 20:07
1.4k+

OpenAI внедрила в ChatGPT «режим блокировки» и пометку «повышенный риск»

Компания OpenAI объявила о запуске новых функций безопасности для продуктов на базе искусственного интеллекта — «режима блокировки» (Lockdown Mode) и маркировки «повышенный риск» (Elevated Risk). Нововведения затрагивают ChatGPT, ChatGPT Atlas и Codex...