Alibaba представила EMO. Это система для создания реалистичных видео по фотографии

  • 03.03.2024 12:42
  • 10k+

Программисты китайской технологической компании Alibaba создали ИИ-систему, которая способна оживлять фотографии. EMO (Emote Portrait Alive) может создавать реалистичные видеоролики говорящего или поющего человека по одной фотографии, сообщает «Хайтек» со ссылкой на исследование в издании arXiv.

EMO использует диффузионную модель ИИ, которая преобразует звуковые волны в видеокадры. Система была обучена на наборе данных из 250 часов видео "говорящих голов" из различных источников, таких как речи, фильмы, телешоу и вокальные выступления.
EMO превзошла существующие методы с точки зрения качества видео, сохранения идентичности и выразительности. Созданные ею видеоролики воспринимаются как более естественные и эмоциональные, чем этого удалось добиться другим разработкам. 
ИИ-система может не только создавать диалоговые видеоролики, но и анимировать поющие портреты, синхронизированные с вокалом. Она поддерживает создание видео произвольной продолжительности в зависимости от длины входного аудио.
Такая разработка может иметь множество применений, таких как создание обучающих материалов, видеопрезентаций, персонализированных поздравлений и т.д.


27.02.2026 21:33
7.5k+

Новая модель Nano Banana 2 от Google получила поддержку 4K и все знания Gemini

Американская компания Google презентовала нейросеть Nano Banana 2. Разработчики называют ее «новейшей, передовой моделью обработки изображений», сообщают «Ведомости». Технология будет внедрена во все сервисы корпорации...

21.02.2026 17:41
1.6k+

Gemini 3.1 Pro оказалась умнее конкурентов, и к тому же заметно дешевле

Google представила новую ИИ-модель Gemini 3.1 Pro, предназначенную для задач, где требуется сложное логическое рассуждение, а не короткий ответ. Модель способна писать приложения, проводить исследования и даже создавать анимации...

21.02.2026 14:09
1k+

Google изменила интерфейс ИИ-поиска после жалоб издателей

Google внесла изменения в отображение гиперссылок в разделах «Обзор от ИИ» (AI Overviews) и «Режиме ИИ» на базе Gemini, сообщает вице-президент по продукту Google Search Робби Стейн. Решение принято на фоне критики со стороны владельцев сайтов, фиксирующих падение поискового трафика...

19.02.2026 20:07
1.4k+

OpenAI внедрила в ChatGPT «режим блокировки» и пометку «повышенный риск»

Компания OpenAI объявила о запуске новых функций безопасности для продуктов на базе искусственного интеллекта — «режима блокировки» (Lockdown Mode) и маркировки «повышенный риск» (Elevated Risk). Нововведения затрагивают ChatGPT, ChatGPT Atlas и Codex...