Alibaba представила EMO. Это система для создания реалистичных видео по фотографии

  • 03.03.2024 12:42
  • 10k+

Программисты китайской технологической компании Alibaba создали ИИ-систему, которая способна оживлять фотографии. EMO (Emote Portrait Alive) может создавать реалистичные видеоролики говорящего или поющего человека по одной фотографии, сообщает «Хайтек» со ссылкой на исследование в издании arXiv.

EMO использует диффузионную модель ИИ, которая преобразует звуковые волны в видеокадры. Система была обучена на наборе данных из 250 часов видео "говорящих голов" из различных источников, таких как речи, фильмы, телешоу и вокальные выступления.
EMO превзошла существующие методы с точки зрения качества видео, сохранения идентичности и выразительности. Созданные ею видеоролики воспринимаются как более естественные и эмоциональные, чем этого удалось добиться другим разработкам. 
ИИ-система может не только создавать диалоговые видеоролики, но и анимировать поющие портреты, синхронизированные с вокалом. Она поддерживает создание видео произвольной продолжительности в зависимости от длины входного аудио.
Такая разработка может иметь множество применений, таких как создание обучающих материалов, видеопрезентаций, персонализированных поздравлений и т.д.


05.05.2026 05:26
3.1k+

ИИ научился выявлять риск СДВГ у детей на ранней стадии

Учёные показали, что искусственный интеллект может выявлять признаки синдрома дефицита внимания и гиперактивности (СДВГ) у детей за несколько лет до постановки диагноза....

18.04.2026 12:23
4.2k+

Мэн станет первым штатом США, запретившим строительство крупных дата-центров

Штат Мэн планирует первым в США заморозить строительство новых крупных дата-центров с энергопотреблением от 20 МВт до ноября 2027 года. Законопроект направлен на защиту энергосетей и оценку экологического......

07.03.2026 17:10
965

OpenAI представила GPT-5.4. В нем контекстное окно увеличили до миллиона токенов

OpenAI представила новую языковую модель GPT-5.4. Разработчики продолжают развивать линейку систем искусственного интеллекта, уделяя больше внимания решению сложных задач, программированию и работе с различными инструментами...

06.03.2026 12:05
2.7k+

В GPT-5.4 появится режим экстремального рассуждения

В модели GPT-5.4 может появиться специальный режим обработки сложных запросов. Об этом сообщает издание The Information. По данным источника, в таком режиме модель будет использовать больше времени и вычислительных ресурсов для решения задач, требующих сложной логики и детального анализа...