Alibaba представила EMO. Это система для создания реалистичных видео по фотографии

  • 03.03.2024 12:42
  • 10k+

Программисты китайской технологической компании Alibaba создали ИИ-систему, которая способна оживлять фотографии. EMO (Emote Portrait Alive) может создавать реалистичные видеоролики говорящего или поющего человека по одной фотографии, сообщает «Хайтек» со ссылкой на исследование в издании arXiv.

EMO использует диффузионную модель ИИ, которая преобразует звуковые волны в видеокадры. Система была обучена на наборе данных из 250 часов видео "говорящих голов" из различных источников, таких как речи, фильмы, телешоу и вокальные выступления.
EMO превзошла существующие методы с точки зрения качества видео, сохранения идентичности и выразительности. Созданные ею видеоролики воспринимаются как более естественные и эмоциональные, чем этого удалось добиться другим разработкам. 
ИИ-система может не только создавать диалоговые видеоролики, но и анимировать поющие портреты, синхронизированные с вокалом. Она поддерживает создание видео произвольной продолжительности в зависимости от длины входного аудио.
Такая разработка может иметь множество применений, таких как создание обучающих материалов, видеопрезентаций, персонализированных поздравлений и т.д.


07.03.2026 17:10
910

OpenAI представила GPT-5.4. В нем контекстное окно увеличили до миллиона токенов

OpenAI представила новую языковую модель GPT-5.4. Разработчики продолжают развивать линейку систем искусственного интеллекта, уделяя больше внимания решению сложных задач, программированию и работе с различными инструментами...

06.03.2026 12:05
2.7k+

В GPT-5.4 появится режим экстремального рассуждения

В модели GPT-5.4 может появиться специальный режим обработки сложных запросов. Об этом сообщает издание The Information. По данным источника, в таком режиме модель будет использовать больше времени и вычислительных ресурсов для решения задач, требующих сложной логики и детального анализа...

27.02.2026 21:33
8.4k+

Новая модель Nano Banana 2 от Google получила поддержку 4K и все знания Gemini

Американская компания Google презентовала нейросеть Nano Banana 2. Разработчики называют ее «новейшей, передовой моделью обработки изображений», сообщают «Ведомости». Технология будет внедрена во все сервисы корпорации...

21.02.2026 17:41
1.7k+

Gemini 3.1 Pro оказалась умнее конкурентов, и к тому же заметно дешевле

Google представила новую ИИ-модель Gemini 3.1 Pro, предназначенную для задач, где требуется сложное логическое рассуждение, а не короткий ответ. Модель способна писать приложения, проводить исследования и даже создавать анимации...