Посмотрите, как новая нейросеть OmniHuman-1 «оживляет» фотографии

  • 07.02.2025 13:45
  • 4.6k+

Китайская компания ByteDance, владеющая видеоплатформой TikTok, разработала новую систему искусственного интеллекта OmniHuman-1. Она способна преобразовать фотографии в максимально реалистичные видеоролики реалистичные видеоролики с естественными движениями.

В отличие от предыдущих моделей, которые приводили в движение только лицо или верхнюю часть тела, OmniHuman-1 создает видео в полный рост, синхронизируя жесты и движения с речью.
В ByteDance рассказали, что разработка основана на обучении нейросети на 18 700 часах реально отснятых людьми видеоданных. Новый метод объединяет различные входные данные — текст, аудио и движения тела, что позволяет существенно расширить возможности генерации видео.
Исследовательская группа отмечает, что такой подход снижает потери данных и повышает качество результата.
В ходе тестирования OmniHuman-1 показала превосходство над существующими системами по ряду параметров. Примеры работы нейросети можно найти по этой ссылке.


10.03.2025 08:09
1.3k+

Представлена умная ручка с ChatGPT и функцией перевода

Инженер Закван Ахмад представил на Kickstarter умную ручку The One Smart AI Pen. Устройство оснащено аккумулятором, микрофоном и Bluetooth 5.2. Гаджет поддерживает перевод, голосовые команды и напоминания, а также...

26.02.2025 13:57
5.3k+

Норвегия создает мягкого домашнего робота-помощника

Компания 1X из Норвегии представила робота по имени Neo Gamma – новую модель, предназначенную для помощи в домашних делах. Он пришел на смену модели Neo Beta. Главная особенность роботов 1X состоит в их безопасности...

21.01.2025 13:44
1.9k+

В телевизорах Samsung появится синхронный ИИ-переводчик и другие умные функции

Samsung представила новые линейки телевизоров QD-OLED, Neo QLED, The Frame и The Frame Pro. Вместе с тем, компания анонсировала умную систему Samsung Vision AI - набор функций на основе искусственного интеллекта...

14.01.2025 17:10
2.9k+

Lenovo показала на CES 2025 наушники с ИИ-функцией перевода: они клонируют голос

На выставке CES 2025 в Лас-Вегасе Lenovo представила прототип наушников с искусственным интеллектом. Они способны выполнять перевод в реальном времени и анализировать здоровье пользователей, сообщает TechRadar...