OpenAI представила GPT-4o. Он «может работать с голосом, текстом и зрением»

  • 15.05.2024 07:07
  • 2.8k+

Компания OpenAI представила новую версию языковой модели с генеративным искусственным интеллектом GPT-4o. Новая, более продвинутая версия модели способна работать с речью, текстом и видео. На это и отсылает буква «o» в названии — сокращение от «omni» (лат. «всесторонний»), сообщает TechCrunch со ссылкой на сайт компании.

GPT-4o реагирует на аудиозапросы в среднем за 320 миллисекунд, что сопоставимо со временем реакции человека в разговоре.

«GPT-4o может работать с голосом, текстом и зрением. И это невероятно важно, потому что мы смотрим на будущее взаимодействия между нами и машинами», — заявила технический директор OpenAI Мира Мурати во время презентации в офисе OpenAI в Сан-Франциско 13 мая.

По производительности новая модель соответствует GPT-4 Turbo, но при этом «особенно хорошо справляется с изображением и пониманием звука», подчеркивают в OpenAI.
GPT-4o свободно владеет 50 языками и доступна для пользователей с 13 мая. Пока что голосовые функции модели будут доступны лишь «небольшой группе доверенных партнеров», но уже в июне ими смогут воспользоваться платные подписчики.


16.05.2026 11:07
2.5k+

Теперь свой ИИ есть даже у рыбок: новый аквариум узнаёт их и кормит

Компания Dangbei представила умный аквариум Smart Fish Tank 2S Ultra, который автоматически ухаживает за рыбами с помощью искусственного интеллекта....

16.05.2026 07:49
1.3k+

В Сеуле открылся парк с шоу роботов и ИИ-аттракционами

В Сеуле начал работу парк развлечений Galaxy Robot Park, где посетителям предлагают шоу человекоподобных роботов, K-pop-постановки и интерактивные ИИ-аттракционы для детей и семей....

15.05.2026 11:35
3.1k+

В сеть слили изображения умных очков Samsung Galaxy Glasses

В сети появились качественные рендеры умных очков Samsung Galaxy Glasses. Судя по изображениям, опубликованным Android Headlines, устройство по внешнему виду напоминает классические очки Ray-Ban, но оснащено......

12.05.2026 15:04
1.5k+

Hisense выпустила аудиоочки G11 с поддержкой ИИ и синхронным переводом речи

Hisense официально представила умные очки G11, ключевой особенностью которых стала встроенная языковая модель для перевода диалогов и интерпретации речи в режиме реального времени....