OpenAI представила GPT-4o. Он «может работать с голосом, текстом и зрением»

  • 15.05.2024 07:07
  • 2.7k+

Компания OpenAI представила новую версию языковой модели с генеративным искусственным интеллектом GPT-4o. Новая, более продвинутая версия модели способна работать с речью, текстом и видео. На это и отсылает буква «o» в названии — сокращение от «omni» (лат. «всесторонний»), сообщает TechCrunch со ссылкой на сайт компании.

GPT-4o реагирует на аудиозапросы в среднем за 320 миллисекунд, что сопоставимо со временем реакции человека в разговоре.

«GPT-4o может работать с голосом, текстом и зрением. И это невероятно важно, потому что мы смотрим на будущее взаимодействия между нами и машинами», — заявила технический директор OpenAI Мира Мурати во время презентации в офисе OpenAI в Сан-Франциско 13 мая.

По производительности новая модель соответствует GPT-4 Turbo, но при этом «особенно хорошо справляется с изображением и пониманием звука», подчеркивают в OpenAI.
GPT-4o свободно владеет 50 языками и доступна для пользователей с 13 мая. Пока что голосовые функции модели будут доступны лишь «небольшой группе доверенных партнеров», но уже в июне ими смогут воспользоваться платные подписчики.


11.01.2026 13:19
2.3k+

Samsung создала холодильник с ИИ: он анализирует продукты и предлагает по ним рецепты

Samsung, среди прочего, принесла на выставку CES 2026 в Лас-Вегас обновленную линейку холодильников Bespoke AI Refrigerator Family Hub. Новинки оснащены модулем на базе большой языковой модели Google Gemini. Интеграция ИИ позволяет усовершенствовать систему AI Vision для точной идентификации содержимого полок...

11.01.2026 12:00
2.1k+

Gemini для Google TV позволит управлять телевизором через голосовые команды

Телевизор постепенно перестает быть просто экраном для просмотра кино или шоу, превращаясь в полноценного собеседника. С новым обновлением Gemini для Google TV взаимодействие с техникой становится похожим на обычный разговор...

25.12.2025 12:15
2.7k+

ИИ ускорил моделирование термоядерной плазмы с нескольких дней до секунд

Учёные представили инструмент на основе искусственного интеллекта, способный в тысячи раз ускорить моделирование термоядерной плазмы. Система GyroSwin разработана специалистами Управления по атомной энергии Великобритании (UKAEA), Университета Иоганна Кеплера в Линце и компании Emmi AI...

24.12.2025 14:38
3.5k+

Sony разработала ИИ для автоматической фильтрации контента в видеоиграх

Компания Sony запатентовала модель искусственного интеллекта, предназначенную для фильтрации аудиовизуального контента в видеоиграх и других медиафайлах. Технология обеспечивает автоматическое редактирование и адаптацию материалов в соответствии с личными предпочтениями пользователя и его чувствительностью к определенным сценам...