OpenAI представила GPT-4o. Он «может работать с голосом, текстом и зрением»

  • 15.05.2024 07:07
  • 2.7k+

Компания OpenAI представила новую версию языковой модели с генеративным искусственным интеллектом GPT-4o. Новая, более продвинутая версия модели способна работать с речью, текстом и видео. На это и отсылает буква «o» в названии — сокращение от «omni» (лат. «всесторонний»), сообщает TechCrunch со ссылкой на сайт компании.

GPT-4o реагирует на аудиозапросы в среднем за 320 миллисекунд, что сопоставимо со временем реакции человека в разговоре.

«GPT-4o может работать с голосом, текстом и зрением. И это невероятно важно, потому что мы смотрим на будущее взаимодействия между нами и машинами», — заявила технический директор OpenAI Мира Мурати во время презентации в офисе OpenAI в Сан-Франциско 13 мая.

По производительности новая модель соответствует GPT-4 Turbo, но при этом «особенно хорошо справляется с изображением и пониманием звука», подчеркивают в OpenAI.
GPT-4o свободно владеет 50 языками и доступна для пользователей с 13 мая. Пока что голосовые функции модели будут доступны лишь «небольшой группе доверенных партнеров», но уже в июне ими смогут воспользоваться платные подписчики.


11.03.2026 19:57
2.3k+

ChatGPT научился распознавать музыку благодаря интеграции Shazam

OpenAI добавила в ChatGPT функцию распознавания музыки на основе технологии Shazam. Теперь пользователи могут определять звучащие рядом песни прямо в чат-боте, не переключаясь между приложениями. Интеграция стала продолжением сотрудничества OpenAI и Apple...

10.03.2026 11:56
1.8k+

Samsung готовит очки с камерой и ИИ, которые будут знать, на что смотрит пользователь

Компания Samsung разрабатывает умные очки со встроенной камерой и системой искусственного интеллекта. О планах создания устройства рассказал вице-президент мобильного подразделения компании Джей Ким в интервью CNBC на выставке MWC 2026 в Барселоне...

09.03.2026 00:22
3.2k+

xAI Илона Маска планирует вложить $659 млн в расширение суперкомпьютера Colossus 2

xAI Илона Маска планирует инвестировать 659 миллионов долларов в строительство нового здания рядом со своим центром обработки данных недалеко от Мемфиса, штат Теннесси. Компания подала заявку на разрешение построить объект площадью 28 985 квадратных метров по адресу 5414 Tulane Road...

06.03.2026 18:24
777

Microsoft объявила даты проведения конференции Build 2026

Microsoft объявила даты ежегодной конференции Build 2026. Мероприятие пройдет со 2 по 3 июня в Сан-Франциско, а ключевые сессии можно будет бесплатно посмотреть онлайн. Стоимость билета для очного участия составляет 1099 долларов...