OpenAI представила GPT-4o. Он «может работать с голосом, текстом и зрением»

  • 15.05.2024 07:07
  • 2252
OpenAI представила GPT-4o. Он «может работать с голосом, текстом и зрением»

Компания OpenAI представила новую версию языковой модели с генеративным искусственным интеллектом GPT-4o. Новая, более продвинутая версия модели способна работать с речью, текстом и видео. На это и отсылает буква «o» в названии — сокращение от «omni» (лат. «всесторонний»), сообщает TechCrunch со ссылкой на сайт компании.

GPT-4o реагирует на аудиозапросы в среднем за 320 миллисекунд, что сопоставимо со временем реакции человека в разговоре.

«GPT-4o может работать с голосом, текстом и зрением. И это невероятно важно, потому что мы смотрим на будущее взаимодействия между нами и машинами», — заявила технический директор OpenAI Мира Мурати во время презентации в офисе OpenAI в Сан-Франциско 13 мая.

По производительности новая модель соответствует GPT-4 Turbo, но при этом «особенно хорошо справляется с изображением и пониманием звука», подчеркивают в OpenAI.
GPT-4o свободно владеет 50 языками и доступна для пользователей с 13 мая. Пока что голосовые функции модели будут доступны лишь «небольшой группе доверенных партнеров», но уже в июне ими смогут воспользоваться платные подписчики.


29.04.2024 22:12
9608

Новый инструмент от Adobe делает размытое видео четким, увеличивая качество до 8 раз

Команда инженеров по видео и искусственному интеллекту из Adobe Research разработала инструмент под названием VideoGigaGAN. Это приложение с искусственным интеллектом, способное преображать размытые видео в изображения...

03.04.2024 12:39
1776

OpenAI представила Voice Engine – инструмент для клонирования голоса

OpenAI объявил о запуске Voice Engine – инструмента, который позволяет генерировать реалистичные голоса, имитирующие речь любого человека. Для клонирования голоса технологии достаточно 15-секундного аудиосэмпла...

15.03.2024 16:10
3274

Угроза профессии программиста? Представлен ИИ, способный самостоятельно осуществлять полный цикл разработки ПО

Американская компания Cognition представила нейросеть Devin, способную выполнить все работы инженера-программиста самостоятельно. Искусственный интеллект не просто помогает программистам писать код, но также способен...

04.02.2024 23:56
7249

ИИ выучил язык через глаза и уши младенца

Команда исследователей Нью-Йоркского университета провела необычный эксперимент, обучив мультимодальную систему искусственного интеллекта (ИИ) через глаза и уши младенца. В ходе опыта были использованы видеозаписи...