OpenAI открыла сторонним разработчикам возможности для создания голосовых ИИ-приложений

  • 09.10.2024 23:22
  • 1.4k+

Компания OpenAI представила новые инструменты для сторонних разработчиков, упрощающие создание голосовых приложений на основе искусственного интеллекта (ИИ). Теперь разработчики могут использовать единый набор инструкций для создания голосовых решений, основанных на языковых моделях OpenAI, передает 3DNews.

Большую часть дохода OpenAI получает от предприятий, которые используют нейросети компании для создания собственных ИИ-приложений. Поэтому расширение возможностей по созданию таких продуктов является вполне оправданным шагом на фоне обостряющейся борьбы в сфере ИИ с такими компаниями, как Google.
Новый инструмент компании позволяет улучшить процесс создания голосовых помощников, включающий преобразование аудио в текст, обработку запросов и генерацию ответов с последующим преобразованием их в аудио.
OpenAI также представила возможности для тонкой настройки больших языковых моделей, что позволит улучшить качество ответов, генерируемых ИИ. Этот процесс может включать использование изображений для повышения точности понимания визуальной информации. Приложения, созданные с использованием этих инструментов, могут выполнять функции расширенного поиска по изображениям.
Кроме того, OpenAI предложила решения для обучения меньших моделей на основе более крупных, а также ввела механизм быстрого кэширования, который сократит затраты на разработку благодаря повторному использованию обработанных данных.
Все представленные инструменты уже тестируются с ограниченным кругом клиентов OpenAI.


27.02.2026 21:33
7.5k+

Новая модель Nano Banana 2 от Google получила поддержку 4K и все знания Gemini

Американская компания Google презентовала нейросеть Nano Banana 2. Разработчики называют ее «новейшей, передовой моделью обработки изображений», сообщают «Ведомости». Технология будет внедрена во все сервисы корпорации...

21.02.2026 17:41
1.6k+

Gemini 3.1 Pro оказалась умнее конкурентов, и к тому же заметно дешевле

Google представила новую ИИ-модель Gemini 3.1 Pro, предназначенную для задач, где требуется сложное логическое рассуждение, а не короткий ответ. Модель способна писать приложения, проводить исследования и даже создавать анимации...

21.02.2026 14:09
1k+

Google изменила интерфейс ИИ-поиска после жалоб издателей

Google внесла изменения в отображение гиперссылок в разделах «Обзор от ИИ» (AI Overviews) и «Режиме ИИ» на базе Gemini, сообщает вице-президент по продукту Google Search Робби Стейн. Решение принято на фоне критики со стороны владельцев сайтов, фиксирующих падение поискового трафика...

19.02.2026 20:07
1.4k+

OpenAI внедрила в ChatGPT «режим блокировки» и пометку «повышенный риск»

Компания OpenAI объявила о запуске новых функций безопасности для продуктов на базе искусственного интеллекта — «режима блокировки» (Lockdown Mode) и маркировки «повышенный риск» (Elevated Risk). Нововведения затрагивают ChatGPT, ChatGPT Atlas и Codex...