OpenAI открыла сторонним разработчикам возможности для создания голосовых ИИ-приложений

  • 09.10.2024 23:22
  • 1.4k+

Компания OpenAI представила новые инструменты для сторонних разработчиков, упрощающие создание голосовых приложений на основе искусственного интеллекта (ИИ). Теперь разработчики могут использовать единый набор инструкций для создания голосовых решений, основанных на языковых моделях OpenAI, передает 3DNews.

Большую часть дохода OpenAI получает от предприятий, которые используют нейросети компании для создания собственных ИИ-приложений. Поэтому расширение возможностей по созданию таких продуктов является вполне оправданным шагом на фоне обостряющейся борьбы в сфере ИИ с такими компаниями, как Google.
Новый инструмент компании позволяет улучшить процесс создания голосовых помощников, включающий преобразование аудио в текст, обработку запросов и генерацию ответов с последующим преобразованием их в аудио.
OpenAI также представила возможности для тонкой настройки больших языковых моделей, что позволит улучшить качество ответов, генерируемых ИИ. Этот процесс может включать использование изображений для повышения точности понимания визуальной информации. Приложения, созданные с использованием этих инструментов, могут выполнять функции расширенного поиска по изображениям.
Кроме того, OpenAI предложила решения для обучения меньших моделей на основе более крупных, а также ввела механизм быстрого кэширования, который сократит затраты на разработку благодаря повторному использованию обработанных данных.
Все представленные инструменты уже тестируются с ограниченным кругом клиентов OpenAI.


27.08.2025 15:44
4.9k+

Китай строит первый в мире подводный дата-центр для искусственного интеллекта

В Китае ведется строительство первого в мире подводного центра обработки данных для искусственного интеллекта. Объект находится в 10 км от побережья Шанхая, а его питание будет обеспечивать близлежащая морская ветроэлектростанция, передает Live Science...

22.08.2025 08:10
1k+

Google добавила в Gemini инструмент для озвучивания документов

Разработчики Google внедрили в сервис «Google Документы» новую функцию, позволяющую преобразовывать текст в аудиоформат. Инструмент работает на базе модели искусственного интеллекта Gemini. Опция «Аудио» появилась в меню «Инструменты» в верхней части рабочего пространства...

21.08.2025 16:21
1.7k+

Первый в космосе ИИ-ассистент: Китай вывел на орбиту систему «Укун»

Китайские астронавты на станции «Тяньгун» получили первого ИИ-помощника. Система под названием «Укун», созданная на базе отечественной открытой модели, была доставлена на станцию грузовым кораблем «Тяньчжоу-9» вместе с новыми скафандрами, фруктами и другими запасами...

18.08.2025 09:58
3.1k+

OpenAI вступает в территорию Neuralink. Компания инвестирует в создание мозговых чипов

Американская компания OpenAI и её соучредитель Сэм Альтман собираются инвестировать в стартап Merge Labs, который разрабатывает интерфейсы для мозговых имплантов. Об этом сообщила Financial Times со ссылкой на три анонимных источника...