В последний день рождественской акции Shipmas – 12-дневного марафона анонсов компания OpenAI представила новые ИИ-модели o3 и o3-mini.
По словам разработчиков, «рассуждающая» модель показала высокие результаты на тестах, сравнивающих возможности ИИ с интеллектом человека. На ARC-AGI она набрала 88 %, более чем втрое превзойдя свою предшественницу – o1, которая была запущена в сентябре этого года.
Новинку решили назвать o3, чтобы избежать путаницы (или конфликтов товарных знаков) с британской телекоммуникационной компанией O2.
Модель o3 на 22,8 % быстрее пишет код и демонстрирует выдающиеся результаты в математике, успешно решив почти все задачи теста AIME 2024.
Стоит подчеркнуть, что о выпуске нейросети пока речи не идет. Обучение моделей все ещё продолжается, а точные сроки их релиза не определены.
«Рассуждающими» такие модели называют из-за способности разбивать сложные задачи на этапы и объяснять свои решения. Однако этот процесс может незначительно увеличить время ответа, отмечают в OpenAI.
Кроме того, технология требует больших вычислительных мощностей, что делает ее использование дорогим. Поэтому OpenAI продолжает принимать заявки от исследователей на тестирование, чтобы доработать модели перед запуском.