OpenAI анонсировала Deep Research — особый режим для ChatGPT, позволяющий искусственному интеллекту самостоятельно проводить глубокие исследования.
Теперь ИИ способен самостоятельно разрабатывать план работы, искать информацию в интернете, агрегировать и анализировать данные с использованием Python-скриптов, полностью без участия человека.
Этот шаг знаменует значительный прогресс в автономности ИИ. Ранее «думающие» модели OpenAI могли вести длинные цепочки рассуждений, но не обладали такой активной способностью использовать различные инструменты для сбора и обработки информации.
В тестах на Humanity Last Exam Deep Research показал впечатляющие результаты, однако использование инструментов, таких как браузер и Python, вызывает вопросы о методологии. В бенчмарке GAIA, ориентированном на реалистичные задачи, Deep Research достиг 58% на уровне 3, что значительно выше предыдущих рекордов.
Внутренние тесты OpenAI показали, что более быстрые исследования часто приводят к более качественным результатам, особенно при простых запросах. На качество работы также влияет количество обращений к браузеру и Python: до 20 обращений результат практически нулевой. Но потом качество результата растет практически линейно с ростом количества обращений. После 60 обращений качество стабилизируется, модель уже достаточно прошерстила весь интернет, и всю легкодостижимую информацию, поэтому дальше от количества запросов рост качества совсем незначителен.
С запуском Deep Research OpenAI делает значительный шаг в развитии автономных ИИ-агентов, что может существенно повлиять на различные отрасли и повседневную жизнь.