Google представила новую ИИ-модель Gemini 3.1 Pro, предназначенную для задач, где требуется сложное логическое рассуждение, а не короткий ответ. Модель способна писать приложения, проводить исследования и даже создавать анимации.
В примерах компании Gemini 3.1 Pro использовалась для создания анимированных SVG-файлов и трекера положения МКС в реальном времени. Модель самостоятельно написала код приложения, подобрала нужные API и сформировала карту. В большинстве тестов она превзошла Gemini 3 Pro, Claude Sonnet 4.6 и GPT-5.2.
В тесте ARC-AGI-2, который оценивает умение решать новые логические задачи, Gemini 3.1 Pro набрала 77,1%. Это вдвое выше результата Gemini 3 Pro. Разработчики могут протестировать модель в Google AI Studio. Обычным пользователям она доступна в приложениях Gemini и NotebookLM при подписке AI Pro или AI Ultra.
По данным Artificial Analysis, модель Gemini 3.1 Pro Preview заняла первое место в рейтинге Intelligence Index, который оценивает совокупные интеллектуальные возможности ИИ-моделей. Одновременно она показала более выгодное соотношение цены и результатов по сравнению с основными конкурентами.
Для прохождения всех тестов Intelligence Index модели Gemini потребовалось 56 млн токенов. Для сравнения, GPT-5.2 в версии xhigh, рассчитанной на максимальный уровень рассуждений, использовала 130 млн токенов, а Claude Opus 4.6 в режиме max — 58 млн. При близких показателях по объёму вычислений ключевым фактором стала стоимость.
Цена Gemini 3.1 Pro Preview составляет 2 доллара за миллион входных токенов и 12 долларов за миллион выходных. У Claude Opus 4.6 эти показатели равны 5 и 25 долларам, у GPT-5.2 — 1,75 и 14 долларов соответственно.
В результате полный набор тестов для Gemini обошелся в 892 доллара. Аналогичный прогон GPT-5.2 стоил бы 2304 доллара, а Claude Opus 4.6 — 2486 долларов.
Gemini 3.1 Pro оказалась умнее конкурентов, и к тому же заметно дешевле
- сегодня 17:41
- 291