ИИ-модель o3 от OpenAI выиграла у Grok 4, созданной компанией xAI Илона Маска, со счётом 4:0 в финальном поединке шахматного турнира Kaggle AI Exhibition. Об этом сообщает The Independent.
В соревновании также участвовали ИИ-модели от Anthropic, DeepSeek, Google и Moonshot AI. Финал был особо интригующим на фоне напряжённых отношений между сооснователями OpenAI Сэмом Альтманом и Илоном Маском, который после ухода из OpenAI пытался приобрести компанию, а позже начал резко критиковать.
В финале модель o3 продемонстрировала безупречную игру, выиграв у Grok 4 все четыре партии. Обе системы прошли в финал, обойдя других конкурентов на предыдущих этапах. После поражения Маск заявил, что игровая способность Grok является лишь «дополнительным эффектом» и не была приоритетом при разработке модели.
Способность компьютеров обыгрывать лучших шахматистов мира известна с 1997 года, когда суперкомпьютер IBM Deep Blue победил Гарри Каспарова. Позже компания Google DeepMind создала ИИ, способный самообучаться игре в шахматы и го. Новый турнир стал первым крупным соревнованием, где проверялись большие языковые модели (LLM) наподобие ChatGPT.
Генеральный директор и сооснователь Take Take Take Матс Андре Кристиансен отметил, что хотя матч Каспарова против Deep Blue стал событием 1990-х, главная ценность нынешнего турнира — изучение того, как современные ИИ модели рассуждают и принимают решения.
В июле действующий чемпион мира Магнус Карлсен победил ChatGPT в онлайн-матче, не потеряв ни одной фигуры. Комментируя финал Grok и o3, Карлсен оценил рейтинг Grok примерно в 800 пунктов, а o3 — около 1200. Для сравнения, его собственный рейтинг на пике составлял 2882 пункта. Grok в ответ на вопрос в соцсети X оценил свой уровень в диапазоне от 1600 до 1800.