Китайская лаборатория DeepSeek создала нейросеть R1, которая, по заявлениям разработчиков, превосходит модель o1 от американской OpenAI в ключевых тестах. Речь идет о тестах AIME, MATH-500 и SWE-bench Verified, которые измеряют умение решать математические задачи, писать код и общую производительность, сообщает издание TechCrunch.
Особенность R1 состоит в способности к самопроверке, что позволяет уменьшить количество ошибок. Но из-за этого ответы нейросети могут занимать от нескольких секунд до нескольких минут. Подобный подход делает модель более надежной в сложных областях, таких как наука и математика.
R1 содержит 671 миллиард параметров и является одной из крупнейших моделей ИИ. Для разных нужд созданы также упрощенные версии с параметрами от 1,5 до 70 миллиардов. Самая маленькая версия может работать на ноутбуке, а для полной требуется более мощное оборудование.
При этом доступ к R1 через API значительно дешевле, чем у американского конкурента.
R1 имеет также свои нюансы: разработанная в Китае, она проходит проверку на соответствие «основным социалистическим ценностям». Поэтому модель не будет отвечать на вопросы о политически чувствительных для Китая темах.