ИИ-гонка разгорается: Alibaba заявила о превосходстве своей модели над DeepSeek-V3 и GPT-4o

30.01.2025 16:18
3.2k+

Китайская технологическая компания Alibaba представила новую версию своей модели искусственного интеллекта Qwen 2.5. Разработчик особо подчеркивает, что она по многим параметрам превосходит DeepSeek-V3, GPT-4o и другие популярные аналоги, пишет Reuters.

О запуске Qwen 2.5-Max объявили в не типичное для этого время — первый день Нового года по лунному календарю, когда большинство китайцев не работают и проводят время с семьями. По мнению источника, это говорит о том, что стремительный взлет небольшого китайского ИИ-стартапа DeepSeek за последние три недели заставил всполошиться не только зарубежных, но и внутренних конкурентов.

«Qwen 2.5-Max превосходит практически по всем показателям GPT-4o, DeepSeek-V3 и Llama-3.1-405B», — сообщило облачное подразделение Alibaba в своем официальном аккаунте в WeChat, ссылаясь также на наиболее продвинутые модели ИИ от OpenAI и Meta.

Qwen2.5-Max построена на архитектуре Mixture-of-Experts (MoE) и обучена на массиве данных, превышающем 20 триллионов токенов. Разработчики подчёркивают, что инструмент показал «значительный прогресс в интеллектуальных возможностях» и уже доступен для использования. По их словам, новая версия модели отличается улучшенной производительностью и лучше справляется с задачами, требующими глубокого понимания контекста, таких как анализ текста, перевод и генерация контента.
Недавний выпуск DeepSeek своего ИИ-ассистента на основе модели DeepSeek-V3, а затем и модели R1, сильно повлиял на технологический мир и вызвал падение акций многих гигантов Кремниевой долины. Предположительно низкие затраты китайского стартапа на разработку и использование моделей заставили инвесторов усомниться в планах ведущих американских ИИ-компаний по расходованию огромных средств.
Успех DeepSeek подстегнул и других китайских разработчиков. Владелец TikTok, компания ByteDance, также обновила свою модель ИИ всего через два дня после выхода DeepSeek-R1.
ByteDance также утверждала, что ее модель превзошла o1 от OpenAI, поддерживаемой Microsoft, в эталонном тесте AIME, измеряющем, насколько хорошо модели ИИ понимают и реагируют на сложные инструкции. Это перекликается с заявлением DeepSeek о том, что ее модель R1 конкурирует с o1 от OpenAI по нескольким показателям производительности.