ИИ-гонка разгорается: Alibaba заявила о превосходстве своей модели над DeepSeek-V3 и GPT-4o

  • вчера 16:18
  • 1.7k+

Китайская технологическая компания Alibaba представила новую версию своей модели искусственного интеллекта Qwen 2.5. Разработчик особо подчеркивает, что она по многим параметрам превосходит DeepSeek-V3, GPT-4o и другие популярные аналоги, пишет Reuters.

О запуске Qwen 2.5-Max объявили в не типичное для этого время — первый день Нового года по лунному календарю, когда большинство китайцев не работают и проводят время с семьями. По мнению источника, это говорит о том, что стремительный взлет небольшого китайского ИИ-стартапа DeepSeek за последние три недели заставил всполошиться не только зарубежных, но и внутренних конкурентов.

«Qwen 2.5-Max превосходит практически по всем показателям GPT-4o, DeepSeek-V3 и Llama-3.1-405B», — сообщило облачное подразделение Alibaba в своем официальном аккаунте в WeChat, ссылаясь также на наиболее продвинутые модели ИИ от OpenAI и Meta.

Qwen2.5-Max построена на архитектуре Mixture-of-Experts (MoE) и обучена на массиве данных, превышающем 20 триллионов токенов. Разработчики подчёркивают, что инструмент показал «значительный прогресс в интеллектуальных возможностях» и уже доступен для использования. По их словам, новая версия модели отличается улучшенной производительностью и лучше справляется с задачами, требующими глубокого понимания контекста, таких как анализ текста, перевод и генерация контента.
Недавний выпуск DeepSeek своего ИИ-ассистента на основе модели DeepSeek-V3, а затем и модели R1, сильно повлиял на технологический мир и вызвал падение акций многих гигантов Кремниевой долины. Предположительно низкие затраты китайского стартапа на разработку и использование моделей заставили инвесторов усомниться в планах ведущих американских ИИ-компаний по расходованию огромных средств.
Успех DeepSeek подстегнул и других китайских разработчиков. Владелец TikTok, компания ByteDance, также обновила свою модель ИИ всего через два дня после выхода DeepSeek-R1.
ByteDance также утверждала, что ее модель превзошла o1 от OpenAI, поддерживаемой Microsoft, в эталонном тесте AIME, измеряющем, насколько хорошо модели ИИ понимают и реагируют на сложные инструкции. Это перекликается с заявлением DeepSeek о том, что ее модель R1 конкурирует с o1 от OpenAI по нескольким показателям производительности.


28.01.2025 23:56
2k+

DeepSeek бросил еще один вызов OpenAI, анонсировав конкурента DALL-E 3

Китайский стартап DeepSeek громко заявила о себе, выпустив бесплатный ИИ-чат-бот. Разработчики не собираются на этом останавливаться. Теперь компания анонсировала семейство мультимодальных моделей Janus Pro, чьи...

28.01.2025 14:38
3.3k+

Потребительские расходы на ИИ-приложения в 2024 году достигли $1 млрд

Расходы на приложения с искусственным интеллектом превысили $1 млрд в 2024 году, а общий интерес к таким сервисам продолжает расти. По данным Sensor Tower, рост популярности ИИ-приложений привел к увеличению общего...

28.01.2025 13:31
5.9k+

«Последний экзамен человечества»: создан тест, который не пройдёт ни один ИИ

Центр безопасности искусственного интеллекта (CAIS) совместно с компанией Scale AI представили тест под названием Humanity’s Last Exam («Последний экзамен человечества»). Он разработан для выявления возможностей...

26.01.2025 20:40
5.5k+

Huawei выпустила лимитированные версии Pura 70 Ultra в честь китайского Нового года

Компания Huawei выпустила специальные версии смартфона Pura 70 Ultra по случаю празднования китайского Нового года. Новинки получили названия Red Edition («Красная версия») и Black Edition («Черная версия»). Основное...