ИИ-гонка разгорается: Alibaba заявила о превосходстве своей модели над DeepSeek-V3 и GPT-4o

  • 30.01.2025 16:18
  • 2.9k+

Китайская технологическая компания Alibaba представила новую версию своей модели искусственного интеллекта Qwen 2.5. Разработчик особо подчеркивает, что она по многим параметрам превосходит DeepSeek-V3, GPT-4o и другие популярные аналоги, пишет Reuters.

О запуске Qwen 2.5-Max объявили в не типичное для этого время — первый день Нового года по лунному календарю, когда большинство китайцев не работают и проводят время с семьями. По мнению источника, это говорит о том, что стремительный взлет небольшого китайского ИИ-стартапа DeepSeek за последние три недели заставил всполошиться не только зарубежных, но и внутренних конкурентов.

«Qwen 2.5-Max превосходит практически по всем показателям GPT-4o, DeepSeek-V3 и Llama-3.1-405B», — сообщило облачное подразделение Alibaba в своем официальном аккаунте в WeChat, ссылаясь также на наиболее продвинутые модели ИИ от OpenAI и Meta.

Qwen2.5-Max построена на архитектуре Mixture-of-Experts (MoE) и обучена на массиве данных, превышающем 20 триллионов токенов. Разработчики подчёркивают, что инструмент показал «значительный прогресс в интеллектуальных возможностях» и уже доступен для использования. По их словам, новая версия модели отличается улучшенной производительностью и лучше справляется с задачами, требующими глубокого понимания контекста, таких как анализ текста, перевод и генерация контента.
Недавний выпуск DeepSeek своего ИИ-ассистента на основе модели DeepSeek-V3, а затем и модели R1, сильно повлиял на технологический мир и вызвал падение акций многих гигантов Кремниевой долины. Предположительно низкие затраты китайского стартапа на разработку и использование моделей заставили инвесторов усомниться в планах ведущих американских ИИ-компаний по расходованию огромных средств.
Успех DeepSeek подстегнул и других китайских разработчиков. Владелец TikTok, компания ByteDance, также обновила свою модель ИИ всего через два дня после выхода DeepSeek-R1.
ByteDance также утверждала, что ее модель превзошла o1 от OpenAI, поддерживаемой Microsoft, в эталонном тесте AIME, измеряющем, насколько хорошо модели ИИ понимают и реагируют на сложные инструкции. Это перекликается с заявлением DeepSeek о том, что ее модель R1 конкурирует с o1 от OpenAI по нескольким показателям производительности.


вчера 21:15
2.5k+

OpenAI потратила $14 млн на рекламу в Супербоуле. Обучение ИИ DeepSeek стоило дешевле

OpenAI потратила огромные деньги на 60-секундную рекламу ChatGPT во время трансляции Супербоула – финала Национальной футбольной лиги США. The Verge пишет, что это первый случай, когда компания, занимающаяся искусственным...

11.02.2025 23:33
1.5k+

Christie's организует аукцион произведений искусства, созданных ИИ: художники против

Аукционный дом Christie's объявил о проведении аукциона произведений искусства, созданных с помощью искусственного интеллекта. Мероприятие под названием «Дополненный интеллект» станет первым в своем роде, посвященным...

11.02.2025 23:24
856

В браузер Microsoft Edge внедрили ИИ-защиту от программ-страшилок

Microsoft представила новый инструмент Scareware blocker для браузера Edge. Он предназначен для защиты пользователей от мошеннических программ. Технология буквально следит за тем, что происходит на экране для выявления...

11.02.2025 08:23
1.8k+

reCAPTCHA больше не отличает людей от ботов, но превратилась в инструмент сбора данных

Система Google reCAPTCHA, разработанная для защиты сайтов от автоматических атак, утратила свою эффективность и фактически потеряла свою основную функцию. Алгоритмы машинного обучения легко обходят её проверки...