ИИ-гонка разгорается: Alibaba заявила о превосходстве своей модели над DeepSeek-V3 и GPT-4o

  • 30.01.2025 16:18
  • 3k+

Китайская технологическая компания Alibaba представила новую версию своей модели искусственного интеллекта Qwen 2.5. Разработчик особо подчеркивает, что она по многим параметрам превосходит DeepSeek-V3, GPT-4o и другие популярные аналоги, пишет Reuters.

О запуске Qwen 2.5-Max объявили в не типичное для этого время — первый день Нового года по лунному календарю, когда большинство китайцев не работают и проводят время с семьями. По мнению источника, это говорит о том, что стремительный взлет небольшого китайского ИИ-стартапа DeepSeek за последние три недели заставил всполошиться не только зарубежных, но и внутренних конкурентов.

«Qwen 2.5-Max превосходит практически по всем показателям GPT-4o, DeepSeek-V3 и Llama-3.1-405B», — сообщило облачное подразделение Alibaba в своем официальном аккаунте в WeChat, ссылаясь также на наиболее продвинутые модели ИИ от OpenAI и Meta.

Qwen2.5-Max построена на архитектуре Mixture-of-Experts (MoE) и обучена на массиве данных, превышающем 20 триллионов токенов. Разработчики подчёркивают, что инструмент показал «значительный прогресс в интеллектуальных возможностях» и уже доступен для использования. По их словам, новая версия модели отличается улучшенной производительностью и лучше справляется с задачами, требующими глубокого понимания контекста, таких как анализ текста, перевод и генерация контента.
Недавний выпуск DeepSeek своего ИИ-ассистента на основе модели DeepSeek-V3, а затем и модели R1, сильно повлиял на технологический мир и вызвал падение акций многих гигантов Кремниевой долины. Предположительно низкие затраты китайского стартапа на разработку и использование моделей заставили инвесторов усомниться в планах ведущих американских ИИ-компаний по расходованию огромных средств.
Успех DeepSeek подстегнул и других китайских разработчиков. Владелец TikTok, компания ByteDance, также обновила свою модель ИИ всего через два дня после выхода DeepSeek-R1.
ByteDance также утверждала, что ее модель превзошла o1 от OpenAI, поддерживаемой Microsoft, в эталонном тесте AIME, измеряющем, насколько хорошо модели ИИ понимают и реагируют на сложные инструкции. Это перекликается с заявлением DeepSeek о том, что ее модель R1 конкурирует с o1 от OpenAI по нескольким показателям производительности.


28.05.2025 20:26
2.8k+

Жители ОАЭ первыми получат бесплатный доступ к ChatGPT Plus

Жители Объединённых Арабских Эмиратов вскоре первыми в мире получат бесплатный доступ к ChatGPT Plus — платной версии чат-бота от OpenAI. Это часть масштабного партнёрского проекта между OpenAI и властями ОАЭ, пишет издание The Economic Times...

26.05.2025 17:07
3.2k+

Microsoft представила ИИ-модель Aurora для точных прогнозов погоды

Microsoft представила новую ИИ-модель Aurora, предназначенную для прогнозирования погоды. Исследование с результатами работы модели опубликовано в журнале Nature. В отличие от традиционных методов, основанных на физических уравнениях, Aurora обучалась исключительно на архивных данных...

25.05.2025 23:15
2.4k+

Сервис Flow от Google предлагает создавать фильмы без актеров и декораций

Google запустила новый ИИ-инструмент Flow, который преобразует текстовые подсказки в реалистичные фильмы. Сервис позволяет создавать кино без участия актеров, съемочных групп, декораций и традиционного производства...

24.05.2025 13:11
10k+

В Китае нашли мировой центр перепродажи украденных iPhone

Многие похищенные iPhone из разных стран мира в итоге оказываются в одном здании в китайском Шэньчжэне. Это по итогам расследования выяснили журналисты Financial Times. Речь идет о неброской башне Feiyang Times в районе Хуацянбэй...