Китайский стартап DeepSeek громко заявила о себе, выпустив бесплатный ИИ-чат-бот. Разработчики не собираются на этом останавливаться.
Теперь компания анонсировала семейство мультимодальных моделей Janus Pro, чьи алгоритмы способны генерировать и анализировать изображения лучше, чем OpenAI DALL-E 3, PixArt-alpha и Stable Diffusion XL.
По данным TechCrunch, флагманская версия Janus Pro 7B с 7 млрд параметров уже продемонстрировала лучшие результаты в бенчмарках GenEval и DPG-Bench.
«Janus Pro превосходит предыдущие универсальные модели и сопоставима, и даже превосходит узкоспециализированные решения других компаний», — заявили в DeepSeek.
Модель доступна под лицензией MIT, что позволяет свободно использовать её в коммерческих проектах.
Архитектура Janus Pro объединяет генерацию и анализ изображений, но пока ограничена разрешением 384 × 384 пикселей — гораздо ниже, чем у DALL-E 3. Однако, как отмечают эксперты, для компактных моделей это «впечатляющий результат».
Успех DeepSeek привлёк внимание после того, как её чат-бот возглавил рейтинги App Store. Стартап, финансируемый High-Flyer Capital Management, использует энергоэффективные методы обучения. Это, по мнению аналитиков, ставит под вопрос лидерство США в ИИ-гонке и долгосрочный спрос на специализированные чипы.