Китайская технологическая компания Alibaba в среду представила новую версию своей ИИ-модели Qwen 2.5, которая, по ее утверждениям, превосходит высоко оцениваемую DeepSeek-V3. Об этом сообщает Reuters.
Необычное время выпуска Qwen 2.5-Max в первый день Китайского Нового года, когда большинство людей в Китае находятся на отдыхе с семьями, свидетельствует о давлении, которое стремительный взлет китайского стартапа DeepSeek за последние три недели создал не только для международных конкурентов, но и для местных.
"Qwen 2.5-Max превосходит почти по всем параметрам GPT-4o, DeepSeek-V3 и Llama-3.1-405B," - отметила облачная платформа Alibaba в объявлении на своем официальном аккаунте в WeChat, имея в виду новейшие открытые модели ИИ от OpenAI и Meta.
Выпуск 10 января ИИ-ассистента DeepSeek, работающего на модели DeepSeek-V3, а также 20 января модели R1 шокировал Кремниевую долину и вызвал падение технологических акций.
Низкая, по заявлениям компании, стоимость разработки и использования моделей DeepSeek заставила инвесторов усомниться в масштабных затратах ведущих ИИ-компаний США.
Однако успех DeepSeek также подтолкнул китайских конкурентов к обновлению собственных AI-моделей.
Через два дня после выпуска DeepSeek-R1 компания ByteDance, владелец TikTok, представила обновление своей флагманской AI-модели, которая, по ее утверждению, превосходит модель OpenAI o1 в тесте AIME, измеряющем способность моделей ИИ понимать и отвечать на сложные инструкции.
Это отражает заявления DeepSeek о том, что ее модель R1 конкурирует с OpenAI o1 по нескольким показателям производительности.