Китайский техгигант Alibaba выпустил новое семейство ИИ-моделей Qwen3, которые «способны сравниться или превзойти в некоторых случаях» лучшие решения от Google и OpenAI.
Их размер варьируется от 600 млн до 235 млрд параметров. Модели являются «гибридными» — они способны как затрачивать больше времени для рассуждений, так и предоставлять быстрые ответы.
«Мы органично объединили режимы мышления и немышления, предоставив пользователям гибкость […]. Такая конструкция позволяет с большей легкостью настраивать бюджеты для конкретных задач», - отметила команда в блоге.
Qwen3 поддерживает 119 языков и обучена на наборе данных, содержащем более 36 трлн токенов.
На платформе по оценке навыков программирования Qwen-3-235B-A22B обошла o3-mini и Gemini 2.5 Pro. o3-mini она опередила в последней версии математического теста AIME и BFCL — оценивает способность «рассуждать» о проблемах.
Qwen-3-235B-A22B пока нет в публичном доступе. Qwen3-32B является крупнейшей среди открытых. Она превосходит o1 в нескольких тестах, включая бенчмарк программирования LiveCodeBench.
В марте Alibaba представила ориентированную на рассуждения ИИ-модель QwQ-32.