Alibaba avait précédemment dévoilé son modèle d'inférence phare le plus puissant à ce jour."Qwen3-Max-Pensée"Ce monstre, avec des paramètres dépassant les billions, prétend non seulement avoir vaincu GPT-5.2-Thinking d'OpenAI et Google Gemini 3 Pro dans de multiples évaluations faisant autorité, mais aussi avoir obtenu le meilleur score mondial à l'évaluation HLE, considérée comme « le dernier test pour l'humanité ».
Le score d'évaluation de HLE était supérieur de 10 points, sa capacité de raisonnement étant son point fort.
Le principal atout de Qwen3-Max-Thinking réside dans ses puissantes capacités de raisonnement profond. Selon les données publiées par Alibaba, le modèle utilise jusqu'à 36 téraoctets de données pré-entraînées et obtient d'excellents résultats sur 19 tests de référence reconnus.
Plus particulièrement, lors du test de performance HLE, Qwen3-Max-Thinking a obtenu un score élevé de 58.3, surpassant largement GPT-5.2-Thinking (45.5) et Gemini 3 Pro (45.8). Dans le domaine des tests de performance en IA, un écart de plus de 10 points est généralement considéré comme une avance considérable, témoignant de sa capacité à résoudre des tâches mathématiques, logiques et à étapes multiples complexes.
Le mécanisme exclusif d'« extraction d'expérience » rend l'IA de plus en plus intelligente.
Pourquoi est-il si puissant ? Son secret réside dans le nouveau mécanisme de « mise à l'échelle en temps de test » d'Alibaba.
Contrairement aux méthodes traditionnelles qui se contentent d'augmenter le nombre de chemins de raisonnement (force brute), Qwen3-Max-Thinking intègre une technologie d'« extraction d'expérience ». Elle identifie et supprime les chemins logiques redondants, concentrant ainsi la puissance de calcul sur les branches de réflexion les plus pertinentes, ce qui améliore considérablement l'efficacité du raisonnement et réduit les coûts des applications d'entreprise.
De plus, pour les applications d'agents d'IA, le nouveau modèle améliore la capacité à appeler des outils de manière autonome, non plus seulement par le biais d'une simple interaction dialogique, mais peut déterminer de manière proactive quand effectuer une recherche en ligne, quand écrire du code ou consulter des bases de connaissances, réduisant considérablement le problème de « l'illusion » du modèle.
Dépassant Llama pour devenir le nouveau leader mondial de l'open source
Au-delà de ses avancées technologiques, les performances de Qwen au sein de l'écosystème open source sont également remarquables. Selon les données de Hugging Face, le nombre de modèles dérivés basés sur Qwen a dépassé les 20 10, avec un volume cumulé de téléchargements de plus d'un milliard et un volume quotidien moyen de 110 million de téléchargements. Qwen a ainsi surpassé la série Llama de Meta pour devenir la base de modèles open source de référence pour les développeurs du monde entier.
Actuellement, les développeurs peuvent tester gratuitement Qwen3-Max-Thinking sur QwenChat, tandis que les utilisateurs professionnels peuvent appeler l'API via la plateforme Bailian d'Alibaba Cloud.
Analyse des points de vue
L'émergence de la pensée Qwen3-Max prouve que la Chine a la capacité de se tenir à égalité avec, voire de surpasser, les géants de la Silicon Valley dans le domaine des « modèles de raisonnement ».
L'application de la technologie de « mise à l'échelle lors des tests » mérite une attention particulière. Auparavant, nous pensions que les capacités de l'IA dépendaient principalement de l'ampleur du « pré-entraînement », mais désormais, le champ de bataille se situe au niveau de l'efficacité de calcul lors de la « phase d'inférence ».
Alibaba améliore l'efficacité grâce à une pensée optimisée, ce qui est crucial pour la mise en œuvre commerciale car les entreprises ont besoin d'une IA à la fois intelligente et peu coûteuse, et non de produits expérimentaux qui ne font que gaspiller de l'argent.
D'un autre côté, la position dominante de Qwen au sein de la communauté open source constitue un atout considérable pour Alibaba. À mesure que des millions de développeurs à travers le monde s'habituent à utiliser l'architecture Qwen pour développer des applications, cela stimulera la croissance de l'infrastructure d'Alibaba Cloud. À l'instar d'Android à ses débuts, celui qui contrôle l'écosystème des développeurs contrôle le discours à l'ère de l'IA.




