Suite à son annonce de rejoindre l'écosystème NVIDIA NVLink Fusion, permettant une intégration plus étroite de ses processeurs Xeon aux systèmes de calcul accélérés par GPU NVIDIA, Intel a présenté un système de rack hybride IA personnalisé lors de l'OCP Summit 2025. Ce système utilise des GPU NVIDIA B200, des cartes réseau ConnectX-7 et des DPU BlueField-3, et intègre même la puce de commutation Tomahawk 5 51.2 Tbit/s de Broadcom.
Verrouillage « Inférence séparée », Gaudi 3 est responsable du décodage et B200 est responsable du pré-remplissage
Le système démontre une architecture appelée « inférence désagrégée », dont le concept de base est de déléguer différentes étapes des charges de travail d’inférence de l’IA au matériel le plus performant.
Dans cette architecture, Intel Gaudi 3 se concentre sur le « décodage », où il est conçu pour être avantageux, tandis que NVIDIA B200 gère le « pré-remplissage », où il affiche des performances exceptionnelles. Intel affirme que cette répartition claire des tâches améliore considérablement l'efficacité globale du système.
Intel vient de franchir une nouvelle étape dans son alliance avec NVIDIA en intégrant ses nouveaux systèmes rackables Gaudi3 à la carte NVIDIA B200 via une inférence PD désagrégée. Intel affirme avoir comparé sa base de référence B200 seule et son système d'inférence utilisant Gaudi3 pour le décodage… pic.twitter.com/jAKin6rgZx
— SemiAnalysis (@SemiAnalysis_) 18 octobre 2025
Le coût total de possession revendiqué a augmenté de 1.7 fois
En termes de spécifications spécifiques, ce rack informatique est équipé de 16 modules de rack, chacun contenant 2 processeurs Xeon, 4 puces Gaudi 3 AI, 4 cartes réseau ConnectX-7 400 GbE et 1 DPU NVIDIA BlueField-3.
Intel affirme que le TCO (coût total de possession) de ce système hybride peut être considérablement amélioré de 1.7 fois par rapport à un système qui utilise uniquement des GPU B200.
L'avenir de Gaudi reste un mystère
Cependant, Intel Gaudi 3 reste confronté au problème fondamental de la compatibilité avec le support logiciel. Par ailleurs, compte tenu de la restructuration interne actuelle d'Intel, il n'est pas encore certain que la gamme de produits Gaudi poursuive son développement.
D'autre part, NVIDIA devrait annoncer le successeur de son système d'accélération B200 au premier semestre de l'année prochaine, ce qui fait du système hybride proposé par Intel une véritable stratégie d'écoulement du stock de produits Gaudi. Cependant, cela illustre également la future feuille de route technologique d'accélération hybride XPU d'Intel. En particulier, la conception du système intègre la puce de commutation Tomahawk 5 51.2 Tbit/s de Broadcom, plutôt que d'adopter directement la conception de commutation Mellanox InfiniBand de NVIDIA. Cela suggère que, malgré l'investissement substantiel de NVIDIA, Intel n'adoptera pas exclusivement les solutions de conception de NVIDIA.

