Lors du Sommet mondial OCP 2025, Intel a annoncé le lancement d'un GPU pour centre de données, nom de code « Crescent Island », spécialement conçu pour gérer les charges de travail croissantes d'inférence IA. La société a également lancé simultanément la conception de référence à l'échelle du rack Gaudi 3, élargissant ainsi son portefeuille d'accélérateurs IA.
Nouveau GPU de centre de données dédié au marché de l'inférence IA
Le GPU de centre de données « Crescent Island » est optimisé pour les serveurs d'entreprise refroidis par air. Il utilise la microarchitecture Xe3P et est équipé de 160 Go de mémoire LPDDR5X. Il privilégie une capacité mémoire élevée et une efficacité énergétique optimale, ce qui le rend particulièrement adapté aux fournisseurs de « Token-as-a-Service » et à divers scénarios d'application d'inférence.
« L'IA passe d'un apprentissage statique à un calcul d'inférence omniprésent et en temps réel, une évolution portée par l'IA agent », a déclaré Sachin Katti, directeur technique d'Intel. « Pour adapter efficacement ces charges de travail complexes, des systèmes hétérogènes sont nécessaires, exploitant les atouts de différentes puces. »
Le nouveau GPU devrait commencer à être échantillonné auprès des clients au cours du second semestre 2026, et la pile logicielle associée est actuellement en cours de développement et de test sur les GPU Arc Pro série B.
La conception de référence à l'échelle du rack Gaudi 3 prend en charge l'inférence de modèles à grande échelle
La conception de référence rack Gaudi 3, annoncée simultanément, prend en charge jusqu'à 64 accélérateurs par rack, est équipée de 8.2 To de mémoire à large bande passante et d'un refroidissement liquide. Elle est optimisée pour les modèles de grande taille et l'inférence en temps réel. Cette conception permet aux clients d'évoluer en toute flexibilité vers des performances d'inférence rack complètes à partir de leur infrastructure PCIe existante.
L'avis de l'auteur
Les mises à jour de produits Intel illustrent sa réorientation stratégique, passant de l'accent mis jusqu'alors sur les performances d'entraînement à l'intégration du marché de l'inférence en pleine expansion. Le Crescent Island, destiné aux serveurs d'entreprise refroidis par air, occupe une niche sur le marché de l'inférence milieu et haut de gamme, complétant ainsi la série Gaudi, axée sur l'entraînement.
Avec l'accélération des applications d'IA, les charges de travail d'inférence deviennent un enjeu majeur du marché. Intel combine ses processeurs Xeon 6, Gaudi 3 et ses nouveaux GPU pour centres de données afin de créer une solution complète et complète, cherchant ainsi à se démarquer de concurrents comme NVIDIA et AMD. Cette architecture système flexible et hétérogène est particulièrement attractive pour les entreprises soucieuses des coûts.
