Face à la complexité croissante des modèles d'IA, les gouvernements et les grandes entreprises accordent une importance accrue à la souveraineté et à la conformité des données. Lors de re:Invent 2025, AWS a annoncé son nouveau service AI Factories, qui déploie l'infrastructure d'IA d'AWS, notamment la toute dernière plateforme de calcul accéléré NVIDIA et les puces Trainium propriétaires d'AWS, directement dans les centres de données existants des clients. Ce service leur permet ainsi de créer rapidement des environnements de calcul d'IA performants, conformes et souverains.

Résoudre les problèmes des systèmes construits en interne, fonctionnant comme une « région AWS privée ».
AWS souligne que pour les secteurs réglementés et le secteur public, la mise en place d'infrastructures d'IA à grande échelle en interne se heurtera à des difficultés majeures en termes d'investissement et de cycles d'approvisionnement. Le concept fondamental du service AWS AI Factory est de déployer l'ensemble de la pile d'IA d'AWS (réseaux haut débit, stockage, sécurité et services tels que Bedrock et SageMaker) directement dans le centre de données du client, AWS assurant l'exploitation.

Cela permet à l'environnement de fonctionner comme une « région AWS privée », où les clients peuvent utiliser la puissance et l'espace existants tout en profitant des services gérés d'AWS et d'un accès au modèle sans avoir à négocier de licences avec plusieurs fournisseurs, ce qui réduit considérablement le temps de déploiement et répond aux exigences réglementaires en matière de localisation des données.
L’approfondissement du partenariat avec NVIDIA impliquera l’adoption de Grace Blackwell et de la future Vera Rubin.
Au niveau matériel, la collaboration entre AWS et NVIDIA sera renforcée. Les services AWS AI Factory intégreront la suite logicielle d'IA complète et la plateforme de calcul accéléré de NVIDIA, notamment la prise en charge de la toute dernière architecture de calcul accéléré NVIDIA Grace Blackwell, ainsi que des offres à venir.Plateforme informatique NVIDIA Vera Rubin.
De plus, la puce Trainium 4 de nouvelle génération d'AWS la prendra également en charge.Technologie d'interconnexion haute vitesse NVIDIA NVLink FusionCela signifie que, à l'instar de Qualcomm, MediaTek, Intel et d'autres sociétés, AWS s'intégrera également plus étroitement à l'écosystème de calcul accéléré par GPU de NVIDIA via la technologie NVLink Fusion, offrant ainsi aux clients d'AWS une plus grande flexibilité dans le choix des options de calcul accélérées par l'IA.
Ian Buck, vice-président de la division Hyperscale et HPC chez NVIDIA, a déclaré que le calcul IA à grande échelle exige une approche globale. Cette collaboration avec AWS permettra de déployer ces capacités de calcul massives directement dans les environnements clients, permettant ainsi aux entreprises de se concentrer sur l'innovation plutôt que sur l'intégration.

Le serveur UltraServer P6e-GB300 fait ses débuts, avec des déploiements initiaux en Arabie saoudite.
Parallèlement au lancement de son service AI Factory, AWS a également annoncé la nouvelle instance Amazon EC2 P6e-GB300 UltraServers, qui propose…Système NVIDIA GB300 NVL72Conçu spécifiquement pour les opérations d'inférence IA à grande échelle, il prend en charge les modèles à mille milliards de paramètres avec des capacités de raisonnement dans les environnements de production et est alimenté par AWS Nitro System, permettant une intégration transparente avec des services tels qu'Amazon EKS.
La première application du serveur UltraServer P6e-GB300 concernera le Fonds d'investissement public saoudien.HUMAINLa première « zone d'IA » devrait être créée en Arabie saoudite. Elle déploiera jusqu'à 150 000 puces d'IA (dont des GPU NVIDIA GB300), alimentées par l'infrastructure de services AWS AI Factory, afin de répondre à la demande croissante de puissance de calcul pour l'IA aux niveaux local et mondial.
Outre sa collaboration avec AWS et NVIDIA, HUMAIN a déjà annoncé des partenariats avec AMD, Qualcomm et d'autres acteurs du secteur.Fourniture de puces informatiques pour l'IADe plus, lors du Snapdragon Summit 202 de cette année, ils ont même annoncé une collaboration avec Qualcomm pour lancer…AIPCCela favorisera le développement d'agents d'IA plus conviviaux et permettra également le déploiement de solutions informatiques accélérées par l'IA de Qualcomm en Arabie saoudite.Infrastructure d'inférence IA à grande échelle.
En plus de fournir des serveurs Amazon EC2 P6e-GB300 UltraServers, AWS continuera de fournir des serveurs Amazon EC2 P6e-GB200 UltraServers avec système GB200 NV72, et continuera également de fournir des serveurs Amazon EC2 P6 avec systèmes B300 et B200.