MLCommons a récemment publié les résultats de la dernière série de tests de performance MLPerf Training v5.1. Ce test constitue non seulement l'examen final annuel du domaine de l'informatique IA, mais aussi une plateforme permettant à NVIDIA et AMD de démontrer la puissance de leurs architectures de nouvelle génération. NVIDIA a dominé la compétition avec son architecture Blackwell Ultra, tandis qu'AMD participait pour la première fois à ce test avec son architecture CDNA 4 série MI350, prouvant ainsi sa compétitivité.
NVIDIA : La précision de Blackwell Ultra, associée à NVFP4, double les performances
Dans ce test, NVIDIA a sans surprise atteint la vitesse d'entraînement la plus rapide dans les sept tests, y compris le Large Language Model (LLM) et la génération d'images, et a été la seule plateforme à soumettre des résultats dans tous les projets.
Le principal atout de NVIDIA cette fois-ci est son système rack GB300 NVL72, basé sur l'architecture GPU Blackwell Ultra. Pour des performances extrêmes, NVIDIA a adopté pour la première fois dans l'histoire de l'entraînement MLPerf le calcul basse précision NVFP4.
D'après les données officielles publiées par NVIDIA, Blackwell Ultra offre une amélioration significative des performances par rapport à l'architecture Hopper de génération précédente, avec le même nombre de GPU :
• Pré-entraînement du lama 3.1 405B :L'efficacité est multipliée par plus de 4.
• Réglage fin LoRA du Llama 2 70B :L'efficacité a été multipliée par près de 5.
Les avantages architecturaux de Blackwell Ultra résident dans ses nouveaux cœurs Tensor offrant une puissance de calcul IA de 15 pétaflops grâce à l'architecture NVFP4 et jusqu'à 279 Go de mémoire HBM3e à large bande passante. De plus, NVIDIA a utilisé plus de 5 000 GPU Blackwell lors du test Llama 3.1 405B, établissant un record en terminant l'entraînement en seulement 10 minutes.
AMD : L'architecture CDNA 4 fait ses débuts, le MI355X offre des performances 2.8 fois supérieures à celles de son prédécesseur.
Par ailleurs, AMD a également obtenu des résultats impressionnants lors de ce test. C'est la première fois qu'AMD utilise ses GPU de la série Instinct MI350 (notamment les MI355X et MI350X) pour les tests d'entraînement MLPerf.
Le GPU AMD Instinct MI355X utilise un procédé de fabrication en 3 nm et une architecture CDNA 4, et est équipé de 288 Go de mémoire HBM3e à large bande passante. AMD met en avant ses performances nettement améliorées.
• Un bond en avant en matière d'efficacité :Comparé à son prédécesseur, le MI300X, le MI355X offre une amélioration de 2.8 fois des performances d'entraînement.
• Réglage fin LoRA du Llama 2 70B :La plateforme MI355X a terminé en 10.18 minutes, une réduction significative par rapport aux 27.97 minutes de la MI300X.
Bien que la plateforme B200 de NVIDIA ait légèrement surpassé l'AMD MI355X en termes de vitesse absolue avec un temps de 9.85 minutes, les 10.18 minutes de l'AMD MI355X ont démontré une performance très compétitive, indiquant que l'écart entre les deux se réduit.
Écosystème et aménagement futur
Ce test a également mis en lumière l'expansion des écosystèmes des deux entreprises. NVIDIA a vu 15 partenaires soumettre des résultats, dont ASUS, Dell, Quanta Computer et Wistron. AMD n'était pas en reste, avec 9 partenaires (dont ASUS, Dell et GIGABYTE) ayant soumis des résultats de tests basés sur le matériel AMD Instinct.
Lors de sa conférence Financial Analyst Day, AMD a également mis à jour sa feuille de route produit, confirmant qu'elle maintiendrait...Le calendrier de mise à jour « une fois par an »La série MI400 devrait être lancée en 2026, tandis que la série MI500 devrait faire ses débuts en 2027, afin de concurrencer davantage NVIDIA.









