Avec une explosion attendue des téléchargements de modèles et de frameworks d'IA open source en 2026, NVIDIA a annoncé une mise à jour de son [système/mécanisme] au CES 2026.DGX Spark, une plateforme de développement d'IA de bureauCette mise à jour offre non seulement une amélioration des performances jusqu'à 2.5 fois supérieure grâce à l'optimisation logicielle, mais elle introduit également de nouveaux outils et flux de travail pour le développement d'IA agentique, et peut même fonctionner avec les dernières cartes graphiques RTX 5090 pour accélérer le processus de création 3D.
L'optimisation logicielle permet d'obtenir un gain de performance de 2.5 fois.
NVIDIA souligne que depuis le lancement de DGX Spark, grâce à une optimisation continue avec la communauté open source et aux mises à jour de la pile logicielle, ses performances ont été considérablement améliorées.
D'après les données officielles, le modèle Qwen-235B, grâce à la dernière version de TRT-LLM et à la technologie de quantification NVFP4, affiche des performances plus de 2.5 fois supérieures à celles de sa version initiale. Il affiche également des performances plus de deux fois supérieures sur les tâches de Stable Diffusion 3.5 Large et d'optimisation PyTorch, ce qui permet aux développeurs d'obtenir des vitesses d'inférence et d'entraînement plus rapides sur le même matériel.
7 nouveaux guides pratiques : du réglage bi-machine au Nsight Copilot
Pour faciliter le développement, NVIDIA a publié sept nouveaux Playbooks (guides de développement) couvrant tous les aspects, de l'inférence et du réglage fin à la science des données :
• Inférence : Ajout de la prise en charge de l'inférence VLLM, SGLang et TRT-LLM, et prise en charge du décodage spéculatif.
• Réglage fin : Il s’agit d’une nouveauté majeure. Il prend désormais en charge la connexion de deux DGX Sparks pour le réglage fin PyTorch, ce qui est très utile pour les tâches de réglage fin FLUX.1 Dreambooth LoRA ou LLAMA Factory nécessitant davantage de mémoire d’affichage.
• Outils : Pour faciliter la tâche la plus complexe des développeurs — l’écriture de code CUDA —, NVIDIA lancera Nsight Copilot, un assistant IA fonctionnant hors ligne sur les dispositifs DGX Spark. Il peut aider à écrire du code CUDA (comme la multiplication de matrices FP4) et garantir la confidentialité des données.
Collaboration intersectorielle : Accélération de la génération vidéo sur MacBook et de la création 3D avec la RTX 5090
DGX Spark n'est pas seulement un site de développement autonome, mais peut également servir d'accélérateur externe puissant.
• Accélération sur MacBook Pro : Grâce à la connectivité LAN, DGX Spark multiplie par 8 la vitesse de génération vidéo IA sur MacBook Pro (M4 Max et versions supérieures). La génération de vidéos 4K avec les modèles FLUX.1 et WAN 2.2 dans ComfyUI, qui prenait auparavant 8 minutes, ne prend plus qu’une minute.
• Collaboration RTX 5090 : NVIDIA a présenté aux créateurs de mods un flux de travail collaboratif combinant la RTX 5090 et DGX Spark. Les créateurs peuvent ainsi modifier leurs mods sur la RTX 5090 et laisser DGX Spark gérer les tâches fastidieuses de génération de textures, pour une expérience de création RTX Remix sans interruption.
Robotique et informatique de périphérie : Reachy Mini fait ses débuts
Dans le domaine de l'IA physique, NVIDIA a annoncé une collaboration avec Hugging Face pour alimenter le robot open source Reachy Mini grâce à DGX Spark. Les développeurs peuvent tirer parti de la puissance de calcul de DGX Spark pour créer des agents d'IA et contrôler directement ce petit robot, conçu spécifiquement pour l'interaction homme-machine, afin de mener des expériences.
De plus, la suite logicielle NVIDIA AI Enterprise prendra officiellement en charge DGX Spark fin janvier. Ceci permettra d'étendre les applications de l'informatique de périphérie (Edge AI), notamment le contrôle qualité dans l'industrie 1, la détection des pertes dans le commerce de détail et l'analyse en temps réel dans les établissements de soins.
Analyse : Un élément clé du puzzle de l'approche « fondamentale » du développement de l'IA
À mon avis, à mesure que les modèles d'IA deviennent de plus en plus complexes, les coûts et les problèmes de confidentialité liés à l'inférence dans le cloud prennent une importance croissante. La mise à jour de DGX Spark par NVIDIA vise clairement à consolider son avantage concurrentiel dans le développement d'IA sur le terrain.
En prenant en charge le réglage fin en série sur deux machines et l'utilisation de Nsight Copilot sur l'appareil, NVIDIA répond au problème majeur du stockage des données sur site pour les entreprises. La collaboration multiplateforme avec la RTX 5090 et le MacBook transforme DGX Spark, d'une simple plateforme de calcul, en un module de puissance de calcul IA indispensable aux professionnels de la création et aux développeurs. Avec des partenaires OEM tels qu'ASUS, Dell, HP et Lenovo qui lancent des produits conçus autour de DGX Spark, nous prévoyons de voir davantage de solutions d'IA de bureau basées sur cette architecture d'ici 2026.




