NVIDIA a officiellement lancé sa plateforme d'IA plus tôt dans la journée lors de la conférence NeurIPS sur l'IA à San Diego, en Californie.Un nouveau modèle d'IA open source nommé "Alpamayo-R1"Il s'agit d'un « modèle de langage de vision raisonnée » conçu spécifiquement pour la recherche sur la conduite autonome. Il deviendra une technologie fondamentale pour l'IA physique, permettant aux véhicules de posséder un « bon sens de conduite » comparable à celui des humains et de gérer des décisions de conduite subtiles.
Le premier modèle de langage visuel appliqué au mouvement était axé sur la conduite autonome et possédait des capacités de « réflexion ».
NVIDIA affirme qu'Alpamayo-R1 est le premier modèle d'action du langage de vision du secteur axé sur la conduite autonome, et que ce modèle est basé sur le modèle Cosmos-Reason de NVIDIA.
Contrairement aux modèles traditionnels qui réagissent directement, Cosmos-Reason possède des capacités de raisonnement, lui permettant de réfléchir et d'analyser les décisions avant de répondre. Ainsi, Alpamayo-R1 peut traiter simultanément les informations textuelles et visuelles, ce qui lui permet non seulement de percevoir son environnement, mais aussi de mieux comprendre la situation et de porter des jugements plus proches de ceux d'un humain.
NVIDIAArticle de blogL'article souligne que ce type de technologie, basée sur le raisonnement, est crucial pour les entreprises qui s'orientent vers la conduite autonome de niveau 4 (c'est-à-dire la conduite entièrement autonome dans des zones limitées et sous certaines conditions). NVIDIA espère l'utiliser pour doter les véhicules autonomes d'un « bon sens » accru afin de mieux appréhender les conditions routières complexes.
Alpamayo-R1 est actuellement disponible en tant que logiciel libre sur GitHub et sur la plateforme Hugging Face.
Le guide du développeur « Cosmos Cookbook » est disponible
Outre le modèle lui-même, NVIDIA a également publié le guide de développement « Cosmos Cookbook » sur GitHub. Il s'agit d'une boîte à outils complète comprenant des instructions détaillées, des ressources d'inférence et un flux de travail post-entraînement.
Le livre Cosmos Cookbook aide les développeurs à entraîner et à déployer plus efficacement des modèles Cosmos pour des cas d'utilisation spécifiques, en couvrant des aspects clés tels que la curation des données, la génération de données synthétiques et l'évaluation des modèles.
Verrouiller la prochaine vague d'IA physique
Cette nouvelle annonce fait également écho au point de vue que le PDG de NVIDIA, Jensen Huang, a récemment mis en avant : la prochaine vague d’IA sera « l’IA physique ».
Bill Dally, directeur scientifique de NVIDIA, a déclaré que les robots joueraient un rôle prépondérant dans le monde et que l'objectif de NVIDIA est de « créer le cerveau de tous les robots ». Grâce à l'écosystème Alpamayo-R1 et Cosmos, NVIDIA déploie activement sa puissance de calcul GPU avancée pour des applications concrètes telles que la robotique et les véhicules autonomes.




