Waymo, la filiale d'Alphabet spécialisée dans les voitures autonomes, a récemment dévoilé sa dernière arme secrète.Modèle mondial Waymo (Modèle du monde Waymo). Ce système est basé sur la dernière version de Google DeepMind...Technologie du modèle mondial Genie 3Elle peut générer des mondes virtuels 3D hautement réalistes et interactifs, permettant aux voitures autonomes de Waymo de subir des milliards de kilomètres de tests extrêmes dans cette « Matrice » générée par l'IA avant de prendre réellement la route, sans avoir à prendre de risques dans le monde réel.
Basé sur Genie 3 : non seulement il peut générer des vidéos, mais il peut aussi être « interactif ».
Le modèle du monde de Waymo repose essentiellement sur Genie 3, développé par Google DeepMind. Contrairement à Sora d'OpenAI, qui génère principalement des vidéos destinées à être visionnées, Genie 3 est un « modèle du monde général » dont les environnements générés sont interactifs.
Waymo a effectué des ajustements ciblés pour lui permettre non seulement de générer des images visuelles, mais aussi de produire simultanément des données de détection LiDAR et radar, permettant ainsi aux voitures autonomes d'apprendre non seulement grâce à des systèmes d'entraînement par l'image, mais aussi grâce aux données enregistrées par plusieurs capteurs.
Spécialisé dans « l'effet de longue traîne » : des tornades et des véhicules fonçant sur l'ennemi peuvent être générés à volonté.
Waymo a accumulé près de 2 millions de kilomètres de conduite autonome sur routes réelles, mais cela ne suffit pas. En effet, dans la réalité, les « scénarios à longue traîne », comme les tornades soudaines, les piétons déguisés en dinosaures ou les véhicules circulant à contresens sur l'autoroute, ont une probabilité d'occurrence extrêmement faible, ce qui rend difficile la collecte de données à grande échelle.
Toutefois, grâce au modèle du monde Genie 3, Waymo sera en mesure de construire des environnements numériques plus réalistes et d'adapter des scénarios aux besoins spécifiques d'apprentissage et de formation.
Grâce aux modèles génératifs du monde, les ingénieurs de Waymo peuvent agir comme des « créateurs » :
• Des événements climatiques extrêmes sont générés :Tempête de neige, inondation et lumière aveuglante.
• Créer des situations inattendues :Mettez en place des scénarios où de gros animaux surgissent en courant ou où du chargement tombe des véhicules qui précèdent.
• Simulation contrefactuelle :C’est sa fonctionnalité la plus puissante. Le système peut recréer un scénario réel, mais en modifiant les variables (par exemple : « Et si cette voiture n’avait pas cédé le passage ? »), permettant ainsi à l’IA d’essayer différentes décisions dans un univers parallèle et d’évaluer quelle réaction est la plus sûre.
Stratégie de Google en matière d'IA : le projet Genie ouvre la voie.
Il convient de mentionner que Google a également lancé un produit destiné aux consommateurs à la fin du mois de janvier de cette année.Prototype du projet Genie (Actuellement disponible pour les abonnés Google AI Ultra). Cet outil permet aux utilisateurs de « construire un monde avec des mots ». On peut le considérer comme une version ludique du modèle de monde Waymo, illustrant la volonté de Google de scinder sa technologie Genie en deux axes : l’un dédié au divertissement et à la création, l’autre aux applications industrielles de haute précision.
Analyse des points de vue
L'introduction de cette technologie signifie que la formation à la conduite autonome est entrée dans une nouvelle ère de « simulation générative ».
Les simulateurs précédents étaient pour la plupart créés manuellement à l'aide de moteurs de jeu (comme Unreal ou Unity). Bien que visuellement impressionnants, leurs lois physiques étaient codées en dur et les scènes relativement limitées. Le concept de « modèle du monde » repose sur l'apprentissage par l'IA des « règles de fonctionnement du monde » grâce à l'observation d'un grand nombre de vidéos. Par exemple, elle sait qu'une voiture s'arrête en percutant un mur, que le verre se brise et que l'eau éclabousse.
Cela s'apparente à l'entraînement de bout en bout que Tesla met actuellement en œuvre (Tesla entraîne également son propre modèle du monde pour prédire les ombres futures). Cependant, l'avantage de Waymo réside dans la plus grande précision des données de ses capteurs (LiDAR) utilisées comme référence.
Pour Waymo, cela résout le problème de la vitesse d'expansion. Auparavant, l'implantation dans une nouvelle ville (comme de Phoenix à San Francisco) nécessitait le déploiement d'une flotte pendant plusieurs mois pour collecter des données. Désormais, en théorie, grâce à des données cartographiques de base, le modèle du monde peut générer différentes conditions de circulation, permettant ainsi aux véhicules de se familiariser avec la ville virtuellement avant leur mise en service. Ceci explique peut-être l'accélération significative de l'expansion de Waymo ces derniers temps.





