S’appuyant sur le modèle du monde Genie 3 lancé par Google DeepMind l’année dernière, Google a annoncé un programme expérimental appelé « Project Genie » qui permet aux utilisateurs de découvrir par eux-mêmes la puissance du modèle du monde Genie 3 et de générer leur propre monde virtuel interactif.
Cependant, le service présente actuellement une barrière à l'entrée très élevée et n'est ouvert qu'aux utilisateurs américains abonnés au forfait Google AI Ultra (qui coûte jusqu'à 250 dollars par mois, soit environ 8 000 NT$) pour pouvoir demander un essai.
Grâce à Nano Banana Pro, créez un monde interactif avec une seule phrase.
Au cœur du Projet Genie se trouve le modèle du monde Genie 3 développé par DeepMind. En clair, il ne s'agit pas d'un moteur de jeu traditionnel, mais d'un système d'IA capable de « comprendre » et de « prédire » comment les graphismes évolueront en fonction des actions de l'utilisateur.
La version démo actuelle propose trois modes : « Croquis du monde », « Exploration » et « Remixage ». Le gameplay est plutôt intéressant :
• Base de dessin IA :Le système utilisera d'abord le modèle Nano Banana Pro (le modèle avancé de génération d'images de Google) pour dessiner une « image source » à partir des indications textuelles.
• Paramétrage des paramètres :Vous pouvez choisir l'apparence du protagoniste, son point de vue (première personne, troisième personne ou isométrique) et sa méthode d'exploration.
• Génération et interaction :Genie 3 va s'emparer de cette image et la transformer en un environnement virtuel dynamique et interactif.
Ce n'est pas un moteur de jeu, il y a donc encore de nombreuses limitations.
Bien qu'il ressemble à un jeu, Google souligne spécifiquement que Genie 3 n'est pas un « moteur de jeu ». Cela signifie qu'il ne possède pas de mécanismes de jeu traditionnels (tels que le score, la santé ou les objectifs de mission) et qu'il simule uniquement les interactions physiques et le retour visuel.
De plus, la démonstration technologique actuelle présente encore de nombreuses limitations matérielles :
• Durée limite :Chaque expérience interactive générée a une durée maximale de 60 secondes.
• Limitations de la qualité d'image :La résolution était bloquée à 720p et la fréquence d'images n'était que de 24 images par seconde.
Exhibant les muscles du « mannequin mondial »
Bien que la qualité et la durée de l'image soient limitées, il s'agit d'une occasion rare pour les abonnés à Google AI Ultra de découvrir la technologie de pointe de DeepMind. Genie 3 démontre que l'IA ne se contente plus de générer des images statiques, mais qu'elle peut comprendre l'espace physique et les relations de cause à effet (par exemple, un clic droit déplace le personnage vers la droite et l'arrière-plan se déplace en conséquence). Cette capacité sera très utile pour entraîner les agents d'IA à comprendre le monde réel à l'avenir.
Analyse des points de vue
La modélisation du monde est actuellement l'un des Graals les plus recherchés dans le domaine de l'IA, et le projet Genie rapproche les développeurs de l'avenir des jeux générés par l'IA en temps réel. Par exemple, il suffira de saisir « Je veux jouer à un jeu de parkour dans une ville cyberpunk remplie de lave » pour que l'IA génère et affiche automatiquement des graphismes jouables sans avoir besoin de télécharger au préalable des dizaines de gigaoctets de ressources de jeu.
Bien que le projet Genie soit actuellement dans sa coûteuse phase de démonstration technologique, la révolution en matière de logique informatique qu'il représente pourrait complètement révolutionner l'industrie du développement de jeux et de la formation par simulation au cours des 10 prochaines années.




