Pour les développeurs, la question la plus urgente est la suivante : « L’IA peut-elle réellement être utilisée pour la création de contenu ? » plutôt que de simplement produire des « images inutiles » ou des « modèles inutiles » d’apparence impressionnante mais au final brouillons.

Dans cette optique, AssetHub (Japon) et Kapnetix (San Francisco, États-Unis, et Royaume-Uni, respectivement) proposent des solutions pragmatiques autour de la modélisation statique et de la capture de mouvement. En clair, ils ne recherchent pas la magie d'une génération instantanée par IA, mais utilisent plutôt l'IA pour automatiser les processus manuels traditionnels les plus chronophages, réduisant ainsi la production 3D de plusieurs semaines à quelques jours et permettant même la capture de mouvement, auparavant réservée aux studios photo et nécessitant des millions de dollars, avec un simple téléphone portable.
AssetHub : La modélisation par IA ne doit pas seulement viser la « ressemblance », mais aussi la « facilité d’utilisation ».
De nombreuses IA génératives 3D disponibles sur le marché peuvent générer un modèle 3D à partir d'un simple texte. Cependant, selon Takuya Goto, PDG d'AssetHub, ces modèles présentent souvent des défauts majeurs : maillages imprécis, textures incrustées et impossibles à modifier, et détails superflus (comme des cheveux fantomatiques) impossibles à supprimer.

« Pour les développeurs de jeux, les modèles non modifiables sont inutilisables. » AssetHub propose une solution de « flux de travail 3D natif de l'IA ».
Contrairement à la photogrammétrie traditionnelle, sujette au bruit, la technologie de base d'AssetHub repose sur la « décomposition en parties ». Lorsque l'IA analyse un dessin de personnage 2D, elle ne génère pas directement un « objet 3D ». Elle comprend d'abord que « ceci est des cheveux », « ceci est des chaussures » et « ceci est une jupe », puis les décompose en composants individuels.


Dans sa présentation, Takuya Goto a démontré comment ce processus permet d'abord de transférer le style et de supprimer les arrière-plans et les ombres des personnages d'anime 2D, puis d'utiliser l'IA pour générer une structure géométrique 3D préliminaire. AssetHub met l'accent sur le concept d'intervention humaine : l'IA génère 80 % de la structure du contenu, les 20 % restants étant peaufinés par des artistes 3D professionnels (retopologie).


Cela résout le problème des modèles générés par l'IA qui sont « uniquement destinés à la visualisation et non à l'utilisation », permettant ainsi de réaliser le processus de modélisation manuelle, qui prenait initialement deux semaines, en quelques jours seulement. De plus, les modèles obtenus constituent des ressources de productivité « clairement segmentées, pouvant être liées à un squelette et utilisées dans le moteur ».
Kapnetix : Dites adieu aux millions dépensés en studios, un seul iPhone suffit pour la capture de mouvement de qualité AAA
Une fois le modèle 3D créé, l'étape suivante consiste à donner vie au personnage. La technologie de capture de mouvement traditionnelle est presque exclusivement réservée à Hollywood et aux jeux vidéo AAA. Elle nécessite généralement la location d'un studio à haut plafond, l'installation de plus de 100 objectifs optiques et le port de combinaisons intégrales recouvertes de billes réfléchissantes par les acteurs. Le coût peut atteindre 5 000 $ par jour.
L’objectif de Johny Darkwah, cofondateur de Kapnetix, est simple : « Nous voulons ramener les coûts de la capture de mouvement à un niveau quasi nul. »

La technologie de base présentée par Kapnetix repose sur l'utilisation de l'IA combinée à des calculs physiques pour réaliser la « reconnaissance de squelette 3D à partir d'une seule caméra ». Cela signifie que les développeurs n'ont même pas besoin de caméras professionnelles ; ils peuvent simplement utiliser un iPhone pour filmer des mouvements réels, télécharger la vidéo sur la plateforme cloud de Kapnetix, et l'IA peut calculer les données du squelette 3D correspondantes (format FBX) en quelques minutes.
Johny Darkwah a partagé une expérience d'échec intéressante : initialement, ils ont entraîné l'IA uniquement avec d'énormes quantités de données, ce qui a produit des animations saccadées et instables, clairement inacceptables pour les animateurs professionnels. Par la suite, ils ont changé de stratégie, abandonnant la force brute des données massives au profit de « contraintes physiques » et d'une « logique ergonomique ».
Par exemple, lorsque la caméra capture un bras masqué par le corps (occlusion), une IA pure pourrait deviner la position du bras et provoquer un rognage ; mais l’algorithme de Kapnetix intègre la contrainte physique selon laquelle « le coude ne peut pas se plier dans la direction opposée », permettant à l’IA de calculer une trajectoire de mouvement raisonnable.
Lors de l'étude de cas présentée à l'événement, Johny Darkwah a souligné que le tournage et la post-production des dribbles des joueurs NBA, qui nécessitaient auparavant cinq jours, pouvaient désormais être réalisés en seulement dix minutes grâce à la solution de tournage mobile de Kapnetix. La fluidité des mouvements était telle qu'ils pouvaient être directement intégrés à Maya ou Blender pour un peaufinage, et le coût a été réduit de plusieurs milliers de dollars au prix d'un café (environ 2 euros les 30 secondes).


Analyse : L'IA remodèle la « couche intermédiaire » de l'industrie 3D.
Les données partagées par AssetHub et Kapnetix montrent que l'industrie 3D actuelle est en pleine révolution « décentralisée ».
Auparavant, la production de contenu 3D était soumise à des barrières à l'entrée extrêmement élevées, la rendant accessible uniquement aux grandes entreprises. Désormais, AssetHub a résolu le problème de la construction et de la structuration rapides des « actifs statiques », tandis que Kapnetix a résolu celui du coût d'acquisition des « performances dynamiques ».
Ce que ces deux entreprises ont en commun, c'est qu'elles ne cherchent pas à remplacer les artistes par l'IA, mais plutôt à remplacer les flux de travail fastidieux, notamment le travail de topologie répétitif, la réparation des cellules clés et le nettoyage du bruit.
Quand un téléphone portable pourra capturer le mouvement et que quelques images suffiront à générer un modèle 3D exploitable, le développement de jeux vidéo ou la production de contenu VTuber ne seront plus limités par la technologie ni par le budget, mais renoueront avec leur essence même : la créativité et la narration. Ce sera peut-être là la plus grande contribution de l’IA à l’industrie du contenu.


