Magazine WIREDCitant des sources, NVIDIA a déclaré avoir acquis Gretel, une startup de données synthétiques fondée en 2019 par d'anciens membres de la National Security Agency, de Google et d'AWS.
Cependant, ni NVIDIA ni Gretel n'ont réagi à cette information. Des articles de presse connexes indiquent que NVIDIA rachète Gretel pour un prix à neuf chiffres. La capitalisation boursière précédente de Gretel étant d'environ 9 millions de dollars, le prix d'acquisition réel devrait dépasser sa capitalisation boursière.
Après l'annonce de l'acquisition par NVIDIA, environ 80 employés de Gretel seront intégrés au système NVIDIA, et sa technologie sera également utilisée dans les produits et services NVIDIA.
Le service principal de Gretel fournit du contenu de données synthétiques, permettant aux développeurs souhaitant créer des modèles d'entraînement d'IA, mais manquant de données, de générer davantage de données d'entraînement à partir d'un volume limité. Les services de Gretel répondront au problème actuel de pénurie de données pour de nombreux besoins d'entraînement d'IA, tout en garantissant la qualité des résultats.
Actuellement, Gretel propose des services permettant de générer des données structurées, des données de séries chronologiques et du contenu non structuré. L'entreprise affirme également pouvoir garantir la sécurité des données et éviter les fuites de données.
Dans Pendant le GTC 2025NVIDIA préconise l'utilisation de données synthétiques pour entraîner les modèles d'intelligence artificielle. En utilisant une petite quantité de données réelles de manière artificielle pour synthétiser davantage de données d'entraînement, NVIDIA peut même adapter les données aux besoins, résolvant ainsi le problème du manque de données d'entraînement. Parallèlement, NVIDIA peut également anonymiser les données réelles pour éviter les problèmes de confidentialité.
Concernant l'utilisation de données synthétiques, nombreux sont ceux qui pensent qu'elle comporte encore des dangers cachés. Par exemple, générer davantage de données synthétiques à partir de données existantes biaisées ou erronées peut amplifier ces problèmes, conduisant à des résultats d'entraînement inexacts. Cependant, d'autres estiment que, dans des circonstances limitées, générer davantage de données d'entraînement synthétiques à partir de données réelles et en ajouter de nouvelles si nécessaire peut garantir la qualité et l'efficacité de l'entraînement.
Outre la promotion par NVIDIA de l'utilisation de données synthétiques pour accélérer l'efficacité de la formation en intelligence artificielle lors du GTC 2025, Meta, Microsoft et Google DeepMind ont également commencé à utiliser des données synthétiques pour former l'intelligence artificielle.
Pour répondre aux besoins massifs en données nécessaires à l'entraînement des robots, NVIDIA a développé le NVIDIA Isaac GR00T Blueprint, capable de générer de grandes quantités de données de démonstration d'actions synthétiques. Conçu à partir des modèles d'univers Omniverse et Cosmos Transfer, le Blueprint utilise une petite quantité de données d'actions réelles provenant de personnes réelles pour générer une grande quantité de données synthétiques destinées à l'entraînement des robots.
NVIDIA a souligné que la technologie NVIDIA Isaac GR00T Blueprint peut générer jusqu'à 11 78 pistes de mouvement synthétiques en 6500 heures, ce qui équivaut presque à 9 XNUMX heures de données de mouvement de démonstration réelles pendant neuf mois consécutifs.
Par rapport à la formation avec des données de mouvement humain réelles, l'efficacité de la formation du modèle de base Isaac GR00T N00 à l'aide des données générées par NVIDIA Isaac GR1T Blueprint peut être augmentée d'environ 40 %.
