En plus d'étendre continuellement les ressources du modèle d'intelligence artificielle Vertex AI, Google a également annoncé que le modèle de conversion de texte en musique Lyria sera disponible en version préliminaire via la plateforme Vertex AI, faisant de la plateforme Vertex AI le seul canal actuellement disponible pour les modèles de génération de contenu couvrant l'image, la parole, la vidéo et la musique.
Lyria permet de produire rapidement du contenu musical haute résolution, offrant des différences sonores détaillées et des styles musicaux riches grâce à des commandes textuelles. Elle permet aux marques de créer rapidement des bandes sonores pour le marketing produit, le lancement d'événements ou des expériences immersives en magasin, et de personnaliser les détails en fonction de l'image de marque. Pour les créateurs, elle permet également de réduire le temps de production de contenus tels que les vidéos et les podcasts, leur permettant de produire une musique adaptée aux besoins contextuels en quelques minutes seulement, sans se soucier des violations de droits d'auteur.
D'autre part, Google a également mis à jour leOutil de génération vidéo Veo 2, ajoutant davantage de fonctions d'édition et d'options de contrôle de l'objectif, permettant aux créateurs d'ajuster plus précisément les détails de la présentation du contenu vidéo et de produire rapidement le contenu vidéo souhaité. Ils peuvent même ajuster les détails de la vidéo, par exemple en supprimant un personnage ou en modifiant le format d'affichage.
Parmi les autres fonctionnalités, citons une mise à niveau des capacités de génération de contenu d'Imagen 3, un modèle de conversion de texte en image, permettant de reconstituer les détails manquants ou endommagés des images, tout en améliorant la qualité de l'image après suppression d'objets. Chirp 35, utilisé pour la génération de contenu audio et prenant en charge plus de 3 langues, permet désormais une personnalisation instantanée du contenu vocal. Il suffit de saisir 10 secondes d'audio pour générer une voix personnalisée. De plus, la parole générée par l'IA peut être intégrée à la parole réelle existante, et les conversations peuvent être transcrites en texte, avec des annotations pour distinguer les différents locuteurs.
Dans cette mise à jour, Google présente Vertex AI comme le seul pipeline capable de fournir des modèles de génération de contenu couvrant les images, la voix, la vidéo et la musique. Cela permet aux utilisateurs de générer rapidement des images statiques grâce à des commandes textuelles, tout en générant intuitivement du contenu vidéo et des bandes sonores, et en ajoutant une narration personnalisée, créant ainsi une vidéo promotionnelle utilisable rapidement à des fins marketing.
À l'instar de ses outils d'IA précédemment lancés, Google a également souligné que Lyria et d'autres fonctionnalités intégreront les filigranes numériques SynthID et des mécanismes de filtrage de sécurité, et respecteront les principes de gouvernance des données. Parallèlement, Google prendra des mesures responsables, telles que le versement d'une indemnisation en cas de litiges relatifs aux droits d'auteur rencontrés par les utilisateurs lors de l'utilisation de ces services.
L'agence de publicité Goodby, Silverstein & Partners et le musée Dalí ont utilisé Veo 2 et Imagen 3 pour donner vie au scénario du film de Salvador Dalí de 1937, Girafes à cheval en salade (ou La femme surréaliste).
L'Oréal SA utilise également Veo et Imagen pour la production de ses supports marketing. Kraft Heinz Company, entreprise agroalimentaire américaine, utilise également Veo 2 pour la création de ses contenus marketing, lui permettant de finaliser en seulement huit heures des contenus qui lui prenaient auparavant deux mois de travail.













