Google a annoncé précédemment que son assistant IA Gemini avait officiellement intégré le modèle de génération musicale de dernière génération développé par l'équipe DeepMind.Lyrie 3Cela signifie que les utilisateurs n'ont plus besoin de connaissances musicales approfondies. Grâce à de simples commandes textuelles, une photo ou même une vidéo, Gemini peut « chanter » un extrait musical de 30 secondes en haute fidélité directement dans la fenêtre de discussion.
Non seulement ils écrivent des chansons, mais ils préparent également les paroles et les pochettes d'album pour vous.
Auparavant, la création musicale nécessitait un processus complexe comprenant l'arrangement, l'écriture des paroles et l'enregistrement. Cependant, avec la Lyria 3, Gemini a considérablement simplifié l'accès à la création musicale.
D'après la démonstration de Google, les utilisateurs peuvent simplement saisir des phrases familières telles que « une ballade R&B amusante sur la recherche de l'âme sœur avec des chaussettes », et le système peut produire une musique de qualité assez élevée.
Si vous avez des exigences plus spécifiques concernant la musique, Lyria 3 offre également un contrôle granulaire plus précis. Par exemple, vous pouvez demander explicitement de modifier le tempo d'une section particulière, d'ajuster le style de batterie ou de changer l'ambiance générale de la musique.
Plus impressionnant encore, la génération musicale de Gemini ne se limite pas au texte. Les utilisateurs peuvent télécharger une photo de coucher de soleil ou une courte vidéo, permettant à l'IA de générer une musique de fond adaptée à l'ambiance visuelle. Une fois le morceau créé, le système utilise automatiquement le modèle d'image Nano Banana de Google pour générer une pochette d'album personnalisée, enrichissant ainsi l'expérience créative.
SynthID intègre YouTube Shorts et utilise le marquage numérique pour empêcher toute utilisation abusive.
L'application de cette technologie ne se limite pas à la version web de Gemini. Google a également annoncé que Lyria 3 sera intégrée à la fonctionnalité « Dream Track » de YouTube, permettant ainsi aux créateurs de générer rapidement une musique de fond très détaillée pour leurs courtes vidéos.
Bien entendu, les questions les plus sensibles concernant la musique générée par l'IA sont les litiges relatifs aux droits d'auteur et à l'authenticité.
Pour empêcher toute utilisation malveillante ou usurpation d'identité de la musique générée par IA, tous les fichiers audio de 30 secondes produits par Lyria 3 intégreront de force le filigrane numérique SynthID de Google. Ce filigrane est imperceptible à l'oreille humaine, mais il est facilement identifiable comme généré par une machine grâce à l'outil SynthID Detector présenté par Google lors de la conférence Google I/O de l'année dernière.
Premières impressions : L’accompagnement est incroyable, mais il y a encore de la marge d’amélioration au niveau des paroles écrites par des humains.
D'après les premiers retours des tests effectués par les médias étrangers, le Lyria 3 excelle dans la catégorie « Instrumental », produisant des mélodies d'une grande richesse et d'un réalisme saisissant. Cependant, en ce qui concerne les « Paroles et Voix » générées automatiquement par l'IA, le rendu actuel manque parfois de naturel et manque de subtilité. Il est probable que les utilisateurs devront s'exercer à plusieurs reprises pour trouver les bons réglages.
Cette fonctionnalité de création musicale est désormais disponible pour les utilisateurs de Gemini âgés de 18 ans et plus dans le monde entier, à compter d'aujourd'hui. Dans un premier temps, elle prend en charge huit langues : anglais, espagnol, allemand, français, hindi, japonais, coréen et portugais.



