Amazon annonce un nouveau modèle de baseAmazon Nova Sonic, unifiant la compréhension et la génération de la parole en un modèle unique, rapprochant les performances des services d'intelligence artificielle en conversation de celles des personnes réelles. Appelable via Amazon Bedrock sous forme d'API, il peut être utilisé pour l'automatisation des appels de service ou pour des services d'intelligence artificielle intersectoriels couvrant des secteurs tels que le tourisme, l'éducation, la santé et le divertissement.
Le développement d'applications vocales traditionnelles nécessite la coordination simultanée de plusieurs modèles, tels qu'un modèle de reconnaissance vocale qui convertit la parole en texte, un modèle de langage étendu qui comprend et génère des réponses, et un modèle de synthèse vocale qui convertit le texte en présentation audio. Cela accroît non seulement la complexité du développement, mais rend également difficile la préservation du contexte vocal et des nuances essentielles aux conversations naturelles, comme le ton, l'intonation et le style de parole.
Nova Sonic, d'autre part, abandonne la conception précédente consistant à utiliser plusieurs modèles différents et unifie les fonctions de compréhension et de génération dans un seul modèle, permettant au modèle d'ajuster les réponses vocales générées en fonction du contexte sonore tel que le ton et le style, ainsi que l'entrée parlée, pour rendre la performance plus proche de l'intonation d'une conversation naturelle.
Nova Sonic est même capable de comprendre les nuances subtiles d'une conversation humaine, y compris les pauses et les hésitations naturelles, ce qui lui permet de réagir de manière appropriée et de gérer les interruptions avec élégance. Le modèle génère également du texte à partir du contenu parlé, ce qui permet aux développeurs d'utiliser ce texte pour appeler des outils et des API spécifiques, créant ainsi des services d'agents vocaux IA plus riches.
Vous pouvez découvrir la performance d'intonation naturelle générée par Nova Sonic via le lien suivant :
• Agent d'IA pour les voyages construit sur Amazon Nova Sonic








