En amélioration continueSa technologie d'intelligence artificielle ClovaDans ce cadre, LINE a annoncé lors de l'événement LINE Developer Day 2021 organisé plus tôt qu'il construirait un système de dialogue vocal capable d'interagir naturellement basé sur HyperClova, qui a été lancé en juin de cette année au niveau d'échelle correspondant à GPT-6.

Dans ce nouveau système de dialogue vocal, LINE utilise le YouTubeur virtuel « Kizuna Ai » comme démonstration, montrant comment la saisie vocale en temps réel permet au système de comprendre et de réagir instantanément, même complétée par des mouvements corporels saisissants pour une meilleure interactivité. À l'avenir, le système pourra ajuster le ton, la voix et l'apparence interactive selon les besoins, créant ainsi un service d'assistant numérique, un système de service client ou des applications d'interface homme-machine plus réalistes. De plus, différentes apparences peuvent être utilisées pour optimiser l'interaction utilisateur.

Selon LINE, ce système de dialogue vocal, basé sur HyperClova (Note), convertira la parole de l'utilisateur en texte grâce à la reconnaissance vocale. HyperClova analysera et comprendra ensuite le contenu, formulera des réponses appropriées et les convertira en contenu vocal numérique pour la lecture, créant ainsi une « interaction » avec l'utilisateur.

Actuellement, ce système de dialogue vocal prend principalement en charge le japonais, mais d'autres langues seront ajoutées ultérieurement. De plus, la reconnaissance et la compréhension d'images seront intégrées, ce qui laisse présager une intégration avec un plus large éventail d'applications. D'un point de vue opérationnel, ce système de dialogue vocal peut également se connecter à diverses bases de données grâce à une approche modulaire, prenant même en charge des contenus publics, élargissant ainsi ses capacités interactives.

Outre son application aux systèmes de dialogue vocal, LINE souligne également qu'HyperClova peut être utilisé pour la reconnaissance et la compréhension de texte, ainsi que pour la réinterprétation de contenu. Cela inclut la présentation de descriptions de produits complexes sous forme de résumé concis, et même l'ajustement du degré de concision selon les besoins, illustrant ainsi les capacités de compréhension de texte d'HyperClova.

La capacité à comprendre en profondeur le contenu du texte et à le réinterpréter signifie également qu'HyperClova peut être utilisé pour intégrer davantage de services d'application qui nécessitent une compréhension du texte, et peut même être combiné avec la compréhension de l'image et de la vidéo pour obtenir de meilleures fonctions d'application.
Noter:HyperClova a été créé par NAVER, la société mère de LINE. Initialement axé sur la compréhension du contenu coréen, il comptait 2040 milliards de jeux de paramètres, contre 3 milliards pour le modèle de langage naturel GPT-1750 développé par OpeAI. Cela lui confère des capacités de reconnaissance plus précises en compréhension du langage, mais cela peut également être lié aux différences de construction et de conception des différents modèles linguistiques. HyperClova, en particulier, était initialement axé uniquement sur le contenu coréen. Les différentes structures grammaticales des langues reflètent naturellement des échelles de paramètres différentes. Par exemple, même si le modèle de langage GPT-3 correspond déjà à la compréhension sémantique courante de l'anglais, sa compréhension sémantique du chinois et d'autres langues doit encore être renforcée.


