Lors de son discours à re:Invent 2024, Andy Jassy, PDG d'Amazon, a annoncé Nova, un modèle d'IA multimodal à génération automatique développé en interne, disponible en quatre tailles : Micro, Lite, Pro et Premier. Il a également annoncé Nova Canas, un modèle adapté aux besoins de génération d'images, et Nova Reel, une plateforme de génération automatique de contenu vidéo.
Quatre spécifications ont été annoncées cette fois-ci, dont Micro, Lite et Pro, qui sont déjà disponibles pour les utilisateurs d'AWS, tandis que Premier ne sera pas disponible au public avant le premier trimestre 2025.
Amazon affirme que les modèles de la série Nova peuvent apporter jusqu'à 75 % de rentabilité, produire du contenu à une vitesse plus rapide et améliorer la précision de la génération grâce à un réglage précis.
Parmi eux, Nova Micro, le plus petit et responsable uniquement de la génération de contenu textuel, a une précision globale supérieure à celle de Google Gemini 1.5Flash 8B et Meta Llama 3.1 8B. Bien que Nova Lite soit légèrement inférieur à Claude 3.5 Sonnet V2, GPT-4o, Gemini 1.5 Pro et Llama 3.2 90B en compréhension visuelle, ses performances globales restent bonnes.
Le modèle de génération d'images lancé simultanément, Nova Canas, est conçu pour la création artistique, mettant l'accent sur une précision de génération supérieure à celle du Dall-E 3 et du Stable Diffusion 3.5 Large, et peut générer une sortie dans un délai plus court.
Quant à la Nova Reel générée pour la vidéo correspondante, elle peut correspondre à des angles de prise de vue tels que le panoramique, le surround à 360 degrés ou le zoom. Actuellement, elle ne peut générer que des vidéos de 6 secondes, mais Amazon a annoncé le lancement prochain d'une version capable de générer des vidéos de 2 minutes.
Amazon a également expliqué que le contenu généré par le modèle d'intelligence artificielle généré automatiquement lancé cette fois-ci est hautement contrôlable, et grâce à des méthodes d'identification telles que les filigranes numériques pour éviter la possibilité de confondre les faux avec les vrais, soulignant que ces outils sont fournis de manière responsable.
Cependant, Amazon n'a pas divulgué la source de ses propres données de formation de modèle d'intelligence artificielle, indiquant seulement qu'elles étaient formées de manière croisée via des données dédiées spécifiques et des données autorisées.
Amazon a également annoncé son intention d'étendre ses modèles d'applications de reconnaissance vocale, dont le lancement est prévu au premier trimestre 2025. L'application sera ensuite étendue à des modèles pouvant être saisis et générés sous n'importe quelle forme. Ainsi, les utilisateurs pourront générer des vidéos à partir de texte, ou convertir du contenu vidéo en descriptions textuelles, etc. À cette date, les modèles d'intelligence artificielle générés automatiquement devraient proposer davantage de formes d'application.
Amazon n'a pas annoncé cette foisLa prochaine version du service d'assistant numérique Alexa, selon les rumeurs, peut-être que des explications plus détaillées ne seront données que lorsque l'application de son modèle d'intelligence artificielle généré automatiquement se développera à un certain niveau.












