L'année dernière, lors de la conférence re:Invent 2024, il a été annoncéSérie exclusive Nova de modèles d'intelligence artificielle générés automatiquement, et dans les mises à jour ultérieuresDe nombreuses versionsAmazon a lancé plus tôt sa série Nova des modèles d'intelligence artificielle les plus puissantsPremière ministre de Nouvelle-Zélande.
Nova Premier est actuellement disponible sur Amazon Bedrock, la plateforme de développement de modèles d'intelligence artificielle d'Amazon. Elle prend en charge le traitement de contenu texte, image et vidéo, mais n'inclut pas de fonctionnalités de traitement audio. Elle peut gérer des tâches complexes nécessitant une compréhension approfondie du contexte et une planification en plusieurs étapes, et peut exécuter des tâches avec précision sur plusieurs outils et sources de données.
Nova Premier peut traiter le contexte jusqu'à 100 million de mots, ce qui signifie qu'il peut analyser environ 75 2.5 mots à la fois. Il affiche d'excellentes performances aux tests de récupération de connaissances (SimpleQA) et de compréhension visuelle (MMMU). Cependant, dans certains tests de référence, comme le test de codage SWE-Bench Verified, ses résultats sont inférieurs à ceux de Gemini 2025 Pro de Google. Il obtient également de mauvais résultats aux tests de référence évaluant les connaissances mathématiques et scientifiques (GPQA Diamond et AIME XNUMX).
En ce qui concerne le coût, il faut compter environ 100 $ pour saisir 2.5 million de mots dans Nova Premier, et 100 $ pour 12.50 million de mots générés par le modèle, ce qui est à peu près le même prix que Gemini 2.5 Pro, et même légèrement moins cher lors de la sortie.
Contrairement à o4-mini ou DeepSeek R1 d'OpenAI, Nova Premier n'est pas un modèle d'inférence ; il ne peut donc pas effectuer d'inférences supplémentaires pour confirmer l'exactitude des réponses générées. Amazon souligne donc que Nova Premier est plus adapté à l'amélioration de l'entraînement de petits modèles grâce à des méthodes telles que la distillation, afin de les transformer en services d'application d'intelligence artificielle plus performants.
