Récemment présenté en avant-première à Google NEXT'25, un modèle d'IA à latence plus faible et plus rentableGémeaux 2.5 Flash, actuellementCommencez à fournir des tests aux développeurs.
Comparé à Gemini 2.5 Pro, capable de traiter jusqu'à un million de mots de compréhension de contenu et d'effectuer des analyses de données approfondies, de fournir des informations clés dans des domaines professionnels spécifiques ou d'exécuter des tâches de codage complexes après avoir compris l'intégralité du code, ce qui en fait le modèle d'intelligence artificielle le plus performant de Google, Gemini 100 Flash offre une efficacité d'exécution à faible latence et des coûts d'utilisation réduits. Il devrait devenir le modèle d'utilisation principal pour la plupart des services applicatifs, tout en conservant une certaine précision d'exécution, ce qui le rend idéal pour la création d'assistants virtuels interactifs ou d'outils de synthèse de contenu en temps réel.
Gemini 2.5 Flash intègre également des fonctionnalités de raisonnement dynamiques et contrôlables qui ajustent automatiquement le temps de traitement en fonction de la complexité du contenu de la question (ce qui peut être considéré comme un « budget de réflexion »), permettant des interactions plus rapides pour les questions à réponses simples. Les développeurs et les entreprises peuvent également définir les coûts d'utilisation et ajuster la vitesse et la précision des réponses en fonction des besoins réels, permettant ainsi une utilisation plus efficace des budgets d'exploitation des services.
Les développeurs peuvent ajuster le nombre de jetons générés par Gemini 2.5 Flash pendant la phase de réflexion grâce à Google AI Studio ou à la plateforme Vertex AI. Réduire le nombre de jetons permet d'obtenir des réponses plus rapides, tandis que l'augmenter nécessite plus de temps de réflexion, ce qui entraîne des coûts de réponse plus élevés.
Concernant la quantité de connaissances contenues dans Gemini 2.5 Flash, celui-ci capture du contenu depuis janvier dernier et prend en charge la saisie multimodale de texte, d'images, de vidéos et d'audio, mais ne peut produire que du texte. Il est également destiné à remplacer la version originale de Gemini 1 Flash Thinking.








