Google DeepMind annoncé plus tôtNommé « Gemma 3 », et peut exécuter des modèles d'intelligence artificielle sur un seul GPU ou TPU. Il affirme également pouvoir surpasser les performances de modèles tels que Llama-405B, DeepSeek-V3 et o3-mini lors du projet préliminaire d'évaluation des préférences humaines du classement des tests LMArena, tout en soulignant que des fonctions d'application d'intelligence artificielle hautes performances peuvent être déployées sur du matériel de spécifications générales.
「Gemma 3」支援超過140種語言、提供128K詞元長度的上下文擴展能力,同時也具備先進的文字與視覺分析推理能力,並且提供10億、40億、120億及270億組參數規模版本,可讓開發者依照硬體及效能需求選擇合適規模版本模型。
« Gemma 3 » est également compatible avec divers outils de développement, notamment Hugging Face Transformers, Ollama, JAX, Keras, PyTorch, etc. Il peut également être optimisé pour fonctionner sur les GPU NVIDIA, Google Cloud TPU et AMD. Les modèles « Gemma 3 » sont actuellement disponibles sur des plateformes d'hébergement telles que Google AI Studio, Kaggle ou Hugging Face.
En plus de « Gemma 3 », Google DeepMind a également lancé simultanément ShieldGemma 40, un outil d'inspection de sécurité d'images de 2 milliards de paramètres qui peut définir des étiquettes de sécurité en fonction du contenu à risque, du contenu explicite et du contenu violent, permettant aux développeurs de créer des services d'application d'intelligence artificielle plus responsables et plus sécurisés.
Google a également annoncé le lancement du programme académique Gemma 3, offrant 1 3 dollars de crédits Google Cloud par projet aux chercheurs universitaires pour poursuivre leurs recherches basées sur Gemma 6. À ce jour, plus de 1 XNUMX modèles d'IA dérivés ont été créés à partir de Gemma, et la famille de modèles Gemma a été téléchargée plus de XNUMX millions de fois.








