• Sujets principaux
  • Intelligence artificielle
  • Pilote automatique
  • réseau
  • processeur
  • Téléphone portable
  • Expositions
    • CES
      • CES 2014
      • CES 2015
      • CES 2016
      • CES 2017
      • CES 2018
      • CES 2019
      • CES 2020
    • MWC
      • MWC 2014
      • MWC 2015
      • MWC 2016
      • MWC 2017
      • MWC 2018
      • MWC 2019
    • Computex
      • Computex 2014
      • Computex 2015
      • Computex 2016
      • Computex 2017
      • Computex 2018
      • Computex 2019
    • E3
      • E3 2014
      • E3 2015
      • E3 2016
      • E3 2017
    • IFA
      • IFA 2014
      • IFA 2015
      • IFA 2016
      • IFA 2017
    • TGS
      • TGS 2016
  • 关于 我们
    • À propos de mashdigi
    • coordonnées du site web mashdigi
11/12/2025 08:58 Jeudi
  • Connexion
mashdigi – Technologie, nouveaux produits, actualités intéressantes, tendances
  • Sujets principaux
  • Intelligence artificielle
  • Pilote automatique
  • réseau
  • processeur
  • Téléphone portable
  • Expositions
    • CES
      • CES 2014
      • CES 2015
      • CES 2016
      • CES 2017
      • CES 2018
      • CES 2019
      • CES 2020
    • MWC
      • MWC 2014
      • MWC 2015
      • MWC 2016
      • MWC 2017
      • MWC 2018
      • MWC 2019
    • Computex
      • Computex 2014
      • Computex 2015
      • Computex 2016
      • Computex 2017
      • Computex 2018
      • Computex 2019
    • E3
      • E3 2014
      • E3 2015
      • E3 2016
      • E3 2017
    • IFA
      • IFA 2014
      • IFA 2015
      • IFA 2016
      • IFA 2017
    • TGS
      • TGS 2016
  • 关于 我们
    • À propos de mashdigi
    • coordonnées du site web mashdigi
Pas de résultat
Voir tous les résultats
  • Sujets principaux
  • Intelligence artificielle
  • Pilote automatique
  • réseau
  • processeur
  • Téléphone portable
  • Expositions
    • CES
      • CES 2014
      • CES 2015
      • CES 2016
      • CES 2017
      • CES 2018
      • CES 2019
      • CES 2020
    • MWC
      • MWC 2014
      • MWC 2015
      • MWC 2016
      • MWC 2017
      • MWC 2018
      • MWC 2019
    • Computex
      • Computex 2014
      • Computex 2015
      • Computex 2016
      • Computex 2017
      • Computex 2018
      • Computex 2019
    • E3
      • E3 2014
      • E3 2015
      • E3 2016
      • E3 2017
    • IFA
      • IFA 2014
      • IFA 2015
      • IFA 2016
      • IFA 2017
    • TGS
      • TGS 2016
  • 关于 我们
    • À propos de mashdigi
    • coordonnées du site web mashdigi
Pas de résultat
Voir tous les résultats
mashdigi – Technologie, nouveaux produits, actualités intéressantes, tendances
Pas de résultat
Voir tous les résultats
page de garde Dynamique du marché

Google lance VaultGemma, le modèle de langage à grande échelle différentiellement privé le plus puissant jamais conçu, marquant une nouvelle étape dans l'équilibre entre confidentialité et performances.
Libérer de manière synchrone les poids des modèles sur les plateformes Hugging Face et Kaggle

Écrit par : Mash Yang
2025-09-14
in Dynamique du marché, 生活, réseau, Logiciel
A A
0
Partager sur FacebookPartager sur TwitterPartager sur LINE

L'équipe de recherche de Google annonce le lancement deNouveau modèle VaultGemma, se présentant comme le modèle linguistique à grande échelle le plus puissant actuellement disponible, entièrement formé de zéro et protégé par la confidentialité différentielle (DP). Les pondérations du modèle sont publiées simultanément sur les plateformes Hugging Face et Kaggle, permettant aux développeurs et aux universitaires de les utiliser, de les vérifier et de les améliorer librement.

▲L'équipe de recherche de Google annonce le lancement d'un nouveau modèle VaultGemma

Publicité

Avec la généralisation de l'IA générative, la protection de la vie privée est devenue un enjeu crucial dans le développement de l'IA. La confidentialité différentielle réduit le risque que les modèles mémorisent des données individuelles en introduisant du « bruit » lors de l'apprentissage. Cependant, cela présente également des défis tels qu'une stabilité d'apprentissage réduite, une taille de lot accrue et des coûts de calcul accrus.

Google a déclaré que la recherche menée en collaboration avec DeepMind a établi pour la première fois des « lois de mise à l'échelle du modèle de confidentialité différentiel », qui peuvent prédire avec précision la configuration de formation optimale sous différents budgets de calcul, de confidentialité et de données, devenant un guide important pour la formation de modèles de confidentialité différentiels hautes performances.

Confidentialité différentielleLa structure de la loi d'échelle, souligne GoogleLa perte de prédiction peut être modélisée avec précision à l'aide de la taille du modèle, du nombre d'itérations et du rapport bruit/lot, simplifiant ainsi les interactions complexes entre le calcul, la confidentialité et le budget de données.

VaultGemma est une nouvelle version basée sur Gemma 10, conçue avec un milliard de paramètres. Grâce à des expériences systématiques, l'équipe de recherche de Google a quantifié la relation entre la taille du modèle, le nombre d'itérations d'entraînement et le rapport bruit, et a conclu que la stratégie optimale pour un entraînement différentiellement privé consiste à utiliser des modèles plus petits avec des lots plus importants. Cette stratégie permet à VaultGemma d'atteindre des performances proches de celles des modèles non privés tout en préservant une confidentialité accrue, avec des performances comparables à celles des modèles non différentiellement privés d'il y a cinq ans.

Techniquement, VaultGemma utilise un algorithme DP-SGD évolutif et une méthode d'échantillonnage de Poisson améliorée pour garantir une taille de lot constante tout en préservant de solides garanties de confidentialité. Le modèle obtenu atteint une confidentialité différentielle au niveau de la séquence (ε ≤ 2.0, δ ≤ 1.1e-10), garantissant que même si un seul exemple d'entraînement est interrogé, il est pratiquement impossible pour le modèle de le reproduire. Google a également effectué des tests de mémorisation, qui ont montré que VaultGemma ne « valide » pratiquement aucune donnée d'entraînement.

▲L'avantage marginal de l'augmentation du budget de confidentialité (epsilon) et du budget de calcul (taille du lot) en termes d'impact du rapport bruit/lot

Google a constaté que, même si les performances des modèles différentiellement privés restent légèrement inférieures à celles des versions entièrement non privées, l'écart s'est réduit et des pistes de recherche claires permettent de les améliorer. VaultGemma démontre non seulement l'engagement à long terme de Google en faveur de la protection de la vie privée, mais fournit également une référence reproductible et vérifiable pour l'industrie et le monde universitaire, favorisant ainsi le développement de la prochaine génération d'IA axée sur la confidentialité.

▲Comparaison des performances de VaultGemma 1B (confidentialité différentielle) avec sa version non privée (Gemma3 1B) et une référence antérieure (GPT-2 1.5B).Les résultats quantifient l’investissement en ressources requis pour la confidentialité actuelle et montrent que la formation moderne différentiellement privée produit une utilité comparable aux modèles non privés d’il y a environ cinq ans.

Pour les développeurs, la sortie de VaultGemma propose non seulement des modèles pré-entraînés, mais également un rapport technique complet et des recommandations d'optimisation, permettant aux entreprises et aux équipes de recherche d'adapter leurs modèles à leurs besoins informatiques et de confidentialité. Ainsi, à l'avenir, nous pouvons nous attendre à voir davantage d'entreprises adopter l'IA, réduisant ainsi les risques pour la confidentialité, répondant aux exigences réglementaires et protégeant les données des utilisateurs, tout en bénéficiant de modèles hautes performances.

Enfin, Google a souligné que Vault Gemma n'était qu'une première étape. À l'avenir, la société continuera d'améliorer le mécanisme d'entraînement différentiel à la confidentialité, d'optimiser les performances et d'abaisser le seuil de calcul, afin que l'IA « à la fois sûre et intelligente » devienne la norme sur le marché.

Comparaison des paramètres et des performances de VaultGemma, de Gemma non différentiellement privé et des premiers modèles GPT-2 :

Modèle VaultGemma 1B Gemma 3 1B GPT-2 1.5B
Échelle des paramètres 10 milliards de paramètres 10 milliards de paramètres 15 milliards de paramètres
la protection de la vie privée Intimité différentielle (ε ≤ 2.0, δ ≤ 1.1e-10) Pas de confidentialité différentielle Pas de confidentialité différentielle
Méthodes de formation Optimisation de l'échantillonnage DP-SGD + Poisson Formation standard non-DP Formation traditionnelle non DP en grands lots
Performances (par rapport aux modèles non DP) Proche du modèle non-DP d'il y a 5 ans (même niveau que GPT-2) Légèrement supérieur à VaultGemma Inférieur aux modèles modernes non-DP, mais similaire à VaultGemma
Risque lié à la mémoire des données Presque aucune mémorisation n'est détectée Il y a un certain risque de mémorisation Risque élevé de mémorisation (vérifié à plusieurs reprises)
Statut de la version Publié, open source (Hugging Face et Kaggle) Publié, open source Modèles historiques, accessibles au public en téléchargement
Mots clés: AIGemmeGoogleconfidentialitéVaultGemmaIntelligence artificielle隱私
PartagezTweetPartagez
Mash Yang

Mash Yang

Fondateur et rédacteur en chef de mashdigi.com, et étudiant en journalisme technologique.

Laissez un commentaire Annuler la réponse

Votre adresse courriel n'apparaitra pas. Les champs obligatoires sont marqués *

Ce site utilise Akismet pour réduire les spams. Découvrez comment vos données de commentaire sont traitées.

  • Populaire
  • 留言
  • 最新
Sony dévoile le Xperia PRO, un téléphone phare en cours de développement, prenant en charge les bandes d'ondes inférieures à 6 GHz et millimétriques

Sony dévoile le Xperia PRO, un téléphone phare en cours de développement, prenant en charge les bandes d'ondes inférieures à 6 GHz et millimétriques

2020-02-24
Interview/Le nouveau téléphone phare de Sony, le Xperia 5, se positionne-t-il comme un téléphone « Compact » ?

Interview/Le nouveau téléphone phare de Sony, le Xperia 5, se positionne-t-il comme un téléphone « Compact » ?

2019-09-07
La Fondation Raspberry Pi a annoncé la carte de développement Raspberry Pi 5, indiquant que les problèmes de chaîne d'approvisionnement se sont améliorés.

La Fondation Raspberry Pi a annoncé la carte de développement Raspberry Pi 5, indiquant que les problèmes de chaîne d'approvisionnement se sont améliorés.

2023-09-28
À partir de mai de l'année prochaine, Google donnera la priorité aux pages Web non AMP dans les résultats de recherche mobile

À partir de mai de l'année prochaine, Google donnera la priorité aux pages Web non AMP dans les résultats de recherche mobile

2
La société mère d'Ubuntu confirme son intention d'entrer en bourse, mais aucun calendrier précis n'a été fixé.

La société mère d'Ubuntu confirme son intention d'entrer en bourse, mais aucun calendrier précis n'a été fixé.

1

Sony Interactive Entertainment confirme que la PlayStation 5 ne sera rétrocompatible qu'avec la plupart des jeux PlayStation 4.

0
Rockstar Games annonce plus d'informations sur les personnages et les étapes d'aventure de Grand Theft Auto 6

Accusée de répression contre les syndicats ? Rockstar Games licencie 31 employés affiliés à un syndicat ; le Premier ministre britannique annonce l’ouverture d’une enquête.

2025-12-11
Instagram a enfin permis aux utilisateurs de « régler » son algorithme, en lançant la fonctionnalité « Votre algorithme » pour rendre les recommandations de l'IA plus personnalisées.

Instagram a enfin permis aux utilisateurs de « régler » son algorithme, en lançant la fonctionnalité « Votre algorithme » pour rendre les recommandations de l'IA plus personnalisées.

2025-12-11
L’UE a proposé un projet de ligne directrice sur l’intelligence artificielle générale, qui devrait être finalisé en mai 2025.

L'UE est parvenue à un accord visant à réduire ses émissions de carbone de 90 % d'ici 2040, surpassant ainsi les efforts des États-Unis et de la Chine, et ambitionnant la neutralité carbone d'ici 2050.

2025-12-11
mashdigi – Technologie, nouveaux produits, actualités intéressantes, tendances

Copyright © 2017 mashdigi.com

  • À propos de mashdigi.com
  • 投放廣告
  • Contactez mashdigi.com

Suivez-nous

Ravis de vous revoir!

Connectez-vous à votre compte ci-dessous

Mot de passe oublié?

Récupérez votre mot de passe

Vous avez déjà une adresse e-mail? Cliquez ici.

Se connecter
Pas de résultat
Voir tous les résultats
  • À propos de mashdigi.com
  • 投放廣告
  • Contactez mashdigi.com

Copyright © 2017 mashdigi.com

Aller à la version mobile