• Sujets principaux
  • Intelligence artificielle
  • Pilote automatique
  • réseau
  • processeur
  • Téléphone portable
  • Expositions
    • CES
      • CES 2014
      • CES 2015
      • CES 2016
      • CES 2017
      • CES 2018
      • CES 2019
      • CES 2020
    • MWC
      • MWC 2014
      • MWC 2015
      • MWC 2016
      • MWC 2017
      • MWC 2018
      • MWC 2019
    • Computex
      • Computex 2014
      • Computex 2015
      • Computex 2016
      • Computex 2017
      • Computex 2018
      • Computex 2019
    • E3
      • E3 2014
      • E3 2015
      • E3 2016
      • E3 2017
    • IFA
      • IFA 2014
      • IFA 2015
      • IFA 2016
      • IFA 2017
    • TGS
      • TGS 2016
  • 关于 我们
    • À propos de mashdigi
    • coordonnées du site web mashdigi
17/01/2026 04:56 Samedi
  • Connexion
mashdigi – Technologie, nouveaux produits, actualités intéressantes, tendances
  • Sujets principaux
  • Intelligence artificielle
  • Pilote automatique
  • réseau
  • processeur
  • Téléphone portable
  • Expositions
    • CES
      • CES 2014
      • CES 2015
      • CES 2016
      • CES 2017
      • CES 2018
      • CES 2019
      • CES 2020
    • MWC
      • MWC 2014
      • MWC 2015
      • MWC 2016
      • MWC 2017
      • MWC 2018
      • MWC 2019
    • Computex
      • Computex 2014
      • Computex 2015
      • Computex 2016
      • Computex 2017
      • Computex 2018
      • Computex 2019
    • E3
      • E3 2014
      • E3 2015
      • E3 2016
      • E3 2017
    • IFA
      • IFA 2014
      • IFA 2015
      • IFA 2016
      • IFA 2017
    • TGS
      • TGS 2016
  • 关于 我们
    • À propos de mashdigi
    • coordonnées du site web mashdigi
Pas de résultat
Voir tous les résultats
  • Sujets principaux
  • Intelligence artificielle
  • Pilote automatique
  • réseau
  • processeur
  • Téléphone portable
  • Expositions
    • CES
      • CES 2014
      • CES 2015
      • CES 2016
      • CES 2017
      • CES 2018
      • CES 2019
      • CES 2020
    • MWC
      • MWC 2014
      • MWC 2015
      • MWC 2016
      • MWC 2017
      • MWC 2018
      • MWC 2019
    • Computex
      • Computex 2014
      • Computex 2015
      • Computex 2016
      • Computex 2017
      • Computex 2018
      • Computex 2019
    • E3
      • E3 2014
      • E3 2015
      • E3 2016
      • E3 2017
    • IFA
      • IFA 2014
      • IFA 2015
      • IFA 2016
      • IFA 2017
    • TGS
      • TGS 2016
  • 关于 我们
    • À propos de mashdigi
    • coordonnées du site web mashdigi
Pas de résultat
Voir tous les résultats
mashdigi – Technologie, nouveaux produits, actualités intéressantes, tendances
Pas de résultat
Voir tous les résultats
page de garde  Application

OpenAI entraîne l'IA à « avouer » ! Un nouveau système récompense les modèles qui admettent honnêtement leurs torts.
Même le fait d'admettre avoir triché peut rapporter des points, ce qui permet de résoudre le problème des grands modèles de langage qui mentent ou créent des illusions pour plaire aux utilisateurs, et de révéler le processus de prise de décision grâce à des « réponses secondaires ».

Écrit par : Mash Yang
2025-12-04
in  Application , Dynamique du marché, 生活, réseau, observer, Logiciel
A A
0
Partager sur FacebookPartager sur TwitterPartager sur LINE

Pour rendre l'intelligence artificielle plus transparente et réduire les cas d'absurdités graves, OpenAI...DescriptionUn tout nouveau cadre de formation est en cours de développement ; l’équipe le nomme « mécanisme de confession ». Son principe fondamental est d’entraîner les modèles d’IA à reconnaître proactivement leurs comportements inappropriés, même si ces comportements sont erronés. S’ils « avouent honnêtement », ils peuvent recevoir une récompense.

OpenAI entraîne l'IA à « avouer » ! Un nouveau système récompense les modèles qui admettent honnêtement leurs torts.

Lutter contre la « flatterie » et l’illusion de surconfiance de l’IA

OpenAI souligne que les grands modèles de langage (LLM) sont actuellement généralement entraînés à produire des réponses qui « semblent répondre aux attentes des utilisateurs ». Cela conduit à un effet secondaire : les modèles sont de plus en plus enclins à la « flagornerie », c’est-à-dire à dire la même chose pour plaire à l’utilisateur, ou à affirmer avec assurance de fausses informations (c’est-à-dire à créer des illusions).

Pour remédier à ce problème, le nouveau modèle de formation tente d'encourager l'IA à fournir une « réponse secondaire » en plus de la réponse principale, expliquant comment elle est parvenue à cette réponse.

Mécanisme de récompense : Si vous êtes honnête, vous recevrez également des points pour avoir admis avoir « triché ».

Le fonctionnement de ce système de « confession » est radicalement différent de celui des formations traditionnelles. Alors que les réponses générales sont évaluées selon leur utilité, leur exactitude et leur conformité, les « confessions » sont évaluées uniquement sur la base de l'« honnêteté ».

Dans sa documentation technique, OpenAI explique : « Si un modèle admet honnêtement avoir piraté un test, utilisé des techniques de sape ou même enfreint des instructions, le système augmentera les récompenses pour de tels aveux, permettant au modèle d'être plus honnête dans la description du processus au cours duquel il "ment", permettant ainsi au système de permettre au modèle de corriger les réponses générées en temps réel, réduisant ainsi la proportion de contenu généré qui est "illusoire". »

Cela signifie qu'OpenAI souhaite inciter les modèles à être honnêtes quant à leur comportement, même face à des comportements potentiellement problématiques. Ce mécanisme d'apprentissage de la « reconnaissance des erreurs » par l'IA pourrait jouer un rôle important dans l'amélioration de la sécurité et de l'interprétabilité des grands modèles de langage à l'avenir.

Mots clés: LLMOpenAIGrands modèles de langage懺悔
PartagezTweetPartagez
Mash Yang

Mash Yang

Fondateur et rédacteur en chef de mashdigi.com, et étudiant en journalisme technologique.

Laissez un commentaire Annuler la réponse

Votre adresse courriel n'apparaitra pas. Les champs obligatoires sont marqués *

Ce site utilise Akismet pour réduire les spams. Découvrez comment vos données de commentaire sont traitées.

mashdigi – Technologie, nouveaux produits, actualités intéressantes, tendances

Copyright © 2017 mashdigi.com

  • À propos de mashdigi.com
  • 投放廣告
  • Contactez mashdigi.com

Suivez-nous

Ravis de vous revoir!

Connectez-vous à votre compte ci-dessous

Mot de passe oublié?

Récupérez votre mot de passe

Vous avez déjà une adresse e-mail? Cliquez ici.

Se connecter
Pas de résultat
Voir tous les résultats
  • À propos de mashdigi.com
  • 投放廣告
  • Contactez mashdigi.com

Copyright © 2017 mashdigi.com