• Sujets principaux
  • Intelligence artificielle
  • Pilote automatique
  • réseau
  • processeur
  • Téléphone portable
  • Expositions
    • CES
      • CES 2014
      • CES 2015
      • CES 2016
      • CES 2017
      • CES 2018
      • CES 2019
      • CES 2020
    • MWC
      • MWC 2014
      • MWC 2015
      • MWC 2016
      • MWC 2017
      • MWC 2018
      • MWC 2019
    • Computex
      • Computex 2014
      • Computex 2015
      • Computex 2016
      • Computex 2017
      • Computex 2018
      • Computex 2019
    • E3
      • E3 2014
      • E3 2015
      • E3 2016
      • E3 2017
    • IFA
      • IFA 2014
      • IFA 2015
      • IFA 2016
      • IFA 2017
    • TGS
      • TGS 2016
  • 关于 我们
    • À propos de mashdigi
    • coordonnées du site web mashdigi
Mardi 2026 août 03, 17h14
  • Login
mashdigi – Technologie, nouveaux produits, actualités intéressantes, tendances
  • Sujets principaux
  • Intelligence artificielle
  • Pilote automatique
  • réseau
  • processeur
  • Téléphone portable
  • Expositions
    • CES
      • CES 2014
      • CES 2015
      • CES 2016
      • CES 2017
      • CES 2018
      • CES 2019
      • CES 2020
    • MWC
      • MWC 2014
      • MWC 2015
      • MWC 2016
      • MWC 2017
      • MWC 2018
      • MWC 2019
    • Computex
      • Computex 2014
      • Computex 2015
      • Computex 2016
      • Computex 2017
      • Computex 2018
      • Computex 2019
    • E3
      • E3 2014
      • E3 2015
      • E3 2016
      • E3 2017
    • IFA
      • IFA 2014
      • IFA 2015
      • IFA 2016
      • IFA 2017
    • TGS
      • TGS 2016
  • 关于 我们
    • À propos de mashdigi
    • coordonnées du site web mashdigi
Pas de résultat
Voir tous les résultats
  • Sujets principaux
  • Intelligence artificielle
  • Pilote automatique
  • réseau
  • processeur
  • Téléphone portable
  • Expositions
    • CES
      • CES 2014
      • CES 2015
      • CES 2016
      • CES 2017
      • CES 2018
      • CES 2019
      • CES 2020
    • MWC
      • MWC 2014
      • MWC 2015
      • MWC 2016
      • MWC 2017
      • MWC 2018
      • MWC 2019
    • Computex
      • Computex 2014
      • Computex 2015
      • Computex 2016
      • Computex 2017
      • Computex 2018
      • Computex 2019
    • E3
      • E3 2014
      • E3 2015
      • E3 2016
      • E3 2017
    • IFA
      • IFA 2014
      • IFA 2015
      • IFA 2016
      • IFA 2017
    • TGS
      • TGS 2016
  • 关于 我们
    • À propos de mashdigi
    • coordonnées du site web mashdigi
Pas de résultat
Voir tous les résultats
mashdigi – Technologie, nouveaux produits, actualités intéressantes, tendances
Pas de résultat
Voir tous les résultats
Ceci est une publicité.
page de garde Dynamique du marché

La solution d'IA « PrivModel » d'APMIC prend entièrement en charge le modèle gpt-oss d'OpenAI, augmentant la précision de 40 % et réduisant les coûts d'inférence de 90 %.

Écrit par : Mash Yang
2025-08-19
in Dynamique du marché
A A
0
Partager sur FacebookPartager sur TwitterPartager sur LINE

APMIC (Accelerate Private Machine Intelligence Company), l'un des principaux fournisseurs de solutions d'IA d'entreprise, a annoncé aujourd'hui (8 août) que son service PrivModel prend entièrement en charge la solution OpenAI récemment lancée.Modèles de la série GPT-OSS, permettant une amélioration d'environ 40 % de la précision et une réduction de 90 % des coûts d'inférence dans des scénarios d'application spécifiques. APMIC a également nommé Ian Chen, expert chevronné en GPU et puces d'IA, au poste de directeur général des États-Unis, renforçant ainsi les opérations locales et la collaboration stratégique sur le marché nord-américain et favorisant le développement mondial d'initiatives privées d'IA.

La solution d'IA « PrivModel » d'APMIC prend entièrement en charge le modèle gpt-oss d'OpenAI, augmentant la précision de 40 % et réduisant les coûts d'inférence de 90 %.

Ceci est une publicité.

GPT-OSS combiné avec PrivModel : haute précision et faible coût

APMIC a entièrement mis à niveau sa solution originale « S1 Distillation » vers PrivModel, l'intégrant ainsi en profondeur à la série gpt-oss d'OpenAI (notamment gpt-oss-120b et gpt-oss-20b). Des tests internes ont montré que, grâce à des techniques de réglage fin et de distillation, le modèle maintient des performances stables à la précision FP4, améliorant la précision de 40 % en moyenne et réduisant significativement les coûts d'inférence de 90 %.

Le modèle distillé peut maintenir un fonctionnement efficace sur la plate-forme NVIDIA RTX Pro 6000 et prend en charge pour la première fois le raisonnement de la chaîne de pensée traditionnelle chinoise (CoT), permettant aux entreprises de déployer en privé « l'IA de raisonnement » dans un cadre réglementaire.

L'APMIC a constaté que les méthodes traditionnelles QLoRA (Quantized LoRA, réglage fin des modèles de langage à grande échelle) présentaient encore des limites pour l'apprentissage de connaissances spécialisées. Par conséquent, l'équipe a combiné les méthodes CPT, SFT et RL pour réaliser un réglage fin approfondi. Lors du test de connaissances locales TMMLU+, tous les modèles GPT-OSS ont obtenu des scores supérieurs à 80, soit une amélioration significative par rapport au score GPT-2023 de 3, inférieur à 60. Dans le domaine des applications médicales, ils ont même surpassé l'O4 Mini de 13 points, tandis que leurs performances en logique mathématique n'étaient inférieures que de 2 points.

De plus, PrivModel complète les lacunes de la série gpt-oss en termes de capacités visuelles, aidant les entreprises à créer des modèles d'IA privés exclusifs et commercialement précieux.

Coopérer en profondeur avec les partenaires de la chaîne industrielle pour garantir une mise en œuvre sûre

Jerry Wu, PDG d'APMIC, a déclaré qu'associé à l'architecture « PrivStation », PrivModel peut offrir des performances opérationnelles comparables à celles du modèle o4 mini. Grâce au soutien de partenaires informatiques tels que CKmates, GMI Cloud, Glows AI et Ubilink, ainsi que de fabricants de matériel tels que Dell, HPE et NVIDIA, le modèle peut fonctionner de manière stable sur les derniers appareils à architecture d'affichage Blackwell.

Dans le même temps, APMIC combine également la protection de sécurité de CyCraft pour garantir que les entreprises peuvent non seulement verrouiller efficacement leurs propres actifs de connaissances lors du déploiement de l'IA privée, mais également bénéficier d'une inférence à haute efficacité à moindre coût, réalisant véritablement le chemin d'application du « modèle à la décision ».

Les experts seniors en GPU ouvrent la voie à la promotion du marché nord-américain

APMIC a également annoncé la nomination de Chen Yinjun au poste de directeur général du marché américain. Fort de plus de 20 ans d'expérience dans le secteur des GPU et des puces d'IA, Chen Yinjun a occupé des postes d'ingénieur et de direction commerciale chez NVIDIA dans la Silicon Valley, à Hong Kong et à Taïwan, se spécialisant dans les cartes graphiques haut de gamme et les GPU pour centres de données.

À l'avenir, Chen Yinjun se concentrera sur la promotion de la mise en œuvre de PrivModel et PrivStation sur le marché nord-américain et coopérera avec les services cloud GPU, les OEM et les sociétés de logiciels de conception pour étendre les applications industrielles telles que la finance et la fabrication qui ont une forte demande d'IA conforme.

Grâce à l'innovation technologique et au déploiement mondial, APMIC espère permettre aux entreprises de déployer l'IA à moindre coût, avec une plus grande précision et une plus grande sécurité, d'accélérer la mise en œuvre industrielle de « l'IA privatisée » et de promouvoir une transformation complète de la protection des données à la valeur commerciale.

Tags: AIAPMICgpt-ossOpenAIIntelligence artificielle
PartagezTweetPartagez
Mash Yang

Mash Yang

Fondateur et rédacteur en chef de mashdigi.com, et étudiant en journalisme technologique.

留言 Annuler la réponse

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

Ce site utilise Akismet pour réduire les indésirables.En savoir plus sur la façon dont Akismet traite les commentaires des visiteurs du site Web.

Traduction (Tanslate)

Dernières mises à jour :

Les processeurs Intel Xeon 6 sont désormais intégrés au système rack DGX Rubin NVL8 de NVIDIA, devenant ainsi le « centre de commande » de l'ère de l'inférence IA.

Les processeurs Intel Xeon 6 sont désormais intégrés au système rack DGX Rubin NVL8 de NVIDIA, devenant ainsi le « centre de commande » de l'ère de l'inférence IA.

2026-03-17
Samsung dévoile la série Galaxy S26, visant 8 millions d'appareils dotés d'IA : une évolution complète en matière de performances, d'appareil photo et d'IA multi-modèle.

La division MX de Samsung annonce sa toute première perte ! Les précommandes record de la série Galaxy S26 n'ont pas résisté au choc de la « surcharge mémoire ».

2026-03-17
Microsoft ouvre les tests sur PC Windows de son service d'IA « Copilot for Gaming » pour aider les joueurs à résoudre les problèmes et à explorer les jeux en temps réel

Xbox intégrera l'assistant IA Gaming Copilot à ses consoles de génération actuelle d'ici 2026.

2026-03-17
mashdigi – Technologie, nouveaux produits, actualités intéressantes, tendances

Copyright © 2017 mashdigi.com

  • À propos de mashdigi.com
  • 投放廣告
  • Contactez mashdigi.com

Suivez-nous

Ravis de vous revoir!

Connectez-vous à votre compte ci-dessous

Mot de passe oublié?

Récupérez votre mot de passe

Vous avez déjà une adresse e-mail? Cliquez ici.

Se connecter
Pas de résultat
Voir tous les résultats
  • À propos de mashdigi.com
  • 投放廣告
  • Contactez mashdigi.com

Copyright © 2017 mashdigi.com