APMIC (Accelerate Private Machine Intelligence Company), l'un des principaux fournisseurs de solutions d'IA d'entreprise, a annoncé aujourd'hui (8 août) que son service PrivModel prend entièrement en charge la solution OpenAI récemment lancée.Modèles de la série GPT-OSS, permettant une amélioration d'environ 40 % de la précision et une réduction de 90 % des coûts d'inférence dans des scénarios d'application spécifiques. APMIC a également nommé Ian Chen, expert chevronné en GPU et puces d'IA, au poste de directeur général des États-Unis, renforçant ainsi les opérations locales et la collaboration stratégique sur le marché nord-américain et favorisant le développement mondial d'initiatives privées d'IA.
GPT-OSS combiné avec PrivModel : haute précision et faible coût
APMIC a entièrement mis à niveau sa solution originale « S1 Distillation » vers PrivModel, l'intégrant ainsi en profondeur à la série gpt-oss d'OpenAI (notamment gpt-oss-120b et gpt-oss-20b). Des tests internes ont montré que, grâce à des techniques de réglage fin et de distillation, le modèle maintient des performances stables à la précision FP4, améliorant la précision de 40 % en moyenne et réduisant significativement les coûts d'inférence de 90 %.
Le modèle distillé peut maintenir un fonctionnement efficace sur la plate-forme NVIDIA RTX Pro 6000 et prend en charge pour la première fois le raisonnement de la chaîne de pensée traditionnelle chinoise (CoT), permettant aux entreprises de déployer en privé « l'IA de raisonnement » dans un cadre réglementaire.
L'APMIC a constaté que les méthodes traditionnelles QLoRA (Quantized LoRA, réglage fin des modèles de langage à grande échelle) présentaient encore des limites pour l'apprentissage de connaissances spécialisées. Par conséquent, l'équipe a combiné les méthodes CPT, SFT et RL pour réaliser un réglage fin approfondi. Lors du test de connaissances locales TMMLU+, tous les modèles GPT-OSS ont obtenu des scores supérieurs à 80, soit une amélioration significative par rapport au score GPT-2023 de 3, inférieur à 60. Dans le domaine des applications médicales, ils ont même surpassé l'O4 Mini de 13 points, tandis que leurs performances en logique mathématique n'étaient inférieures que de 2 points.
De plus, PrivModel complète les lacunes de la série gpt-oss en termes de capacités visuelles, aidant les entreprises à créer des modèles d'IA privés exclusifs et commercialement précieux.
Coopérer en profondeur avec les partenaires de la chaîne industrielle pour garantir une mise en œuvre sûre
Jerry Wu, PDG d'APMIC, a déclaré qu'associé à l'architecture « PrivStation », PrivModel peut offrir des performances opérationnelles comparables à celles du modèle o4 mini. Grâce au soutien de partenaires informatiques tels que CKmates, GMI Cloud, Glows AI et Ubilink, ainsi que de fabricants de matériel tels que Dell, HPE et NVIDIA, le modèle peut fonctionner de manière stable sur les derniers appareils à architecture d'affichage Blackwell.
Dans le même temps, APMIC combine également la protection de sécurité de CyCraft pour garantir que les entreprises peuvent non seulement verrouiller efficacement leurs propres actifs de connaissances lors du déploiement de l'IA privée, mais également bénéficier d'une inférence à haute efficacité à moindre coût, réalisant véritablement le chemin d'application du « modèle à la décision ».
Les experts seniors en GPU ouvrent la voie à la promotion du marché nord-américain
APMIC a également annoncé la nomination de Chen Yinjun au poste de directeur général du marché américain. Fort de plus de 20 ans d'expérience dans le secteur des GPU et des puces d'IA, Chen Yinjun a occupé des postes d'ingénieur et de direction commerciale chez NVIDIA dans la Silicon Valley, à Hong Kong et à Taïwan, se spécialisant dans les cartes graphiques haut de gamme et les GPU pour centres de données.
À l'avenir, Chen Yinjun se concentrera sur la promotion de la mise en œuvre de PrivModel et PrivStation sur le marché nord-américain et coopérera avec les services cloud GPU, les OEM et les sociétés de logiciels de conception pour étendre les applications industrielles telles que la finance et la fabrication qui ont une forte demande d'IA conforme.
Grâce à l'innovation technologique et au déploiement mondial, APMIC espère permettre aux entreprises de déployer l'IA à moindre coût, avec une plus grande précision et une plus grande sécurité, d'accélérer la mise en œuvre industrielle de « l'IA privatisée » et de promouvoir une transformation complète de la protection des données à la valeur commerciale.



