Le « modèle d'IA ouvert » d'OpenAI, initialement prévu pour être publié cette semaine, a été annoncé plus tôt par le PDG Sam Altman.Annoncer personnellement le report, et a expliqué que le plan initial était de publier un modèle de langage avec des poids ouverts cette semaine, mais considérant que les risques de sécurité associés nécessitent encore des tests supplémentaires, il a été décidé de reporter le calendrier de lancement.
Sam Altman a déclaré : « Une fois les pondérations du modèle publiées, il n'y a plus de retour en arrière possible. Nous prenons cette expérience très au sérieux. C'est la première fois qu'OpenAI prévoit de publier un modèle de langage avec des pondérations complètes, et nous voulons réussir. »
Ce « modèle ouvert » est considéré comme le premier retour d'OpenAI à une stratégie de développement technologique relativement ouverte depuis la sortie de GPT-2019 en 2. Le modèle devrait être exécuté sur le propre matériel des utilisateurs, capable de raisonnement à long terme et de réponses très fiables, symbolisant l'exploration continue par OpenAI des possibilités de l'open source et de la transparence dans l'IA.
Cependant, ce projet a également suscité de nombreuses discussions et une évaluation minutieuse dans le contexte du développement rapide de l'IA. La divulgation des pondérations, qui expose les détails du fonctionnement interne du modèle, pourrait entraîner des risques accrus pour la société et la sécurité de l'information en cas d'utilisation abusive. OpenAI a déclaré à plusieurs reprises que la sécurité de l'IA et la supervision des applications sont des éléments essentiels de sa stratégie de développement.
Bien que Sam Altman n'ait pas précisé le calendrier précis de report ni révélé les goulots d'étranglement techniques rencontrés lors des tests actuels, il a souligné que le modèle sera officiellement publié après s'être assuré qu'il est conforme aux principes de sécurité ouverts.
Selon les déclarations publiques précédentes, ce modèle de poids ouvert devrait avoir les caractéristiques suivantes :
• Les applications peuvent être déployées sur du matériel grand public (tel que des serveurs GPU)
• Prend en charge plusieurs cycles de raisonnement sur texte long et de réponses aux questions
• Maintenir la cohérence logique et la haute précision des modèles de langage existants d’OpenAI
• Orienté vers une communauté d'utilisateurs ouverte, facilitant la recherche et les applications de réglage de modèles
De plus, certains observateurs du secteur suggèrent que la décision d'OpenAI de publier ce modèle répond en partie à la pression concurrentielle exercée par la tendance actuelle à l'IA ouverte. Actuellement, des entreprises comme Meta, Mistral et Cohere ont successivement ouvert le code source de leurs modèles linguistiques à grande échelle, et les communautés de modèles ouverts (comme LLaMA et Mixtral) connaissent une croissance rapide, favorisant les échanges techniques et la flexibilité des applications entre entreprises, instituts de recherche et développeurs.
À l'heure actuelle, OpenAI n'a pas annoncé le nom du modèle spécifique et l'échelle des paramètres, mais on pense généralement que le modèle peut être comparable à la série LLaMA 3 de Meta ou à la dernière version du modèle Mistral, devenant ainsi une partie importante de l'écosystème open source de l'IA.
Alors que les modèles linguistiques continuent de progresser vers l'évolutivité, la sécurité et la contrôlabilité, le report d'OpenAI, bien que quelque peu conservateur, démontre l'importance continue de la prévention des risques et de la réflexion à long terme dans l'industrie de l'IA en évolution rapide.
L'acquisition de WindSurf par OpenAI serait rompue
D'autre part, en mai dernier, il a été annoncé qu'OpenAI prévoyait d'acquérir la startup d'IA WindSurf pour un montant pouvant atteindre 5 milliards de dollars afin de renforcer son offre de technologie de codage assisté par IA. Cependant, les dernières nouvelles montrent que ce plan pourrait avoir changé. La principale raison est que deux dirigeants clés de WindSurf, dont le PDG Varun Mohan et le cofondateur Douglas Chen, ont rejoint Google DeepMind et signé un accord de licence technologique non exclusif, jetant ainsi une ombre sur ce projet d'acquisition à succès.
WindSurf est une start-up spécialisée dans la génération de code et les outils de développement d'IA. Elle a acquis une popularité considérable auprès de la communauté des développeurs au cours de l'année écoulée.Bloomberg NewsIl avait été précédemment rapporté qu'OpenAI et WindSurf avaient conclu un accord préliminaire d'acquisition, signé une lettre d'intention et entamé des négociations exclusives. La valeur de la transaction était estimée à 30 milliards de dollars. Cependant, des inquiétudes au sein de WindSurf concernant le partenariat entre Microsoft et OpenAI ont finalement conduit à une rupture des négociations.
Selon des rapports ultérieurs, Google n'a pas directement acquis WindSurf, ni participé à des investissements en actions, mais grâce à des licences technologiques non exclusives et au braconnage, il a réussi à acquérir les principaux talents de WindSurf et certains droits technologiques, dépensant un total d'environ 24 milliards de dollars américains.Site Web de TechCrunchIl a déclaré que l'ajout de Mohan et Chen aidera DeepMind à améliorer ses capacités de développement et de déploiement automatisés de programmes d'agents d'IA.








