Apple semble rencontrer de sérieuses difficultés d'infrastructure interne dans sa quête d'une intelligence artificielle générative. (D'après le site web The Information...)Recevez des nouvellesL'utilisation réelle d'Apple Intelligence étant inférieure aux prévisions, et compte tenu de la forte fragmentation de l'architecture technique de ses équipes de R&D internes, jusqu'à 90 % de la puissance de calcul des serveurs d'IA qu'Apple a préparée pour son cloud privé (PCC) reste inutilisée. Pour remédier à cette situation critique, Apple a confirmé son intention d'étendre sa collaboration avec Google et d'intégrer directement la technologie Gemini afin d'améliorer la nouvelle version de Siri, dont le lancement est prévu cette année.
L'intérieur est parsemé de nombreuses petites collines : 90 % de la puissance de calcul des serveurs de cloud privé est inutilisée.
D'après les données divulguées dans le rapport, sur la puissance de calcul matérielle qu'Apple a réservée pour prendre en charge le cloud computing d'Apple Intelligence, seulement 10 % environ ont été déployés dans les centres de données, et les 90 % restants des serveurs d'IA sont actuellement inactifs.
La cause profonde de ce gaspillage considérable de ressources réside dans la fragmentation extrême de l'infrastructure d'IA interne d'Apple. Les différentes équipes de R&D en IA d'Apple opèrent indépendamment, utilisent des technologies radicalement différentes et n'ont pas réussi à mettre en place une architecture serveur unifiée et efficace.
Ce modèle de R&D fragmenté a non seulement freiné l'efficacité globale du développement, mais a également entraîné d'importants dépassements de coûts dus à la construction d'infrastructures redondantes.
Compromis à court terme : partenariat avec Google pour alimenter la nouvelle version de Siri avec la technologie Gemini.
Face aux goulets d'étranglement de son infrastructure interne et à la demande urgente du marché pour des applications d'IA, Apple a opté pour un compromis pragmatique à court terme : approfondir sa coopération avec Google et utiliser le modèle Gemini comme moteur principal pour la mise à niveau de Siri.
La grande nouveauté de cette année : Apple devrait lancer une version profondément remaniée de Siri. Cette nouvelle version sera basée sur un modèle d'IA Gemini personnalisé (nom de code interne : Foundation Models v10) doté de 1 200 milliards de paramètres, améliorant considérablement la compréhension et les capacités conversationnelles de Siri.
Un chatbot autonome dans iOS 27 l'année prochaine : Apple prévoit d'intégrer à la prochaine mise à jour iOS 27 un chatbot Siri autonome plus performant. Bien que propriétaire du système, il s'exécutera sur l'infrastructure TPU et cloud de Google et bénéficiera d'une version plus avancée de Foundation Models v11, dont les performances devraient rivaliser avec celles de Gemini 3.
Stratégie à long terme : Puce serveur IA développée en interne, nom de code « Baltra »
Bien qu'Apple doive s'appuyer sur le soutien de Google à court terme, il est clair qu'elle n'a aucune intention de confier à un concurrent, à long terme, la clé de voûte de son intelligence artificielle dans le cloud.
Pour inverser radicalement sa dépendance aux technologies étrangères, Apple poursuit le développement d'un circuit intégré spécifique (ASIC) pour serveur d'IA, conçu en interne et baptisé « Baltra ». Cette puce devrait présenter les caractéristiques avancées suivantes :
• Une alliance puissante :Nous avons entamé une collaboration de conception approfondie avec Broadcom, un important fabricant de puces réseau.
• Procédés de fabrication avancés :Il est fabriqué à l'aide du procédé haut de gamme actuel de TSMC, le « N3E » de 3 nm.
• Architecture à puces : En intégrant différents modules fonctionnels dans un seul boîtier, la conception Chiplet optimise considérablement l'efficacité de la communication au sein de la puce, tout en permettant à Apple de maintenir une stricte confidentialité concernant les détails de conception de l'architecture globale de la puce vis-à-vis de ses partenaires.
Analyse des points de vue
Cette fuite révèle l'approche à deux volets d'Apple concernant sa stratégie en matière d'IA : « L'expérience utilisateur repose sur des alliances, tandis que l'infrastructure système repose sur un développement interne. »
Le fait que jusqu'à 90 % de sa puissance de calcul dans le cloud privé soit inutilisée révèle les lacunes d'Apple en matière de logiciels cloud et de gestion de l'architecture serveur. Cependant, le génie d'Apple réside dans sa volonté de revoir ses exigences à la baisse et, face à une éventuelle baisse de l'expérience utilisateur, d'intégrer directement la technologie Gemini de Google, leader du secteur, afin de prolonger la durée de vie de Siri. Ainsi, des centaines de millions d'utilisateurs d'iPhone pourront profiter cette année d'une expérience d'assistant vocal IA de premier ordre, sans être pénalisés par les difficultés techniques internes d'Apple.
Parallèlement, le véritable atout d'Apple réside dans son projet de puce développée en interne, nom de code Baltra. Une fois cette puce serveur, basée sur le procédé 3 nm de TSMC et l'architecture Chiplet, finalisée, Apple pourra reproduire à la perfection les gains d'efficacité énergétique obtenus grâce à Apple Silicon (puces de la série M) dans ses centres de données. Dès lors, Apple pourra non seulement s'affranchir totalement de sa dépendance à Google Cloud, mais aussi reprendre la maîtrise absolue de l'intégration matérielle et logicielle.



