D’après les rapports financiers trimestriels récemment publiés par Microsoft et Meta, l’IA non seulement ne ralentit pas, mais coûte également plus cher.
Dans leurs précédents rapports financiers, Microsoft et Meta ont toutes deux indiqué que leurs dépenses en infrastructure d'IA étaient entrées dans une nouvelle phase d'expansion. Malgré des montants d'investissement déjà colossaux, les deux entreprises ont souligné que la puissance de calcul de l'IA est une ressource rare et que les coûts atteindront des sommets en 2026, notamment en raison de l'achat de GPU pour l'accélération de l'IA et de la hausse des coûts d'électricité liée à l'augmentation de la demande en IA.
Meta n'hésite pas à investir massivement, annonçant des dépenses faramineuses de 1250 milliards de dollars.
Au cours du quatrième trimestre qui vient de s'achever, les dépenses d'investissement de Microsoft ont augmenté pour atteindre 375 milliards de dollars, tandis que celles de Meta ont augmenté de 221.37 milliards de dollars, dépassant toutes deux les attentes du marché.
Plus étonnant encore est le calendrier prévisionnel : Meta a revu à la hausse ses prévisions de dépenses pour 2026, les portant à 1250 milliards de dollars, soit une augmentation spectaculaire de 73 % par rapport à la même période l’an dernier. Ces fonds seront principalement investis dans la construction de centres de données, de serveurs et d’infrastructures réseau. Les analystes de JPMorgan soulignent que, sous l’effet du déploiement accéléré des modèles de base, des agents d’IA et des applications commerciales, la puissance de calcul actuelle dédiée à l’IA est tout simplement insuffisante pour répondre à la demande du marché.
Si vous n'en achetez pas assez, fabriquez-les vous-même : la guerre des puces personnalisées commence.
Alors que les GPU NVIDIA et AMD restent les piliers du marché, Microsoft et Meta accélèrent leurs stratégies de développement de puces personnalisées afin d'améliorer les performances et de maîtriser les coûts exorbitants.
• Méta:MétaPuce MTIA personnaliséeCe système continuera d'évoluer et prend déjà en charge l'inférence des moteurs de recherche. Son extension aux charges de travail d'entraînement pour le classement et la recommandation est prévue pour le premier trimestre 2026, ce qui représente un avantage majeur pour son partenaire de conception de puces, Broadcom.
• Microsoft :Microsoft se concentre sur l'optimisation de l'efficacité énergétique du traitement des jetons, bien queLe MAIA 200, récemment annoncéMarvell n'a pas participé au développement de la MAIA 300 de nouvelle génération, mais les analystes soulignent que Marvell apportera son concours à son développement, la production en série étant prévue pour le second semestre 2026.
Les contraintes d'approvisionnement deviennent la norme et le boom des investissements se poursuivra jusqu'en 2027.
Microsoft et Meta ont reconnu que la croissance de la demande est exponentielle, tandis que la capacité de la chaîne d'approvisionnement est linéaire, ce qui entraîne des « limites d'approvisionnement » devenues la norme. Meta a révélé que la taille de son cluster GPU a doublé pour entraîner le modèle GEM de nouvelle génération, mais qu'une expansion supplémentaire est encore nécessaire.
Cela signifie que le boom des investissements dans le matériel informatique, impulsé par les fournisseurs de services cloud (CSP), devrait se poursuivre jusqu'en 2027.



