30 milliards de revenus, 122 milliards levés — et toujours pas assez de GPU.

Anthropic annonce un run rate de 30 milliards de dollars. OpenAI boucle un tour de 122 milliards. Pendant ce temps, GitHub observe une explosion 14x des commits en trois mois. Toute cette puissance de feu financière, et la ressource critique reste introuvable : le compute.

La course aux milliards, décryptée

Les chiffres donnent le vertige. Anthropic affiche désormais un run rate annuel de plus de 30 milliards de dollars — en hausse depuis 9 milliards fin 2025. Plus de 1 000 clients entreprises dépassent le million de dollars annualisé, un chiffre qui a doublé en moins de deux mois [1]. Pour alimenter cette croissance, Anthropic vient de sécuriser 3,5 gigawatts de capacité de compute TPU avec Google et Broadcom, disponibles à partir de 2027.

Côté OpenAI, le “tour de table” de 122 milliards mérite un examen plus attentif. L’analyse de SaaStr est sans concession : une partie significative n’est pas du capital frais mais des accords fournisseurs, du capital contingent et un rendement garanti que l’entreprise “ne peut sans doute pas se permettre” [2]. Des deals avec Microsoft et SoftBank, conditionnés à des milestones de revenus, avec un retour minimum garanti aux investisseurs. Le vrai cash injecté serait bien moindre que le headline.

Deux géants. Deux stratégies de financement radicalement différentes. Mais un même problème.

Le mur du compute

Le COO de GitHub vient de partager un chiffre sidérant : une augmentation annualisée de ~14x du nombre de commits ces trois derniers mois [3]. L’essentiel vient des agents de codage qui passent en mainstream. Et c’est probablement sous-estimé — beaucoup de “vibe coders” n’utilisent même pas Git.

« All AI companies are feeling this intensely. Even worse, there is a domino effect — when Claude Code starts tightening usage limits, people start switching to Codex or OpenCode, putting increased pressure on them. »

La rumeur que Sora aurait été coupé pour libérer du compute pour d’autres tâches n’a rien de surprenant dans ce contexte [3]. La demande en inférence croît plus vite que la capacité à construire des datacenters. Et les gigawatts sécurisés par Anthropic ne seront disponibles qu’en 2027.

La riposte par l’ingénierie

Quand on ne peut pas simplement ajouter plus de GPU, il faut devenir plus malin avec ceux qu’on a. C’est exactement ce que décrit le deep dive de Pragmatic Engineer sur l’inference engineering — une discipline qui passe du cercle fermé des équipes modèles aux mains de tous les ingénieurs [4].

Avec les modèles fermés, l’inference engineering était réservé aux quelques milliers d’ingénieurs des labs. Mais avec l’essor des modèles open source capables, la donne change. Cursor a construit son Composer 2.0 par-dessus Kimi 2.5, en optimisant l’inférence pour obtenir de meilleures performances [4]. Le message est clair : la prochaine vague d’avantage compétitif ne viendra pas de celui qui a le plus gros modèle, mais de celui qui tire le plus d’utilité de chaque FLOP disponible.

Ce que ça change sur le terrain

Pendant que les labs se battent pour les GPU, les grandes entreprises commencent à déployer l’IA là où ça fait vraiment mal. Chez Meta, une équipe a utilisé l’IA pour cartographier le “tribal knowledge” enfermé dans des milliers de data pipelines [5]. Le problème : des milliers de pipelines Spark et Dataswarm hérités, dont la logique n’existait que dans la tête des gens qui les avaient écrits. L’IA a permis de documenter, classifier et extraire le sens de ces systèmes à une échelle qu’aucune équipe humaine n’aurait pu atteindre.

Et cette accélération change aussi la façon dont on pense l’architecture. Un débat intéressant émerge : l’IA pousse-t-elle vers les microservices ou vers le monolithe ? L’argument classique dit que les LLMs bénéficient de l’encapsulation forte, donc microservices. Mais Nate Meyvis retourne l’argument : les monolithes se déploient plus vite (critique pour le dev assisté par IA), et l’encapsulation forte ne nécessite pas des frontières de services — on peut l’obtenir au sein d’un monolithe bien structuré [6].

« I’ve recently been struck by how AI was pushing me to make several of my projects more monolithic. »

Le mot qu’il faudrait arrêter d’utiliser

Au milieu de cette frénésie d’investissements, de GPU et de déploiements, un concept continue de parasiter le débat : l’AGI. Helen Toner, ancienne du board d’OpenAI, publie un diagnostic lucide : le terme est devenu quasi inutile [7].

Le problème ? Les capacités de l’IA sont “jagged” — profondément irrégulières. Un même modèle peut surpasser un PhD sur certaines tâches et échouer sur des exercices de bon sens. On a simultanément des experts qui affirment que l’AGI a été atteinte (en avril 2025, décembre 2025, février 2026) et d’autres qui la situent dans une décennie ou plus [7]. Le “know-it-when-you-see-it” ne fonctionne manifestement pas.

Ce n’est pas un débat académique. Quand des contrats de conversion d’entreprise, des valorisations de 300 milliards et des deals avec le Pentagone dépendent de la définition de l’AGI, le flou n’est pas anodin — il est dangereux.

Le mot de la fin

L’industrie de l’IA vient de prouver qu’elle sait lever de l’argent. La vraie question qui reste : sait-elle transformer ces milliards en utilité concrète plus vite que la demande en compute n’explose ? La réponse se jouera moins dans les communiqués de presse que dans l’ingénierie d’inférence, les déploiements ciblés et les choix d’architecture. Pas dans les définitions d’AGI.

Sources

Pour aller plus loin

Google tests Jules V2 agent capable of taking bigger tasks — Google prépare Jitro, la V2 de son agent de codage Jules, orienté KPIs et capable de tâches plus ambitieuses
AI Is Becoming an Operating System Layer — Pourquoi la vraie question en due diligence n’est plus “quelle est votre stratégie IA ?” mais “à quel point avez-vous reconstruit l’entreprise autour de l’IA ?”
“Why Your Engineering Team Is Slow (It’s the Codebase, Not the People)” — Un audit en 5 signaux pour diagnostiquer si c’est la codebase (et pas les gens) qui freine votre équipe
A Cryptography Engineer’s Perspective on Quantum Computing Timelines — Un ingénieur crypto analyse les timelines réalistes de la menace quantique sur la cryptographie actuelle

Cet article a été rédigé en m’appuyant sur une IA pour m’aider à synthétiser et structurer ma veille. Les idées, le choix des sources et la relecture restent les miens.

Cet article a été rédigé en m'appuyant sur une IA pour m'aider à synthétiser et structurer ma veille. Les idées, le choix des sources et la relecture restent les miens.