L'agent qui sort la carte bleue : la nouvelle économie des agents IA
Aurélien Allienne
Publié le • 6 min de lecture
L’agent qui sort la carte bleue : la nouvelle économie des agents IA
Combien de fois ton agent IA t’a-t-il demandé tes credentials cette semaine ? À partir de cette semaine, il n’aura peut-être plus besoin de demander : il peut désormais ouvrir un compte Cloudflare, acheter un domaine, lancer une campagne Meta et passer commande sur Stripe — sans que tu touches un dashboard. En face, les hyperscalers viennent de cramer 112 milliards de dollars en un trimestre [1]. La question n’est plus de savoir si les agents passent en prod. C’est de savoir qui paye, et combien.
Cette semaine, l’agent a obtenu son permis de dépenser
Trois annonces en quatre jours, et la même direction. Stripe ouvre link-cli, qui permet à un agent de payer en ton nom : tu lances link login, tu approuves un montant, et l’agent peut acheter du café, des serveurs ou des billets d’avion sans jamais voir ta carte [2]. Cloudflare embraye le 30 avril : un agent peut désormais créer un compte, démarrer un abonnement payant, enregistrer un domaine et récupérer un token API pour déployer du code, sans qu’un humain copie un seul secret [3]. Et Meta sort son ads-cli qui plug ton agent directement dans le Marketing API : créer une campagne, ajuster les budgets, lire les conversions — au prompt [4].
L’angle commun n’est pas la nouveauté technique. C’est le déplacement du périmètre de confiance. Hier, l’agent appelait ton API. Aujourd’hui, il ouvre un compte, achète, déploie. Le rôle du human-in-the-loop devient explicite : approuver, pas exécuter.
Et derrière, la facture qui s’aligne
Pendant que les agents apprennent à dépenser, les hyperscalers, eux, dépensent déjà. Google Cloud +63% YoY, Azure +40%, AWS +28%, et 112 milliards de dollars de capex cumulé sur un seul trimestre [1]. Sundar Pichai annonce que Google Cloud aurait fait plus de chiffre s’ils avaient pu construire les datacenters assez vite. Le backlog de Google Cloud a quasiment doublé en un trimestre, à 460 milliards de dollars de contrats engagés. C’est un pari à plusieurs années sur la demande agentique.
“Nos solutions IA enterprise sont devenues notre principal moteur de croissance cloud pour la première fois au Q1.” — Sundar Pichai
Ce qui se construit là, ce n’est pas un cycle d’optimisation. C’est l’infrastructure d’une économie où chaque agent est un consommateur autonome de compute.
Le coût caché : l’évaluation devient le nouveau goulot
Quand l’agent dépense, comment tu sais qu’il dépense bien ? La réponse honnête : tu évalues. Et là, ça pique. Le Holistic Agent Leaderboard a brûlé 40 000 $ pour 21 730 rollouts d’agents sur 9 modèles et 9 benchmarks. Un seul run de GAIA sur un modèle frontier coûte 2 829 $ avant cache [5]. Et un sweep de configurations d’agents par Exgentic a révélé un écart de 33× sur des tâches identiques selon les choix de scaffolding.
Traduction concrète : l’évaluation rigoureuse d’un agent en prod coûte parfois plus cher que son entraînement. Et plus on déploie d’agents, plus on multiplie les benchmarks à faire tourner pour s’assurer qu’ils ne dérivent pas. C’est un coût qu’on a sous-estimé pendant deux ans, et qui devient maintenant la ligne budgétaire que les CTOs n’avaient pas vue venir.
Quand l’infra devient un projet à 145 millions
L’autre coût qu’on découvre, c’est celui de l’industrialisation. TransUnion, agence de crédit à 4,6 milliards de dollars de revenus, a passé trois ans et 145 millions à construire OneTru, sa plateforme agentique [6]. Pourquoi ? Parce qu’il fallait combiner la fiabilité déterministe des vieux systèmes scriptés avec la flexibilité du gen AI, et qu’aucune brique du marché ne le permettait à leur niveau de régulation. IDC estime à 28 millions le nombre d’agents déployés fin 2025, et projette plus d’un milliard d’ici 2029 [6]. Les boîtes qui n’ont pas commencé à muscler leur infra vont se retrouver dans une position délicate : un POC qui marche, mais aucune capacité à le scaler sans s’exposer à du vendor lock-in douloureux [7].
Et le lock-in, justement, mord déjà. Forrester avance qu’environ 70 % des entreprises subissent du vendor lock-in lié à l’IA, et que les coûts cachés peuvent dépasser de 30 à 60 % le coût visible des contrats [7]. La leçon SaaS d’il y a dix ans est en train de se rejouer, en plus rapide.
”Just ask Sarah” ne marche pas avec les agents
Et au milieu de tout ça, il y a un effet plus discret, mais qui me touche directement comme leader d’équipe. Toute organisation a sa Sarah — la personne qui sait pourquoi un service a été splitté, pourquoi telle abstraction existe, pourquoi le fix évident a été refusé il y a trois trimestres [8]. Les humains peuvent demander à Sarah. Les agents, non.
“La documentation cesse d’être une politesse pour les futurs humains. Elle devient le moyen principal d’assurer un contexte historique durable et disponible.”
Quand un agent ouvre un ticket et qu’il ne trouve aucun ADR pour expliquer une contrainte, il fait ce pour quoi il a été conçu : il étend le pattern dominant. Pas par bug, mais parce que le contexte non-écrit ne se propage pas. Le coût de la non-doc, qu’on mesurait en heures perdues d’onboarding humain, se mesure désormais en décisions prises à l’aveugle par un agent qui aura cette même décision à reprendre demain.
Ce que ça change pour nous
L’agent qui sort la carte bleue, c’est trois mouvements simultanés. D’abord, le périmètre des permissions explose : il faut désormais penser auth, scoping, dépense plafonnée, audit trail. Ensuite, le coût migre — du modèle vers l’infra, et de l’infra vers l’évaluation continue. Enfin, la documentation cesse d’être un livrable secondaire pour devenir l’interface principale entre ton organisation et les agents qui y travaillent.
Et toi, parmi ces trois chantiers — gouvernance des dépenses, économie de l’éval, doc-as-context — lequel est le plus en retard chez vous ?
Sources
- The $112 Billion Quarter
- GitHub - stripe/link-cli: Let your agents spend on your behalf. Your payment credentials are never exposed. You approve every purchase.
- Agents can now create Cloudflare accounts, buy domains, and deploy
- Introducing Ads CLI: A Command-Line Interface for Meta Ads and Commerce
- AI evals are becoming the new compute bottleneck
- Your AI agent is ready to go. Is your infrastructure?
- Locked, stocked, and losing budget: AI vendor lock-in bites back
- The end of “Just ask Sarah”
Pour aller plus loin
- Darwinian Specialization in AI — pourquoi le marché de l’inférence se fragmente comme celui des bases de données : latence, multimodal, edge, chaque workload tire sa propre stack.
- Adding a team was the wrong strategic decision — un retex honnête sur ce qui se passe quand l’org saute une étape de discovery et empile des équipes sur le mauvais découpage produit.
- Scaling smarter: A CIO’s road map to unified, future-ready operations — la lecture CIO du même mouvement, côté unification opérationnelle et data plane.
- GitHub is sinking — un coup de gueule rafraîchissant sur la dégradation de GitHub depuis le rachat Microsoft, à lire si tu réfléchis à ta stratégie de plateforme.
Cet article a été rédigé en m’appuyant sur une IA pour m’aider à synthétiser et structurer ma veille. Les idées, le choix des sources et la relecture restent les miens.
Pour aller plus loin
— pourquoi le marché de l'inférence se fragmente comme celui des bases de données : latence, multimodal, edge, chaque workload tire sa propre stack.
— un retex honnête sur ce qui se passe quand l'org saute une étape de discovery et empile des équipes sur le mauvais découpage produit.
— la lecture CIO du même mouvement, côté unification opérationnelle et data plane.
— un coup de gueule rafraîchissant sur la dégradation de GitHub depuis le rachat Microsoft, à lire si tu réfléchis à ta stratégie de plateforme.
Cet article a été rédigé en m'appuyant sur une IA pour m'aider à synthétiser et structurer ma veille. Les idées, le choix des sources et la relecture restent les miens.