Les agents IA débarquent en prod — qui tient le volant ?

Combien d’agents IA tournent dans votre SI à cette minute ? Si vous ne savez pas répondre, vous n’êtes pas seul. Microsoft vient de faire passer en GA Agent 365, présenté comme un “control plane” pour observer, gouverner et sécuriser des agents qui prolifèrent plus vite que les politiques de sécurité [1]. Le sujet du jour, ce n’est plus “est-ce qu’on adopte les agents”, c’est “comment on évite qu’ils prennent le contrôle de la maison”.

Les agents ne sont plus une promesse, ils sont déjà là

Ce qui frappe dans le billet de Microsoft, c’est le ton. Ce n’est plus du marketing futuriste : “AI agents aren’t coming — they’re already in your environment” [1]. Ils apparaissent là où on les attend (Copilot, Teams) et surtout là où on ne les attend pas — assistants locaux, agents SaaS connectés à des données sensibles, “shadow AI” qui se déploie sans passer par la DSI. Agent 365 mise sur Defender et Intune pour découvrir ces agents, leur attribuer des identités propres, et les faire tourner dans des environnements managés via Windows 365 for Agents.

Anthropic pousse exactement la même logique côté Claude Managed Agents, avec trois nouveautés annoncées le 6 mai : du “dreaming” (les agents rejouent leurs sessions pour s’améliorer entre deux runs), des “outcomes” comme nouvelle unité de mesure plutôt que des actions isolées, et une orchestration multi-agents nativement gérée [2]. Le message implicite est clair : un agent solo qui exécute une tâche, c’est déjà du passé. La brique de base, c’est l’équipe d’agents.

Mais quand la prod tombe, c’est encore l’humain qui décroche le téléphone

Le revers de la médaille s’écrit en gras chez Patrick Hughes : Your AI Agent Will Eventually Delete Prod [3]. Le titre n’est pas une provoc — il s’appuie sur le cas PocketOS, qui a perdu ses backups de base de données de production à cause d’un agent Cursor laissé un peu trop libre. L’auteur dissèque ce que les “spend rails” runtime attrapent vraiment, ce qu’ils n’attrapent pas, et l’enchaînement de garde-fous qu’il faut empiler avant de laisser un agent toucher à de la donnée critique.

Cet incident résonne avec un témoignage côté CIO que j’ai trouvé honnête : “I gave our developers an AI coding assistant. The security team nearly mutinied” [4]. L’auteur raconte sa décision d’ouvrir Copilot à ses équipes — le business case tenait debout, 15 millions de devs utilisaient déjà l’outil chez Microsoft en 2025 — et le séisme déclenché chez ses RSSI. Sa conclusion mérite d’être méditée :

Les outils d’IA ne changent pas que la livraison logicielle. Ils changent les termes de la confiance dans l’entreprise. Ils forcent à répondre à des questions désagréables sur le contrôle, la preuve, la responsabilité et la discipline de revue.

Vibe coding ou spec-driven : le vrai débat n’est pas celui qu’on croit

InfoWorld pose la question d’un autre angle, côté pratiques de dev : faut-il faire du vibe coding (on décrit, l’IA produit, on itère au feeling) ou du spec-driven development (on écrit la spec, l’IA exécute) [5] ? La réponse est moins clivante que les threads LinkedIn voudraient nous le faire croire : ça dépend du couple maturité de la base de code × tolérance au risque. Pour un proto isolé, le vibe coding fait gagner un temps fou. Pour un système qui touche à la prod, la spec redevient le contrat — et c’est exactement ce que disent les billets précédents en filigrane : sans contrat explicite, l’agent improvise, et c’est là que ça casse.

La vraie question est politique, pas technique

Pendant que les Américains poussent leurs control planes et leurs benchmarks, sept géants européens — Mistral en tête — viennent de signer un appel à la compétitivité IA souveraine, demandant à Bruxelles un cadre qui ne fasse pas de l’Europe un simple consommateur de stacks américaines [6]. La question n’est plus “qui a le meilleur modèle” mais “qui contrôle l’infrastructure d’agents qui orchestrent demain les workflows de nos entreprises”. Quand Microsoft décide qui peut tourner dans Agent 365, et qu’Anthropic décide quelles équipes d’agents Claude peut piloter, c’est un peu plus que de la tech. C’est un choix de souveraineté.

Et nous, managers, dans tout ça ?

Le rapport sur le “Tech Pendulum” rappelle que notre industrie oscille en permanence entre extrêmes — QA intégrée vs séparée, monolithe vs microservices — et qu’à chaque cycle, les bonnes équipes ne sont pas celles qui choisissent le bon camp, mais celles qui comprennent les trade-offs [7]. Les agents IA ne dérogent pas à la règle. Tout-agent ou pas-d’agent sont deux postures de débutants. Ce qui sépare les équipes qui vont s’en sortir, c’est la capacité à instrumenter, observer, gouverner — et accepter qu’un agent qui livre un “outcome” reste sous la responsabilité d’un humain qui répond au pager.

Le vrai sujet de cette semaine, ce n’est pas “les agents arrivent”. C’est : avez-vous une carte de qui tourne où, avec quels droits, et qui décroche quand ils déraillent ?

Sources

Pour aller plus loin

Becoming a Business Leader, Not Just a Technical One — Kevin Goldsmith sur le passage de “tech leader” à “business leader” : une lecture utile quand on doit défendre un budget agents en COMEX.
How AI Agent Memory Works — un essai interactif et pédagogique sur ce que veut vraiment dire “mémoire” pour un agent : indispensable avant d’en déployer en prod.
AI inference just plays by different rules — pour comprendre pourquoi l’économie de l’inférence ne ressemble en rien à celle du SaaS classique.
The April every AI plan broke — la chronologie des cinq annonces de pricing IA d’avril, et ce qu’elles disent du chaos packaging chez Anthropic, OpenAI et GitHub.

Cet article a été rédigé en m’appuyant sur une IA pour m’aider à synthétiser et structurer ma veille. Les idées, le choix des sources et la relecture restent les miens.

Cet article a été rédigé en m'appuyant sur une IA pour m'aider à synthétiser et structurer ma veille. Les idées, le choix des sources et la relecture restent les miens.