L’agent code vite, mais c’est toi qui réponds quand il efface la prod

Combien de revues de code as-tu faites cette semaine ? Et combien d’entre elles concernaient du code écrit à 80% par un agent ? Cette semaine, un agent IA a effacé une base de production en appelant directement l’API Railway avec un token traînant sur le disque [1]. La question n’est plus “est-ce que les agents savent coder” — c’est “qui paie quand ils se trompent”.

Le code n’est plus le goulot d’étranglement

L’analyse a16z d’avril 2026 confirme ce que beaucoup voyaient venir : le coding est de loin le premier usage entreprise de l’IA, devant tout le reste d’un ordre de grandeur [2]. Les meilleures équipes ne shipent pas plus vite parce qu’elles tapent plus vite. Elles shipent plus vite parce qu’elles ont arrêté de regarder l’agent travailler et qu’elles l’ont mis sous instrumentation.

CircleCI a la donnée nette : les équipes qui étaient déjà au 90e percentile en DX il y a trois ans livrent aujourd’hui plus de deux fois plus vite qu’avant l’IA [3]. Pas les autres. La maturité d’avant l’IA prédit qui gagne avec l’IA. Les Ferraris qui roulaient sur des routes boueuses en 2023 roulent toujours sur des routes boueuses.

Le vrai problème, c’est l’absence de spec

Quand un dev tape un prompt vague, l’agent écrit du code qui compile mais qui ne reflète pas ton système. Plus de tokens, plus de revues, plus d’incohérences [2]. Thoughtworks a posé un nom là-dessus : Structured Prompt-Driven Development. L’idée — traiter les prompts comme des artefacts de livraison versionnés, revus, réutilisés. Pas des chats jetables [4].

Un workflow qui revient chez les praticiens sérieux : ne jamais laisser Claude écrire du code avant d’avoir validé un plan écrit. Phase recherche, phase plan, phase implémentation — chaque étape produit un fichier markdown que tu peux lire et corriger [5].

Si la recherche est fausse, le plan sera faux, et l’implémentation sera fausse. Garbage in, garbage out.

”Vérifié” ne veut plus dire “lu par toi”

Voilà le glissement sémantique le plus important de l’année. Pendant longtemps, “vérifié” voulait dire “j’ai lu chaque ligne”. Avec le débit actuel des agents, c’est devenu impossible — et c’est aussi inutile [2]. “Vérifié” veut maintenant dire : passé par les tests, par le type checker, par les gates automatisés — et lu par un humain là où le jugement compte vraiment. Skim sur les diffs UI, lecture attentive sur les diffs sécu et base de données. C’est une compétence senior à part entière de savoir où placer ses yeux.

C’est exactement ce que le vibe coding refuse de faire. Et c’est exactement ce qui te plante en prod.

Les guardrails ne sont pas une feature, c’est l’architecture

Retour à Railway. L’agent a effacé la base parce que l’API GraphQL faisait son boulot : authentification valide → mutation exécutée. Le contrat datait des CI pipelines, pas des agents. La réponse de Railway, c’est une refonte d’architecture : suppressions différées par défaut, permissions granulaires sur les tokens, sauvegardes automatiques, garde-fous au niveau de la plateforme [1]. La leçon est claire : tant que tu construis tes APIs comme si seul un humain ou un CI pouvait les appeler, tu auras des incidents.

Anthropic vient de pousser le miroir : Claude Security passe en bêta publique pour scanner du code à la recherche de vulnérabilités et proposer des patches [6]. La même technologie qui exploite peut défendre. Mais le calendrier est inquiétant — les modèles savent déjà trouver des failles, la prochaine génération saura les exploiter de manière autonome. La fenêtre pour mettre tes garde-fous en place se referme.

Le manager dans tout ça ?

Si l’agent code, qu’est-ce qui reste au manager ? Tout, justement. Définir les specs claires, capturer la connaissance dans des règles réutilisables, refuser de livrer du code que personne ne comprend, dégager les routes boueuses [3]. Le travail de fond — la vraie qualité, l’hygiène long terme, l’investissement dans les fondations — devient l’avantage compétitif. Parce que tout le monde a accès aux mêmes modèles. Ce qui te différencie, c’est ce que tu fais autour.

L’agent ira plus vite que toi. La question, c’est : est-ce qu’il ira dans la bonne direction ?

Sources

Pour aller plus loin

Continually improving our agent harness — comment Cursor itère sur le context engineering, terrain par terrain
AI agents are forcing enterprises to overhaul their operations — le panorama côté DSI : ce qui change dans les ops
Anthropic Unveils Claude Security to Counter AI-Powered Exploit Surge — la lecture sécu de l’annonce Claude Security et ses partenariats
GitHub - Fission-AI/OpenSpec: Spec-driven development for AI coding assistants — un outil open source pour mettre les specs au cœur du workflow agent

Cet article a été rédigé en m’appuyant sur une IA pour m’aider à synthétiser et structurer ma veille. Les idées, le choix des sources et la relecture restent les miens.

Cet article a été rédigé en m'appuyant sur une IA pour m'aider à synthétiser et structurer ma veille. Les idées, le choix des sources et la relecture restent les miens.

L'agent code vite, mais c'est toi qui réponds quand il efface la prod

L’agent code vite, mais c’est toi qui réponds quand il efface la prod

Le code n’est plus le goulot d’étranglement

Le vrai problème, c’est l’absence de spec

”Vérifié” ne veut plus dire “lu par toi”

Les guardrails ne sont pas une feature, c’est l’architecture

Le manager dans tout ça ?

Sources

Pour aller plus loin

Pour aller plus loin