L'IA s'industrialise — et redessine la dépendance, le contexte et le métier de dev
Aurélien Allienne
Publié le • 7 min de lecture
L’IA s’industrialise — et redessine la dépendance, le contexte et le métier de dev
Combien coûte une review de code chez vous ? Chez DoorDash, environ 3 dollars — et l’agent qui la fait tourne sur 10 000 PR par semaine [1]. On est passés du démo qui impressionne au compteur qui tourne en prod. Et ça change pas mal de choses sur la façon dont on construit, dont on dépend, et dont on bosse.
Quand l’agent passe la barre de la prod
DoorDash a publié les chiffres de leur agent de code review, et ils sont parlants : 60,2 % des findings critiques poussent l’ingénieur à modifier son code avant le merge, contre 46 % avec leur précédent outil tiers [1]. Le truc qui m’a frappé, c’est leur métrique cible : pas “est-ce qu’il trouve des bugs”, mais “est-ce que les devs changent leur code à cause de lui”. L’attention plutôt que la couverture.
Ils en sont à la v3. La v1 avec des agents spécialistes (sécurité, perf, tests) loupait les problèmes d’architecture. La v2 avec deux reviewers généralistes en parallèle a corrigé ça mais générait trop de bruit. La v3 mixe les deux et apprend à se taire quand elle n’a rien à dire d’utile. Trois itérations pour arriver à un système qui ne pousse pas les devs à scroller au-dessus de ses commentaires.
C’est ça, l’industrialisation de l’IA : on ne mesure plus la prouesse, on mesure la confiance qui tient dans le temps.
Et soudain, la facture arrive
Quand un service marche vraiment, on commence à le compter. Anthropic vient de mettre tous ses agents — Claude Code, Cowork, Skills — sur un compteur d’usage horaire commun, partagé sur l’ensemble des abonnements [2]. Les heures Claude Code ne sont plus illimitées sur Max ; elles partagent un quota avec tout le reste. La promesse “lance autant d’agents que tu veux” devient “tu as X heures de capacité par cycle”.
C’est rationnel côté Anthropic — la capacité GPU n’est pas extensible. Mais côté boîte, ça pose une question concrète : si demain Claude Code coûte le double, ou si la fenêtre passe à 5 heures, qu’est-ce qu’on fait ? Cette tension, Rémy Gaskell la formule sans détour dans sa newsletter d’aujourd’hui : il refuse de voir son business trapped in Claude, et sépare désormais son setup en deux — un OS personnel autour de Claude Code, et des agents business portables qui peuvent migrer d’une plateforme à l’autre [3].
Simon Willison observe le même mouvement côté code applicatif : avec les agents de coding, le langage et le framework redeviennent réversibles. Une boîte qu’il a croisée vient de réécrire ses apps iOS et Android en React Native, en se disant que si c’était une erreur, ils pourraient juste re-porter en natif plus tard [4].
Programming languages used to be LOCK IN, and they’re increasingly not so.
L’agent réduit le coût du changement, donc il réduit le pouvoir de la dépendance. Et ça vaut pour les langages comme pour les plateformes IA.
Le contexte, le vrai moat
Si les modèles deviennent interchangeables, qu’est-ce qui reste ? Le contexte. Glean a publié un benchmark intéressant : sur Claude Cowork, leur couche d’index centralisée est préférée 2,5 fois plus souvent que les MCP off-the-shelf, et consomme 30 % de tokens en moins (43k contre 83k pour les mêmes tâches) [5]. Plus la requête est complexe et cross-application, plus l’écart se creuse — 66 % de win rate sur les tâches simples, 73 % sur les multi-étapes.
Le message est clair : le MCP standardise la connexion, pas la qualité. Federation oblige le modèle à brute-forcer la recherche en multipliant les boucles ; un index unifié fait le tri en amont. Et derrière, ça se traduit en factures.
C’est exactement ce que Bassim Eledath décrit dans son modèle des 8 niveaux de l’agentic engineering : le palier 3, c’est Context Engineering — “chaque token doit se battre pour sa place dans le prompt” [6]. Au-delà, on entre dans l’orchestration : agents en parallèle, subagents spécialisés, pipelines async. Le niveau 7 et plus, c’est gérer plusieurs PR en parallèle pendant qu’on dort. Mais — point important — la progression du dev individuel est plafonnée par le niveau le plus bas de l’équipe. Si votre reviewer humain est encore en niveau 2, votre niveau 7 ne sert à rien.
Le métier de dev se reconfigure
Cette montée en niveau, c’est aussi un changement de rôle. Une étude DX/Microsoft publiée dans ACM Queue (1 300+ développeurs, 22 entretiens approfondis) identifie quatre stades dans la trajectoire d’un dev face à l’IA : le Skeptic, l’Explorer, le Collaborator, le Strategist [7]. Le Strategist orchestre plusieurs agents en parallèle : un qui définit les tests, un qui implémente, un qui review pour la sécurité. Il front-load le contexte, décide quoi déléguer, garde la main sur le verdict.
Un dev interrogé résume sans filtre la pression du moment :
Either you have to embrace the AI, or you get out of your career.
Et au-dessus de ça, une autre tendance pointe : celle du High-Impact Individual Contributor — un IC qui fait, seul, le boulot d’une équipe entière, et qui est payé comme un manager [7bis]. Elena Verna le raconte de son propre parcours : on a passé vingt ans à promouvoir les gens hors du job où ils étaient bons ; l’IA rend possible le mouvement inverse. Le flex aujourd’hui, ce n’est plus “je manage 15 personnes”, c’est “je shippe seul ce qui prenait 15 personnes”.
Mais — et c’est le clin d’œil du jour — tout le monde n’est pas prêt. Une enquête Salesforce/IDC sur 200 enterprises rapporte que 99 % investissent dans l’IA, mais seulement 5 % estiment que leur data est AI-ready [8]. Le talon d’Achille reste le même qu’il y a dix ans : sans contexte propre, sans gouvernance, sans pipelines fiables, l’agent le plus brillant tourne dans le vide.
Ce qui se joue cette semaine
Tout converge : les modèles deviennent commodity, les agents deviennent infra, le contexte devient le différenciateur, et le métier de dev se redéfinit en orchestrateur plutôt qu’en exécutant. Reste une question simple, qu’on devrait tous se poser cette semaine : si demain ton fournisseur d’IA double ses prix, combien de jours te faut-il pour partir ailleurs ? Si la réponse dépasse la semaine, t’es peut-être déjà trapped.
Sources
- How DoorDash built an AI code reviewer engineers actually listen to
- Anthropic puts Claude agents on a meter across its subscriptions
- I don’t want my business trapped in Claude
- Not so locked in any more
- Context makes the Coworker: Glean preferred ~2.5x as often as off-the-shelf MCP tools, which consumed 30% more tokens in Claude Cowork
- The 8 Levels of Agentic Engineering — Bassim Eledath
- The AI-native developer
- Nearly every enterprise is investing in AI, but only 5% say their data is ready
Pour aller plus loin
- IC work is the new career flex — Elena Verna formalise le High-Impact IC, ce nouveau rôle où on shippe seul ce qui prenait une équipe, sans pour autant manager personne
- How to Work and Compound with AI — un guide pratique pour transformer le contexte en infra, et la “taste” en config — chaque session enrichit la suivante
- Why are AI companies buying the teams behind your favorite dev tools? — analyse des rachats d’Astral et Bun par OpenAI et Anthropic : le tooling devient un actif stratégique
- What Microservices Should Have Taught Us About AI | Uplevel — un parallèle utile entre la hype microservices d’il y a 15 ans et celle qu’on vit autour des agents
- Adopting Herb at GitHub - Joel Hawksley — un retour terrain rare : 500k lignes d’ERB chez GitHub passées au crible d’un nouveau parser, avec les bugs trouvés et le chemin vers la 1.0
Cet article a été rédigé en m’appuyant sur une IA pour m’aider à synthétiser et structurer ma veille. Les idées, le choix des sources et la relecture restent les miens.
Pour aller plus loin
— Elena Verna formalise le High-Impact IC, ce nouveau rôle où on shippe seul ce qui prenait une équipe, sans pour autant manager personne
— un guide pratique pour transformer le contexte en infra, et la "taste" en config — chaque session enrichit la suivante
— analyse des rachats d'Astral et Bun par OpenAI et Anthropic : le tooling devient un actif stratégique
— un parallèle utile entre la hype microservices d'il y a 15 ans et celle qu'on vit autour des agents
— un retour terrain rare : 500k lignes d'ERB chez GitHub passées au crible d'un nouveau parser, avec les bugs trouvés et le chemin vers la 1.0
Cet article a été rédigé en m'appuyant sur une IA pour m'aider à synthétiser et structurer ma veille. Les idées, le choix des sources et la relecture restent les miens.