Le capex bascule des têtes vers les GPU. Et après ?

80 000 tech workers licenciés au Q1 2026. La même semaine, les quatre plus gros hyperscalers ont engagé 725 milliards de dollars d’AI capex, +77% en un an [1]. Le capital qui finançait des recrutements en 2021 finance des clusters GPU en 2026. Mais le vrai sujet, ce n’est pas la pyramide qu’on aplatit. C’est ce qui se passe dans les équipes qui restent — et la question est plus inconfortable qu’un graphique de courbes de licenciements.

Le grand aplatissement n’est pas un cycle, c’est une substitution

Cette vague de coupes ne ressemble pas à 2022. À l’époque, on corrigeait l’embauche excessive de la pandémie. Là, le langage des dirigeants a basculé : Salesforce parle de “besoin de moins de têtes”, Meta présente ses 10% de coupes comme un redéploiement vers la recherche IA, Oracle supprime 30 000 postes legacy pour financer ses datacenters [1]. On est passés de la discipline à la substitution.

Le risque n’est pas réparti uniformément. Le support, la QA, le middle management, le recrutement, et les rôles d’ingénieurs juniors et IT généralistes absorbent l’essentiel des coupes. Gartner annonce qu’une entreprise sur cinq aura éliminé plus de la moitié de son middle management d’ici la fin de l’année [1]. Si on est dans ces clusters, le poste de travail change de fond en comble. Et si on n’y est pas, on travaille avec ceux qui restent — c’est-à-dire avec une équipe qui doit absorber le travail des partis.

Ce que les développeurs veulent vraiment de l’IA (et où ils n’en veulent pas)

Une étude récente parue dans ACM Queue, basée sur plus de 1 300 développeurs et 22 praticiens “AI-fluent”, cartographie ce que les devs attendent réellement de l’IA selon quatre dimensions : valeur, identité, responsabilité, exigences [2]. Trois clusters émergent : Core Work (coder, débugger, tester), Ops & Coordination (DevOps, doc, communication), People & AI Building (mentoring, intégration de features IA).

Le résultat est contre-intuitif. Sur le Core Work et l’Ops, les développeurs sont ouverts à plus d’IA — beaucoup plus que ce que les outils actuels offrent. La barrière, ce n’est pas la réticence, c’est la confiance : ils demandent de la prédictibilité, de la transparence, de la vérifiabilité, et un humain dans la boucle [2].

Le cluster “De-prioritize”, lui, est plus révélateur encore : tout ce qui touche au relationnel — communication avec les parties prenantes, interactions client — les développeurs n’en veulent pas. Ils veulent garder la voix finale et la responsabilité. Ça contredit beaucoup de pitchs d’agents “autonomes” qui circulent en ce moment.

La collision des workflows arrive

Le problème suivant est plus subtil mais aussi plus structurant. D’un côté, l’équipe a un workflow qu’elle a affûté pendant des années : Kanban pull-based, WIP limits, design sessions, peu d’états, autonomie [3]. De l’autre, l’agent a besoin d’un lifecycle qui le contraint : machine à états, planification upfront, revue adversariale, transitions bloquées. Les deux marchent. Dans leur contexte. Ensemble, ils s’opposent presque sur tout.

Pull-based flow says: trust the worker to choose well. Agent lifecycles say: constrain the worker because it cannot be trusted to choose at all.

Cette tension est rarement nommée explicitement. Quand on plugue un agent dans une équipe, on impose silencieusement un modèle de confiance opposé à celui qu’elle a construit. C’est invisible mais ça grippe — et ça finit par grincer là où on ne l’attend pas.

Quand le contexte se construit à l’oral

Une réponse partielle vient d’un endroit inattendu. Martin Fowler décrit un pattern qu’il appelle “interrogatory LLM” : au lieu d’écrire des pages de markdown pour donner du contexte à un LLM, on lui demande de nous interroger [4]. Une question à la fois. Il génère ensuite le document de contexte qu’on lui aurait fourni nous-mêmes.

L’intérêt va au-delà du gain de temps. Beaucoup de gens trouvent l’écriture très difficile, et l’information ne sort jamais de leur tête. Une conversation peut être un meilleur extracteur qu’un document blanc. C’est exactement le pont entre la culture pull (l’humain pense en marchant) et la culture agent (la machine veut une spec complète). Le LLM interrogateur s’utilise aussi pour faire relire un document par un expert qui n’a pas le temps de le lire.

Ce qui se casse quand l’usage déborde

L’envers du décor existe. L’équipe d’Archestra raconte avoir reçu 27 pull requests pour ajouter le support du provider x.ai à leur projet — la plupart non testées par leurs auteurs. Un membre de l’équipe consacre une demi-journée par semaine à nettoyer l’AI slop du repo : PRs hallucinées, issues bidons, commentaires en boucle [5]. Une issue à 900 $ de bounty s’est retrouvée polluée par 253 commentaires de bots, noyant les vraies contributions.

Le constat est dur mais utile : “open source as we know it” est en train de changer de nature. Si on encourage tout le monde à coder avec un agent sans poser de garde-fous sur la qualité, on déplace le coût de production vers les mainteneurs et les reviewers. Le travail ne disparaît pas. Il migre — vers ceux qui ont le moins de marge pour l’absorber.

Le vrai risque, c’est de ne rien dire

Et c’est là que la boucle se ferme. La majorité des décisions architecturales catastrophiques ne viennent pas d’un manque de connaissance technique : elles viennent du fait que personne n’a poussé back [6]. Nokia, TSB, Boeing — à chaque fois, des ingénieurs avaient vu venir le problème. Mais parler coûtait plus cher que se taire. Chez Nokia, “porter une mauvaise nouvelle vers le haut, c’était un risque de carrière, pas un mouvement de carrière”.

In most companies, alignment is just the corporate name for silencing dissent.

C’est le mot à surveiller en ce moment, dans la bouche des dirigeants : alignment. Quand quelqu’un dit que l’équipe est “alignée” sur la stratégie IA, demandez-vous si ça veut dire que tout le monde est d’accord, ou simplement que plus personne n’ose dire le contraire à voix haute. Avec des budgets capex de cette ampleur, et des annonces de redéploiement aussi rapides, la pression à ne pas casser le récit est énorme.

On est à un point d’inflexion, c’est probable. Mais un point d’inflexion sans contre-arguments dans la salle, c’est juste une trajectoire qu’on n’a pas su corriger à temps. Vous, dans votre équipe, qu’est-ce que vous voyez venir que personne n’ose nommer ?

Sources

Pour aller plus loin

The last six months in LLMs in five minutes — Simon Willison résume le point d’inflexion de novembre 2025 et le ping-pong du “meilleur modèle” entre Anthropic, OpenAI et Google
Distilling leadership wisdom — un pattern concret pour fabriquer ses propres “coachs IA” à partir d’interviews et de podcasts de leaders inaccessibles
Learning Software Architecture — un rappel de la loi de Conway, plus utile que jamais quand on redessine l’org chart
3 AI PM Archetypes + 1 — un panorama lucide des nouveaux rôles PM autour de l’IA, avec ce qui est réel et ce qui est du hype
Don’t answer the first question — une leçon d’ingénierie qui n’a rien à voir avec l’IA mais qui vaut son pesant d’or quand on revoit nos pratiques

Cet article a été rédigé en m’appuyant sur une IA pour m’aider à synthétiser et structurer ma veille. Les idées, le choix des sources et la relecture restent les miens.

Cet article a été rédigé en m'appuyant sur une IA pour m'aider à synthétiser et structurer ma veille. Les idées, le choix des sources et la relecture restent les miens.