L’IA, l’addiction et la facture cachée : pourquoi la lune de miel se termine

Meta surveille les clics de ses 78 000 employés pour entraîner ses modèles, juste avant de licencier 10 % d’entre eux. GitHub Copilot passe à la facturation au token, et tout le monde réalise que les 10 $/mois n’ont jamais été soutenables. Tu codes deux fois plus vite avec un agent ? Bonne nouvelle : il faut aussi diviser tes coûts de maintenance par deux, sinon tu es piégé. La question n’est plus “comment intégrer l’IA” — c’est “à quel prix, et qui tient encore le manche ?”

Le réveil culturel : quand l’IA devient un outil de contrôle

Le New York Times a publié un papier qui devrait être affiché dans toutes les COMEX [1]. Meta a annoncé en interne qu’elle allait tracker la frappe, la souris, les clics et l’écran de ses 78 000 employés pour entraîner ses modèles à “apprendre comment les gens accomplissent vraiment leurs tâches”. Un manager engineering demande : “comment je me désinscris ?” Andrew Bosworth, CTO, répond : il n’y a pas d’opt-out sur le laptop corporate. Plus de 100 emojis en colère plus tard, le ton est donné.

Le contexte est encore plus violent : Meta intègre l’usage de l’IA dans les performance reviews et s’apprête à licencier 10 % de ses effectifs le 20 mai. Certains ingénieurs signalent en interne qu’ils veulent être licenciés pour toucher la severance. Quand l’outil devient simultanément un capteur de productivité et l’argument du plan social, ce n’est plus de la transformation — c’est de la défiance institutionnalisée.

“It’s incredibly demoralizing.”

Ce témoignage anonyme d’un employé Meta résume l’année 2026 : on a vendu l’IA comme un copilote, elle devient un superviseur.

La facture cachée : ton agent te rend plus rapide, pas plus productif

James Shore signe un billet brutal et lumineux [2] : ton agent de codage doit réduire tes coûts de maintenance. Pas marginalement. Tu codes deux fois plus vite ? Il faut que la maintenance ait baissé d’autant. Sinon, tu troques un sprint de vitesse contre un endettement permanent.

Sa démonstration tient en une phrase : chaque ligne de code écrite vit ensuite des années en maintenance — bug fixes, mises à jour de dépendances, refactos. Si tu écris deux fois plus de code sans réduire ce coût marginal, tu satures ta capacité avant la fin de l’année. Le faux gain de productivité devient une dette technique exponentielle.

C’est exactement le piège que Drew Breunig pointe avec “The Cost of Overfitting the Harness” [3]. OpenAI met fin au fine-tuning. Les labs frontière entraînent leurs modèles dans leur propre harness (Codex, Claude Code), au point que les modèles deviennent moins généralistes — des appliances plutôt que des plateformes. Pour l’enterprise builder, c’est du lock-in : tu prends la fiabilité, tu perds la fongibilité. Et tu ne peux plus généraliser via du fine-tuning.

Le burn-out de l’orchestration : human-in-the-loop ou human-on-the-loop ?

Sur le terrain, le quotidien des devs ressemble à du StarCraft II. L’auteur de “Escape from agentic loop” décrit ce que beaucoup ressentent sans l’avouer [4] : douze terminaux ouverts, Claude Code, Codex, Gemini, Cursor, Replit, Rovo Dev qui tournent en parallèle. C’est exaltant, c’est productif… et c’est épuisant. Plus les agents pensent vite, moins tu as le temps de penser.

Il introduit une distinction utile, empruntée à la défense aérienne : Human-in-the-loop (HITL) vs Human-on-the-loop (HOTL). HITL, tu valides chaque étape — l’agent attend ton feu vert. HOTL, l’agent court tout seul, tu supervises depuis un dashboard, tu interviens si ça dérape. Le problème, c’est qu’on glisse en silence de HITL vers HOTL sans avoir décidé où le human doit vraiment être assis. Et “wave at oversight” ne suffit plus quand cinq agents commitent en parallèle.

“As the agents are thinking, I found myself having less time to think.”

C’est la phrase qui me parle le plus de toute cette veille. La vraie question managériale, ce n’est pas “combien d’agents tu utilises” — c’est “où sont les moments où tu décides encore par toi-même ?”

Le casse-tête sécurité : l’IA accélère aussi les attaquants

Pendant qu’on optimise nos workflows, l’asymétrie offensive se creuse. Jeff Kaufman explique comment l’IA casse deux cultures de divulgation de vulnérabilités [5]. La culture “bugs are bugs” du noyau Linux — corriger silencieusement, espérer que personne ne remarque — repose sur le bruit de fond. Or l’IA fait fondre ce bruit : examiner chaque commit, évaluer son impact sécurité, c’est devenu cheap et efficace. Le ratio signal/bruit est désormais favorable aux attaquants.

La récente vulnérabilité Copy Fail, fixée silencieusement par Hyunwoo Kim, a été repérée publiquement le jour même. L’embargo “coordinated disclosure” devient intenable face à des LLMs qui lisent en continu les diffs des projets open source. Le monde où on avait 90 jours pour patcher tranquillement est en train de se fermer.

La quête d’indépendance : et si on rachetait notre liberté ?

Face à ce paysage, certains commencent à reculer activement. Le post “@adlrocha - In a quest to becoming AI-independent” raconte un parcours concret [6] : depuis l’annonce du passage de GitHub Copilot à la facturation usage-based, l’auteur a réalisé que les 10 $/mois étaient un land grab, pas un produit soutenable. Chaque appel API subventionné était aussi un data point d’entraînement, et chaque workflow construit autour de leur service un switching cost.

Sa réponse : acheter du hardware capable d’inférence locale (un Strix Halo Ryzen AI Max+ avec 128 Go de mémoire unifiée), basculer une partie croissante de ses workflows sur des modèles open weights. Ce n’est plus une lubie de geek nostalgique : c’est une stratégie de continuité. Quand ton outil de productivité quotidien est sous la coupe d’un acteur qui peut tripler son prix demain matin, tu construis une roue de secours.

L’angle architecte : 76 agents dans un trench-coat

Zach Wilson, lui, prend un autre angle : il faut arrêter de penser l’IA comme une armée de scribes autonomes [7]. Ce dont les entreprises ont vraiment besoin, ce sont des secrétaires compétents, fiables, proactifs. Un assistant qui connaît ton contexte, qui pilote des sous-agents quand c’est utile, et qui te rend le contrôle plutôt que de te submerger d’outputs.

Son modèle mental : une couche d’orchestration (le secrétaire), qui dispatche vers une armée de scribes spécialisés (les agents techniques). Tu n’interagis pas avec 76 outils — tu interagis avec un seul, qui parle aux 76 autres. C’est une autre forme de HOTL : tu déplaces la complexité d’un cran, mais tu retrouves un point de contact humain unique. Sans ça, l’utilisateur final paie le prix cognitif de la fragmentation.

Et si la singularité n’arrivait jamais ?

Pour conclure, un article qui remet une couche de réalisme [8] : “The Anti-Singularity” sur LessWrong propose une perspective inverse au discours dominant. Et si la General Purpose Intelligence n’existait tout simplement pas ? Et si l’avenir n’était pas une SAI omnisciente, mais une infinité de modèles spécialisés, fragiles, sur-entraînés sur des heuristiques étroites — exactement ce qu’on construit aujourd’hui ?

Dans ce scénario, le rêve utopique de la singularité tombe à plat. Pas parce qu’elle est dangereuse, mais parce que l’intelligence n’est pas une métrique unique scalable à l’infini. C’est une vue minoritaire — mais elle aide à comprendre pourquoi 2026 ressemble moins à un sprint vers AGI qu’à un atterrissage industriel.

Le vrai sujet de fond, c’est peut-être celui-là : la lune de miel se termine, et la question devient stratégique. Quel niveau de dépendance tu acceptes ? Où tu remets le human dans la loop ? Et qu’est-ce que tu mesures vraiment quand tu mesures la productivité de tes équipes ?

Sources

Pour aller plus loin

A recent experience with ChatGPT 5.5 Pro — un mathématicien de Cambridge raconte comment GPT 5.5 Pro a produit un résultat PhD-level en une heure, presque sans input mathématique. À lire pour contrebalancer la lecture “anti-singularité”.
Garry Tan on X: Meta-Meta-Prompting — le CEO de Y Combinator code à 2h du mat parce que l’IA l’a transformé en builder. L’autre face de la médaille : l’enthousiasme intact des bâtisseurs.
Useful Memories Become Faulty When Continuously Updated by LLMs — recherche fascinante : la mémoire des LLMs se dégrade quand on la met à jour en continu. Pourquoi ton agent “personnalisé” pourrait devenir moins fiable, pas plus.
Running Codex safely at OpenAI — comment OpenAI fait tourner ses propres agents Codex en production avec des garde-fous concrets. Utile quand tu veux passer du POC à la prod.
SkillOS: Learning Skill Curation for Self-Evolving Agents — la recherche sur les agents qui apprennent à curer leurs propres skills. La piste qui pourrait sortir les architectures d’agents du chaos actuel.

Cet article a été rédigé en m’appuyant sur une IA pour m’aider à synthétiser et structurer ma veille. Les idées, le choix des sources et la relecture restent les miens.

Cet article a été rédigé en m'appuyant sur une IA pour m'aider à synthétiser et structurer ma veille. Les idées, le choix des sources et la relecture restent les miens.

L'IA, l'addiction et la facture cachée : pourquoi la lune de miel se termine

L’IA, l’addiction et la facture cachée : pourquoi la lune de miel se termine

Le réveil culturel : quand l’IA devient un outil de contrôle

La facture cachée : ton agent te rend plus rapide, pas plus productif

Le burn-out de l’orchestration : human-in-the-loop ou human-on-the-loop ?

Le casse-tête sécurité : l’IA accélère aussi les attaquants

La quête d’indépendance : et si on rachetait notre liberté ?

L’angle architecte : 76 agents dans un trench-coat

Et si la singularité n’arrivait jamais ?

Sources

Pour aller plus loin

Pour aller plus loin