L'IA est entrée dans le "find out stage". Et nos process, nos bases de données, nos modèles éco — rien n'était prêt.
Aurélien Allienne
Publié le • 7 min de lecture
L’IA est entrée dans le “find out stage”. Et nos process, nos bases de données, nos modèles éco — rien n’était prêt.
OpenAI vient d’open-sourcer Symphony, un orchestrateur qui a multiplié par 5 les PR mergées dans certaines équipes. GitHub Copilot bascule en facturation à l’usage. Les GPU B200 ont pris 114 % en six semaines. Et un développeur résume la transition tech la plus brutale de la décennie en quatre mots : on est passés au “find out stage”.
Du “fuck around” au “find out”
Ryan Donovan, sur le blog de Stack Overflow, raconte qu’il y a un an, à la conférence HumanX, on parlait encore de RAG, de hallucinations, de “bottom of the first inning” [1]. Aujourd’hui, le ton a changé : tout le monde parle “d’inflection point”, de “second phase”. Les agents ne sont plus une démo qui devine un film à partir d’emojis. Ils sont en production, ils brûlent du token, et ils doivent justifier leur coût.
“The next phase of AI adoption won’t be limited by model performance — it will be limited by trust.” — Ravindra Mistri, Better Auth [1]
Et c’est précisément maintenant que la facture arrive — sur tous les plans à la fois.
L’orchestration devient le vrai sujet
OpenAI a publié hier Symphony, un spec open-source pour transformer un board Linear en plan de contrôle pour agents Codex [2]. Le constat de départ est limpide : un ingénieur peut gérer 3 à 5 sessions Codex en parallèle avant que le coût de context-switching ne fasse chuter sa productivité. Au-delà, il oublie ce que fait chaque session, jongle entre terminaux, et perd plus de temps qu’il n’en gagne.
Symphony renverse le modèle : chaque issue ouverte se voit assigner un agent qui tourne en continu, et l’humain ne fait plus que reviewer les PR sortantes. Résultat sur certaines équipes OpenAI : +500 % de PR mergées. Le slogan : “manage work instead of supervising coding agents”.
C’est exactement le même problème que Brandon Walsenuk va creuser début mai dans une session “Unblocked” : how to stop babysitting your agents [3]. Plus de MCP, plus de règles, plus de context windows ne résolvent pas le problème racine — les agents ont besoin de comprendre, pas juste d’accéder.
Nos infrastructures n’ont pas été conçues pour ça
Mais l’orchestration des agents n’est qu’une partie du problème. La couche en dessous craque aussi.
Hussein Nasser le formule très bien : Databases Were Not Designed For This [4]. Pendant 40 ans, l’architecture des bases de données reposait sur un contrat implicite : le caller est une application déterministe écrite par un humain, les requêtes sont prévisibles, les écritures sont intentionnelles, les connexions sont brèves. Les agents violent ce contrat à chaque couche.
Un agent ne connaît pas vos requêtes — il les raisonne. Différentes chaînes de raisonnement produisent des requêtes différentes sur les mêmes tables. Vos index couvrent le happy path. Votre pool de connexions est dimensionné pour votre pic observé. Rien de tout ça ne tient quand l’agent peut générer n’importe quelle requête à la volée et garder la connexion ouverte pendant qu’il “réfléchit”.
La parade ? Des statement_timeout agressifs au niveau du rôle, pas de l’application. Une requête humaine qui prend 30s est un bug que quelqu’un repère. Une requête agent qui prend 30s est une boucle de raisonnement que personne ne surveille.
Vitesse individuelle ≠ vitesse collective
Les agents accélèrent l’individu. Mais Jim Nielsen rappelle, en partant d’une note de Chris Coyier, une vérité que beaucoup de DSI vont apprendre à leurs dépens : “Faster individuals don’t make a fast company” [5].
Sa métaphore est parfaite : le 4×100 mètres aux JO. Pour gagner, on pourrait croire qu’il suffit de prendre les quatre sprinteurs les plus rapides du pays. En réalité, ce qui décide de la course, c’est le passage du témoin. Une chute, un témoin mal transmis, et toute la vitesse individuelle s’évapore.
Pareil dans nos boîtes. On peut équiper chaque dev d’un agent qui code 10× plus vite. Si les interfaces entre les équipes — code review, déploiement, communication produit, gestion de la dette technique — n’ont pas été pensées pour absorber ce flux, on accumule des PR sans les merger, on accumule des features sans les shipper, on accumule du débit sans livrer.
Le modèle économique se redessine en direct
Et pendant que les équipes tech découvrent ces nouvelles fragilités, le modèle éco bascule. GitHub Copilot a annoncé hier le passage à une facturation à l’usage [6]. Fini le forfait à 10 $/mois — on paie désormais le volume de tokens consommés. Le message est clair : les utilisateurs intensifs (ceux qui font tourner des agents en background) coûtent des dizaines de fois plus cher que la moyenne. Le forfait n’est plus tenable.
Côté infra, Tomasz Tunguz a sorti des chiffres édifiants sur le marché spot des GPU : le B200 NVIDIA est passé de 2,31 $/h début mars à 4,95 $/h — soit +114 % en six semaines [7]. Chaque release de modèle frontier (GPT-5.5, Codex) déclenche un choc de demande. Le spread entre fournisseurs s’élargit. L’écart B200/H200 a doublé : les anciens chips se déprécient à mesure que les nouveaux modèles exigent les nouvelles architectures mémoire.
Le sellers’ market est de retour. Les startups IA qui pariaient sur une baisse continue du coût d’inférence vont devoir revoir leurs unit economics.
Ce qu’il faut retenir
L’IA n’est plus un sujet de R&D. C’est un sujet de production, de SRE, de FinOps, et de design organisationnel. La phase “fuck around” est terminée. Place au “find out”.
Concrètement, ça veut dire arrêter de demander “quel modèle utiliser ?” et commencer à se poser quatre questions qui font mal :
- Mon orchestration est-elle prête à manager 50 agents en parallèle plutôt que 5 ?
- Mes bases de données ont-elles des timeouts au niveau du rôle, pas juste de l’application ?
- Mes interfaces entre équipes peuvent-elles absorber 10× plus de PR sans tout casser ?
- Mon modèle éco tient-il toujours si le coût d’inférence double tous les six mois ?
Si la réponse est “non” sur au moins deux de ces questions, on n’est pas en avance avec l’IA. On est juste en train de découvrir, en production, ce que les autres trouvent dans leur stack.
Et toi — sur quel front ton équipe est-elle déjà en train de “find out” ?
Sources
- Welcome to the “find out” stage of AI
- An open-source spec for Codex orchestration: Symphony
- How to stop babysitting your agents
- Databases Were Not Designed For This
- Collective Speed Is Not the Summation of Individual Speed
- GitHub Copilot is moving to usage-based billing
- GPU Spot Prices Surge 114% in Six Weeks
Pour aller plus loin
- The Moat or the Commons — Warman Notes — Une thèse forte : le pari “frontier-models-as-monopoly” qui finance l’IA US est en train de s’écrouler face à l’open-weight chinois
- The next phase of the Microsoft OpenAI partnership — La licence Microsoft sur l’IP OpenAI passe non-exclusive jusqu’en 2032 ; OpenAI peut désormais distribuer sur tous les clouds
- GPT 5.5: The System Card — TheZvi décortique le system card de GPT-5.5 et le compare (sévèrement) à celui d’Anthropic Mythos
- The task is not the job — Une réponse argumentée à Amodei : automatiser des tâches ne fait pas disparaître les jobs, et voici pourquoi
Cet article a été rédigé en m’appuyant sur une IA pour m’aider à synthétiser et structurer ma veille. Les idées, le choix des sources et la relecture restent les miens.
Pour aller plus loin
— Une thèse forte : le pari "frontier-models-as-monopoly" qui finance l'IA US est en train de s'écrouler face à l'open-weight chinois
— La licence Microsoft sur l'IP OpenAI passe non-exclusive jusqu'en 2032 ; OpenAI peut désormais distribuer sur tous les clouds
— TheZvi décortique le system card de GPT-5.5 et le compare (sévèrement) à celui d'Anthropic Mythos
— Une réponse argumentée à Amodei : automatiser des tâches ne fait pas disparaître les jobs, et voici pourquoi
Cet article a été rédigé en m'appuyant sur une IA pour m'aider à synthétiser et structurer ma veille. Les idées, le choix des sources et la relecture restent les miens.