AI Models Are the New Rebar
- Auteur
- Philipp D. Dubach
- Thème
- IA
- Mots-clés
- commoditisation IA, open source, inférence, pricing, investissement
- Ton
- opinion
Résumé
Les modèles IA se commoditisent à une vitesse sans précédent : les prix d'inférence chutent de 50x par an à performance équivalente, l'écart entre open source et propriétaire est tombé à 1,7 %, et OpenAI perd des milliards malgré une croissance de revenus. L'auteur compare les modèles IA au béton armé (rebar) : essentiel mais sans valeur intrinsèque, la différenciation se jouant dans les couches supérieures.
💡 Pourquoi ça compte
Cet article offre un cadre d'analyse précieux pour comprendre la redistribution de valeur dans l'écosystème IA. La métaphore du béton armé aide à expliquer pourquoi les labs de fondation luttent pour être rentables alors que les startups d'outillage (Cursor, Replit) atteignent des valorisations stratosphériques.
Analyse approfondie
Qwen 3.5-35B-A3B, un modèle publié par Alibaba en février 2026, tourne sur un seul GPU grand public avec 24 Go de VRAM. Une RTX 4090 d'occasion, disponible pour environ 2 000 $, génère 60 à 100 tokens par seconde avec ce modèle. Sur certains benchmarks selon les propres évaluations d'Alibaba, il égale ou dépasse Claude Sonnet 4.5. Le tier Qwen 3.5 Flash coûte 0,10 $ par million de tokens d'entrée via l'API d'Alibaba. Claude Sonnet 4.5 coûte 3,00 $.
C'est une réduction de 97 %. Pour une performance comparable.
L'auteur ne se limite pas à un seul exemple. GLM-5 de Zhipu AI atteint un score Elo de 1 452 sur le Chatbot Arena, le plus élevé pour un modèle open source, avec une performance estimée à environ 95 % des modèles fermés pour 15 % du coût. Kimi K2.5 de Moonshot AI, un modèle d'un trillion de paramètres, atteint 99,0 sur HumanEval et 96,1 sur AIME 2025, à environ 88 % moins cher que Claude Opus 4.5 par token. Le Stanford HAI 2025 AI Index montre que l'écart de performance entre modèles open source et propriétaires est passé de 8 % en 2024 à 1,7 % en 2025.
L'analogie du béton armé
L'auteur compare les modèles IA au béton armé (rebar) dans la construction. Le béton armé est un matériau essentiel — aucun bâtiment ne tient sans lui — mais il ne commande pas de prix premium. L'intelligence artificielle suit la même trajectoire : les modèles de base deviennent un commodity, et la valeur se déplace vers les couches supérieures de la stack.
Les chiffres d'OpenAI
OpenAI illustre cette dynamique de compression. Sa marge brute ajustée est tombée de 40 à 33 % en 2025, alors que ses coûts d'inférence ont quadruplé pour atteindre 8,4 milliards de dollars. La société a perdu 13,5 milliards de dollars au premier semestre 2025. Même avec un revenu annualisé de 16,8 milliards, la pression de la commoditisation érode les marges plus vite que la croissance ne les restaure.
La déflation de l'inférence
Selon Epoch AI, les prix de l'inférence IA baissent à un rythme médian de 50x par an à performance équivalente. C'est une vitesse de déflation qui éclipse la loi de Moore (2x tous les 18 mois). Cette chute redéfinit les dynamiques concurrentielles : les labs qui comptaient sur des marges d'inférence élevées se retrouvent dans une course vers le bas.
Où va la valeur ?
Si les modèles sont le béton armé, la valeur se trouve dans l'architecture au-dessus : les outils de développement, les plateformes d'orchestration d'agents, les systèmes d'entreprise qui rendent les modèles utiles dans un contexte spécifique. La question pour les investisseurs n'est plus "quel modèle gagnera" mais "quelle couche de la stack capturera la marge".