La GenAI coûte 20 € par mois. Vraiment ?

GitHub Copilot, Claude Code, ChatGPT Plus : quelques dizaines d’euros par mois, et l’IA s’installe dans le quotidien sans douleur. Pourtant OpenAI ne prévoit pas d’être cash-flow positif avant 2029, et près d’un tiers des entreprises dépassent déjà leur budget cloud à cause des charges de travail IA. Alors, la GenAI est-elle bon marché — ou est-ce qu’on n’a tout simplement pas encore reçu la vraie facture ?

Le prix affiché n’est pas le prix réel

L’illusion est confortable : un abonnement à deux chiffres, une intégration en quelques minutes, et voilà l’IA dans le workflow. Mais derrière ces tarifs accessibles se cachent des coûts massifs d’infrastructure, de cloud, de déploiement — sans compter l’intégration, la gouvernance et la maintenance, souvent invisibles pour l’utilisateur final [1].

Surtout, les prix actuels sont en partie subventionnés. OpenAI ne table pas sur un cash-flow positif avant 2029, et côté entreprises, le ROI clair reste à établir. L’IA est peut-être le premier produit tech dont la valeur dépend d’un usage intensif… qui le rendrait, par la même occasion, inabordable [1]. Bref : le prix d’aujourd’hui n’est pas celui de demain.

Quand les GPU font sauter le budget cloud

Cette mécanique se voit déjà dans les factures cloud. Selon le Flexera State of the Cloud Report, près de 30 % des entreprises dépassent leur budget cloud à cause des charges de travail IA — un tiers des entreprises allemandes dépensent désormais plus en services d’IA cloud que ce qui avait été budgété [2]. Logique : une instance GPU coûte entre 2 et 32 € de l’heure, là où une instance de calcul standard tourne entre 0,05 et 0,50 € — jusqu’à 30 fois plus cher.

Le vrai problème est structurel. Les cadres FinOps classiques sont conçus pour des charges de travail prévisibles ; or l’inférence IA ne l’est pas. Un même modèle peut varier d’un facteur 50 en coût selon la longueur de la requête, le nombre de tokens ou la taille du lot [2]. Dario Amodei, le PDG d’Anthropic, résume bien la bascule :

L’entraînement, c’est construire la maison ; l’inférence, c’est la facture d’électricité — et cette facture arrive tous les jours.

La parade existe : budgets d’inférence dédiés par application, model routing qui envoie les requêtes simples vers des modèles plus petits (jusqu’à 70 % d’économie), réservations GPU stratégiques, mise en cache sémantique [2]. Mais cela suppose une discipline FinOps spécifique à l’IA — pas juste un dashboard de plus.

Et la facture environnementale, elle ?

Il y a un autre poste de coût qu’on ne lit nulle part sur la note de frais. Une requête à ChatGPT consomme en moyenne 2,9 Wh, dix fois plus qu’une recherche Google classique ; l’AIE projette que la consommation totale des centres de données pourrait atteindre 1 000 TWh en 2026, soit l’équivalent de la consommation électrique annuelle du Japon [3].

Le réflexe serait de miser sur l’efficacité — modèles plus légers, puces qui tournent sur smartphone. Sauf que c’est exactement le piège de l’effet rebond : toute amélioration d’efficacité réduit le coût marginal d’un usage, donc stimule la demande, et finit par annuler — voire dépasser — les économies initiales [3]. Le numérique le rejoue depuis quarante ans : le CD devait alléger l’empreinte du stockage, il a explosé la taille des fichiers ; la 4G devait réduire la consommation des réseaux, elle a fait décoller la vidéo mobile. Et l’IA ne remplace pas les outils existants — elle s’y superpose [3].

La conclusion rejoint la précédente : le vrai problème n’est pas « combien consomme l’IA », mais « pourquoi, comment et à quel moment je l’utilise » [1].

Le ROI existe — pour ceux qui maîtrisent les usages

Et c’est là que le tableau s’éclaire. Malgré ces coûts, beaucoup d’organisations observent déjà un retour sur investissement significatif — à condition, justement, de maîtriser les usages [1].

Chez Trustpair, scale-up de la fintech, le sujet est devenu transverse au point de créer un poste de Chief AI Officer. En connectant des agents à la base de connaissance interne via Dust, l’équipe pre-sales a automatisé le remplissage des questionnaires de sécurité : une tâche de 4 à 5 heures par semaine se traite désormais en quelques minutes. Le message : viser le « x10 », pas les gains marginaux [4].

Aux Galeries Lafayette, même logique côté grand groupe : Gala, l’assistant conversationnel, a réduit la charge du support client sur les requêtes à faible valeur ajoutée ; côté DSI, GitHub Copilot bien utilisé fait gagner jusqu’à une journée de travail par semaine aux développeurs. La méthode pour y arriver : sortir du « Shadow IA » pour aller vers une stratégie structurée — hackathons internes, AI Learning Schools, tests en mode agile — et accepter que le commerce glisse du « Search and Click » vers le « Chat and Buy » [5].

Dans les deux cas, le coût brut de l’IA n’a pas disparu. C’est la valeur produite en face qui change tout.

Finalement, la GenAI n’est ni vraiment bon marché, ni forcément hors de prix [1]. Et la vraie question pour un tech leader n’est plus « combien ça coûte ? » mais « qu’est-ce que j’en fais — et est-ce que je sais le mesurer ? »

Sources

Pour aller plus loin

Cap sur le Tech.Rocks Summit 2026 ! - Marion Ghibaudo, Guillaume Postaire, Philippe Ensarguet & Cyril Morcrette - S08EP01 | Tech.Rocks - “Paroles de Tech Leaders” | Ausha — le thème « L’exploration continue » et le rôle de boussole du tech leader face à l’IA et la souveraineté.
Tech.Rocks · La 1ère communauté des professionnels de la Tech en France — pour suivre les retours d’expérience « no bullshit » de la communauté tout au long de l’année.
FinOps Foundation — le cadre de référence pour structurer une discipline FinOps, à adapter aux spécificités des charges de travail IA.

Cet article a été rédigé en m’appuyant sur une IA pour m’aider à synthétiser et structurer ma veille. Les idées, le choix des sources et la relecture restent les miens.

Cet article a été rédigé en m'appuyant sur une IA pour m'aider à synthétiser et structurer ma veille. Les idées, le choix des sources et la relecture restent les miens.