Introducing Forge

Article original : mistral.ai Lire en 🇫🇷 via Google Translate

Auteur: Mistral AI
Thème: IA
Mots-clés: fine-tuning entreprise, souveraineté IA, entraînement sur données propriétaires, agents IA, reinforcement learning
Ton: news

Résumé

Mistral AI annonce Forge, un système permettant aux entreprises d'entraîner des modèles IA de niveau frontier sur leurs données propriétaires. Contrairement aux modèles génériques entraînés sur des données publiques, Forge permet d'intégrer la connaissance institutionnelle (documentation interne, code, données structurées, processus opérationnels) directement dans les modèles. Six partenaires de lancement sont déjà engagés, dont ASML, Ericsson et l'Agence Spatiale Européenne, positionnant la souveraineté et le contrôle des données comme valeurs centrales.

💡 Pourquoi ça compte

Forge marque un tournant dans la stratégie de Mistral AI vers le B2B enterprise et positionne l'entraînement de modèles sur données propriétaires comme le prochain levier de différenciation pour les entreprises, en opposition directe avec l'approche "modèle générique + RAG" qui domine le marché actuel.

Analyse approfondie

Aujourd'hui, nous présentons Forge, un système permettant aux entreprises de construire des modèles IA de niveau frontier ancrés dans leur connaissance propriétaire.

La plupart des modèles IA disponibles aujourd'hui sont entraînés principalement sur des données publiques. Ils sont conçus pour bien performer sur un large éventail de tâches. Mais les entreprises fonctionnent avec des connaissances internes : normes d'ingénierie, politiques de conformité, bases de code, processus opérationnels et des années de décisions institutionnelles.

Forge comble l'écart entre l'IA générique et les besoins spécifiques de l'entreprise. Au lieu de s'appuyer sur des données publiques générales, les organisations peuvent entraîner des modèles qui comprennent leur contexte interne, intégrés dans les systèmes, les workflows et les politiques, alignant l'IA avec leurs opérations uniques.

Mistral AI s'est déjà associé à des organisations de premier plan mondial, comme ASML, DSO National Laboratories Singapore, Ericsson, l'Agence Spatiale Européenne, le Home Team Science and Technology Agency (HTX) Singapore et Reply pour entraîner des modèles sur les données propriétaires qui alimentent leurs systèmes les plus complexes et leurs technologies définissant l'avenir.

Entraîner des modèles sur la connaissance institutionnelle

Forge permet aux entreprises de construire des modèles qui internalisent leur connaissance métier. Les organisations peuvent entraîner des modèles sur de grands volumes de documentation interne, de bases de code, de données structurées et de registres opérationnels. Pendant l'entraînement, le modèle apprend le vocabulaire, les schémas de raisonnement et les contraintes qui définissent cet environnement.

Cela permet aux équipes de développer des modèles et des agents qui raisonnent en utilisant la terminologie interne et comprennent les workflows de l'entreprise. Forge prend en charge les approches d'entraînement modernes à travers plusieurs étapes du cycle de vie du modèle :

Le pré-entraînement permet aux organisations de construire des modèles conscients du domaine en apprenant à partir de grands ensembles de données internes.
Les méthodes de post-entraînement permettent aux équipes d'affiner le comportement du modèle pour des tâches et des environnements spécifiques.
L'apprentissage par renforcement aide les organisations à aligner les modèles et les agents avec les politiques internes, les critères d'évaluation et les objectifs opérationnels, tout en améliorant les performances agentiques dans des environnements réels, comme l'orchestration complexe, l'utilisation d'outils et la prise de décision.

Ensemble, ces capacités permettent aux entreprises de dépasser le comportement IA générique et de développer des modèles qui reflètent l'intelligence institutionnelle.

Contrôle et autonomie stratégique

Pour de nombreuses organisations, l'adoption de l'IA soulève des questions sur le contrôle des modèles, des données et de la propriété intellectuelle à long terme. Forge permet aux entreprises de construire des modèles qui restent sous leur contrôle. Les modèles peuvent être entraînés en utilisant des ensembles de données propriétaires et gouvernés selon des politiques internes, des standards d'évaluation et des exigences opérationnelles.

Cela permet aux organisations de conserver le contrôle sur la manière dont leur connaissance est encodée et utilisée par les systèmes IA. Dans les environnements réglementés, ce niveau de contrôle est critique. Les entreprises doivent s'assurer que les modèles reflètent les exigences de conformité, les contraintes opérationnelles et les cadres de gouvernance internes.

En permettant aux organisations de construire des modèles ancrés dans leur propre connaissance et opérés au sein de leurs propres environnements d'infrastructure, Forge offre un degré plus élevé d'autonomie stratégique à mesure que l'IA devient partie intégrante des systèmes d'entreprise fondamentaux.

Les modèles personnalisés rendent les agents d'entreprise fiables

Les agents d'entreprise doivent faire plus que générer des réponses. Ils doivent naviguer dans les systèmes internes, utiliser correctement les outils et prendre des décisions dans les contraintes de l'organisation.

Les modèles personnalisés rendent cela possible en fournissant aux agents une compréhension plus profonde de l'environnement dans lequel ils opèrent. Au lieu de s'appuyer sur un raisonnement générique, les agents alimentés par des modèles entraînés sur le domaine peuvent interpréter la terminologie interne, suivre les procédures opérationnelles et comprendre comment les différents systèmes et sources de données sont liés les uns aux autres.

Cela change le comportement des agents en pratique. La sélection d'outils devient plus précise. Les workflows multi-étapes deviennent plus fiables. Les décisions peuvent refléter les politiques internes et la logique métier plutôt que des hypothèses génériques.

Le résultat est des agents qui dépassent la simple assistance et commencent à fonctionner comme des composants opérationnels des systèmes d'entreprise, capables d'exécuter des tâches, de se coordonner entre les outils et de soutenir des processus complexes avec une plus grande précision et rapidité.

Support de multiples architectures de modèles

Forge offre de la flexibilité avec le support des architectures dense et mixture-of-experts (MoE). Cela permet aux organisations d'optimiser pour la performance, le coût et les contraintes opérationnelles. Les modèles denses offrent une forte capacité générale sur un large éventail de tâches d'entreprise, tandis que le MoE permet à de très grands modèles de fonctionner plus efficacement, offrant une capacité comparable avec une latence et un coût de calcul inférieurs à ceux d'un modèle dense de taille similaire. Forge prend également en charge les entrées multimodales lorsque c'est nécessaire, permettant aux modèles d'apprendre à partir de texte, d'images et d'autres formats de données.

Conçu pour les agents en priorité

Les agents de code deviennent les utilisateurs principaux des outils de développement, c'est pourquoi Forge a été conçu pour eux en priorité, pas comme une réflexion après coup. Un agent autonome comme Mistral Vibe peut l'utiliser pour affiner des modèles, trouver les hyperparamètres optimaux, planifier des tâches et générer des données synthétiques pour progresser sur les évaluations. Tout au long du processus, Forge surveille les métriques pour s'assurer que le modèle ne régresse pas sur les benchmarks importants. Parce que Forge gère l'infrastructure et inclut des recettes éprouvées pour les pipelines de données et les propres méthodes d'entraînement de Mistral AI, n'importe qui, y compris les agents, peut personnaliser un modèle simplement en écrivant en anglais courant.

Amélioration continue par l'apprentissage par renforcement et l'évaluation

Les environnements d'entreprise évoluent constamment. Les réglementations changent. Les systèmes sont mis à jour. De nouvelles données deviennent disponibles. Forge est conçu pour une adaptation continue plutôt qu'un entraînement unique. Les organisations peuvent utiliser des pipelines d'apprentissage par renforcement pour affiner le comportement du modèle en utilisant des retours dérivés des évaluations internes et des workflows opérationnels.

Cela permet aux équipes d'améliorer les modèles au fil du temps et d'aligner les résultats avec les objectifs organisationnels. Les cadres d'évaluation permettent aux entreprises de tester les modèles par rapport à des benchmarks internes, des règles de conformité et des tâches spécifiques au domaine avant de les déployer dans les environnements de production.

Le résultat est un cycle de vie du modèle qui soutient l'amélioration continue plutôt que le déploiement statique.

Exemples d'applications en entreprise

Les organisations peuvent appliquer Forge à de nombreux types de workflows d'entreprise.

Les agences gouvernementales peuvent construire des modèles entraînés pour différentes langues et dialectes, cadres politiques, textes réglementaires et procédures administratives. Cela permet aux agents IA d'être fiables lorsqu'ils travaillent sur l'analyse de politiques, la prestation de services publics et la planification opérationnelle, tout en reflétant les mandats institutionnels et les exigences de gouvernance.

Les institutions financières peuvent entraîner des modèles sur des cadres de conformité, des procédures de gestion des risques et de la documentation réglementaire. Cela permet aux systèmes IA de produire des résultats cohérents avec les politiques de gouvernance internes.

Les équipes logicielles peuvent entraîner des modèles sur des bases de code propriétaires et des standards de développement. La vraie valeur vient du fait de façonner les modèles pour qu'ils performent exceptionnellement bien sur les tâches d'ingénierie spécifiques qui stimulent la productivité et la qualité au sein de l'entreprise. Un modèle entraîné sur des dépôts propriétaires et des standards de développement peut mieux comprendre les abstractions internes, les patterns et les choix architecturaux. Lorsqu'il est post-entraîné pour des workflows prioritaires comme l'implémentation, le débogage, la migration, la revue de code ou le support à la conception système, il peut fournir des résultats plus conscients du contexte, plus cohérents avec les pratiques internes et plus utiles tout au long du cycle de développement logiciel.

❕ Points Clés

Forge couvre l'ensemble du cycle de vie du modèle : pré-entraînement, post-entraînement et apprentissage par renforcement sur des données internes
Partenaires de lancement : ASML, DSO National Laboratories Singapore, Ericsson, Agence Spatiale Européenne, HTX Singapore, Reply
La souveraineté est au coeur de la proposition : les modèles restent sous le contrôle de l'entreprise, entraînés sur ses données, déployables sur sa propre infrastructure
Le reinforcement learning permet d'aligner les agents IA avec les politiques internes et les objectifs opérationnels
Support des architectures dense et mixture-of-experts (MoE), ainsi que des entrées multimodales
Conception "agent-first" : un agent autonome comme Mistral Vibe peut piloter le fine-tuning, l'optimisation des hyperparamètres et la génération de données synthétiques