Agents IA en entreprise : quelle architecture et quels standards en 2026
Un guide décisionnel pour CTO, DSI et leads techniques : comment structurer des agents IA, quels frameworks d'orchestration retenir et quels standards ouverts (MCP, A2A) exiger pour industrialiser sans vous verrouiller.
Par Alexandre Beguel, 20 ans d'expérience Data & IA · Mis à jour : juin 2026
L'orchestration d'agents IA consiste à coordonner plusieurs agents, des programmes pilotés par un modèle de langage qui raisonnent, décident et utilisent des outils, pour accomplir une tâche complexe. Un agent orchestrateur découpe le travail, délègue à des agents spécialisés, puis assemble les résultats. L'enjeu pour une DSI n'est pas la prouesse technique, c'est le contrôle : périmètre, coûts, supervision humaine et traçabilité.
En 2025, les agents IA sont passés du laboratoire à la production. Le sujet n'est plus « est-ce que ça marche », mais « comment le déployer sans créer une dette technique ingérable ni se rendre captif d'un éditeur ». Deux décisions structurent tout le reste : quelle architecture d'agents adopter, et quels standards exiger pour rester libre de changer de modèle, de framework ou de fournisseur. Ce guide traite les deux, du point de vue d'un décideur technique qui doit aussi rendre des comptes au comité de direction.
Pourquoi l'architecture devient le sujet n°1
Tant qu'un agent reste une démo isolée, son architecture importe peu. Dès qu'il entre en production et qu'on en multiplie, elle devient le facteur n°1 de coût, de fiabilité et de risque. Selon McKinsey, à fin 2025, 23 % des organisations déclaraient déployer à l'échelle au moins un système d'IA agentique et 39 % de plus l'expérimentaient, mais rarement au-delà d'une ou deux fonctions (McKinsey, State of AI 2025).
Le marché bascule vite. Gartner anticipe que 33 % des applications logicielles d'entreprise intégreront de l'IA agentique d'ici 2028, contre moins de 1 % en 2024. Mais le même cabinet prévient que plus de 40 % des projets d'IA agentique seront abandonnés d'ici fin 2027, faute de maîtrise des coûts, de valeur métier claire ou de garde-fous suffisants (Gartner). Autrement dit : la technologie n'est plus le frein, la maîtrise de l'architecture et de la gouvernance l'est. C'est précisément là que se joue la différence entre un pilote séduisant et un système qui tient en production.
Les hiérarchies d'agents : du plus simple au plus complexe
La meilleure architecture est la plus simple qui résout le problème. On n'ajoute de la complexité que lorsqu'un palier est réellement atteint. C'est le principe directeur d'Anthropic dans sa référence « Building effective agents » : les implémentations les plus réussies n'utilisent pas de frameworks complexes, mais des motifs simples et composables (Anthropic). Cinq patterns reviennent en entreprise, par complexité croissante.
1. L'agent unique outillé. Un seul agent, doté d'outils (recherche, base de données, API) et d'une boucle « raisonner, agir, observer ». Il couvre la majorité des cas d'usage et reste, de loin, le plus facile à superviser et à déboguer. La règle saine : commencer là, toujours.
2. Le multi-agents collaboratif. Plusieurs agents traitent en parallèle des sous-tâches indépendantes, puis on agrège. Utile quand la charge se découpe naturellement (analyser dix documents, interroger plusieurs sources). Le gain est la vitesse ; le coût est la multiplication des appels au modèle.
3. L'architecture hiérarchique (orchestrateur → agents spécialisés). C'est le motif « orchestrator-workers » d'Anthropic : un agent orchestrateur décompose dynamiquement la tâche, délègue à des agents spécialisés (« workers ») puis synthétise leurs résultats. Contrairement à la simple parallélisation, les sous-tâches ne sont pas prédéfinies : l'orchestrateur les détermine selon l'entrée. C'est le motif de référence pour les tâches complexes et imprévisibles.
4. Le réseau pair-à-pair (handoffs). Les agents se passent la main explicitement, en transmettant le contexte de la conversation : c'est l'abstraction centrale de l'OpenAI Agents SDK. Chaque agent a un périmètre, des instructions et une liste d'agents vers lesquels il peut router. Ce modèle convient à des processus métiers découpés en étapes (qualification, puis devis, puis support).
5. La boucle de supervision humaine (human-in-the-loop). Ce n'est pas une architecture concurrente, c'est une couche transversale : un point de contrôle où un humain valide une action sensible (envoyer un e-mail client, modifier un CRM, engager une dépense) avant exécution. Pour une DSI, elle est non négociable sur tout ce qui a un effet irréversible ou réglementé.
Quand la complexité se justifie
- Un agent unique sature : trop d'outils, contexte ingérable, raisonnement qui dérape.
- La tâche se décompose en sous-problèmes aux compétences distinctes.
- Le processus métier suit des étapes claires qui justifient des handoffs.
- Vous avez déjà la supervision (coûts, latence, traces) pour piloter plusieurs agents.
- Le gain de qualité ou de vitesse dépasse le surcoût d'appels au modèle.
Quand le multi-agents est prématuré
- Le cas d'usage n'a pas encore prouvé sa valeur avec un seul agent.
- Vous n'avez aucune observabilité sur les coûts et la latence réels.
- Les agents risquent de boucler sans limite de pas ni de budget.
- Personne ne sait dire qui fait quoi : périmètres flous, responsabilités diluées.
- On ajoute des agents « pour faire moderne », pas pour résoudre un blocage réel.
Les frameworks d'orchestration en 2026
Aucun framework n'est « le meilleur » dans l'absolu : le bon choix dépend du cas, de votre socle technique et de votre exigence de portabilité. Le paysage s'est consolidé et bouge vite : certains projets ont fusionné ou changé de nom en 2025-2026. Voici les options les plus utilisées en production à mi-2026, toutes open source, toutes compatibles MCP nativement ou via adaptateur.
LangGraph (écosystème LangChain) modélise les agents comme des graphes à états, avec exécution durable. C'est l'option privilégiée pour des workflows de production exigeants ; sa liste d'utilisateurs en entreprise est l'une des plus fournies. CrewAI, framework indépendant écrit de zéro, organise des « équipes » d'agents par rôles : c'est la voie la plus rapide d'une idée à une démo multi-agents fonctionnelle, et l'un des projets les plus populaires sur GitHub (plusieurs dizaines de milliers d'étoiles).
Microsoft Agent Framework est la convergence d'AutoGen et de Semantic Kernel : sa version 1.0, sortie en avril 2026 (.NET et Python, licence MIT), ajoute des workflows multi-agents à base de graphes et des fonctions d'entreprise (état, télémétrie, sécurité de typage) ; AutoGen et Semantic Kernel sont désormais en mode maintenance. L'OpenAI Agents SDK (mars 2025, successeur de l'expérimental Swarm) est minimaliste et bâti autour des handoffs. Google ADK, natif GCP et multimodal, intègre nativement le protocole A2A pour l'interopérabilité entre agents.
Frameworks d'orchestration : capacités à date (juin 2026)
Scores qualitatifs de capacités (0 = non / 1 = partiel ou via adaptateur / 2 = natif et mûr), établis à juin 2026. Ce n'est pas un classement absolu mais une photo de capacités qui évolue vite : vérifiez l'état du jour avant de décider. Le support MCP est désormais généralisé ; le support A2A natif reste, lui, plus rare.
| Critère | LangGraph | CrewAI | MS Agent Framework | OpenAI Agents SDK | Google ADK |
|---|---|---|---|---|---|
| Orchestration multi-agents | 2 | 2 | 2 | 2 | 2 |
| Support MCP (outils/données) | 2 | 2 | 2 | 2 | 2 |
| Support A2A (agent↔agent) | 1 | 1 | 1 | 1 | 2 |
| Maturité & communauté | 2 | 2 | 2 | 2 | 1 |
La lecture utile pour une DSI n'est pas « lequel a le plus haut score », mais « lequel colle à mon contexte ». Un socle Microsoft Azure orientera vers Agent Framework ; un besoin de workflows audités et durables, vers LangGraph ; un prototype multi-métiers rapide, vers CrewAI ; un écosystème Google, vers ADK. Le vrai discriminant à long terme, ce n'est aucune de ces marques : c'est le support des standards ouverts, qui détermine votre capacité à changer d'avis demain sans tout réécrire.
Les standards de protocoles : MCP et A2A
Deux standards ouverts structurent désormais l'interopérabilité des agents, et ils sont complémentaires, pas concurrents. MCP connecte un agent à ses outils et données ; A2A connecte les agents entre eux. Pour une DSI, les exiger tous deux, c'est se prémunir contre le verrouillage : on garde la liberté de changer de modèle, de framework ou de fournisseur sans réécrire les intégrations.
MCP (Model Context Protocol). Introduit par Anthropic en novembre 2024, c'est un standard ouvert pour connecter les agents à des outils, des bases de données et des systèmes externes de façon uniforme, l'analogie officielle est celle d'un « port USB-C pour l'IA » : on branche une fois, on réutilise partout. Son adoption a été fulgurante (OpenAI, Google, Microsoft l'ont intégré ; plus de 10 000 serveurs MCP publics recensés). En décembre 2025, Anthropic en a fait don à l'Agentic AI Foundation, un fonds dédié de la Linux Foundation co-fondé avec Block et OpenAI : une gouvernance neutre, gage de pérennité pour un standard d'infrastructure.
A2A (Agent2Agent). Lancé par Google le 9 avril 2025, A2A normalise la communication entre agents : il leur permet de se découvrir (via des « Agent Cards » décrivant leurs capacités), d'échanger en sécurité et de coordonner des tâches complexes, indépendamment du framework ou de l'éditeur. Le projet a été confié à la Linux Foundation le 23 juin 2025 et fédère, à avril 2026, plus de 150 organisations (Google, Microsoft, AWS, Salesforce, SAP, ServiceNow, IBM…). Là où MCP règle le « agent ↔ outil », A2A règle le « agent ↔ agent » : les deux couches d'une architecture interopérable.
Agent ↔ outils & données
Standardise la connexion d'un agent à ses outils, bases et API. Anthropic, nov. 2024 ; donné à la Linux Foundation (Agentic AI Foundation) en déc. 2025.
Ce que ça normalise : l'accès aux outils et au contexte.
Agent ↔ agent
Standardise la découverte et la communication entre agents (Agent Cards), au-delà des frameworks. Google, avr. 2025 ; Linux Foundation depuis juin 2025.
Ce que ça normalise : l'interopérabilité entre agents.
Pourquoi ça compte
Interopérabilité, sécurité et surtout liberté : exiger ces standards évite le verrouillage et permet de changer de modèle ou de framework sans tout réécrire.
À exiger : dans tout appel d'offres ou POC.
Une architecture d'agents d'entreprise, gouvernée
Où en est l'adoption en entreprise
Les agents IA quittent l'expérimentation, mais le passage à l'échelle reste l'exception, pas la règle. Le graphique ci-dessous croise deux mesures sourcées : l'état réel du déploiement à fin 2025 (McKinsey) et la trajectoire projetée par Gartner. À lire comme des ordres de grandeur directionnels, pas comme une promesse : ces chiffres encadrent la décision, ils ne la prennent pas.
Agents IA en entreprise : déploiement réel et trajectoire
Part d'entreprises concernées, en %. Sources : McKinsey, State of AI 2025 (déploiement à l'échelle vs expérimentation, fin 2025) ; Gartner (projection 2028 de la part d'applications d'entreprise intégrant l'IA agentique, contre < 1 % en 2024). Périmètres et définitions distincts : à lire comme des ordres de grandeur.
| Indicateur | Part d'entreprises (%) |
|---|---|
| Déploient à l'échelle un système agentique (McKinsey, fin 2025) | 23 |
| Expérimentent des agents IA (McKinsey, fin 2025) | 39 |
| Applications d'entreprise avec IA agentique en 2024 (Gartner) | 1 |
| Applications d'entreprise avec IA agentique projetées en 2028 (Gartner) | 33 |
Un piège d'orchestration qui m'a coûté cher
Lors d'un cadrage multi-métiers comme celui mené chez Elée, j'ai voulu, sur un cas, aller trop vite vers une architecture multi-agents élégante : un orchestrateur, plusieurs agents spécialisés qui se passaient la main. Sur le papier, parfait. En pratique, mon premier piège a été classique : deux agents se renvoyaient la balle en boucle, chacun « complétant » le travail de l'autre, sans condition d'arrêt claire. Résultat, des exécutions interminables et une facture de tokens qui partait en vrille pour une tâche qu'un agent unique aurait bouclée en trois appels.
Ce qui m'a remis d'aplomb, ce n'est pas un framework plus malin, c'est de la discipline d'ingénierie. J'ai imposé des limites dures de pas et de budget par exécution, un agent qui dépasse s'arrête, point. J'ai redécoupé les périmètres pour que chaque agent ait une responsabilité unique et un critère de « fini » explicite, ce qui a réglé la plupart des handoffs ratés. Surtout, j'ai remis l'humain dans la boucle sur les actions sensibles, et branché l'observabilité que nous utilisons chez CNPP (tableaux de bord Grafana / LLMOps) pour voir, en temps réel, le coût et la latence de chaque agent.
La leçon que je répète depuis à chaque DSI : commencez par l'agent le plus simple, et ne passez au multi-agents que contraint et mesuré. L'élégance d'une architecture ne vaut rien sans garde-fous. Ce sont les limites, le périmètre clair et la supervision qui font la différence entre une démo qui impressionne et un système qui tient, et qui ne ruine pas votre budget cloud au passage.
Gouvernance : éviter le verrouillage, garder le contrôle
Le risque n°1 d'un projet d'agents n'est pas qu'il échoue techniquement : c'est qu'il réussisse en vous rendant captif d'un seul fournisseur, ou qu'il dérape en coûts faute de garde-fous. La gouvernance d'agents tient en trois exigences simples, à poser dès le premier POC : la portabilité, le contrôle des coûts et la supervision des actions.
Éviter le verrouillage. C'est tout l'intérêt des standards ouverts. En exigeant MCP pour les outils et A2A là où l'interopérabilité entre agents compte, vous découplez votre architecture du modèle et du framework sous-jacents. Concrètement : vous pouvez changer de fournisseur de modèle, ou remplacer un framework par un autre, sans réécrire vos intégrations métier. Inscrivez cette exigence dans vos appels d'offres ; c'est la meilleure assurance contre une dépendance subie.
Maîtriser les coûts et les actions. Un agent qui boucle ou qui multiplie les appels au modèle coûte vite très cher : d'où l'importance de limites de pas et de budget, et d'une observabilité temps réel des coûts et de la latence, exactement la supervision Grafana / LLMOps déployée chez CNPP, qui donne à la DSI la visibilité dont elle a besoin. Côté conformité, l'AI Act européen et le RGPD imposent transparence, supervision humaine et traçabilité : la boucle « human-in-the-loop » sur les actions sensibles n'est pas qu'une bonne pratique, c'est souvent une obligation. Pour superviser coûts et performances dans la durée, voir notre guide Observabilité & FinOps des LLM.
Par où commencer
On ne « déploie pas des agents » : on résout un problème métier, avec le plus petit système qui marche. La séquence saine est toujours la même : un cas d'usage à valeur claire, un agent unique outillé, des standards ouverts exigés d'emblée, des garde-fous, puis, seulement si nécessaire, la montée vers une architecture multi-agents.
Choisissez un cas où l'agent a accès à des outils utiles et où l'erreur n'est pas catastrophique. Branchez ses outils via MCP. Fixez les limites (pas, budget) et le point de supervision humaine. Mesurez coût, latence et qualité avant de parler d'échelle. C'est exactement la logique appliquée chez Elée : cadrer par métier, déployer des agents sécurisés besoin par besoin, mesurer le ROI avant tout passage à l'échelle. Si votre cas relève du commercial, notre guide Agents IA pour le développement commercial B2B détaille un premier déploiement concret. Et pour prioriser le bon cas d'usage selon votre maturité réelle, l'audit IA gratuit situe votre point de départ et propose les premiers chantiers, voir aussi nos solutions IA.
Questions fréquentes
Qu'est-ce que l'orchestration d'agents IA ?
L'orchestration d'agents IA consiste à coordonner plusieurs agents (des programmes pilotés par un modèle de langage qui raisonnent, décident et utilisent des outils) pour accomplir une tâche complexe. Un agent orchestrateur découpe le travail, délègue à des agents spécialisés, puis assemble les résultats. L'enjeu pour une DSI est de garder le contrôle : périmètre par agent, limites de coût, supervision humaine et traçabilité.
Quelle architecture d'agents IA choisir en entreprise ?
On part toujours du plus simple. Un agent unique outillé suffit pour la majorité des cas. On ne passe au multi-agents hiérarchique (un orchestrateur qui pilote des agents spécialisés) que lorsqu'un seul agent ne tient plus la charge cognitive de la tâche. Les architectures pair-à-pair, où les agents se passent la main par handoffs, conviennent à des processus métiers découpés en étapes. Dans tous les cas, une boucle de supervision humaine reste indispensable sur les actions sensibles.
Qu'est-ce que le protocole MCP (Model Context Protocol) ?
MCP (Model Context Protocol) est un standard ouvert introduit par Anthropic en novembre 2024 pour connecter les agents IA à des outils, des données et des systèmes externes de façon uniforme, un peu comme un port USB-C pour l'IA. En décembre 2025, Anthropic en a fait don à l'Agentic AI Foundation, un fonds dédié de la Linux Foundation. Pour une DSI, MCP standardise la couche agent-vers-outils et réduit le verrouillage : on branche une fois, on réutilise partout.
Quelle différence entre MCP et A2A ?
MCP et A2A sont complémentaires. MCP (Anthropic) normalise la connexion entre un agent et ses outils ou données. A2A (Agent2Agent, lancé par Google en avril 2025 et confié à la Linux Foundation en juin 2025) normalise la communication entre agents : il leur permet de se découvrir, d'échanger et de coordonner des tâches au-delà des frameworks et des éditeurs. En résumé : MCP connecte un agent à ses outils, A2A connecte les agents entre eux.
Quels sont les meilleurs frameworks d'agents IA en 2026 ?
Aucun n'est meilleur dans l'absolu : le bon choix dépend du cas. À mi-2026, les plus utilisés en production sont LangGraph (workflows à états, exécution durable), CrewAI (équipes d'agents par rôles, mise en route rapide), Microsoft Agent Framework (convergence d'AutoGen et Semantic Kernel, version 1.0 en avril 2026), OpenAI Agents SDK (handoffs explicites entre agents) et Google ADK (natif GCP, A2A intégré). Le critère décisif n'est pas la popularité mais l'adéquation au besoin, le support des standards ouverts et la facilité de supervision.
Par où commencer pour déployer des agents IA sans se verrouiller ?
Commencez par un cas d'usage cadré et un agent unique outillé, avant toute architecture multi-agents. Exigez le support des standards ouverts (MCP pour les outils, A2A si l'interopérabilité entre agents compte) pour préserver votre liberté de changer de modèle ou de framework. Imposez dès le départ des garde-fous : limites de pas et de budget par agent, périmètre clair, supervision humaine sur les actions sensibles et observabilité des coûts et de la latence. Un audit IA permet de prioriser le premier cas.
Quel premier agent pour votre entreprise ?
L'audit IA gratuit situe votre maturité, identifie le cas d'usage à plus fort ROI et propose une première feuille de route, avant d'engager le moindre euro dans une architecture.
Faire mon audit IA gratuitSources
- Anthropic, Building effective agents (patterns : orchestrator-workers, etc.).
- Anthropic, Introducing the Model Context Protocol (nov. 2024) et modelcontextprotocol.io.
- Anthropic, Don de MCP à l'Agentic AI Foundation (Linux Foundation) (déc. 2025).
- Google Developers, Google donne A2A à la Linux Foundation et Linux Foundation : lancement du projet A2A.
- McKinsey, The State of AI 2025 (déploiement des agents).
- Gartner, Predicts Over 40% of Agentic AI Projects Will Be Canceled by End of 2027 (inclut la projection 33 % d'ici 2028).
- Frameworks (dépôts officiels), LangGraph, CrewAI, Microsoft Agent Framework, OpenAI Agents SDK, Google ADK.
À lire aussi
Observabilité & FinOps des LLM (Grafana) Superviser coûts, latence et usages de vos agents en production, comme chez CNPP. Agents IA pour le développement commercial B2B Un premier déploiement concret : qualification, relances, next-best-action.Revenir à tous les guides IA ou voir nos études de cas et nos solutions IA.