En intelligence artificielle , un agent intelligent est une entité qui perçoit son environnement , agit de manière autonome pour atteindre des objectifs et peut améliorer ses performances grâce à l'apprentissage automatique ou à l'acquisition de connaissances . Les manuels d'IA définissent l'intelligence artificielle comme « l'étude et la conception d'agents intelligents », soulignant que le comportement orienté vers un but est essentiel à l'intelligence.l'IA agentique (également connue sous le nom d'agent IA ou simplement agent), étend ce concept en poursuivant de manière proactive des objectifs, en prenant des décisions et en agissant sur des périodes prolongées.
Les agents intelligents peuvent être simples ou très complexes. Un thermostat ou un système de contrôle de base est considéré comme un agent intelligent, tout comme un être humain ou tout autre système répondant aux mêmes critères, tel qu'une entreprise , un État ou un biome .
Les agents intelligents fonctionnent selon une fonction objectif qui définit leurs buts. Ils sont conçus pour élaborer et exécuter des plans qui maximisent la valeur attendue de cette fonction une fois celle-ci terminée. Par exemple, un agent d'apprentissage par renforcement possède une fonction de récompense qui permet aux programmeurs de façonner son comportement souhaité. De même, le comportement d'un algorithme évolutionnaire est guidé par une fonction d'évaluation.
Les agents intelligents en intelligence artificielle sont étroitement liés aux agents en économie , et des versions du paradigme de l'agent intelligent sont étudiées en sciences cognitives , en éthique et en philosophie de la raison pratique , ainsi que dans de nombreuses modélisations socio-cognitives interdisciplinaires et simulations sociales informatiques .
Les agents intelligents sont souvent décrits schématiquement comme des systèmes fonctionnels abstraits, semblables à des programmes informatiques . Afin de distinguer les modèles théoriques de leurs implémentations concrètes, les descriptions abstraites d'agents intelligents sont appelées agents intelligents abstraits. Les agents intelligents sont également étroitement liés aux agents logiciels — des programmes informatiques autonomes qui exécutent des tâches pour le compte d'utilisateurs. On les désigne aussi par un terme emprunté à l'économie : « agent rationnel »
modèle BDI ). Kaplan et Haenlein proposent une définition similaire, axée sur la capacité d'un système à comprendre les données externes, à en tirer des enseignements et à utiliser ces enseignements pour atteindre ses objectifs grâce à une adaptation flexible.Définir l'IA en termes d'agents intelligents offre plusieurs avantages clés :
- Évite les débats philosophiques : cette approche contourne les arguments concernant la nature « véritablement » intelligente ou consciente de l’IA, tels que ceux soulevés par le test de Turing ou l’expérience de la chambre chinoise de Searle . Elle se concentre sur le comportement et l’atteinte des objectifs , et non sur la reproduction de la pensée humaine.
- Tests objectifs : Ils offrent une méthode claire et scientifique pour évaluer les systèmes d’IA. Les chercheurs peuvent comparer différentes approches en mesurant leur capacité à maximiser une fonction objectif spécifique. Cela permet une comparaison directe et la combinaison de techniques.
- Communication interdisciplinaire : Elle crée un langage commun permettant aux chercheurs en IA de collaborer avec d'autres domaines comme l'optimisation mathématique et l'économie , qui utilisent également des concepts comme « objectifs » et « agents rationnels ».
Fonction objectif
La fonction objectif englobe tous les buts que l'agent est conçu pour atteindre. Pour les agents rationnels, elle intègre également les compromis entre des objectifs potentiellement contradictoires. Par exemple, la fonction objectif d'une voiture autonome pourrait équilibrer des facteurs tels que la sécurité, la vitesse et le confort des passagers.
Différents termes sont utilisés pour décrire ce concept, selon le contexte. En voici quelques exemples :
- Fonction d'utilité : Souvent utilisée en économie et en théorie de la décision, elle représente l'attrait d'un état.
- Fonction objectif : Terme général utilisé en optimisation.
- Fonction de perte : généralement utilisée en apprentissage automatique, où le but est de minimiser la perte (erreur).
- Fonction de récompense : utilisée dans l’apprentissage par renforcement .
- Fonction d'adaptation : utilisée dans les systèmes évolutifs .
Les objectifs, et donc la fonction objectif, peuvent être :
- Défini explicitement : programmé directement dans l’agent.
- Induit : Appris ou ayant évolué au fil du temps.
- En apprentissage par renforcement , une « fonction de récompense » fournit un retour d'information, encourageant les comportements souhaités et décourageant les comportements indésirables. L'agent apprend à maximiser sa récompense cumulée.
- Dans les systèmes évolutifs , une « fonction d’adaptation » détermine quels agents sont les plus susceptibles de se reproduire. Ceci est analogue à la sélection naturelle, où les organismes évoluent pour maximiser leurs chances de survie et de reproduction.
Certains systèmes d'IA, comme l' algorithme des plus proches voisins , raisonnent par analogie plutôt que d'être explicitement orientés vers un objectif. Cependant, même ces systèmes peuvent avoir des objectifs implicitement définis dans leurs données d'entraînement. Il est toujours possible d' évaluer ces systèmes en les considérant comme un système sans objectif défini, dont le « but » est d'accomplir sa tâche de classification spécifique.
Des systèmes qui ne sont pas traditionnellement considérés comme des agents, tels que les systèmes de représentation des connaissances , sont parfois intégrés à ce paradigme en les définissant comme des agents ayant pour objectif, par exemple, de répondre précisément à des questions. Dans ce cas, le concept d’« action » est étendu pour englober l’« acte » de fournir une réponse. Par extension, les systèmes basés sur le mimétisme peuvent être définis comme des agents optimisant une « fonction objectif » en fonction de la fidélité avec laquelle l’agent imite le comportement souhaité. Dans les réseaux antagonistes génératifs (GAN) des années 2010, un composant « encodeur »/« générateur » tente d’imiter et d’improviser la composition textuelle humaine. Le générateur cherche à maximiser une fonction représentant sa capacité à tromper un composant antagoniste « prédicteur »/« discriminateur ».
Alors que les systèmes d'IA symbolique utilisent souvent une fonction objectif explicite, ce paradigme s'applique également aux réseaux de neurones et au calcul évolutionnaire . L'apprentissage par renforcement peut générer des agents intelligents qui semblent agir de manière à maximiser une « fonction de récompense » . Parfois, au lieu d'égaler directement la fonction de récompense à la fonction d'évaluation de référence souhaitée, les programmeurs en apprentissage automatique utilisent le façonnage de la récompense pour récompenser initialement la machine pour ses progrès incrémentaux . Yann LeCun a déclaré en 2018 : « La plupart des algorithmes d'apprentissage conçus consistent essentiellement à minimiser une fonction objectif » . Le jeu d'échecs AlphaZero avait une fonction objectif simple : +1 point par victoire et -1 point par défaite. La fonction objectif d'une voiture autonome serait plus complexe . Le calcul évolutionnaire peut faire évoluer des agents intelligents qui semblent agir de manière à maximiser une « fonction d'adaptation » influençant le nombre de descendants que chaque agent est autorisé à laisser
Le formalisme mathématique d' AIXI a été proposé comme agent d'intelligence maximale dans ce paradigme. Cependant, AIXI est incalculable . Dans la réalité, un agent intelligent est limité par le temps et les ressources matérielles, et les scientifiques rivalisent pour produire des algorithmes qui obtiennent des scores toujours plus élevés aux tests de référence avec le matériel existant.
Fonction de l'agent
Le comportement d'un agent intelligent peut être décrit mathématiquement par une fonction d'agent . Cette fonction détermine ce que fait l'agent en fonction de ce qu'il a observé .
Une perception désigne les informations sensorielles dont dispose un agent à un instant précis. Par exemple, les perceptions d'une voiture autonome peuvent inclure les images de la caméra, les données lidar, les coordonnées GPS et les relevés de vitesse à un instant donné. L'agent utilise ces perceptions, et potentiellement son historique de perceptions, pour décider de sa prochaine action (par exemple, accélérer, freiner, tourner).
La fonction d'agent, souvent notée f , associe l'historique complet des perceptions de l'agent à une action .
Mathématiquement, cela peut être représenté comme
où:
Il est crucial de faire la distinction entre la fonction de l'agent (un concept mathématique abstrait) et le programme de l'agent (l'implémentation concrète de cette fonction).
- La fonction d'agent est une description théorique.
- Le programme de l'agent est le code qui s'exécute sur l'agent. Ce programme prend en entrée la perception actuelle et produit une action en sortie.
La fonction d’agent peut intégrer un large éventail d’approches de prise de décision, notamment :
- Calculer l'utilité (l'opportunité) de différentes actions.
- Utiliser des règles logiques et la déduction.
- Utilisation de la logique floue.
- Autres méthodes.
Classes d'agents intelligents
Classification de Russell et Norvig
Les agents réflexes simples agissent uniquement sur la base de la perception actuelle , ignorant le reste de l'historique perceptif. Leur fonctionnement repose sur la règle conditionnelle : « si condition, alors action ». Cette fonction d'agent n'est efficace que si l'environnement est entièrement observable. Certains agents réflexes peuvent également contenir des informations sur leur état actuel, ce qui leur permet d'ignorer les conditions dont les actionneurs sont déjà activés. Les boucles infinies sont souvent inévitables pour les agents réflexes simples évoluant dans des environnements partiellement observables. Si l'agent peut randomiser ses actions, il peut être possible d'échapper à ces boucles infinies. Un thermostat domestique , qui s'allume ou s'éteint lorsque la température descend en dessous d'un certain seuil, est un exemple d'agent réflexe simple.
Agents réflexes basés sur un modèle

Un agent basé sur un modèle peut interagir avec des environnements partiellement observables. Son état actuel est stocké en interne, conservant une structure qui décrit la partie du monde invisible. Cette connaissance du fonctionnement du monde est appelée modèle du monde, d'où le nom d'« agent basé sur un modèle ».
Un agent réflexe basé sur un modèle doit maintenir un modèle interne qui dépend de l'historique des perceptions et reflète ainsi au moins certains aspects non observés de l'état actuel. L'historique des perceptions et l'impact de l'action sur l'environnement peuvent être déterminés à partir de ce modèle interne. L'agent choisit ensuite une action de la même manière qu'un agent réflexe classique.
Un agent peut également utiliser des modèles pour décrire et prédire les comportements d'autres agents dans l'environnement.
Agents orientés vers un but

Les agents orientés vers un but étendent les capacités des agents basés sur un modèle en utilisant des informations relatives aux objectifs. Ces informations décrivent des situations souhaitables, permettant ainsi à l'agent de choisir parmi plusieurs possibilités celle qui permet d'atteindre l'état cible. La recherche et la planification sont les sous-domaines de l'intelligence artificielle consacrés à la recherche de séquences d'actions permettant d'atteindre les objectifs de l'agent.
ChatGPT et l' aspirateur Roomba sont des exemples d'agents orientés vers un objectif.
Agents basés sur l'utilité

Les agents orientés vers un but ne font la distinction qu'entre états cibles et états non cibles. Il est également possible de définir une mesure de la désirabilité d'un état particulier. Cette mesure peut être obtenue grâce à une fonction d'utilité qui associe à chaque état une mesure de son utilité. Une mesure de performance plus générale devrait permettre de comparer différents états du monde selon leur capacité à satisfaire les objectifs de l'agent. Le terme « utilité » peut alors être utilisé pour décrire le degré de satisfaction de l'agent.
Un agent rationnel, guidé par son utilité, choisit l'action qui maximise l'utilité espérée des résultats de cette action ; autrement dit, ce que l'agent s'attend à retirer, en moyenne, compte tenu des probabilités et des utilités de chaque résultat. Un tel agent doit modéliser son environnement et en assurer le suivi, tâches qui ont nécessité de nombreuses recherches sur la perception, la représentation, le raisonnement et l'apprentissage.
Agents d'apprentissage

L'apprentissage permet aux agents de démarrer dans des environnements inconnus et de dépasser progressivement les limites de leurs connaissances initiales. Une distinction fondamentale chez ces agents réside dans la séparation entre un « élément d'apprentissage », chargé d'améliorer les performances, et un « élément de performance », chargé de choisir les actions externes.
L'élément d'apprentissage recueille les commentaires d'un « critique » afin d'évaluer les performances de l'agent et de déterminer comment ajuster l'élément de performance (également appelé « acteur ») pour obtenir de meilleurs résultats. L'élément de performance, considéré comme l'agent dans son ensemble, interprète les perceptions et agit en conséquence.
Le dernier élément, le « générateur de problèmes », suggère des expériences nouvelles et instructives qui encouragent l'exploration et l'amélioration continue.
Classification de Weiss
Selon déduction logique .
Autre
En 2013, Alexander Wissner-Gross a publié une théorie explorant la relation entre la liberté et l'intelligence chez les agents intelligents.
Hiérarchies d'agents
Selon Nikola Kasabov en 1998, les systèmes d’agents intelligents devraient présenter les caractéristiques suivantes :
- Intégrer progressivement les nouvelles règles de résolution de problèmes .
- Adaptez-vous en ligne et en temps réel .
- Sont capables de s'analyser eux-mêmes en termes de comportement, d'erreurs et de réussites.
- Apprendre et progresser grâce à l’interaction avec l’environnement ( incarnation ).
- Apprenez rapidement à partir de grandes quantités de données .
- Disposer de capacités de stockage et de récupération d'exemples en mémoire .
- Disposer de paramètres permettant de représenter la mémoire à court et à long terme, l'âge, l'oubli, etc.
IA agentique
Ils possèdent plusieurs attributs clés, notamment des structures d'objectifs complexes, des interfaces en langage naturel, la capacité d'agir indépendamment de la supervision de l'utilisateur et l'intégration d'outils logiciels ou de systèmes de planification. Leur flux de contrôle est fréquemment piloté par de grands modèles de langage (LLM). Les agents comprennent également des systèmes de mémoire pour se souvenir des interactions précédentes entre l'utilisateur et l'agent, ainsi qu'un logiciel d'orchestration pour organiser les composants de l'agent.
Les chercheurs et les commentateurs ont noté que les agents d'IA n'ont pas de définition standard. Le concept d'IA agentique a été comparé au personnage fictif JARVIS .
Une application courante des agents d'IA est l'automatisation des tâches, par exemple la réservation de voyages suite à une demande de l'utilisateur . Parmi les exemples notables, citons Devin AI , AutoGPT et SIMA . D'autres agents, publiés depuis 2025, incluent OpenAI Operator , ChatGPT Deep Research , Manus , Quark (basé sur Qwen ), AutoGLM Rumination , Coze (de ByteDance ), nexos.ai et OpenClaw . Les frameworks permettant de créer des agents d'IA comprennent LangChain , ainsi que des outils tels que CAMEL, Microsoft AutoGen, et OpenAI Swarm.
Applications
Le concept de modélisation multi-agents pour les véhicules autonomes a été abordé dès 2003 Hallerbach et al. ont exploré l'utilisation d'approches multi-agents pour le développement et la validation de systèmes de conduite automatisée. Leur méthode reposait sur un jumeau numérique du véhicule testé et des simulations de trafic microscopiques utilisant des agents indépendants . Waymo a développé un environnement de simulation multi-agents appelé Carcraft, afin de tester des algorithmes pour véhicules autonomes . Ce système simule les interactions entre les conducteurs humains, les piétons et les véhicules autonomes. Les agents artificiels reproduisent le comportement humain à partir de données réelles.
Agentforce de Salesforce est une plateforme d'IA agentique qui permet de créer des agents autonomes pour effectuer des tâches.
L’ Administration de la sécurité des transports intègre l’IA agentielle dans les nouvelles technologies, notamment les machines permettant d’authentifier l’identité des passagers à l’aide de données biométriques et de photos, ainsi que dans la réponse aux incidents.
En mars 2026, Amazon Web Services a lancé Amazon Connect Health, sa première plateforme d'agents d'IA éligible HIPAA pour les soins de santé, conçue pour automatiser les flux de travail administratifs, notamment la planification des rendez-vous, la documentation clinique et la vérification des patients pour les prestataires de soins de santé.