Types d'IA : Un guide complet

Découvrez le spectre de l'intelligence artificielle, de l'IA discriminative et des modèles prédictifs aux agents autonomes et au cadre agentique.

Actualisé 30 déc. 2025 · 15 min lire

Si vous avez l'impression que l'intelligence artificielle (IA) est soudainement omniprésente, c'est parce que c'est effectivement le cas. Selon une récente étude de marché réalisée par McKinsey, l'adoption mondiale de l'IA est passée d'environ 50 à 60 % des organisations en 2020-2021 à un taux impressionnant de 88 % en 2025.

Cependant, cette croissance rapide a généré un problème linguistique. L'expression « IA » est devenue un terme générique utilisé pour décrire des technologies très différentes. Il est utilisé de manière interchangeable pour les chatbots simples basés sur des règles, les générateurs d'images et les robots futuristes de science-fiction.

Pour les professionnels des données, cette ambiguïté constitue un obstacle. Lorsqu'un intervenant demande une « solution d'IA », il est important de déterminer s'il a besoin d'un modèle de régression simple, d'un agent génératif ou d'un système de vision par ordinateur.

Dans ce guide complet, nous examinerons cette terminologie. Nous ne nous contenterons pas d'énumérer des définitions, mais nous l'examinerons sous quatre angles distincts : comment il est construit, ce qu'il peut faire, comment il prend ses décisions et comment il s'intègre dans les flux de travail réels.

Si vous débutez dans ce domaine, je vous recommande de suivre le cours « Comprendre l'intelligence artificielle ».

Qu'est-ce que l'IA ?

L'intelligence artificielle (IA) est un sous-domaine de l'informatique qui se concentre sur la création d'agents intelligents capables d'effectuer des tâches qui nécessitent généralement l'intelligence humaine, telles que la résolution de problèmes, la reconnaissance vocale et la prise de décision.

L'IA est une science interdisciplinaire qui comporte de nombreuses approches. Il peut être basé sur des règles (fonctionnant selon des conditions prédéfinies) ou utiliser des algorithmes d'apprentissage automatique pour apprendre à partir des données, permettant ainsi aux systèmes de s'adapter à des scénarios imprévus.

Cependant, définir précisément l'IA s'avère étonnamment difficile en raison de ce que les chercheurs appellent « l'effet IA ». Ce phénomène décrit la manière dont la perception de l'IA par la société évolue constamment à mesure que les technologies mûrissent. Lorsqu'une fonctionnalité devient courante, les gens cessent de l'appeler « IA » et commencent à la considérer comme un logiciel ordinaire.

En raison de cette définition fluctuante et de cette vaste portée, une classification unique ne suffit pas. Il est nécessaire d'utiliser plusieurs objectifs pour obtenir une image complète :

Technologie : Les algorithmes et architectures sous-jacents.
Capacité : Mesure du niveau d'intelligence, de faible à superintelligent.
Fonctionnalité : Comment les systèmes traitent-ils les informations et conservent-ils la mémoire ?

Par exemple, une voiture autonome peut être classée de trois manières simultanément :

IA étroite ( basée sur sa capacité spécifique).
Apprentissage profond ( basé sur sa technologie sous-jacente).
Mémoire limitée (en fonction de ses fonctionnalités).

Dans les sections suivantes, nous examinerons ces types spécifiques.

Pour une introduction strictement non technique aux notions de base, je vous recommande de consulter notre Guide de l'IA pour les débutants.

Types d'IA basés sur la technologie

La manière la plus rigoureuse de classer l'IA consiste à se baser sur la technologie sous-jacente, le « moteur » qui anime le système. Cette classification distingue les systèmes en fonction de la manière dont ils traitent les données et apprennent. Examinons ces différents types.

Apprentissage automatique

L'apprentissage automatique (ML) est un sous-domaine de l'IA qui se concentre sur les systèmes qui apprennent à partir de données et s'améliorent sans être explicitement programmés pour chaque règle. Au lieu d'écrire un code qui dit « si ceci, alors cela », vous fournissez des données à l'algorithme et vous le laissez trouver les modèles.

L'apprentissage automatique se divise en trois principaux paradigmes d'apprentissage, chacun étant adapté à différents types de problèmes :

Apprentissage supervisé: La forme la plus courante dans le monde des affaires. Il utilise des données étiquetées (paires entrée-sortie) pour entraîner des algorithmes. Par exemple, vous pourriez présenter au modèle 1 000 e-mails étiquetés « Spam » ou « Non spam », et il apprendra à classer le prochain e-mail. Les algorithmes courants comprennent la régression linéaire, les K plus proches voisins (KNN) et les arbres de décision.
Apprentissage non supervisé: L'algorithme reçoit des données non étiquetées et doit identifier de manière autonome les structures ou les modèles cachés. Ceci est fréquemment utilisé pour la segmentation de la clientèle (regroupement). Le regroupement par la méthode des k-moyennes et l'analyse en composantes principales (ACP) comptent parmi les algorithmes les plus couramment utilisés.
Apprentissage par renforcement (RL): En empruntant une voie totalement différente, le RL forme les agents par essais et erreurs à l'aide d'un système de récompenses et de sanctions. Un agent RL reçoit un retour d'information sur son interaction avec l'environnement et apprend progressivement quels comportements maximisent les récompenses cumulées au fil du temps. Il s'agit de la méthode utilisée pour former les robots et les IA avancées dans le domaine des jeux, telles qu'AlphaGo.

Afin d'acquérir de solides bases en apprentissage automatique, je vous recommande de suivre le cursus de compétences « Principes fondamentaux de l'apprentissage automatique avec Python ».

Apprentissage profond

L'apprentissage profond (DL) est un sous-ensemble spécialisé du ML inspiré de la structure du cerveau humain. Il utilise des réseaux neuronaux artificiels à plusieurs couches (d'où le terme « profond ») pour modéliser des relations complexes et non linéaires dans de vastes ensembles de données. Alors que l'apprentissage automatique traditionnel peut atteindre un plateau avec davantage de données, l'apprentissage profond continue souvent à s'améliorer.

Les principales architectures comprennent :

Réseaux neuronaux convolutifs (CNN): La référence en matière de traitement d'images. Ils utilisent des « filtres » pour analyser automatiquement les images et détecter les hiérarchies spatiales telles que les contours, les formes et les textures.
Réseaux neuronaux récurrents (RNN): Conçu pour les données séquentielles telles que les séries chronologiques ou la parole. Ils conservent une « mémoire » des entrées précédentes afin d'influencer la sortie actuelle.
Transformateurs: L'architecture sous-jacente aux grands modèles linguistiques (LLM) modernes, tels que GPT 5.2 et Gemini 3. Il utilise un mécanisme d'attention pour traiter simultanément des séquences entières de données, en évaluant l'importance relative des différents mots les uns par rapport aux autres plutôt que de les traiter un par un.
Réseaux antagonistes génératifs (GAN): Un cadre dans lequel deux réseaux sont en concurrence : un « générateur » qui crée des données factices et un « discriminateur » qui tente de détecter ces données factices en tant que telles. Cette compétition aboutit à des résultats synthétiques extrêmement réalistes.
Modèles de diffusion: Le moteur derrière des outils tels que Midjourney. Ils produisent des images de haute qualité en apprenant à inverser systématiquement le bruit aléatoire pour obtenir des images claires et distinctes.

Si vous souhaitez créer ces modèles vous-même, je vous recommande de commencer par le cours Introduction au Deep Learning avec PyTorch.

Traitement du langage naturel

Le traitement du langage naturel (NLP) vise à permettre aux ordinateurs de comprendre, d'interpréter et de générer le langage humain de manière significative. Le TALN comble le fossé entre la communication humaine et la compréhension des machines en traitant l'ambiguïté, la dépendance au contexte et la complexité inhérentes au langage naturel.

Les techniques comprennent les suivantes :

Analyse des sentiments: Analyser le sentiment derrière une phrase, par exemple, déterminer si un commentaire est positif ou négatif.
Reconnaissance des entités nommées (NER): Identification de personnes ou de lieux dans un texte
Tokenisation: Diviser le texte en unités plus petites, telles que des mots, des syllabes ou même des caractères individuels.

Examinons un exemple d'analyse des sentiments à l'aide d' transformers s en Python :

# Example: Sentiment analysis using transformers
from transformers import pipeline
# Load pre-trained sentiment analysis model
sentiment_analyzer = pipeline("sentiment-analysis")
# Analyze multiple texts
texts = [
    "This product exceeded my expectations!",
    "Terrible customer service, very disappointed.",
    "The quality is okay, nothing special."
]
results = sentiment_analyzer(texts)
for text, result in zip(texts, results):
    print(f"Text: {text}")
    print(f"Sentiment: {result['label']}, Confidence: {result['score']:.2f}\n")

Text: This product exceeded my expectations!
Sentiment: POSITIVE, Confidence: 1.00

Text: Terrible customer service, very disappointed.
Sentiment: NEGATIVE, Confidence: 1.00

Text: The quality is okay, nothing special.
Sentiment: NEGATIVE, Confidence: 0.98

Vision par ordinateur

La vision par ordinateur permet aux machines d'extraire des informations significatives à partir d'images et de vidéos numériques, ce qui permet aux ordinateurs de percevoir et de comprendre les données visuelles d'une manière similaire à la perception humaine. Ce domaine concerne l'identification d'objets, la mesure de distances ou même la reconnaissance de motifs invisibles à l'œil nu.

Les systèmes de vision par ordinateur associent des techniques de traitement d'images à l'apprentissage automatique, en particulier l'apprentissage profond, afin d'extraire des représentations de plus en plus abstraites à partir de données visuelles brutes. Les tâches principales comprennent :

Classification des images: Identifier ce qui se trouve dans une image (par exemple, « Il s'agit d'un chat »).
Détection d'objets : Localiser l'emplacement d'un objet (par exemple, « Il y a un piéton aux coordonnées x, y »).
Reconnaissance faciale: Vérification de l'identité à partir des traits du visage.

L'imagerie médicale constitue l'une des applications les plus influentes de la vision par ordinateur, les systèmes d'IA détectant les tumeurs sur les radiographies, les tomodensitogrammes et les IRM avec une précision égale ou supérieure à celle des radiologues humains. Ces systèmes ne remplacent pas les professionnels de santé, mais les assistent, par exemple en signalant les anomalies potentielles afin qu'elles soient examinées par des experts.

Traitement audio

Le traitement audio se concentre sur la reconnaissance, l'interprétation et la synthèse des signaux auditifs, y compris la parole humaine et les sons environnementaux. L'objectif est de permettre aux machines d'écouter, de comprendre et de générer du contenu audio, en comblant le fossé entre les ondes acoustiques et la signification sémantique.

La reconnaissance vocale automatique (RVA) transforme la parole en texte écrit et alimente les assistants vocaux, les services de transcription et les outils d'accessibilité. Les systèmes ASR modernes utilisent des architectures de transformateurs pour mapper directement les formes d'onde audio en séquences de texte, atteignant une précision proche de celle de l'humain sur des discours clairs et s'améliorant régulièrement dans des conditions difficiles telles que le bruit de fond ou les accents.

Les moteurs de synthèse vocale (TTS) tels qu'Amazon Polly effectuent l'opération inverse, en synthétisant une voix naturelle à partir d'un texte écrit à l'aide de vocodeurs neuronaux qui génèrent une prosodie, une intonation et une expression émotionnelle réalistes. Les systèmes TTS contemporains peuvent reproduire des voix à partir de quelques minutes d'échantillons audio seulement, ce qui élargit les possibilités créatives mais soulève également des questions éthiques.

Les applications s'étendent au-delà du traitement de la parole pour toucher des domaines créatifs et pratiques. La technologie de clonage vocal permet de créer des assistants virtuels personnalisés, des narrations d'audiobooks avec des voix cohérentes et des enregistrements audio deepfake controversés.

Robotique et intelligence artificielle intégrée

Ceci représente la convergence entre l'intelligence artificielle et l'ingénierie. L'IA incarnée consiste à intégrer des « cerveaux » avancés (tels que des modèles de vision-langage) dans des corps robotiques physiques. Alors qu'une grande partie de l'IA existe uniquement sous forme numérique, l'IA incarnée doit composer avec la gravité, la friction et la complexité imprévisible des environnements physiques.

Cette ancrage dans la réalité présente des défis qui n'existent pas dans l'IA purement computationnelle, mais permet également une interaction directe avec le monde physique. Les robots traditionnels nécessitaient une programmation explicite pour chaque tâche, les ingénieurs codant manuellement des mouvements précis et des arbres de décision afin d'obtenir des résultats spécifiques.

Les systèmes d'IA modernes comprennent les commandes en langage naturel, telles que « ramassez la pomme » ou « ouvrez cette porte », en utilisant la perception visuelle pour identifier les objets et planifier les actions appropriées sans nécessiter de programmation spécifique à la tâche.

Cette avancée répond au paradoxe de Moravec, qui observe que des tâches simples pour les humains, telles que plier le linge, ouvrir des portes et se déplacer dans des pièces encombrées, s'avèrent extrêmement difficiles pour les robots, tandis que des tâches que les humains trouvent difficiles, comme les échecs ou le calcul, sont relativement faciles pour l'IA.

L'IA incarnée, qui utilise des modèles de base, comble enfin cette lacune en dotant les robots de la compréhension perceptuelle et de la planification adaptative que les humains considèrent comme acquises. Les applications comprennent des appareils grand public tels que les aspirateurs robotisés, les robots collaboratifs industriels (cobots) et les humanoïdes avancés tels que l'Atlas de Boston Dynamics.

Types d'IA basés sur les capacités

Alors que la technologie définit la manière dont une IA est construite, ses capacités définissent ce qu'elle peut accomplir par rapport à l'intelligence humaine. Cette classification sert de chronologie de l'évolution de l'IA, passant des limites actuelles à des perspectives théoriques.

Intelligence artificielle étroite

L'intelligence artificielle étroite (ANI), également appelée IA faible, représente l'intelligence artificielle telle qu'elle existe aujourd'hui. Il s'agit de systèmes conçus pour exceller dans des tâches spécifiques et prédéfinies, mais qui échouent complètement lorsqu'ils sont confrontés à des tâches qui sortent du cadre étroit de leur formation. Un robot d'échecs ne peut pas conduire une voiture, et un outil de diagnostic médical ne peut pas composer de la poésie.

Cependant, la définition « restrictive » est en train de s'élargir. L'état actuel de la technique fait appel à des modèles linguistiques multimodaux avancés (LLM). Nous assistons à la sortie de modèles tels que GPT-5.2 et Gemini 3, capables de traiter simultanément des données textuelles, audio et visuelles.

Bien qu'ils imitent le raisonnement, ils n'ont toujours pas une véritable compréhension du monde. Les développeurs interagissent avec ces systèmes ANI via des API afin de les intégrer dans des applications.

La prochaine étape au sein de l'ANI est l'IA agentique. Il s'agit de systèmes qui vont au-delà du simple chat passif ; ils peuvent effectuer de manière autonome des actions en plusieurs étapes, comme naviguer sur le Web pour réserver un vol, et servir ainsi de passerelle vers une intelligence plus large.

Intelligence artificielle générale

L'intelligence artificielle générale (AGI) représente le Saint Graal de la recherche en intelligence artificielle. Ce terme désigne un stade théorique où une machine possède la capacité d'apprendre, de raisonner et de résoudre des problèmes dans des domaines totalement indépendants les uns des autres, à l'instar de la flexibilité cognitive humaine.

Le principal facteur de différenciation est la généralisation. Un système ANI formé pour parler portugais ne peut pas utiliser ces connaissances pour apprendre l'espagnol plus rapidement. Un système AGI pourrait appliquer la logique d'un domaine à un autre sans nécessiter de nouvelle formation manuelle.

Le calendrier de l'AGI fait l'objet d'un débat intense. Les optimistes du secteur prévoient son arrivée entre 2026 et 2029. À l'inverse, les sceptiques soutiennent que nous ne disposons pas de l'architecture fondamentale (en particulier, des « modèles du monde » précis) pour y parvenir, et situent cette échéance en 2040 ou au-delà.

Superintelligence artificielle

L'intelligence artificielle supérieure (IAS) désigne un stade hypothétique où l'IA surpasserait les esprits humains les plus brillants dans pratiquement tous les domaines : créativité scientifique, sagesse générale, compétences sociales et résolution de problèmes. L'ASI ne se contenterait pas d'égaler Einstein ou De Vinci ; elle les surpasserait de manière aussi spectaculaire qu'ils ont surpassé l'intelligence humaine moyenne.

La préoccupation la plus importante concernant l'ASI concerne l'auto-amélioration récursive, où une ASI redessine sa propre architecture pour devenir plus intelligente, puis utilise cette intelligence améliorée pour apporter d'autres améliorations, créant ainsi une boucle de rétroaction incontrôlable d'intelligence s'accélérant de manière exponentielle.

Cette explosion de l'intelligence pourrait rapidement produire des systèmes tellement au-delà de la compréhension humaine qu'il deviendrait impossible de prédire leur comportement, soulevant ainsi de profondes questions de sécurité concernant leur alignement et leur contrôle. Si les objectifs d'une IA avancée divergent, même légèrement, des valeurs humaines, son intelligence supérieure pourrait poursuivre ces objectifs d'une manière préjudiciable à l'humanité.

Il n'existe aucune feuille de route crédible pour la construction d'une ASI, et de nombreux chercheurs se demandent si la superintelligence est réellement réalisable ou cohérente en tant que concept. Néanmoins, la possibilité théorique de l'ASI motive des travaux universitaires sérieux sur l'alignement de l'IA afin de garantir que des systèmes de plus en plus performants restent bénéfiques et contrôlables.

Types d'IA basés sur les fonctionnalités

Alors que la capacité mesure la puissance, la fonctionnalité évalue la manière dont le système interagit avec le monde et traite les données. Cette classification nous permet de distinguer un ordinateur d'échecs des années 1990 des robots sociaux du futur. Examinons chaque type.

Machines réactives

Les machines réactives représentent la forme la plus élémentaire et la plus ancienne d'IA. Ces systèmes n'ont aucune notion du passé ou du futur, mais fonctionnent strictement sur la base d'entrées immédiates selon des règles préprogrammées.

La caractéristique déterminante de l'IA réactive est qu'elle est sans état et déterministe. Si vous introduisez dix fois la même entrée dans une machine réactive, elle produira dix fois le même résultat. Il ne peut pas apprendre de ses expériences car il ne stocke pas de mémoire.

Un exemple significatif de ce type est Deep Blue d'IBM, l'ordinateur d'échecs qui a battu Garry Kasparov. Il n'a pas appris la psychologie de Kasparov. Il calculait simplement le meilleur coup en fonction de l'état actuel du plateau. Les filtres anti-spam standard qui signalent les mots-clés sans analyser l'historique de vos e-mails entrent également dans cette catégorie.

IA à mémoire limitée

L'intelligence artificielle à mémoire limitée prédomine dans les applications modernes. En stockant temporairement des données récentes ou du contexte afin de prendre des décisions éclairées, les systèmes d'IA à mémoire limitée permettent un comportement dynamique. Contrairement aux machines réactives, elles se réfèrent à des informations historiques dans un contexte limité.

Presque tous les outils d'IA prédictive et d'IA générative utilisés aujourd'hui appartiennent à cette catégorie. Les modèles d'apprentissage automatique (LLM) tels que Claude Opus 4.5 conservent l'historique des conversations, se souvenant de ce que vous avez dit quelques minutes auparavant afin de fournir des réponses cohérentes qui s'appuient sur les échanges précédents. La fenêtre de contexte détermine la quantité d'informations historiques auxquelles le système peut se référer.

Les véhicules autonomes suivent la vitesse et la trajectoire des véhicules à proximité pendant plusieurs secondes, prédisant ainsi leurs positions futures plutôt que de réagir uniquement à leur emplacement actuel.

Théorie de l'esprit IA

La théorie de l'esprit dans le domaine de l'intelligence artificielle occupe un espace controversé entre le prototype de recherche et la capacité pratique. Les systèmes appartenant à cette catégorie modéliseraient les états mentaux, les croyances, les intentions, les émotions et les désirs humains afin de prédire les comportements avec précision.

Cette capacité est essentielle pour une interaction sociale naturelle, permettant à l'IA d'interpréter des indices implicites, de détecter la tromperie ou d'adapter ses réponses à l'humeur d'un utilisateur.

Les modèles pionniers antérieurs, tels que le GPT-4 d'OpenAI, ont déjà atteint des résultats comparables à ceux des humains dans des tâches liées aux fausses croyances, comme la prédiction d'actions basées sur des croyances erronées, comme le montre l'étude PNAS 2024 du chercheur Michal Kosinski de Stanford.

Cependant, les experts débattent pour déterminer si cela signifie que les LLM modernes peuvent déjà être classés comme de véritables systèmes de théorie de l'esprit ou s'ils appliquent simplement la reconnaissance de formes issues de l'apprentissage du langage. Parmi les prototypes, on peut citer ToMnet de DeepMind, conçu pour déduire les croyances d'autres agents dans des environnements simulés.

IA consciente d'elle-même

L'IA consciente d'elle-même décrit un concept de machines dotées d'une conscience, d'une sensibilité et d'une compréhension claire de leur propre existence, distincte du monde qui les entoure.

Cela représente non seulement l'intelligence, mais également l'expérience subjective. Une machine de ce type ne se contenterait pas de traiter des informations la concernant, mais aurait également une conscience profonde de son existence, accompagnée de sentiments, de besoins et de désirs associés.

Ce niveau dépasse la capacité de calcul et aborde le domaine philosophique de la nature même de la conscience. Une intelligence artificielle consciente d'elle-même pourrait-elle ressentir de la douleur, du plaisir ou de la crainte d'être désactivée ? Si tel est le cas, mérite-t-il une considération morale ou des droits ? Ces questions déplacent la conversation de l'ingénierie vers l'éthique.

Aucun système existant n'atteint ce niveau. Exemples fictifs, comme HAL 9000 dans le film 2001 : L'Odyssée de l'espace d': 2001, l'Odyssée de l'espace, ou Data de Star Trek illustrent ce concept, mais il reste à déterminer s'il sera un jour réalisé.

Principaux types de modèles d'IA

Au-delà de la théorie de haut niveau, les praticiens des données doivent comprendre les architectures spécifiques qu'ils rencontreront en production. De manière générale, les types de modèles d'IA utilisés aujourd'hui dans l'industrie peuvent être classés soit comme créateurs, soit comme analyseurs. Vous pouvez en savoir plus sur cette distinction dans cet article consacré aux modèles génératifs et discriminatifs.

IA générative : Les créateurs

Les modèles d'IA générative sont conçus pour générer de nouvelles instances de données qui ressemblent à vos données d'entraînement. Ces modèles apprennent la distribution de probabilité sous-jacente d'un ensemble de données afin de produire du texte, des images, du code ou de l'audio originaux. Ce passage de l'analyse à la création offre de nombreuses possibilités en matière de génération de contenu évolutif, d'augmentation créative et de simulation.

Parmi les exemples les plus connus, on peut citer les LLM tels que Claude pour l'écriture et le codage, les modèles de diffusion tels que Midjourney ou Nano Banana Pro pour la synthèse d'images, et les modèles de génération vidéo tels que Sora, capables de simuler des scènes complexes. Il est important de noter que tous les générateurs d'images ne reposent pas sur la diffusion ; des modèles tels que GPT Image 1.5 utilisent plutôt une architecture autorégressive.

L'IA générative représente une avancée majeure dans les flux de travail de l'IA agentique, où les modèles ne se contentent pas de répondre, mais créent activement des ressources ou des plans. Nous examinerons plus en détail les agents IA ultérieurement.

IA discriminatoire : Les analystes

Alors que l'IA générative fait la une des journaux, l'IA discriminative, également appelée IA prédictive, reste le pilier des opérations des entreprises. Ces modèles ne créent pas de nouvelles données ; ils apprennent plutôt à reconnaître les limites entre les classes d'un ensemble de données afin de classer les entrées ou de prédire les valeurs futures.

La valeur commerciale de l'IA discriminante réside dans sa capacité à éclairer la prise de décision et à évaluer les risques. Les organisations utilisent ces modèles pour automatiser les jugements nécessitant une application cohérente des critères appris.

Contrairement aux modèles génératifs, les modèles discriminatifs ne sont pas axés sur la créativité, mais privilégient la précision et la fiabilité. Ils sont souvent utilisés dans des scénarios à haut risque où les erreurs peuvent avoir des conséquences importantes.

Voici quelques exemples :

Modèles de notation de crédit permettant de prévoir le risque de défaut de paiement.
Filtres anti-spam classant les e-mails comme indésirables ou légitimes.
Outils de diagnostic médical permettant d'identifier les anomalies sur les radiographies.
Systèmes de surveillance financière détectant les transactions frauduleuses.

Modèles de fondation

Les modèles de base s'entraînent sur des ensembles de données vastes et variés, comprenant du texte, des images, du code et des données structurées, afin d'apprendre des modèles généraux applicables à tous les domaines. Un modèle de base n'apprend pas seulement à classer des images ou à générer du texte ; il développe une compréhension globale du langage, du raisonnement et des connaissances du monde qui se transpose à de nouvelles tâches avec un minimum de formation supplémentaire.

Cette approche réduit considérablement le temps et les données nécessaires au déploiement de l'IA pour de nouvelles applications. Plutôt que de créer un modèle distinct pour chaque problème spécifique, les organisations ajustent un modèle de base unique pour diverses tâches, allant de l'analyse de documents juridiques à la génération de code en passant par la traduction linguistique.

Nous observons actuellement une augmentation des modèles linguistiques de petite taille (SLM). Il s'agit de versions simplifiées et efficaces de modèles de base conçues pour fonctionner localement sur des appareils (tels que des ordinateurs portables ou des téléphones), offrant confidentialité et rapidité sans les coûts informatiques élevés associés aux géants du cloud.

Types d'agents IA

L'intelligence artificielle évolue, passant d'outils passifs à des agents autonomes capables d'exécuter des flux de travail complexes. Alors qu'un modèle standard attend une entrée pour produire une sortie, un agent IA est capable de percevoir son environnement, de réfléchir à la manière d'atteindre un objectif et de prendre des mesures pour l'atteindre. Pour appréhender l'architecture sous-jacente des agents et leur mode de création, je vous recommande de commencer par notre cours Introduction aux agents IA.

Les types d'agents IA sont généralement classés en fonction de leur niveau de complexité et d'autonomie. Examinons-les.

Agents réflexes simples

Les agents réflexes constituent la forme la plus simple d'agent. Ils fonctionnent selon une règle stricte de « condition-action », réagissant uniquement à leur perception actuelle et ne tenant pas compte du passé. Un thermostat intelligent illustre bien cela avec des règles telles que celles-ci : Si la température descend en dessous de 20 °C, veuillez activer le chauffage. Si la température dépasse 22 °C, veuillez activer le refroidissement.

Les robots utilisés sur les chaînes de montage constituent un autre exemple ; ils exécutent des actions lorsque des capteurs détectent des conditions indiquant que les pièces ont atteint les positions désignées. Les agents reflex sont particulièrement performants dans les tâches répétitives dans des environnements stables, mais rencontrent des difficultés lorsque les conditions changent de manière inattendue, car ils ne disposent pas de la compréhension contextuelle nécessaire pour s'adapter.

Agents réflexifs basés sur des modèles

Les agents réflexifs basés sur des modèles maintiennent un modèle interne du monde, en suivant l'état au fil du temps afin de gérer des environnements partiellement observables. Ils ne se contentent pas de réagir, mais mémorisent également les informations essentielles nécessaires à un fonctionnement optimal.

Les systèmes de freinage d'urgence autonomes illustrent parfaitement ce principe en fusionnant les données provenant des radars et des caméras afin de suivre la trajectoire des véhicules dans le temps, plutôt que de simplement réagir aux menaces immédiates. Ils maintiennent des estimations précises même avec des informations incomplètes, par exemple en mémorisant la position estimée d'une voiture après qu'elle ait disparu derrière un camion.

Agents basés sur des objectifs

Les agents basés sur des objectifs agissent pour atteindre des objectifs spécifiques plutôt que de se contenter de réagir. Face à un objectif tel que « planifier des vacances en Italie », ils envisagent plusieurs séquences d'actions et évaluent celle qui permettra d'atteindre le mieux cet objectif. Ceci représente la pointe de la technologie en matière d'IA agentielle.

Des outils tels que Roo Code pour l'ingénierie logicielle ou les assistants de réservation autonomes exécutent des workflows en plusieurs étapes, comme la recherche, la comparaison, la vérification des contraintes et la prise de décisions pour mener à bien des tâches complètes. Les plateformes de workflow telles que n8n permettent de créer des processus complexes dans lesquels des agents IA gèrent les points de décision et la logique adaptative.

Si vous souhaitez acquérir des bases solides dans le domaine des agents IA, je vous recommande de suivre notre cursus « Principes fondamentaux des agents IA ».

Agents basés sur l'utilité

Les agents basés sur l'utilité vont encore plus loin : ils optimisent le meilleur chemin vers les objectifs plutôt que n'importe quel chemin fonctionnel. Pour ce faire, ils utilisent des fonctions d'utilité qui attribuent des notes numériques aux résultats, ce qui permet une comparaison quantitative.

Alors qu'un agent axé sur les objectifs réserve n'importe quel vol à destination de Rome, un agent axé sur l'utilité prend en compte des facteurs tels que le coût, la durée, les escales et les heures de départ afin de maximiser l'utilité globale.

On peut citer comme exemples les systèmes de trading algorithmiques qui équilibrent les profits et les risques, ainsi que les applications de navigation telles que Waze, qui optimisent les itinéraires en fonction des préférences des utilisateurs, telles que le temps le plus rapide, la distance la plus courte ou l'évitement des péages.

Agents d'apprentissage

Les agents d'apprentissage opèrent dans des environnements inconnus ou changeants, s'améliorant continuellement grâce à l'expérience, sans intervention humaine. L'architecture comprend un critique qui fournit des commentaires sur les performances et un élément d'apprentissage qui modifie la politique de l'agent.

Les rovers martiens identifient les caractéristiques du terrain qui indiquent des chemins sûrs lorsqu'ils rencontrent de nouvelles formations géologiques. L'algorithme de recommandation de Netflix constitue un autre exemple : il affine continuellement sa compréhension des préférences des utilisateurs en fonction de leur historique de visionnage, améliorant ainsi ses suggestions au fil du temps.

Cadres d'action : Création des agents

Les cadres agentiques servent de système d'exploitation pour les agents complexes, reliant le noyau de raisonnement (généralement un LLM) à la mémoire, aux outils et à la coordination multi-agents. Ils gèrent :

Orchestration : Déterminer quel agent gère chaque sous-tâche et gérer le flux de travail entre les composants.
Planification : Décomposer des objectifs complexes en étapes réalisables et s'adapter lorsque les circonstances changent.
Utilisation des outils : Fournir aux agents l'accès aux moteurs de recherche, aux bases de données, aux API ou à l'exécution de code.
Mémoire : Conserver l'historique des conversations et le contexte à long terme au-delà des interactions immédiates

Les frameworks populaires comprennent :

LangChain/LangGraph: Norme industrielle pour connecter les LLM à des sources de données grâce à des intégrations étendues.
Google ADK: Cadre open source pour la création d'agents sophistiqués sur Vertex AI.
CrewAI: Coordonne plusieurs agents jouant différents rôles qui collaborent à des tâches complexes.

Pour une référence rapide sur ces architectures, je vous recommande de consulter l'aide-mémoire sur les agents IA.

Conclusion

Nous avons abordé de nombreux sujets ici ; nous allons maintenant conclure.

Plutôt que de considérer l'IA comme une technologie monolithique, nous devrions la reconnaître comme un écosystème diversifié d'approches spécialisées, chacune adaptée à des problèmes particuliers. Pour bien comprendre l'IA, il est nécessaire de l'examiner sous trois angles distincts : la technologie, les capacités et les fonctionnalités.

Nous sommes actuellement dans une phase de transition entre l'IA étroite, axée sur des tâches spécifiques, et les premières formes d'IA agentielle, qui exécutent de manière autonome des flux de travail complexes, ce qui en fait un tournant décisif pour son adoption dans tous les secteurs.

Faites le premier pas vers une carrière d'expert en IA en vous inscrivant au cursus de compétences « Principes fondamentaux de l'IA ».

Quels sont les principaux types d'IA ?

Quelle est la différence entre l'IA générative et l'IA prédictive ?

Que sont les agents IA et comment fonctionnent-ils ?

Qu'est-ce que l'IA agentique ?

Quelle est la différence entre l'ANI et l'AGI ?

Author

Rajesh Kumar

Sujets

Intelligence artificielle

Cours sur l'intelligence artificielle

Cursus

Principes fondamentaux de l'IA

10 h

Découvrez les principes fondamentaux de l'IA, apprenez à l'utiliser efficacement dans votre travail et explorez des modèles tels que chatGPT pour vous orienter dans le paysage dynamique de l'IA.

Afficher les détails

Commencer le cours

Cours

Comprendre l'intelligence artificielle

2 h

375.1K

Découvrez les bases de l’intelligence artificielle : machine learning, deep learning, NLP, IA générative et bien plus encore.

Afficher les détails

Commencer le cours

Cours

Introduction aux agents d’IA

1 h 30 min

47.4K

Découvrez les bases des agents d’IA, leurs composants et cas d’usage réels, le tout sans coder.

Afficher les détails

Commencer le cours

Qu'est-ce que l'IA ?

Types d'IA basés sur la technologie

Apprentissage automatique

Apprentissage profond

Traitement du langage naturel

Vision par ordinateur

Traitement audio

Robotique et intelligence artificielle intégrée

Types d'IA basés sur les capacités

Intelligence artificielle étroite

Intelligence artificielle générale

Superintelligence artificielle

Types d'IA basés sur les fonctionnalités

Machines réactives

IA à mémoire limitée

Théorie de l'esprit IA

IA consciente d'elle-même

Principaux types de modèles d'IA

IA générative : Les créateurs

IA discriminatoire : Les analystes

Modèles de fondation

Types d'agents IA

Agents réflexes simples

Agents réflexifs basés sur des modèles

Agents basés sur des objectifs

Agents basés sur l'utilité

Agents d'apprentissage

Cadres d'action : Création des agents

Conclusion

Types d'IA - Questions fréquentes

Que sont les agents IA et comment fonctionnent-ils ?

Qu'est-ce que l'IA agentique ?

Quelle est la différence entre l'ANI et l'AGI ?

.css-1531qan{-webkit-text-decoration:none;text-decoration:none;color:inherit;}Principes fondamentaux de l'IA

Comprendre l'intelligence artificielle

Introduction aux agents d’IA

Principes fondamentaux de l'IA