Glossaire de l’intelligence artificielle
L’intelligence artificielle regroupe un ensemble de concepts et de technologies en constante évolution, rendant parfois son vocabulaire complexe à appréhender. Ce glossaire définit de manière claire et concise les principaux termes utilisés dans ce domaine.
AGENTS
Logiciels capables d’exécuter certaines tâches de manière autonome et proactive, sans intervention humaine, souvent en utilisant un ensemble d’outils comme des calculateurs ou la navigation sur le web.
AGI (INTELLIGENCE ARTIFICIELLE GENERALE)
Bien que la définition soit sujette à débat, l’AGI représente une intelligence artificielle aussi capable qu’un humain pour toute tâche intellectuelle. C’est l’objectif poursuivi actuellement.
AJUSTEMENT DES HYPERPARAMETRES (HYPERPARAMETER TUNING)
Sélection des valeurs optimales pour les hyperparamètres d’un modèle d’apprentissage automatique.
AJUSTEMENT FIN (FINE-TUNING)
Affinage d’un modèle pré-entraîné sur un jeu de données spécifique pour améliorer sa performance sur une tâche particulière.
ALGORITHME
Suite finie de règles formelles (opérations logiques, instructions) permettant d’obtenir un résultat à partir d’éléments d’entrée. Cette suite peut faire l’objet d’un processus d’exécution automatisé et s’appuyer sur des modèles conçus grâce à l’apprentissage automatique. Parmi les algorithmes courants, on retrouve la classification, la régression et le clustering.
APPRENTISSAGE PAR TRANSFERT (TRANSFER LEARNING)
Technique où un modèle pré-entraîné est réutilisé pour une nouvelle tâche.
APPRENTISSAGE PROFOND (DEEP LEARNING)
Une branche de l’apprentissage automatique utilisant des réseaux de neurones artificiels pour identifier des motifs dans les données et générer des résultats (prédictions, classifications, etc.). L’apprentissage profond a permis d’améliorer considérablement les performances de l’IA dans des tâches comme la reconnaissance vocale et d’images, la détection d’objets et la conduite autonome.
APPRENTISSAGE AUTOMATIQUE (MACHINE LEARNING)
Branche de l’IA où les systèmes apprennent à partir d’exemples, sans être explicitement programmés pour chaque tâche. Techniques : apprentissage supervisé, non supervisé, semi-supervisé, par renforcement.
APPRENTISSAGE PAR INSTRUCTION (INSTRUCTION TUNING)
Technique où les modèles sont ajustés en fonction d’instructions spécifiques données dans le jeu de données.
APPRENTISSAGE SUPERVISE
Méthode où un modèle est entraîné avec des données étiquetées.
APPRENTISSAGE NON SUPERVISE
Méthode où un modèle découvre des schémas dans des données non étiquetées.
APPRENTISSAGE ZERO-SHOT (ZERO-SHOT LEARNING)
Capacité d’un modèle à effectuer des prédictions sur des cas qu’il n’a jamais vus en entraînement.
BIAIS ALGORITHMIQUE
Hypothèses faites par un modèle d’IA sur les données. Le compromis entre biais et variance est l’équilibre à atteindre entre les hypothèses qu’un modèle fait sur les données et la variabilité de ses prédictions selon les ensembles d’entraînement.
CHAINE DE PENSEE (CHAIN OF THOUGHT)
Dans l’IA, ce terme désigne la séquence d’étapes de raisonnement qu’un modèle suit pour parvenir à une décision.
CHATBOT
Un chatbot est une application logicielle conçue pour imiter une conversation humaine via du texte ou des commandes vocales.
COMPORTEMENT EMERGENT
Le comportement émergent, ou « emergence », désigne des capacités imprévues ou involontaires manifestées par un système d’IA.
COUCHE CACHEE (HIDDEN LAYER)
Couches de neurones dans un réseau neuronal qui ne sont ni en entrée ni en sortie, mais contribuent aux calculs internes.
DATA SCIENCE (SCIENCE DES DONNEES)
Domaine regroupant les mathématiques, statistiques, probabilités, informatique et visualisation des données afin d’extraire des connaissances à partir d’un ensemble hétérogène de données (images, sons, textes, données génomiques, liens sur les réseaux sociaux, mesures physiques, etc.). Les méthodes et outils dérivés de l’intelligence artificielle font partie de cette discipline.
DEEPFAKES
Images ou vidéos volontairement modifiées pour créer de la désinformation. Les progrès de l’IA générative ont facilité la production de deepfakes.
DESCENTE DE GRADIENT (GRADIENT DESCENT)
Méthode d’optimisation qui ajuste progressivement les paramètres d’un modèle pour minimiser une fonction de coût.
DOUBLE DESCENTE (DOUBLE DESCENT)
Phénomène en apprentissage automatique où la performance d’un modèle s’améliore avec l’augmentation de sa complexité, se dégrade, puis s’améliore à nouveau.
ENCODAGE (EMBEDDING)
Représentation des données sous une nouvelle forme, souvent dans un espace vectoriel, où des données similaires ont des représentations proches.
ÉMERGENCE / COMPORTEMENT EMERGENT
En IA, désigne des comportements complexes résultant d’interactions simples. Des « bifurcations rapides » ou « explosions d’intelligence » sont des scénarios spéculatifs où le développement de l’IA prendrait un tournant radical.
ESPACE LATENT (LATENT SPACE)
Représentation compressée des données dans un modèle, où des éléments similaires sont regroupés.
ÉTHIQUE DE L’IA
L’éthique de l’IA concerne les problématiques que doivent prendre en compte les parties prenantes de l’IA (ingénieurs, responsables politiques, etc.) pour s’assurer que cette technologie est développée et utilisée de manière responsable. Cela implique la mise en place de systèmes garantissant une approche sécurisée, impartiale et respectueuse de l’environnement.
FINE-TUNING (AJUSTEMENT FIN)
Entraînement complémentaire d’un modèle sur un ensemble de données spécifique afin d’améliorer ses performances pour une application donnée.
FONCTION DE PERTE (LOSS FUNCTION)
Fonction mathématique mesurant l’écart entre les prédictions d’un modèle et les valeurs réelles.
GARDE-FOUS (GUARDRAILS)
Les garde-fous sont des règles et restrictions mises en place pour garantir que les systèmes d’IA traitent les données de manière appropriée et ne génèrent pas de contenu contraire à l’éthique.
GPT (GENERATIVE PRETRAINED TRANSFORMER)
Modèle de langage développé par OpenAI, capable de générer du texte de manière fluide.
GPU (GRAPHICS PROCESSING UNIT), PROCESSEUR GRAPHIQUE
Processeur initialement conçu pour le rendu graphique, mais de plus en plus utilisés dans l’entraînement des modèles d’apprentissage automatique en raison de leur capacité à traiter de grandes quantités de données en parallèle.
HYPERPARAMETRE
Un hyperparamètre est une valeur déterminée à l’avance qui influence la manière dont un modèle d’IA apprend. Il est généralement réglé manuellement.
INFERENCE
Processus par lequel un modèle pré-entraîné réalise des prédictions à partir de nouvelles données.
INTELLIGENCE ARTIFICIELLE (IA)
Ensemble de sciences, théories et techniques ayant pour but de reproduire par une machine les capacités cognitives d’un être humain. Les développements actuels visent à confier à une machine des tâches complexes auparavant réservées à l’humain.
Cependant, le terme intelligence artificielle est critiqué par les experts qui distinguent l’IA « forte » (capable de contextualiser de manière autonome des problèmes très variés) et l’IA « faible » ou « modérée » (excellant dans un domaine précis d’entraînement). Selon certains spécialistes, l’IA forte nécessiterait des avancées fondamentales pour modéliser le monde dans son ensemble et non de simples améliorations des performances des systèmes existants.
L’IA peut imiter des capacités humaines comme la communication, l’apprentissage et la prise de décision. L’IA, les systèmes d’IA ou les technologies d’IA sont définis comme « des produits et services qui sont ‘adaptables’ et ‘autonomes’ ».
- Adaptabilité : une fois entraînés, les systèmes d’IA développent souvent la capacité d’identifier de nouvelles façons de repérer des motifs et des connexions dans les données, non prévues par leurs programmeurs humains.
- Autonomie : certains systèmes d’IA peuvent prendre des décisions sans intention ou contrôle humain direct et continu.
INTELLIGENCE ARTIFICIELLE GENERALE
Parfois appelée IA générale, IA forte ou IA large, elle désigne une forme théorique d’IA capable d’atteindre, voire de surpasser, les performances humaines dans la plupart des tâches cognitives. Voir aussi SUPERINTELLIGENCE.
IA ETROITE (NARROW AI)
IA spécialisée dans une tâche précise (ex. reconnaissance vocale). Contrairement à l’IA générale, elle ne peut pas s’adapter à d’autres tâches.
IA DE POINTE (FRONTIER AI)
Modèles d’IA très avancés, capables de réaliser une large gamme de tâches et égalant ou dépassant les modèles les plus performants d’aujourd’hui. Exemples :
- ChatGPT (OpenAI)
- Claude (Anthropic)
- Bard (Google)
IA GENERATIVE
Un modèle d’IA capable de générer du texte, des images, de l’audio, de la vidéo ou d’autres médias en réponse à des requêtes utilisateur en s’appuyant sur de vastes ensembles de données d’entraînement pour identifier des schémas et générer de nouvelles créations.. Applications : chatbots, filtres photo et vidéo, assistants virtuels.
IA RESPONSABLE
Désigne une IA développée en respectant des principes éthiques : transparence, équité, robustesse, respect de la vie privée.
LLM (LARGE LANGUAGE MODELS) AUSSI APPELES GRANDS MODELES DE LANGAGE
Catégorie de modèles fondamentaux entraînés sur d’énormes corpus textuels pour effectuer des tâches de traitement du langage naturel. Exemple : ChatGPT 3.5, entraîné sur 300 milliards de mots.
MÉTADONNÉES
Données utilisées pour définir, contextualiser ou caractériser d’autres données.
MODELES FONDAMENTAUX (FOUNDATION MODELS)
Modèles d’apprentissage automatique entraînés sur d’énormes quantités de données et facilement adaptables à de nombreuses tâches générales, notamment la génération de contenu (IA générative). Voir aussi Grands modèles de langage.
RESEAU DE NEURONES
Une structure informatique inspirée du fonctionnement des neurones biologiques, qui s’est ensuite rapproché des méthodes statistiques, composée d’un grand ensemble d’unités computationnelles interconnectées (« neurones »), organisées en couches. Les données circulent entre ces unités comme entre les neurones du cerveau.
Les sorties d’une couche précédente servent d’entrées pour la suivante, et un réseau avec plus de trois couches est considéré comme un algorithme d’apprentissage profond (deep learning). Assemblés en réseau, ces neurones formels peuvent réaliser rapidement des classifications et apprendre progressivement à les améliorer. Ce type d’apprentissage a été testé sur des jeux (Go, jeux vidéo) et est utilisé en robotique, traduction automatique, etc.
Exemples de réseaux de neurones artificiels : Transformers, réseaux antagonistes génératifs (GANs).
RESEAU ANTAGONISTE GENERATIF (GENERATIVE ADVERSARIAL NETWORK, GAN)
Modèle d’apprentissage automatique opposant un générateur et un discriminateur pour créer des données réalistes.
- Un générateur produit des données artificielles.
- Un discriminateur compare ces données aux vraies données d’entraînement et donne un retour au générateur.
Avec le temps, le générateur apprend à produire des données de plus en plus réalistes.
RESEAU DE NEURONES CONVOLUTIONNEL (CNN – CONVOLUTIONAL NEURAL NETWORK)
Un type de modèle d’apprentissage profond qui traite des données structurées en grille (comme les images) via l’application de filtres successifs.
RETROPROPAGATION (BACK PROPAGATION)
Un algorithme souvent utilisé dans l’entraînement des réseaux neuronaux, permettant de calculer le gradient de la fonction de perte par rapport aux poids du réseau.
SINGULARITE
Concept hypothétique selon lequel l’évolution de l’IA pourrait devenir incontrôlable, entraînant des transformations imprévisibles de la civilisation.
SUPERINTELLIGENCE OU ASI (ARTIFICIAL SUPER INTELLIGENCE)
Bien que controversé, le terme ASI est généralement défini comme une intelligence artificielle dépassant les capacités du cerveau humain.
SUR-AJUSTEMENT (OVERFITTING)
Erreur où un modèle apprend trop précisément les données d’entraînement, nuisant à sa capacité à généraliser.
TRAITEMENT DU LANGAGE NATUREL (NATURAL LANGUAGE PROCESSING, NLP)
Programmation de systèmes pour comprendre et générer du texte humain. Applications : chatbots, traduction automatique, synthèse et analyse de texte.
TRANSFORMEUR (TRANSFORMER)
Architecture de réseau neuronal permettant de traiter les séquences de données, notamment utilisée en traitement du langage naturel, la vision par ordinateur et la robotique.