Qu’est-ce que le machine learning : comment l’intelligence artificielle apprend-elle ?
16 mars, 2023
10 min
Les dispositifs technologiques à l’ère de l’internet des objets sont qualifiés d’intelligents parce qu’ils peuvent apprendre par l’expérience, tout comme les humains : découvrons ce qu’est le machine learning avec des exemples de cette forme d’intelligence artificielle.
Qu’est-ce que le machine learning ? Définition et signification
Le machine learning (ML), ou “apprentissage automatique” en français, est un concept d’actualité même s’il ressemble à une fantaisie futuriste. Des exemples concrets nous aideront à comprendre ce dont il s’agit, en distinguant les principaux types d’algorithmes et les tâches qu’ils peuvent accomplir.
Tout d’abord, cette technologie est une application de l’intelligence artificielle (IA) et consiste à créer des systèmes informatiques capables “d’apprendre” à partir des données fournies, mais sans avoir besoin d’une programmation spécifique. L’objectif est d’identifier automatiquement des modèles et des règles à partir des informations, afin de les catégoriser, de faire des prédictions et de prendre des décisions. La définition de l’apprentissage automatique pourrait se formuler comme “un algorithme qui permet aux ordinateurs de simuler les processus d’apprentissage humain, en améliorant progressivement la précision des tâches effectuées”.
Prenons un peu de recul technique et historique pour mieux comprendre ce qu’est l’apprentissage automatique. En informatique, pour résoudre un problème, selon le mathématicien Lotfi Zadeh, il y a essentiellement deux façons :
- Hard computing – méthode basée sur une logique déterministe (vrai ou faux) ou binaire (1 ou 0) et sur la précision des calculs. Elle nécessite des modèles mathématiques précis et des algorithmes programmés dans les moindres détails. Les mécanismes de calcul intensif sont “fixes” et immuables, c’est-à-dire qu’ils peuvent être appliqués sans modification à des problèmes du même type.
- Soft computing – méthode basée sur le calcul de probabilités qui admet l’approximation et l’imprécision. Ce processus est utile pour traiter des problèmes complexes impliquant des “vérités partielles” et s’inspire du raisonnement humain, qui tolère des informations incomplètes. Dans ce cas, la rationalité découle de l’expérience passée, qui sert de schéma directeur pour évaluer un environnement incertain. Toutefois, à la lumière de nouvelles découvertes, le modèle précédent fut complété et corrigé.
Alan Turing, sur le thème du soft computing, a émis l’hypothèse de la création d’une “machine à apprendre“, concrétisée plus tard par les algorithmes génétiques : des programmes qui recherchent la solution optimale à un problème en combinant des solutions existantes avec de nouvelles solutions, dans un processus d’amélioration continue. Arthur Samuel, en 1959, a ensuite inventé le terme de machine learning, en l’appliquant au jeu de dames, programmé dans un ordinateur. Quelques années plus tard, le champion Robert Nealey perdait une partie contre un IBM 7094 “entraîné”, laissant l’humanité incrédule.
En résumé, pour expliquer ce qu’est l’apprentissage automatique, on peut donc penser à un contexte dans lequel il n’est pas possible d’utiliser des algorithmes “classiques” étant donné qu’on ne dispose pas d’instructions précises et qu’on est donc obligé de procéder au cas par cas, en créant et en optimisant des modèles sur la base des données collectées. C’est l’apprentissage automatique, dont Tom Mitchell nous donne une définition pratique dans son livre Machine Learning :
“On dit qu’un programme apprend de l’expérience E en référence à une certaine classe de tâches T et à une mesure de performance P, si sa performance dans la tâche T, telle que mesurée par P, s’améliore avec l’expérience E.”
Qu’est-ce qu’un algorithme de machine learning ?
Le sens et l’objectif de l’apprentissage automatique est de généraliser les informations recueillies par l’expérience afin de reconnaître des règles et des modèles. Ce type de raisonnement est dit inductif (ou aristotélicien) et consiste précisément à établir une loi universelle à partir de cas particuliers. Grâce au machine learning, les ordinateurs sont capables de résoudre de nouveaux problèmes sur la base de ceux déjà observés.
La phase de formation définit ce qu’est l’apprentissage automatique dans quatre types d’algorithmes :
- Encadré : le programme dispose d’une base de données “labellisée”, composée d’inputs correspondant aux outputs souhaités, afin de le guider dans la détermination de la règle générale qui les lie ;
- Non supervisée : les informations fournies ne sont pas distinguées de quelque manière que ce soit et l’algorithme doit rechercher une structure, un schéma ou un modèle permettant de prédire les prochaines occurrences ;
- Semi-supervisé : les données assignées au programme sont un sous-ensemble incomplet d’un ensemble plus large, car les entrées sont limitées et certaines sans sortie. L’algorithme devra trouver une loi pour les justifier ;
- Par renforcement : l’ordinateur n’analyse pas une base de données mais interagit avec un environnement dynamique ou “adversaire”, dont il recevra un retour positif en cas de résultat exact. Compte tenu de l’intervention massive d’un “superviseur”, ce type d’apprentissage automatique est similaire au premier, mais dans ce cas il s’agit d’essais et d’erreurs, de tâtonnements.
Nous pouvons en apprendre davantage sur ce qu’est l’apprentissage automatique et ses types en considérant également le résultat requis :
- Classification : l’algorithme doit affecter les nouvelles entrées à l’une des classes (sorties) indiquées par le programmeur, sur la base des correspondances déjà indiquées. Cette tâche supervisée (ou de renforcement) pourrait être utile pour filtrer les courriers électroniques afin de reconnaître les spams par exemple ;
- Régression linéaire : l’apprentissage automatique du programme doit conduire, à partir des données, à une fonction reliant une variable dépendante à une ou plusieurs variables indépendantes. Il s’agit d’une loi qui clarifie la relation entre les facteurs mis en évidence par le programmeur, afin de prédire les résultats futurs. Les mécanismes de négociation automatisés, qui analysent les tendances passées pour négocier le marché, pourraient être un exemple d’apprentissage automatique par régression linéaire ;
- Régression logistique : le LM doit estimer la probabilité d’occurrence d’un événement en fonction de ses chances passées, résultat d’une combinaison de plusieurs variables. Un algorithme de régression logistique pourrait estimer, en pourcentage, les chances de victoire d’une équipe de football, en prenant en compte plusieurs facteurs des matchs précédents, tels que le nombre d’occasions créées ou de buts encaissés. En général, les tâches de régression sont supervisées parce qu’elles sont basées sur l’analyse d’informations catégorisées ;
- Clustering : un algorithme d’apprentissage automatique non supervisé doit diviser les données fournies en groupes, mais sans connaître les classes. Contrairement à la classification, le programme doit également créer des catégories sur la base des propriétés distinctives des informations, afin de regrouper les données en fonction de leur “similarité”. Le data mining pourrait être un exemple de machine learning pour le clustering, c’est-à-dire une technique utilisée par les entreprises pour effectuer des analyses exploratoires sur leurs clients afin de découvrir des caractéristiques inconnues.
Comment un ordinateur apprend : deep learning et réseaux neuronaux
Le concept de machine learning est souvent utilisé comme synonyme d’intelligence artificielle, mais après avoir défini de quoi il s’agit, il est évident que ce dernier est plutôt une propriété de l’IA. ChatGPT par exemple, apprend de l’interaction avec l’utilisateur et se corrige parfois pour produire des réponses plus précises. On peut donc se demander comment un tel logiciel apprend : pour l’expliquer, on peut s’appuyer sur le modèle du réseau neuronal artificiel, un type d’algorithme d’apprentissage automatique qui remonte au type “renforcement”.
Essentiellement, un système de ML à réseau neuronal se compose d’au moins trois couches, en communication les unes avec les autres : l’entrée, la couche cachée et la sortie, bien que nous puissions avoir plusieurs couches “cachées”. Chaque couche est composée de plusieurs nœuds, connectés à au moins un nœud de la “couche” suivante. Le fonctionnement est similaire à celui de notre cerveau : les nœuds sont les neurones et les canaux de connexion sont les dendrites et les axones par lesquels les informations sont échangées. Chaque connexion a un poids et un seuil d’activation : une information spécifique en attire d’autres plus facilement, comme un sourire attire le concept de bonheur.
Le processus d’apprentissage automatique par renforcement se divise donc en trois phases :
- Processus de décision : sur la base des données fournies, le résultat requis est produit, qu’il s’agisse d’un modèle, d’une classification ou d’une prédiction.
- Fonction d’erreur : la précision des conclusions est évaluée sur la base d’une comparaison avec les résultats attendus ou des exemples connus.
- Optimisation du modèle : si des erreurs sont constatées dans les résultats, on procède à ce que l’on appelle techniquement la rétropropagation. Dans la pratique, les poids des connexions sont corrigés de manière à ce que la prochaine fois, une certaine entrée ne produise plus un résultat erroné.
Le machine learning est dans ce cas un processus récursif : il est répété plusieurs fois jusqu’à l’obtention de résultats optimaux. Chaque algorithme d’apprentissage automatique doit être révisé d’une manière ou d’une autre : apprendre de ses erreurs est la base de l’apprentissage, de la même manière que les ordinateurs sont testés plusieurs fois, en fournissant des entrées différentes, avant d’obtenir la meilleure réponse.
L’exemple du réseau de neurones artificiels, en plus d’expliquer ce qu’est le machine learning, permet de clarifier la différence avec le deep learning : la “profondeur” correspond au nombre de couches “cachées”, qui permettent des analyses plus sophistiquées de données brutes et non structurées. L’apprentissage profond est généralement une forme non supervisée d’apprentissage automatique, également appelée apprentissage automatique évolutif.
Exemples et problèmes de machine learning
Les applications de l’apprentissage automatique sont nombreuses et certaines se retrouvent dans notre vie quotidienne. Les fonctions de reconnaissance vocale et de transcription de la parole que l’on trouve dans les smartphones en sont des exemples, tout comme les algorithmes qui recommandent des films sur Netflix ou des contenus sur Instagram en fonction de nos préférences. De même, le machine learning est utilisé au niveau de l’entreprise pour reconnaître les fraudes ou pour le service à la clientèle. Enfin, il est fondamental pour la conduite autonome et même pour la classification des objets célestes !
Cette immense utilité s’accompagne toutefois de certains problèmes, avant tout éthiques : si un système d’apprentissage automatique est formé à partir de données biaisées et empreintes de préjugés, il pourrait donner lieu non seulement à des conclusions erronées, mais aussi à des conclusions classistes et racistes. Dans ce cas, qui serait responsable de ces erreurs ? L’entreprise serait certainement fautive, et pas seulement si l’algorithme est supervisé, car elle n’a pas vérifié l’exactitude des données d’entrée.
Une autre question concerne l’impact que l’apprentissage automatique aura sur certains emplois : pourrait-il remplacer les humains ? Aucun algorithme n’est capable de le prédire, mais aucune superintelligence artificielle (ASI) n’a encore été développée. Nous ne disposons que d’exemples restreints qui ne peuvent pas surpasser les compétences d’une personne qualifiée et formée, en tout cas pour l’instant.Enfin, si tu souhaites approfondir d’autres exemples de ce qu’est le machine learning, tu peux lire l’article sur les 7 façons dont l’intelligence artificielle peut améliorer la crypto, où nous avons discuté de l’intégration de la ML et de l’IA dans certains projets de blockchain.