Suivez nous sur
Classe de maître IA :

AI 101

Qu'est-ce que l'apprentissage par machine?

mm
Le kit de préparation mis à jour on

L’apprentissage automatique est l’un des domaines technologiques à la croissance la plus rapide, mais malgré la fréquence à laquelle les mots « apprentissage automatique » sont utilisés, il peut être difficile de comprendre ce qu’est précisément l’apprentissage automatique.

Apprentissage automatique ne fait pas référence à une seule chose, c'est un terme générique qui peut être appliqué à de nombreux concepts et techniques différents. Comprendre l'apprentissage automatique signifie être familiarisé avec différentes formes d'analyse de modèles, de variables et d'algorithmes. Examinons de près l'apprentissage automatique pour mieux comprendre ce qu'il englobe.

Qu'est-ce que l'apprentissage automatique ?

Bien que le terme apprentissage automatique puisse s'appliquer à de nombreuses choses différentes, en général, le terme désigne le fait de permettre à un ordinateur d'effectuer des tâches sans recevoir d'instructions explicites ligne par ligne pour le faire. Un spécialiste de l'apprentissage automatique n'a pas à écrire toutes les étapes nécessaires pour résoudre le problème, car l'ordinateur est capable d'« apprendre » en analysant des modèles dans les données et en généralisant ces modèles à de nouvelles données.

Les systèmes d'apprentissage automatique comportent trois éléments de base :

  • Contributions
  • Algorithmes
  • Sortie

Les entrées sont les données qui sont introduites dans le système d'apprentissage automatique, et les données d'entrée peuvent être divisées en étiquettes et fonctionnalités. Les caractéristiques sont les variables pertinentes, les variables qui seront analysées pour apprendre des modèles et tirer des conclusions. Pendant ce temps, les étiquettes sont des classes/descriptions données aux instances individuelles des données.

Les fonctionnalités et les étiquettes peuvent être utilisées dans deux types différents de problèmes d’apprentissage automatique : l’apprentissage supervisé et l’apprentissage non supervisé.

Apprentissage non supervisé ou supervisé

In enseignement supervisé, les données d'entrée sont accompagnées d'une vérité terrain. Les problèmes d'apprentissage supervisé ont les valeurs de sortie correctes dans le cadre de l'ensemble de données, de sorte que les classes attendues sont connues à l'avance. Cela permet au scientifique des données de vérifier les performances de l'algorithme en testant les données sur un ensemble de données de test et en voyant quel pourcentage d'éléments ont été correctement classés.

En revanche, apprentissage non supervisé les problèmes ne sont pas associés à des étiquettes de vérité terrain. Un algorithme d'apprentissage automatique formé pour effectuer des tâches d'apprentissage non supervisé doit être capable de déduire lui-même les modèles pertinents dans les données.

Les algorithmes d'apprentissage supervisé sont généralement utilisés pour les problèmes de classification, où l'on dispose d'un grand ensemble de données rempli d'instances qui doivent être triées dans l'une des nombreuses classes différentes. Un autre type d'apprentissage supervisé est une tâche de régression, où la valeur produite par l'algorithme est de nature continue au lieu d'être catégorique.

Pendant ce temps, des algorithmes d'apprentissage non supervisés sont utilisés pour des tâches telles que l'estimation de la densité, le regroupement et l'apprentissage des représentations. Ces trois tâches ont besoin du modèle d'apprentissage automatique pour déduire la structure des données, il n'y a pas de classes prédéfinies données au modèle.

Examinons brièvement certains des algorithmes les plus couramment utilisés dans l'apprentissage non supervisé et l'apprentissage supervisé.

Types d'apprentissage supervisé

Les algorithmes d'apprentissage supervisés courants incluent :

  • Naïf Bayes
  • Machines à vecteurs de support
  • Régression logistique
  • Forêts aléatoires
  • Réseaux neuronaux artificiels

Machines à vecteurs de support sont des algorithmes qui divisent un ensemble de données en différentes classes. Les points de données sont regroupés en clusters en traçant des lignes qui séparent les classes les unes des autres. Les points trouvés d'un côté de la ligne appartiendront à une classe, tandis que les points de l'autre côté de la ligne seront d'une classe différente. Les machines à vecteurs de support visent à maximiser la distance entre la ligne et les points trouvés de chaque côté de la ligne, et plus la distance est grande, plus le classificateur est convaincu que le point appartient à une classe et non à une autre classe.

Régression logistique est un algorithme utilisé dans les tâches de classification binaire lorsque des points de données doivent être classés comme appartenant à l'une des deux classes. La régression logistique fonctionne en étiquetant le point de données soit 1 soit 0. Si la valeur perçue du point de données est de 0.49 ou moins, il est classé comme 0, tandis que s'il est de 0.5 ou plus, il est classé comme 1.

Algorithmes d'arbre de décision fonctionnent en divisant les ensembles de données en fragments de plus en plus petits. Les critères exacts utilisés pour diviser les données dépendent de l'ingénieur en apprentissage automatique, mais l'objectif est finalement de diviser les données en points de données uniques, qui seront ensuite classés à l'aide d'une clé.

Un algorithme de forêt aléatoire est essentiellement constitué de plusieurs classificateurs d'arbre de décision uniques reliés entre eux en un classificateur plus puissant.

Le Classificateur Naive Bayes calcule la probabilité qu'un point de données donné se soit produit en fonction de la probabilité qu'un événement antérieur se produise. Il est basé sur le théorème de Bayes et place les points de données en classes en fonction de leur probabilité calculée. Lors de l’implémentation d’un classificateur Naive Bayes, on suppose que tous les prédicteurs ont la même influence sur le résultat de la classe.

An Réseau neuronal artificiel, ou perceptron multicouche, sont des algorithmes d'apprentissage automatique inspirés de la structure et du fonctionnement du cerveau humain. Les réseaux de neurones artificiels tirent leur nom du fait qu'ils sont constitués de nombreux nœuds/neurones reliés entre eux. Chaque neurone manipule les données avec une fonction mathématique. Dans les réseaux de neurones artificiels, il existe des couches d'entrée, des couches cachées et des couches de sortie.

La couche cachée du réseau neuronal est l'endroit où les données sont réellement interprétées et analysées pour les modèles. En d'autres termes, c'est là que l'algorithme apprend. Plus de neurones réunis forment des réseaux plus complexes capables d'apprendre des modèles plus complexes.

Types d'apprentissage non supervisé

Les algorithmes d'apprentissage non supervisé incluent :

  • Regroupement des K-moyennes
  • Codeurs automatiques
  • Analyse des composants principaux

Regroupement des K-moyennes est une technique de classification non supervisée, et elle fonctionne en séparant des points de données en clusters ou groupes en fonction de leurs caractéristiques. Le clustering K-means analyse les caractéristiques trouvées dans les points de données et y distingue des modèles qui rendent les points de données trouvés dans un cluster de classe donné plus similaires les uns aux autres qu'ils ne le sont aux clusters contenant les autres points de données. Ceci est accompli en plaçant des centres possibles pour le cluster, ou centroïdes, dans un graphique des données et en réattribuant la position du centroïde jusqu'à ce qu'une position soit trouvée qui minimise la distance entre le centroïde et les points qui appartiennent à la classe de ce centroïde. Le chercheur peut spécifier le nombre de clusters souhaité.

Analyse des composants principaux est une technique qui réduit un grand nombre de caractéristiques/variables dans un espace de caractéristiques plus petit/moins de caractéristiques. Les "composantes principales" des points de données sont sélectionnées pour la préservation, tandis que les autres caractéristiques sont comprimées dans une représentation plus petite. La relation entre les potions de données d'origine est préservée, mais comme la complexité des points de données est plus simple, les données sont plus faciles à quantifier et à décrire.

Codeurs automatiques sont des versions de réseaux de neurones qui peuvent être appliquées à des tâches d'apprentissage non supervisées. Les auto-encodeurs sont capables de prendre des données non étiquetées de forme libre et de les transformer en données qu'un réseau de neurones est capable d'utiliser, créant essentiellement leurs propres données d'entraînement étiquetées. Le but d'un auto-encodeur est de convertir les données d'entrée et de les reconstruire aussi précisément que possible, c'est donc dans l'incitation du réseau de déterminer quelles fonctionnalités sont les plus importantes et de les extraire.

Blogueur et programmeur spécialisé dans Machine Learning et L'apprentissage en profondeur les sujets. Daniel espère aider les autres à utiliser le pouvoir de l'IA pour le bien social.