avogadro
- 9 mai 2020
- 2 min de lecture

Apprentissage supervisé et non supervisé

Dernière mise à jour : 11 mai 2020

Dans cet article nous allons définir ce qu’est l’apprentissage supervisé et l’apprentissage non supervisé. On fera également un comparatif permettant d’identifier de façon claire la différence entre les deux types d’apprentissage. Mais avant cela nous allons d’abord définir ce qu’est le Machine Learning car l’apprentissage supervisé et l’apprentissage non supervisé (respectivement Supervised Learning et Unsupervised Learning en anglais) sont les deux principaux types du Machine Learning. Le machine Learning peut être défini comme « une composante de l’informatique qui donne aux ordinateurs la possibilité d’apprendre sans être programmé explicitement ». Le mot clé ici et qui fait la différence par rapport à la programmation informatique classique est « apprendre ». Il s’agit donc d’apprentissage.

Le schéma ci-dessus illustre bien cette différence. Le modèle en haut correspond à l’informatique classique ou traditionnelle, l’ordinateur est programmé pour effectuer une action sur la donnée, pour produire le résultat attendu.

Le modèle du bas correspondant au machine Learning se fait en deux phases :

- la phase d’apprentissage qui crée un modèle à partir des données d’apprentissage

- la phase de prédiction pendant laquelle le modèle généré grâce à l’apprentissage fournit un résultat à partir d’une nouvelle donnée.

L’apprentissage supervisé se base sur le passé en apprenant des données du passé pour prédire le futur. On assume que les données futures se comportent comme les données passées. Il s’agit donc d’apprendre sur des données dont le comportement est connu pour prédire le comportement des nouvelles données du futur. Ci-dessous une illustration d’un exemple bien connu d’apprentissage supervisé. On donne à l’ordinateurs plusieurs images dont chacune correspond à un chiffre écrit à la main (chiffre entre 0 et 9). En lui indiquant à quel chiffre correspond chaque image. On dit ainsi que les données sont labellisées. Après la phase d’apprentissage, si on fournit à l’ordinateur une nouvelle image d’un chiffre manuscrit, il doit être capable d’indiquer à quel chiffre cela correspond.

Contrairement à l’apprentissage supervisé, l’apprentissage non supervisé n’est pas un cadre bien posé. Et ne se base pas sur l’historique et les données ne sont pas labellisées. Ainsi on donne à l’ordinateur un ensemble de données et à l’issue de la phase d’apprentissage il doit être capable de les classer dans des groupes. Un exemple d’apprentissage non supervisé est ce qui est fait dans google news. En effet plusieurs articles de presse arrivent tous les matins chez google et ils sont classés automatiquement dans des catégories : sport, économie, culture, politique en fonction du sujet traité par l’article.

Ces sujets sont étudiés en détail dans nos formations sur la data science, l'apprentissage supervisé avec la célèbre librairie scikit learn écrit en langage python et l’apprentissage non supervisé où on apprendra notamment comment faire du text mining pour classer des textes comme dans le cas de google news.

N’hésitez pas à visiter la page formation pour voir l'ensemble des formations proposées.

Apprentissage supervisé et non supervisé

Posts récents