A quoi ça sert ?
Le machine learning sert à faire des prédictions et des classements à partir de données.
A partir de toutes les données : images, textes etc…
Donc le champ d’application est infini.
Le machine learning (ou apprentissage machine) se décompose en 4 grandes familles, selon la qualité de vos données :
Vous avez des données bien classées, bien annotées ?
Faites de l’apprentissage machine supervisé.
Exemple : Si vous avez des exemples déjà classés, la machine peut automatiquement classer des images selon leur contenu.
Ce type de machine learning donne deux types de résultats :
- Un chiffre (exemple : le loyer médian à Paris) – il s’agit alors d’une régression.
- Des données classées par groupe (exemple : classer les chiens et les chats) – il s’agir alors d’une association.
Vous avez des données « brutes », pas classées, vous ne savez pas quel type de résultat vous recherchez ?
Faites de l’apprentissage machine non supervisé.
Exemple : Trouver les groupes significatifs dans des millions de données non classées. C’est typiquement le cas pour les publicitaires qui classent des milliards de profils selon des critères d’habitude de vie, d’achat, de lieux… en plusieurs groupes plus petits.
Ce type de machine-learning donne deux types de résultats :
- Des données classées par groupe (exemple : les femmes actives de moins de 40 ans, avec un chat, à Londres) – il s’agit alors de clustering.
- Des procédures (patterns en anglais) qui permettent de faire de la prédiction (« Vous avez acheté X donc vous serez intéressés par Y ») – il s’agit alors d’association.
Vous avez quelques données classées et des données brutes ?
Faites de l’apprentissage semi-supervisé.
Exemple : En imagerie médicale vous avez des images déjà analysées et d’autres qui ne le sont pas. La machine va combler les vides de vos données.
Ce type de machine learning donnera sensiblement les mêmes résultats que l’apprentissage non-supervisé (clustering / association) mais avec beaucoup plus de pertinence.
Vous n’avez pas de données ?
Faites de l’apprentissage par renforcement.
Exemple : apprenez à votre robot à jouer à la belote ! C’est le type de machine learning le plus connu, avec les défi au jeu de Go, aux échecs etc… L’idée est de faire comme avec un enfant : récompenser la machine pour les bonnes réponses, avec le temps elle va apprendre à éviter les mauvaises ! La machine va collecter les données PENDANT le jeu. Donc il est possible de partir d’une page blanche.
… et bientôt on parlera d’apprentissage par transfert… domaine plus inquiétant car la machine sera capable d’appliquer des modèles appris dans un contexte à un autre contexte.
Le début d’une forme d’intelligence, artificielle.