Apprentissage statistique : modélisation décisionnelle et apprentissage profond
RCP209


Objectifs pédagogiques :

Ce cours présente les méthodes modernes d'intelligence artificielle pour la modélisation décisionnelle à partir des données, notamment les machines à vecteurs supports (SVM), les forêts aléatoires et les réseaux de neurones profonds, en vue de leur utilisation dans des applications réelles.
L'apprentissage automatique ou (machine learning) permet de construire des modèles prédictifs à partir de jeux de données empiriques, par exemple pour la prise de décision. Les méthodes abordées font partie de l'intelligence artificielle et de la fouille de données et ont de très nombreuses applications dans des domaines aussi divers que l'assurance qualité, le diagnostic médical, les véhicules autonomes, la bio-ingénierie, la climatologie, la sécurité environnementale, le marketing, la gestion de la relation client, la recherche d'information, etc.

Public et conditions d'accès :

Cet enseignement s'adresse aux auditeurs et auditrices souhaitant se former à l'apprentissage statistique, notamment à l'apprentissage profond et aux réseaux de neurones artificiels.

Prérequis :

  • avoir un niveau équivalent licence en mathématiques (algèbre linéaire, probabilités, statistiques, analyse) et en informatique (savoir programmer),
    • Avoir suivi la première partie du cycle spécialisation de l'EICNAM ou avoir le niveau M1 (Bac + 4) est suffisant.
    • Le langage de programmation utilisé durant le cours est Python.
  • Il est recommandé d'avoir suivi au préalable l'UE RCP208 « Apprentissage statistique : modélisation descriptive et introduction aux réseaux de neurones » ou un enseignement équivalent comportant une présentation des méthodes de base d'analyse des données et de modélisation descriptive des données.
Méthodes de validation :

L'UE est évaluée sur un projet personnel et un examen écrit. La note finale est la moyenne entre la note obtenue au projet et la note obtenue à l'examen.

Contenu de la formation :

Les thèmes abordés dans les séances de cours et de travaux pratiques (TP) sont :

  • Bases de l'apprentissage supervisé : qu'est-ce qu'un modèle décisionnel ?
  • Évaluation et sélection de modèles.
  • Arbres de décision et forêts d'arbres de décision (random forest).
  • Machines à vecteurs de support (SVM) :
    • discrimination, régression,
    • estimation du support d'une distribution, ingénierie des noyaux.
  • Réseaux de neurones artificiels :
    • apprentissage de représentations
    • apprentissage profond (deep learning)
    • réseaux convolutifs
    • réseaux récurrents

Chaque séance de cours est suivie d'une séance de travaux pratiques (TP) permettant de mettre en œuvre les méthodes présentées. Les TP sont réalisés à l'aide du langage de programmation Python, en utilisant les bibliothèques logicielles Scikit-learn et Keras. Une introduction à Scikit-learn et à Keras est prévue lors des séances de TP.

Bibliographie :
  • Chloé-Agathe Azencott: Introduction au machine learning
  • Aurélien Géron: Machine learning avec Scikit-Learn
  • Aurélien Géron: Deep learning avec Keras
  • Aaron Courville, Ian Goodfellow, Yoshua Bengio: L'apprentissage profond

Cette UE apparaît dans les diplômes et certificats suivants :

  • CS9700A : Certificat de spécialisation Intelligence artificielle
  • CS10900A : Certificat de spécialisation Intelligence artificielle et calcul scientifique
  • CYC9102A : Diplôme d'ingénieur Spécialité informatique parcours Informatique modélisation optimisation
  • CYC9106A : Diplôme d'ingénieur Spécialité informatique parcours Cybersécurité
  • MR11604A : Master Sciences, technologies, santé mention Informatique parcours Traitement de l'information et exploitation des données

Prochaines sessions de formation

Recherche en cours