FFCNCERCERXBD04
Stage inter entreprise
Durée :
2 jour(s)
Présentation
Les sciences de l’information transforment aujourd’hui de nombreux domaines tels que la médecine, la finance, le marketing, la culture, la défense ou encore la sécurité. La capacité à traiter et analyser des données massives (big data) est un enjeu majeur dans tous les secteurs d’activités. La discipline qui développe et étudie des méthodes concrètes pour modéliser ce type de données est le machine learning. A l’interface des mathématiques appliquées et de l’informatique, cette discipline vise à produire des outils de prédiction et d’aide à la décision automatiques, à partir d’un apprentissage sur des données et des évènements. L’apparition d’algorithmes très performants pour la classification de données en grande dimension, tels que les réseaux de neurones, a progressivement transformé le champ occupé jusqu’alors par la statistique traditionnelle. Celle-ci s’appuyait en grande partie sur le prétraitement réalisé par l’opérateur humain.
La formation présente le domaine et ses fondements. Ses problèmes et ses méthodes les plus récentes sont également étudiés. Les concepts sont illustrés par des applications variées.
Objectifs
- Identifier les fondements historiques et théoriques de l’apprentissage automatique
- Utiliser les algorithmes majeurs en machine learning et reconnaître les situations dans lesquelles les appliquer
-
Programme
Introduction
Problématiques traitées par le machine learning
- Classification
- Régression
- Réduction de dimension
- Critères de choix d'algorithme
Introduction à la théorie de l’apprentissage (principe de la minimisation de risque empirique)
Exemples applicatifs :
- LDA (Linear Discriminant Analysis) – supervisé
- K-means – non supervisé
Sur-apprentissage, sélection de modèle
Optimisation pour le machine learning
Régression logistique
Arbres de classification
Méthodes ensemblistes
Support Vector Machine (SVM)
Introduction aux réseaux de neurones / deep learning
- Traitement du langage naturel NLP
- Traitement d’images
Travaux pratiques avec Python, Scikit-Learn
Synthèse et conclusion
-
Points forts
Formation donnant les fondements théoriques et permettant de prendre en main par la pratique les algorithmes de Machine Learning les plus utilisés.
-
Modalités pédagogiques
Travaux pratiques en Python :
- Initiation à Scikit-Learn
- Application des algorithmes
- Compréhension des mesures de performances et des avantages/inconvénients des différentes méthodes
-
Public cible et prérequis
Ingénieurs et techniciens ayant besoin de méthodes d’apprentissage pour automatiser des tâches (prédiction, décision, etc.) de manière performante. Chefs de projets qui souhaitent mieux identifier les tâches que le machine learning permettrait d’automatiser.
Des bases en Python (opérateurs clés (if, for, etc.), listes, dictionnaires) et des connaissances en mathématiques (fonctions et dérivées, limites, norme et produit scalaire) sont souhaitables/nécessaires afin de tirer pleinement profit de cette formation.
-
Responsables
Stephan CLEMENÇON
Enseignant-chercheur au département Image, Données, Signal de Télécom Paris, il anime l’équipe de recherche S2A (Statistiques et Applications) au sein du laboratoire LTCI. Ses recherches portent principalement sur la théorie statistique de l'apprentissage. Il enseigne le machine learning à Télécom Paris, à l'ENSAE Paris, à l'Université Paris 7 et à l'ENS Cachan.
Hicham JANATI
Enseignant-chercheur au département Image, Données, Signal de Télécom Paris. Docteur en apprentissage statistique de l'Institut Polytechnique de Paris et l'Inria. Ses recherches portent principalement sur le machine learning et ses interactions avec la théorie du transport optimal. Il enseigne le machine learning et l'apprentissage statistique a l'ENSAE, Python en data science à l'École Polytechnique.
Prochaine(s) session(s)
- Du 02/12/2024 au 03/12/2024 à Paris
- Du 10/06/2025 au 11/06/2025 à Paris
- Du 04/12/2025 au 05/12/2025 à Paris
Vous pourriez aussi être intéressé par...
[Formation] Standard 5G – Radio et cœur de réseau
Domaine : Réseaux opérateurs de transport de données – Nos formations
Durée : 3 jour(s)