FFCNCERCERXBD15
Stage inter entreprise
Durée :
2 jour(s)
Présentation
Le traitement des grandes masses de données (big data) et l’intelligence artificielle, dans différents secteurs d’activités, se basent sur le machine learning. Les méthodes de régression et leur pénalisation permettent de répondre à plusieurs problématiques, en mettant l’accent sur les approches non paramétriques. Les forêts aléatoires ainsi que différentes méthodes d’optimisation permettent d’apprendre les paramètres des modèles à l’aide de données d’entraînement (utilisant une descente de gradient ou non). D’autres problèmes industriels sont traités grâce au traitement statistique des séries temporelles.
Parallèlement, les réseaux neuronaux et l’apprentissage profond ont révolutionné le traitement des données pour l’analyse et la modélisation de structures complexes. Les réseaux neuronaux sont composés de couches de neurones artificiels capables d’apprendre des représentations hiérarchiques des données. L’apprentissage profond, en particulier, utilise des réseaux de neurones profonds, souvent constitués de dizaines voire de centaines de couches, pour extraire des caractéristiques de haut niveau à partir de données brutes afin d’exploiter le plein potentiel des données, améliorer la précision des modèles prédictifs et automatiser des tâches complexes qui nécessitaient auparavant une intervention humaine intensive.
Objectifs
- Prendre en main les différentes méthodologies d’apprentissage statistique tant pour les données indépendantes que pour les séries temporelles
- Déployer les méthodes les plus récentes, depuis l’écriture d’un modèle jusqu’à son optimisation
- Mettre en œuvre les algorithmes d’apprentissage les plus répandus et les appliquer à différents jeux de données
- Identifier les outils indispensables à l’implémentation de modèles et d’architectures adaptés aux problèmes considérés
-
Programme
Introduction
Rappels de machine learning
- Introduction à la théorie de l'apprentissage
- Réduction de dimension (analyse en composante principale et décomposition en valeurs singulières)
Cas des données complexes
- Extraction de features
- Apprentissage de représentation
Réseaux profonds
- Introduction et concepts fondamentaux
- Mise en œuvre
Méthodes de gradient pour l'apprentissage de modèles complexes
- Descente de gradient
- Algorithme de back-propagation
Apprentissage pour les séries temporelles partiellement observées
- Méthodes bayésiennes et réseaux de neurones récurrents pour les séries temporelles
Étude de cas
Synthèse et conclusion
-
Points forts
Formation technique permettant la prise en main des algorithmes avancés de machine learning à travers les preuves théoriques et des exercices pratiques sur des données réelles.
-
Modalités pédagogiques
Les concepts sont illustrés par de nombreux exemples utilisant des données simulées ainsi que des données réelles (données économétriques, météorologiques, applications en vision). Des séances de travaux pratiques en Python sont réalisées.
-
Public cible et prérequis
La formation s’adresse aux ingénieurs, chefs de projets souhaitant approfondir leurs connaissances en apprentissage statistique. Elle a pour but de détailler le développement des méthodes considérées ainsi que de fournir des éléments théoriques justifiant leurs performances.
Des connaissances de base en statistiques ou en machine learning : notions de probabilités/statistiques élémentaires (variables aléatoires, loi d’une variable aléatoire, espérance, etc.) ainsi que d’une connaissance des enjeux des méthodes d’apprentissage sont nécessaires afin de tirer pleinement profit de cette formation.
-
Responsables
Charlotte LACLAU
Enseignante-chercheuse au LTCI à Télécom Paris dans le département Image, Données et Signal. Ses intérêts de recherche portent sur l'apprentissage automatique et plus spécifiquement l'apprentissage de représentation pour des données complexes, avec un accent sur les graphes dynamiques et le texte. De plus, elle travaille sur l'analyse théorique des biais dans l'apprentissage automatique et le développement d'algorithmes équitables pour les données relationnelles.
Prochaine(s) session(s)
- Du 05/06/2025 au 06/06/2025 à Paris
- Du 06/11/2025 au 07/11/2025 à Paris