FFCNCEREERXBD01
Durée :
7 semaines jour(s)
Présentation
Le MOOC est une solution flexible, accessible et compatible avec le maintien d’une activité professionnelle. Elle vous permet d’acquérir efficacement le niveau prérequis en informatique et en statistiques pour suivre des formations dans le domaine du big data et data science.
Le big data offre de nouvelles opportunités d'emplois au sein des entreprises et des administrations. Nos formations préparent à ces opportunités de métiers existants. Le suivi de ces formations nécessite des connaissances de base en statistiques et en informatique que ce MOOC vous propose d'acquérir dans les domaines de l’analyse, algèbre, probabilités, statistiques, programmation Python et bases de données pour le traitement des données massives et la prédiction.
D’une part, les bases de données relationnelles ne sont pas toujours adaptées aux systèmes de données massives qui sont déployées dans les contextes big data. Ce MOOC vous explique pourquoi.
D’autre part, le langage Python est un langage très utilisé dans le domaine du traitement des masses de données. Le MOOC vous initie à la programmation avec ce langage, particulièrement en utilisant la bibliothèque Numpy.
La formation vous fournit les concepts élémentaires en statistiques nécessaire au traitement des données massives et la prédiction, tels que les variables aléatoires, le calcul différentiel, les fonctions convexes, les problèmes d'optimisation et les modèles de régression. Ces bases sont appliquées sur un algorithme de classification, le Perceptron.
Objectifs
- Développer des applications de base de traitement de données en Python
- Utiliser les concepts d'algèbre, d'analyse et de statistiques nécessaires aux sciences de données
- Identifier les défis liés au stockage et au calcul distribué
-
Programme
Programmation Python
Limites des bases de données relationnelles
Algèbre
Analyse
Probabilités
Statistiques
Classifieur perceptron
-
Points forts
Formation 100% en ligne permettant un suivi à son rythme. Elle donne toutes les bases théoriques en mathématiques et en statistiques pour participer à des formations en intelligence artificielle et en science des données.
-
Modalités pédagogiques
Formation en e-Learning comportant des vidéos, des ressources pédagogiques, des quiz en ligne et des études de cas.
-
Public cible et prérequis
Le MOOC s'adresse à un public ayant des bases en mathématiques et en algorithmique (niveau L2 validé) nécessitant un rafraichissement de ses connaissances pour suivre des formations en data science, IA et big data.
-
Informations pratiques
Chaque partie se termine par un quiz validant les acquis des différentes sessions vidéos. Un quiz final faisant suite à un projet valide l’ensemble du MOOC. -
Responsables
Stephan CLEMENÇON
Enseignant-chercheur au département Image, Données, Signal de Télécom Paris, il anime l’équipe de recherche S2A (Statistiques et Applications) au sein du laboratoire LTCI. Ses recherches portent principalement sur la théorie statistique de l'apprentissage. Il enseigne le machine learning à Télécom Paris, à l'ENSAE Paris, à l'Université Paris 7 et à l'ENS Cachan.
Anne SABOURIN
Enseignante-chercheuse à Télécom Paris, elle consacre ses recherches à l’apprentissage statistique sur des événements rares. Les applications directes de ses recherches concernent la détection d’anomalie et la gestion des risques liés aux valeurs extrêmes.
Alexandre GRAMFORT
Chercheur à l'INRIA
Prochaine(s) session(s)
Nous contacter pour les sessions à venir