[Formation] Data Science avec Python
Informations
- Code formation : FC9BD13
- Prix : 1 850 €
- Durée : 2 jour(s)
- Stage inter entreprise
-
Prochaine(s) session(s) :
- Du 12/09/2024 au 13/09/2024 à Paris
Présentation
Le langage Python est reconnu comme l'un des langages majeurs en informatique. C'est l'un des plus utiles pour les utilisateurs scientifiques et techniques, particulièrement dans le domaine des sciences des données.
Objectifs
- Lire les données depuis différentes sources (fichiers HTML, fichiers Excel, bases de données, etc.)
- Nettoyer et fusionner les données
- Réaliser des analyses simples (statistiques descriptives, visualisations graphiques, régression, etc.)
- Préparer les données pour leur utilisation dans des pipelines d’apprentissage statistique
-
Programme
Introduction
Prise en main de Python
- Python : environnements virtuels, installation de bibliothèques, Jupyter notebook
- Variables, types et structures de contrôle (boucles, conditions, etc.)
Entrées/sorties en Python
- Lire et écrire des données depuis un fichier
- Rappel sur la notion de chemin d’accès
- Erreurs et exceptions : comment Python signale-t-il les erreurs ? Comment gérer les erreurs ?
Fonctions
Pourquoi et comment définir une fonction en Python ?
- Différentes manières d’appeler une fonction en Python
- Utilisation de modules et de bibliothèques tierces
Structures de données
- Listes, ensembles et dictionnaires
- Comment utiliser des classes existantes en Python ?
Données tabulaires
- Bibliothèque Numpy
- Bibliothèque Pandas
- Chargement de données depuis des fichiers Excel, des fichiers HTML et des bases de données
- Opérations basiques (filtres, opérations sur les colonnes, etc.)
Représentations graphiques
- Découverte de Matplotlib et Seaborn
- Personnalisation des graphes
Manipulation des DataFrame
- Groupby
- Jointures
- Nettoyage de données (gestion des valeurs manquantes, validation, etc.)
Manipulation de séries temporelles
- Index et filtrage
- Opérations sur des fenêtres glissantes
Classification et régression
- Aperçu de la bibliothèque Sklearn
- Mise en place d’un pipeline d’apprentissage statistique
- Comment interfacer Sklearn et Pandas ?
Étude de cas
Analyse des données du Covid
- Intégration et consolidation des données provenant de plusieurs sources
- Représentation graphique
- Analyse des données et prédiction de l’évolution
Synthèse et conclusion
-
Points forts
Formation pratique permettant la prise en main des principales libraires Python pour le traitement des données.
-
Modalités pédagogiques
Travaux pratiques
-
Public cible et prérequis
Ingénieurs, développeurs devant traiter des données en Python.
Des connaissances de base en programmation sont nécessaires afin de tirer pleinement profit de la formation. -
Responsables
Guillaume WISNIEWSKI
Enseignant-chercheur en informatique à l'Université Paris Diderot. Il est diplômé de Télécom Paris et de l'Université Pierre et Marie Curie. Son activité de recherche et d’enseignement porte sur l’apprentissage statistique et ses applications au traitement de langage naturel.