FC9BD13

Stage inter entreprise

Prix 2022 :

1 600 €

Comment financer sa formation ?

Durée :

2 jour(s)

Prochaine(s) session(s)

  • Du 12/09/2022 au 13/09/2022 à Paris

Présentation

Le langage Python est reconnu comme l'un des langages majeurs en informatique. C'est l'un des plus utiles pour les utilisateurs scientifiques et techniques, particulièrement dans le domaine des sciences des données.

Objectifs

  • Lire les données depuis différentes sources (fichiers HTML, fichiers Excel, bases de données, etc.)
  • Nettoyer et fusionner les données
  • Réaliser des analyses simples (statistiques descriptives, visualisations graphiques, régression, etc.)
  • Préparer les données pour leur utilisation dans des pipeline d’apprentissage statistique
  • Programme

    Introduction

    Prise en main de Python

    • Python : environnements virtuels, installation de bibliothèques, Jupyter notebook
    • Variables, types et structures de contrôle (boucles, conditions, etc.)

    Entrées/sorties en python

    • Lire et écrire des données depuis un fichier
    • Rappel sur la notion de chemin d’accès
    • Erreurs et exceptions : comment python signale-t-il les erreurs ; comment gérer les erreurs

    Fonctions

    Pourquoi et comment définir une fonction en Python ?

    • Différentes manières d’appeler une fonction en Python
    • Utilisation de modules et de bibliothèques tierces

    Structures de données

    • Listes, ensembles et dictionnaires
    • Comment utiliser des classes existantes en Python

    Données tabulaires

    • Bibliothèque Numpy
    • Bibliothèque Pandas
    • Chargement de données depuis des fichiers Excel, des fichiers HTML et des bases de données
    • Opérations basiques (filtres, opérations sur les colonnes, etc.)

    Représentations graphiques

    • Découverte de Matplotlib et Seaborn
    • Personnalisation des graphes

    Manipulation des DataFrame

    • Groupby
    • Jointures
    • Nettoyage de données (gestion des valeurs manquantes, validation, etc.)

    Manipulation de séries temporelles

    • Index et filtrage
    • Opérations sur des fenêtres glissantes

    Classification et régression

    • Aperçu de la bibliothèque Sklearn
    • Mise en place d’un pipeline d’apprentissage statistique
    • Comment interfacer Sklearn et Pandas

    Étude de cas

    Analyse des données du Covid

    • Intégration et consolidation des données provenant de plusieurs sources
    • Représentation graphique
    • Analyse des données et prédiction de l’évolution

    Synthèse et conclusion

  • Modalités pédagogiques

    Travaux pratiques

  • Public cible et prérequis

    Ingénieurs, développeurs devant traiter des données en Python.


    Des connaissances de base en programmation sont nécessaires pour le suivi de la formation.

  • Responsables

    • Guillaume WISNIEWSKI

      Enseignant-chercheur en informatique à l'Université Paris Diderot. Il est diplômé de Télécom Paris et de l'Université Pierre et Marie Curie. Son activité de recherche et d’enseignement porte sur l’apprentissage statistique et ses applications au traitement de langage naturel.

Prochaine(s) session(s)

  • Du 12/09/2022 au 13/09/2022 à Paris