Data Science avec Python

FFCNCERCERXBD13

Stage inter entreprise

Prix 2026 :

1 910 €

Comment financer sa formation ?

Durée :

2 jour(s)

Prochaine(s) session(s)

Du 24/09/2026 au 25/09/2026 à Paris

S'inscrire

Version imprimable

Version PDF

Présentation

Le langage Python est reconnu comme l'un des langages majeurs en informatique. C'est l'un des plus utiles pour les utilisateurs scientifiques et techniques, particulièrement dans le domaine des sciences des données.

Pour les entreprises, utiliser Python signifie non seulement accéder à une large gamme de ressources et d’outils, mais aussi bénéficier d’une plateforme solide pour développer des applications intelligentes capables de transformer des volumes de données en informations exploitables, améliorant ainsi la prise de décision et l’efficacité opérationnelle.

Objectifs

Lire les données depuis différentes sources (fichiers HTML, fichiers Excel, bases de données, etc.)
Nettoyer et fusionner les données
Réaliser des analyses simples (statistiques descriptives, visualisations graphiques, régression, etc.)
Préparer les données pour leur utilisation dans des pipelines d’apprentissage statistique

Programme
Introduction

Prise en main de Python
- Python : environnements virtuels, installation de bibliothèques, Jupyter notebook
- Variables, types et structures de contrôle (boucles, conditions, etc.)
Entrées/sorties en Python
- Lire et écrire des données depuis un fichier
- Rappel sur la notion de chemin d’accès
- Erreurs et exceptions : comment Python signale-t-il les erreurs ? Comment gérer les erreurs ?
Fonctions

Pourquoi et comment définir une fonction en Python ?
- Différentes manières d’appeler une fonction en Python
- Utilisation de modules et de bibliothèques tierces
Structures de données
- Listes, ensembles et dictionnaires
- Comment utiliser des classes existantes en Python ?
Données tabulaires
- Bibliothèque Numpy
- Bibliothèque Pandas
- Chargement de données depuis des fichiers Excel, des fichiers HTML et des bases de données
- Opérations basiques (filtres, opérations sur les colonnes, etc.)
Représentations graphiques
- Découverte de Matplotlib et Seaborn
- Personnalisation des graphes
Manipulation des DataFrames
- Groupby
- Jointures
- Nettoyage de données (gestion des valeurs manquantes, validation, etc.)
Manipulation de séries temporelles
- Index et filtrage
- Opérations sur des fenêtres glissantes
Classification et régression
- Aperçu de la bibliothèque Sklearn
- Mise en place d’un pipeline d’apprentissage statistique
- Comment interfacer Sklearn et Pandas ?
Étude de cas

Analyse des données du Covid
- Intégration et consolidation des données provenant de plusieurs sources
- Représentation graphique
- Analyse des données et prédiction de l’évolution
Synthèse et conclusion
Points forts

Formation pratique permettant la prise en main des principales libraires Python pour le traitement des données.
Modalités pédagogiques

Travaux pratiques et études de cas.
Public cible et prérequis

Ingénieurs, développeurs devant traiter des données en Python.

Des connaissances de base en programmation sont nécessaires afin de tirer pleinement profit de la formation.
Responsables
- Guillaume WISNIEWSKI
  Enseignant-chercheur en informatique à Université Paris Cité. Il est diplômé de Télécom ParisTech (promo 2004) et de l'Université Pierre et Marie Curie (thèse en apprentissage statistique en 2007). Ses travaux de recherche portent sur la linguistique informatique et la compréhension automatique des langues. Depuis 2008, il enseigne la data science, le traitement des langues, l'apprentissage statistique, l’apprentissage profond et les giga-modèles de langue (LLMs).

Prochaine(s) session(s)

Du 24/09/2026 au 25/09/2026 à Paris

S'inscrire

Vous êtes intéressé(e) et/ou vous voulez procéder à une inscription ?

N'hésitez plus et complétez le formulaire. Nous revenons vers vous ensuite pour répondre à vos questions et/ou compléter votre inscription.

Inscription d'un/des collaborateur(s)		Ordre
	Participant Civilité ^* Fonction / Titre participant Nom Prénom Téléphone Email	Poids pour la ligne 1
	Participant Civilité ^* Fonction / Titre participant Nom Prénom Téléphone Email	Poids pour la ligne 2
	Participant Civilité ^* Fonction / Titre participant Nom Prénom Téléphone Email	Poids pour la ligne 3

Leave this field blank

Nous sommes également à votre disposition par téléphone

Appelez le +33 (01) 75 31 95 90

Formulaire de recherche

[Formation] Data Science avec Python

Vous êtes ici

Prix 2026 :

Durée :

Prochaine(s) session(s)

Présentation

Objectifs

Programme

Introduction

Prise en main de Python

Entrées/sorties en Python

Fonctions

Structures de données

Données tabulaires

Représentations graphiques

Manipulation des DataFrames

Manipulation de séries temporelles

Classification et régression

Étude de cas

Synthèse et conclusion

Points forts

Modalités pédagogiques

Public cible et prérequis

Responsables

Guillaume WISNIEWSKI

Prochaine(s) session(s)

Participant

Participant

Participant