Savoir utiliser les principaux outils de traitement et d’analyse de données pour Python
Être capable d’extraire des données d’un fichier et les manipuler
Apprendre à mettre en place un modèle d’apprentissage simple
- BDD & Décisionnel
- Décisionnel
Formation Big Data – Python pour l’analyse de données
Objectifs
Prérequis
Maîtrise de la programmation Python
Public
Développeurs en Python
Dernière mise à jour
Bon à savoir
Evaluez votre niveau
Notre formateur
Travaux pratiques
A distance / Classe virtuelle
Un cadre Maîtrisé
Les Modules
de formation
Besoins des data-scientist : calculs, analyse d’images, machine learning, interface avec les bases de données
Apports de python : grande variété d’outils, expertise dans le domaine du calcul scientifique
Tour d’horizon des outils : pandas, agate, bokeh, scikit-learn, pybrain, tensorflow, keras, mxnet, caffe
NumPy : Base du calcul sur des tableaux
SciPy : Scientific Tools for Python, couche scientifique
Manipulation de tableaux, fonctions mathématiques
Représentation graphique avec basemap et matplotlib
Mise en oeuvre de SciPy/NumPy : manipulation d’images, détection de contours
NumPy : Base du calcul sur des tableaux
SciPy : Scientific Tools for Python, couche scientifique
Manipulation de tableaux, fonctions mathématiques
Représentation graphique avec basemap et matplotlib
Mise en oeuvre de SciPy/NumPy : manipulation d’images, détection de contours
Pandas : manipulation de tables de données
Tableaux avec Pandas : indexation, opérations, algèbre relationnelle
Stockage dans des fichiers : CSV, h5py, netCDF
Comparaison et performances Pandas / NumPy
Présentation de TensorFlow, scikit-learn, keras, mxnet, caffe
TensorFlow : principe de fonctionnement, plates-formes supportées, distribution, APIs fournies en standard, modèles d’apprentissage
Projet scikit-learn : classification, régression, validation de modèles prédictifs
Démonstrations avec les modèles fournis par scikit-learn
Positionnement et comparaison avec Keras, mxnet, caffe