A l’issue de la formation, l’apprenant sera capable de :
Être capable de mettre en oeuvre SciKit-learn pour de l’apprentissage machine et l’analyse de données
Comprendre comment collecter les données et les préparer pour un traitement efficient
Savoir modéliser les données et optimiser les modèles
Être en mesure d’industrialiser et de déployer une application de prédiction
- BDD & Décisionnel
- Décisionnel
Formation L’apprentissage Machine en Python (SciKit-Learn)
Objectifs
Prérequis
Connaissance de Python et d’une bibliothèque de calcul telle que Numpy ou Pandas
Public
Chefs de projet et data-scientists souhaitant comprendre le fonctionnement de SciKit-learn
Dernière mise à jour
Programme mis à jour le 07 avril 2022
Bon à savoir
Evaluez votre niveau
Pour vous aider à bien choisir votre formation, nous vous proposons soit un entretien avec le formateur soit un test d’évaluation via notre centre d’examen. Cela vous assurera que vous disposez des connaissances nécessaires pour suivre la formation dans des conditions optimales.
Notre formateur
La formation est animée par un professionnel de l’informatique et de la pédagogie. Il est en veille technologique permanente et possède plusieurs années d’expérience sur les produits, technologies et méthodes enseignés.
Travaux pratiques
Nos formations comprennent de nombreux travaux pratiques pour un meilleur apprentissage (60 % de pratique). Elles peuvent être personnalisées pour répondre à vos besoins (contenu, dates, rythme...).
A distance / Classe virtuelle
En classe virtuelle, vous êtes en totale immersion avec le groupe et participez à la formation dans les mêmes conditions que le présentiel : cours théorique, travaux pratiques, échanges en temps réel avec le formateur et les autres stagiaires…
Un cadre Maîtrisé
3 à 6 participants maximum par session pour respecter les objectifs et résultats attendus et pour permettre la réalisation de tous les ateliers pratiques dans de bonnes conditions.
Les + d'une formation Access it
Des formations d'excellence, éligibles CPF, disponibles en distanciel, et animées par des consultants experts passionnés par leur métier.
Les Modules
de formation
Module 1
L’ÉCOSYSTÈME SCIKIT LEARN
Origine
Missions et évolutions
Architecture
Modules
Atelier pratique : Installation de l’écosystème (PC, MAC, LINUX)
Module 2
BONNES PRATIQUES SCIKIT LEARN : LA RÉCUPÉRATION DE DONNÉES
L’API dédiée aux jeux de données
Problématique des grands jeux de données
Les jeux de données internes au framework
La génération de données artificielles
L’accès aux données ouvertes
Méthodologies de chargement de données externes
Atelier pratique : Collecte de données sur un cas concret
Module 3
BONNES PRATIQUES SCIKIT LEARN : LE PRÉTRAITEMENT
Cadre et rôle du prétraitement
Méthodes de mise à l’échelle des données
Normalisation des données
Traitement des données catégorielles
Traitement des données manquantes
Atelier pratique : Prétraitement des données dans un cas concret
Module 4
BONNES PRATIQUES SCIKIT LEARN : L'INGÉNIERIE DES VARIABLES PRÉDICTIVES
Cadre et rôle de l’ingénierie des variables prédictives
Transformations non linéaires
Algorithmes de réduction dimensionnelle de données
L’extraction automatique de traits (textes, images)
Combinaison et transformations ad-hoc des données
Atelier pratique : Ingénierie des variables prédictives sur un cas concret
Module 5
BONNES PRATIQUES SCIKIT LEARN : LA MODÉLISATION
Cartographie des algorithmes de l’écosystème
Tour de l’apprentissage supervisé avec SciKit Learn
Tour de l’apprentissage non supervisé avec SciKit Learn
En pratique, mode de sélection d’algorithmes pertinents
Atelier pratique : L’apprentissage supervisé et non supervisé sur cas concrets
Module 6
BONNES PRATIQUES SCIKIT LEARN : SÉLECTION ET OPTIMISATION DES MODÈLES
Présentation et usage des outils de combinaison et de chaînage de processus
L’évaluation de performance par validation-croisée
Le réglage des hyper-paramètres d’un modèle
Les APIs d’évaluation des modèles de prédiction
Les différentes courbes d’évaluations de modèles de prédictions
Atelier pratique : Sélection de modèle, et optimisation des réglages
Module 7
BONNES PRATIQUES SCIKIT LEARN : INDUSTRIALISATION ET DÉPLOIEMENT
Persistance des modèles
Scaling des applications de prédictions avec SciKit Learn
Problématiques de latence et de débit à l’exécution
La parallélisation
La gestion de l’environnement Python associé
Atelier pratique : Industrialisation d’une application de prédiction
Les prochaines
sessions de formation
Sur demande
Vous souhaitez organiser cette formation à une date spécifique ?
Contactez-nous en remplissant le formulaire ci-dessous
27 février 2023
24 avril 2023
19 juin 2023
14 août 2023