03 20 61 95 00

Formation IBM BigInsights Les fondamentaux


  • DW613G
  • Durée : 3 jours
  • Tarif : 2380 € HT

Objectifs

Comprendre le but du Big Data et comprendre pourquoi c’est important
Pouvoir énumérer les sources de données (données au repos ou données en mouvement)
Décrire l’offre IBM BigInsights
Apprendre à utiliser les divers outils IBM BigInsights, notamment Big SQL, BigSheets, Big R, Jaql et AQL pour vos besoins de données volumineuses
Être capable d’énumérer et de décrire les principaux composants de la pile Apache Hadoop Open Source et l’approche adoptée par Open Data Foundation
Savoir gérer et surveiller les clusters Hadoop avec Apache Ambari et les composants associés
Pouvoir explorer le système de fichiers distribués Hadoop (HDFS) en exécutant les commandes Hadoop
Être en mesure de comprendre les différences entre Hadoop 1 (avec MapReduce 1) et Hadoop 2 (avec YARN et MapReduce 2)
Comprendre comment créer et exécuter des travaux MapReduce de base à l’aide de la ligne de commande
Pouvoir expliquer comment Spark s’intègre dans l’écosystème Hadoop
Apprendre à exécuter des algorithmes itératifs en utilisant le RDD de Spark
Connaître les méthodes courantes pour effectuer le transfert de données
Savoir déplacer des données dans le système HDFS à partir de bases de données relationnelles à l’aide de Sqoop
Comprendre quand utiliser différents formats de stockage de données (fichiers à plat, fichiers CSV / délimités, fichiers Avro / Sequence, Parquet, etc.)
Passer en revue les différences entre les langages de programmation Open Source disponibles généralement utilisés avec Hadoop (Pig, Hive) et pour Data Science (Python, R)

Prérequis

une connaissance de Linux est un plus

Public

Ingénieurs Big Data
Data Scientist
Développeurs ou programmeurs
Administrateurs qui souhaitent en savoir plus sur la plate-forme Open IBM avec Apache Hadoop
enveloppe Cette formation vous intéresse ? Contactez-nous

A distance / Classe virtuelle

En classe virtuelle, vous êtes en totale immersion avec le groupe et participez à la formation dans les mêmes conditions que le présentiel : cours théorique, travaux pratiques, échanges en temps réel avec le formateur et les autres stagiaires…

Notre formateur

La formation est animée par un professionnel de l’informatique et de la pédagogie, dont les compétences techniques, professionnelles et pédagogiques ont été validées par des certifications et/ou testées et approuvées par les éditeurs et/ou notre équipe pédagogique. Il est en veille technologique permanente et possède plusieurs années d’expérience sur les produits, technologies et méthodes enseignés. Il est présent auprès des stagiaires pendant toute la durée de la formation.
illustration-formation
Les + d'une formation Access it
Des formations d'excellence, éligibles CPF, disponibles en distanciel, et animées par des consultants experts passionnés par leur métier.
En savoir plus
modules

Les Modules
de formation

Module 1
PRÉSENTATION D'IBM BIGINSIGHTS
INTRODUCTION AU BIG DATA
INTRODUCTION À IBM BIGINSIGHTS
IBM BIGINSIGHTS POUR ANALYSTES
IBM BIGINSIGHTS POUR DATA SCIENTIST
IBM BIGINSIGHTS POUR ENTERPRISE MANAGEMENT
Module 2
IBM OPEN PLATFORM (IOP) AVEC APACHE HADOOP
IBM OPEN PLATFORM AVEC APACHE HADOOP

APACHE AMBARI

SYSTÈME DE FICHIERS DISTRIBUÉ HADOOP

MAPREDUCE ET YARN
Introduction à MapReduce basé sur MR1
Limites de MR1
YARN et MR2

APACHE SPARK

COORDINATION, GESTION ET GOUVERNANCE

MOUVEMENT DE DONNÉES

STOCKAGE ET ACCÈS AUX DONNÉES
Représentation des données : CSV, XML, JSON et YAML
Langages de programmation Open Source: Pig, Hive et autres [R, Python, etc.]
Concepts NoSQL
Accéder aux données Hadoop à l’aide de Hive
Interrogation des données Hadoop à l’aide de Hive

SUJETS AVANCÉS
Contrôle des flux de travaux avec Oozie
Recherche avec Apache Solr

Cette formation vous intéresse ? Contactez-nous !

Les données personnelles collectées sont destinées à Access IT Company et utilisées pour traiter votre demande et, lorsque vous ne vous y êtes pas opposé, vous communiquer nos offres commerciales. Les données obligatoires vous sont signalées sur le formulaire par un astérisque. L’accès aux données est strictement limité par Access IT Company aux collaborateurs en charge du traitement de votre demande. Conformément au Règlement européen n°2016/679/UE du 27 avril 2016 sur la protection des données personnelles et à la loi « informatique et libertés » du 6 janvier 1978 modifiée, vous bénéficiez d’un droit d’accès, de rectification, d’effacement, de portabilité et de limitation du traitement des donnés vous concernant ainsi que du droit de communiquer des directives sur le sort de vos données après votre mort. Vous avez également la possibilité de vous opposer au traitement des données vous concernant. Vous pouvez exercer vos droits en contactant le DPO à l’adresse suivante : dpo@access-it.fr ou à l’adresse postale suivante 2, Allée Lavoisier, 59650 Villeneuve d’Acscq. Pour plus d’informations sur le traitement de vos données personnelles par Access IT Company, veuillez consulter notre politique de confidentialité disponible sur notre site internet à l’adresse suivante : https://www.access-it.fr/politique-de-confidentialite/