Formation Analyse du Big Data en environnement Hadoop


  • LES DISTRIBUTIONS HADOOP DATA ANALYST - ANALYSE DE DONNÉES EN ENVIRONNEMENT HADOOP
REFERENCE
 
 
OABD
DUREE
 
 
3 jours
TARIFS
 
 
1950 € HT
Niveau : Intermédiaire
Cours à distance: Non
OBJECTIFS :
 

Cette formation Big Data Analyse vous apportera les connaissances et compétences nécessaires pour:

  • Comprendre le fonctionnement d'Hadoop Distributed File System (HDFS) et YARN/MapReduce
  • Explorer HDFS
  • Suivre l’exécution d’une application YARN
  • Maitriser le fonctionnnement et l'utilisation des différents outils de manipulation de la donnée :
    • Hue : Utilisation de l’interface unifiée
    • Hive, Pig : Les générateurs de MapReduce
    • Tez : L’optimisation des générateurs de MapReduce
    • Sqoop : Comment importer les données de l’entreprise dans un cluster Hadoop?
    • Oozie : Comment organiser les exécutions des différentes applications ?
PRÉ-REQUIS :
 

Cecours nécessite d'avoir une expérience dans la manipulation de données. Une connaissance préliminaire d’Hadoop n’est pas exigée mais recommandée.

PUBLIC :
 

Cette formation Big Data Analyse de données en environnement Hadoop est destinée aux personnes qui devront manipuler les données dans un cluster Apache Hadoop.

PROGRAMME :
 

Introduction à Hadoop

Présentation générale d’Hadoop
Exemples d’utilisation dans différents secteurs
Historique et chiffres clés : Quand parle-t-on de Big Data ?

L'écosystème d'Hadoop

Le système de fichier HDFS
Le paradigme MapReduce et l’utilisation à travers YARN

Manipulaiton des données dans un cluster Hadoop

Hue : Comment fonctionne cette interface web ?
Hive : Pourquoi Hive n’est pas une base de données ?

Requête sur Hive

Utilisation de HCatalog
Utilisation avancée sur Hive
Utilisation de fonctions utilisateurs
Paramétrage de requête
Pig : Fonctionnement de Pig

Programmation avec Pig Latin

Utilisation du mode Local
Utilisation de fonctions utilisateurs
Tez : Qu’est-ce que Tez ?

Comment et quand l’utiliser ?

Oozie : Fonctionnement de Oozie

Création de Workflows avec Oozie

Manipulation des workflows
Ajout d’éléments d’exploitation dans les workflows
Ajout de conditions d’exécution
Paramétrage des workflows
Sqoop : A quoi sert Sqoop ?

Chargement des données depuis une base de données relationnelle

Chargement des données depuis Hadoop
Utilisation et paramétrage avancée
Les particularités des distributions : Impala, Hawq
Quelles sont les bonnes pratiques d’utilisation des différents outils ?

S'INSCRIRE À CETTE
FORMATION ANALYSE DES DONNÉES AVEC HADOOP
Cliquez sur une date pour vous inscrire
Information pratiques sur
LA FORMATION
Lieu de la formation Paris - LA DEFENSE
Nous contacter 01 43 34 90 94
CETTE FORMATION SUR-MESURE Ce cours est réalisable en intra-entreprise, dans vos locaux ou nos salles de cours CONTACTER NOTRE SERVICE INTRA
D'autres formations
SUR LE MÊME THÈME

1 j

 
Cette formation Hadoop vous invite à faire le point sur les différents éléments de l'écosystème Hadoop et leurs rôles respectifs.Egalement, elle...

3 j

 
Cette formation Hadoop Hortonworks vous apportera les compétences et connaissances pour maitriser l'administration d'Hadoop sur une distribution Hortonworks. Tous les aspects...

4 j

 
Ce cours enseigne aux Administrateurs systèmes les méthodes et les outils pour leur permettre de gérer et de maintenir des clusters Hadoop en production. A l'issue de...

3 j

 
Cette formation Hadoop Cloudera vous apportera les compétences et connaissances pour maitriser les principes du framework Hadoop Cloudera, savoir l'installer et le configurer.
Plus de formations sur le même thème

Des questions ?

ON VOUS RAPPELLE

 

0

Formations
Informatique
et Management
en ligne à ce jour

+ 0

Stagiaires dans nos
salles de cours sur
l'année

0%

De participants
satisfaits ou très
satisfaits de nos
formations

0

Formateurs experts
validés PLB