Formation Big Data : Développement d'applications et Data Visualisation


  • HADOOP, MAPREDUCE, SPARK, MACHINE LEARNING, R, PYTHON, DATAVIZ
REFERENCE
 
 
ODAB
DUREE
 
 
4 jours
TARIFS
 
 
2390 € HT
Niveau : Débutant
Cours à distance: Possible
OBJECTIFS :
 

Cette formation vous présente les principales technologies concernant le développement d’applications Big Data. Elle forme un ensemble cohérent dans la mesure où, dans un premier temps, elle replace le cadre global du Big Data et se conclut par la visualisation des données que les programmes développés avec les technologies présentées dans cette formation sont capables d’extraire.

Nous n’avons volontairement pas fait le choix d’un langage particulier. En effet, qu’il s’agisse de MapReduce, Spark ou du Machine Learning, la philosophie est précisément d’être indépendant du langage. Cependant, afin d’être concret et de valider le discours théorique, les exemples seront exposés en Java , Python, Scala ou R.

PRÉ-REQUIS :
 

La connaissance d’un langage de programmation est impérative.
Les exemples seront présentés avec les langages suivants : Java, Python, Scala et R.

PUBLIC :
 

Ce cours s'adresse aux développeurs ainsi qu'aux chefs de projets.

PROGRAMME :
 

Comprendre les spécificités du Big Data

Les origines du Big Data
Les données au cœur des enjeux (volume, diversité, IoT, etc.)
Les limites des architectures actuelles et de la BI
Sécurité, éthique, environnement juridique

Les technologies Big Data (Hadoop)

Comprendre Hadoop et ses composants
Le système de fichiers répartis HDFS (Hadopp Filesystem)
Philosophie de MapReduce
L’apport de YARN (Yet Another Resource Negotiator)
Quelles différences entre les distributions (Hortonworks, Cloudera, MapR) pour le développeur ?
Différentes catégories de bases NoSQL (clé/valeur, documents, colonnes, graphes)
Indexer et rechercher des données avec Elasticsearch
Les visualiser à l’aide de KIBANA
Quand utiliser le couplage Elasticsearch, Logstash, Kibana (ELK) ?
Le moteur de recherche SolR
SAS VA et autres solutions mixtes Cloud/On Premice pour explorer vos données
IBM Watson (fédération des informations)
Solution BI Classique
Impacts techniques et financiers des différentes solutions (savoir-faire, coûts, etc.)

Le développement (Mapreduce, Spark)

Philosophie et contraintes du pattern MapReduce (Hadoop)
Concrètement quelles briques logicielles pour le développeur ?
Exemple de pseudo-code pour les opérations map et reduce
Limites de MapReduce et émergence de Spark
Les différentes versions de Spark (Scala, Python et Java)
Des traitements en mémoire et tolérants aux pannes RDD (Resilient Distributed Datasets)
Les modes de travail en cluster de Spark
Exemples :
- Développement d’un wordcount avec MapReduce Spark dans différents langages (Java, Python, Scala, R)
- Calcul d’une jointure sur deux grandes tables

Machine Learning

Qu’est-ce que le Machine Learning ?
Les points de vigilance par rapport au Big Data
Les différents types de machine learning
Les principaux algorithmes
Utiliser SparkML pour faire du Machine Learning de manière distribuée
Créer un système de catégorisation
Comprendre la différence entre Deep Learning et Machine Learning
Réseaux de neurones et Deep Learning
Utiliser le deep learning pour faire de la reconnaissance de caractère avec Tensorflow en Python

La visualisation des données (Dataviz)

Ce que les statistiques ne disent pas
Les objectifs de la visualisation
Quels graphes pour quels usages ?
Représentation de données complexes (encodage visuel, visualisation interactive)
Savoir communiquer sur les analyses de données (Data Storytelling)

Études de cas

Analyse de profils clients avec l’utilisation de Spark (domaine Banque et Assurance)
Classification de conducteur dans une agence de transport
Proposition de produits par rapport à une liste d’achats (Machine Learning)

 

REMARQUES :
 

Il est possible de suivre cette formation Big Data à distance. Vous participez en temps réel à la même session en même temps que les autres participants présents eux en salle de cours. Un kit spécial formation à distance vous sera envoyé avec notamment le matériel (casque micro). Vous n’avez besoin que d’un navigateur et d’une connexion internet pour suivre dans les meilleures conditions ce cours à distance Big Data. Contactez-nous pour plus d’informations sur cette formation en direct de chez vous ou depuis votre bureau.

TRAVAUX PRATIQUES :
 

Des études de cas illustrent cette formation sur les sujets suivants :
- Analyse de profils clients avec l’utilisation de Spark (domaine Banque et Assurance)
- Classification de conducteur dans une agence de transport
- Proposition de produits par rapport à une liste d’achats (Machine Learning).
De nombreux travaux pratiques courts viennent en complément de ceux réalisés sur l’étude de cas.

 

Les avis figurant ci-dessous sont issus des fiches d’évaluation que remplissent les participants à la fin de la formation. Ils sont ensuite publiés automatiquement si les personnes ont explicitement accepté que nous les diffusions. Avis des participants à la formation Big Data : Développement d'applications et Data Visualisation : Note moyenne : 5/5
5/5
Avis certifié A suivi un cours chez PLB
NGUYEN François - PROGILONE

Mon avis sur le contenu du stage :

"Cours qui balaye l'ensemble du BigData avec des exemples concrets et des cas pratiques (présentation et utilisation d'outil concret) "

Mon avis sur le formateur :

"Formateur très compétent, qui a su répondre aux questions. Formateur très pédagogue, qui a également su vulgariser les termes techniques. "

Mon avis sur la salle de formation :

"Etant à l'extérieur, il m'est difficile de juger concrètement les salles. L'accueil par François et Maxime a été super !"

Ce que j'ai le plus apprécié :

"Bonne qualité de son, et dans le cas de soucis technique, Maxime a été très réactif."

Ce que j'ai le moins apprécié :

"Quelques exercices sur papier. Il faudrait prévoir des exercices sur d'autre support tel que des drives par exemple. "

S'INSCRIRE À CETTE
FORMATION BIG DATA DÉVELOPPEMENT
Cliquez sur une date pour vous inscrire
Information pratiques sur
LA FORMATION
Lieu de la formation Paris - LA DEFENSE
Nous contacter 01 43 34 90 94
CETTE FORMATION SUR-MESURE Ce cours est réalisable en intra-entreprise, dans vos locaux ou nos salles de cours CONTACTER NOTRE SERVICE INTRA
D'autres formations
SUR LE MÊME THÈME

3 j

 
Cette formation Concevoir et piloter un projet Big Data vous permet de comprendre le contexte spécifique, le vocabulaire et les enjeux du Big Data afin de bien positionner les fondations...

3 j

 
Cette formation s’adresse aux personnes qui participent à des projets Big Data, Data Mining ou décisionnel et qui souhaitent soit comprendre le vocabulaire des statisticiens,...

2 j

 
Avec le machine learning, même s’il ne s’agit pas d’un domaine d’étude récent, on passe d’une approche « traditionnelle »...

2 j

 
Grâce à l'amélioration des capacités de stockage et de traitement des données, les entreprises peuvent facilement et rapidement compiler et analyser leurs...
Plus de formations sur le même thème

Des questions ?

ON VOUS RAPPELLE

Tampon du Fafiec indiquant que PLB Consultant est partenaire de ses actions collectives

Votre formation Big Data prise en charge à 100% ! *

Depuis Janvier 2017, le Fafiec a sélectionné PLB Consultant pour vous proposer les meilleures formations autour du Big Data.

Sessions inter-entreprise sur  Paris, Lyon et Lille. 

Sessions intra-entreprise sur  toute la France.

*100% des coûts pédagogiques, offre valable dans la limite des fonds mutualisés dédiés aux actions collectives, en application des critères de prise en charge en vigueur (voir conditions détaillées sur le site du FAFIEC)

 

0

Formations
Informatique
et Management
en ligne à ce jour

+ 0

Stagiaires dans nos
salles de cours sur
l'année

0%

De participants
satisfaits ou très
satisfaits de nos
formations

0

Formateurs experts
validés PLB