picto Management des SI

Formation Big Data L'essentiel

Les bases en 2 jours sur les architectures et technologies

Référence

OBIG

Durée

2 JOURS

Tarif

1390 € HT

NIVEAU

débutant

Cours à distance

Partiellement

Objectifs de la formation Big Data L'essentiel

Cette formation Big Data vous permettra de bien comprendre les concepts du Big Data et savoir quelles sont les technologies implémentées.

Pré-Requis

Cette formation Big Data vous permettra de bien comprendre les concepts du Big Data et savoir quelles sont les technologies implémentées.

Public

Cette formation Big Data s'adresse aux chefs de projets, architectes, et à toute personne souhaitant connaître les outils et solutions disponibles pour mettre en place une architecture Big Data.

Contenu du cours Big Data L'essentiel

Introduction au Big Data

Le besoin : volumes importants de données, traitements optimisés de flux de données au fil de l'eau, liés aux nouvelles technologies et aux nouveaux usagesDomaines concernés : recherche scientifique, médical, e-commerce, sécurité...Développement des techniques sur différents aspects : stockage, indexation/recherche, calculDéfinition ETL : Extract Transform LoadLes acteurs

Stockage (Big Data)

Caractéristiques NoSQL :- structure de données proches des utilisateurs, développeurs- données structurées et non structurées, documents, images, fichiers XML, JSON, CSV...Les différents modes et formats de stockageStockage réparti : réplication, sharping, gossip protocol, hachageSystèmes de fichiers distribués : GFS, HDFS, BigTableLes bases de donnéesQuelques exemples de produits et leurs caractéritiques : Cassandra, Mongo DB, Dynamo DB

Indexation et recherche

Moteurs de recherchePrincipe de fonctionnementMéthodes d'indexationExemple de Lucene et mise en oeuvre avec solrRecherche dans les bases de volumes importantsExemples de produits et comparaison : Dremel, Drill, ElasticSearch, MapReduce

Calcul et restitution, intégration

Différentes solutions : calculs en mode batch, ou en temps réel, sur des flux de données ou des données statiquesLes produits : langage de calculs statistiques, R Statistics Language, SAS, RStudioOutils de calcul sur des volumes importants : storm en temps réel, Hadoop en mode batchZoom sur Hadoop : complémentarité de HDMS et MapReduce

Evolutions

Les offres Saas Big Data comme Google BigQuery.Les limites, les nouveautés annoncées.