Formation Elasticsearch : Configuration et mise en place du moteur de recherche de 2è génération


REFERENCE
 
 
ELSE
DUREE
 
 
3 jours
TARIFS
 
 
1690 € HT
Niveau : Débutant
Cours à distance: Possible
OBJECTIFS :
 

ElasticSearch est le moteur de recherche que les entreprises attendaient. D'une simplicité de mise en place époustouflante, il permet d'indexer du contenu issu de sources hétérogènes et d'offrir  des fonctionnalités de recherche puissantes et scalables. Basé sur la librairie Apache Lucene, ElasticSearch offre, via une API Rest JSON extrêmement claire, des fonctionnalités de recherche très avancées telles que le clustering, l'indexation temps-réel, la recherche à facettes, la recherche par coordonnées géographiques.
L'architecture cœur d'Elastic Search basée sur le clustering lui permet de supporter de très gros volumes de données dispersées dans différents type de supports (site web, base de données, base documentaire, fichier journaux, etc..). Cette architecture lui permet également d'offrir des services à haute disponibilité pouvant s'adapter à la charge utilisateur.

Ce cours vous présente les concepts clés du moteur de recherche ElasticSearch deuxième génération et propose de nombreux ateliers pratiques permettant d'apprendre à utiliser et administrer un cluster ElasticSearch.

PRÉ-REQUIS :
 

Aucun

PUBLIC :
 

Cette formation s'adresse à toute personne souhaitant mettre en place une solution d'entreprise pour l'indexation et la recherche de contenu.

PROGRAMME :
 

Comprendre ElasticSearch

L'offre d'ElasticSearch et cas d'usage dans les entreprises
Panorama technique, architecture, technologies utilisées
Le moteur de recherche Lucene, historique et fonctionnalités
Rappel sur le format JSON et l'API Rest
Concepts de base : Index, Document, Cluster, Noeud, Réplique
Pré-requis à l'installation

Atelier

Installation, Exploration du cluster, API d'indexation et de recherche

Configuration d'ElasticSearch

Installation d'Elastic Search comme service Linux ou Windows
Parcours des répertoires de la distribution
Les variables d'environnement, dimensionnement mémoire
La configuration des traces
Dépôt de package et politique de mise à jour

Atelier

Mise en service d'ElasticSearch, Configuration du cluster et dimensionnement

ElasticSearch et l'indexation

Principe du stockage distribué de documents, création, indexation, mise à jour et suppression de documents
Principes de l'API Rest, l'API d'indexation
Création, suppression d'index
Configuration d'index
Types de documents, le rôle du mapping, valeur exacte ou fulltext, index inversé
Les différents types de champs, les champs prédéfinis
Méta-données d'un index

Atelier

Création d'index, Définitions de différents types de documents

Analyse et extraction de texte

Problématiques des analyseurs, les Tonkenizers, adaptation à la langue, cas de contenu multi-lingue
Identification de mot, normalisation, réduire les mots à leur racine, les différents algorithmes de stemmer
Stop words, synonymes, typos et fautes d'orthographe, approximations
Configuration des analyseurs, mesure de la pertinence
Intégration de contenu balisé (HTML, XML)
Intégration avec du contenu binaire (Ex. Document Office)
Intégration avec contenu stocké en base de données

Atelier

Configuration d'analyseurs, Intégration différents types de contenus, Utilisation Apache Tika, Intégration Hibernate

La recherche avec ElasticSearch

L'API Rest de recherche  
Types de recherche et cas d'usage
Recherche structurée
Recherche full-texte, recherche de terme ou de phrase
Recherche sur champs multiples
Recherche de proximité
Maîtriser les scores de pertinence
Utilisation des filtres

Atelier

Tests des différents types de recherches, Mise en place de filtres

Fonctionnalités de recherche avancée d'ElasticSearch

Concepts de l’agrégation, notion de bucket, de mesures   
Utilisation des agrégations, les différents types d'agrégations
Problématique technique de l'agrégation, agrégation approximative, Maîtriser la consommation mémoire et le temps de réponse
Recherche géolocalisée, points, précision, formes, agrégation géographique
Modélisation de données, gestion des relations entre documents
Impact de la modélisation de données sur la scalabilité

Atelier

Agrégations, Recherche géographique, Modélisation de relation

Architecture en Cluster

Principe de fonctionnement d'un cluster Elasticsearch
Configurer un cluster Elasticsearch
Partitionnement, scalabilité et volumétrie de données
Configuration dynamique et rééquilibrage du cluster

Atelier

Tests des différents types de recherches, Mise en place de filtres

Administration, Surveillance et Déploiement

Déploiement en production, recommandations matérielles, JVM, Mémoire, Communications réseau,
L'outil de monitoring Marvel, les métriques récoltés, file d'attente des tâches
Mesure de performance de l'indexation
Changements dynamiques de configuration
Politique de sauvegarde et restauration

Atelier

Installation Marvel, tests de charge avec JMeter

TRAVAUX PRATIQUES :
 

De nombreux travaux pratiques (plus de 50%)  sous Windows ou Linux sont proposés aux participants tout au long de la formation.

S'INSCRIRE À CETTE
FORMATION ELASTICSEARCH
Cliquez sur une date pour vous inscrire
Information pratiques sur
LA FORMATION
Lieu de la formation Paris - LA DEFENSE
Nous contacter 01 43 34 90 94
CETTE FORMATION SUR-MESURE Ce cours est réalisable en intra-entreprise, dans vos locaux ou nos salles de cours CONTACTER NOTRE SERVICE INTRA
D'autres formations
SUR LE MÊME THÈME

3 j

 
La recherche d’information dans les logs a toujours été chronophage tant au niveau humain que du traitement informatique : Connexion au serveur, localisation du fichier, choix...

2 j

 
Que recouvrent les notions de web de données, de web sémantique ? Quelles technologies apportent ce courant ? RDF, SPARQL, les données liées et ouvertes (Linked Open...

2 j

 
Cette formation Web Sémantique développement fait suite à la formation "Web sémantique, web de données : introduction et mise en oeuvre". Là...

4 j

 
Cette formation combine les programmes des formations d'Introduction au web de données d'une part et de Mise en oeuvre des outils d'autre part. Elle permet d'introduire les...
Plus de formations sur le même thème

Des questions ?

ON VOUS RAPPELLE

 

0

Formations
Informatique
et Management
en ligne à ce jour

+ 0

Stagiaires dans nos
salles de cours sur
l'année

0%

De participants
satisfaits ou très
satisfaits de nos
formations

0

Formateurs experts
validés PLB