Formation Data Scientist: niveau avancé


REFERENCE
 
 
MDSA
DUREE
 
 
3 jours
TARIFS
 
 
2350 € HT
Niveau : Expert
Cours à distance: Non
OBJECTIFS :
 

Dans l'univers du Big Data, le rôle du data scientist joue est primordial pour valoriser les données. Cette formation Data Scientist de niveau avancé vous apprend les modèles statistiques et les techniques d'analyse des données qui vous aideront à exploiter vos données.

Durant cette formation Data Science vous apprendrez à :

  • Découvrir et utiliser la puissance prédictive des modèles ensemblistes
  • Savoir effectuer un "feature engineering" performant
  • Appréhender les techniques de text-mining et de deep-learning à travers d'exemples concrets
  • Enrichir ses outils de data scientist

Ce cours est animé par des data scientists en activité. Ils vous font bénéficier de leur retour d'expérience de modèles réels mis en place chez leurs clients et de leur expérience des compétitions de Data Science.

PRÉ-REQUIS :
 

Pour suivre cette formation, il est recommandé d'avoir des connaissances de base en programmation ou en scripting. Il faut également avoir suivi la Formation "Fondamentaux de la Data Science" (OFDS) ou avoir les connaissances équivalentes.

PUBLIC :
 

le cours s'adresse aux data scientists, analystes, statisticiens, architectes et développeurs souhaitant approfondir leurs connaissances sur la Data Science.

PROGRAMME :
 

Rappel des fondamentaux Data Scientist

Ecosystème du Big Data et Data Scientist
Comment modéliser un problème de data science ?
Les différentes familles d’algorithmes (supervisé : classification/régression, non supervisé)
Les algorithmes classiques
Comment évaluer la performance ?
Sur apprentissage et compromis biais/variance

Modèles ensemblistes

Rappels
Pourquoi ça fonctionne ? Raisons théoriques
Introduction au stacking
Architecture et promesses du stacking
Feature weighted stacking

Mise en application

Introduction au text mining

Un modèle de représentation : le bag of words
Normalisations usuelles
Stemming, lemmatization
Distances (Levenshtein, Hamming, Jaro-Winkler)
Word2Vec

Feature engineering avancé

Normalisation
Qu’est ce que la normalisation ?
Quand l’utiliser ?
Réduction de dimension (ACP, TSNE, LSA, etc.)
Transformation et interactions entre variables
Traitement des variables catégorielles à haute dimensionnalité
Création de variables extraites d’arbres (Facebook Trick)

Réseaux de neurones et deep learning

L’origine : le perceptron
Les réseaux de neurones
Deep learning
Objectif : s’affranchir du feature engineering manuel
Convolution
Réseaux récurrent

Cas concret

Reconnaissance de chiffres

Apprentissage semi-supervisé

Rappels et révisions

Synthèse des points abordés les deux premiers jours
Approfondissement des sujets sélectionnés avec l’intervenant

Mise en pratique

Le dernier jour de ce stage est entièrement consacré à des mises en pratique

Sélection et participation à une compétition

Le formateur sélectionnera une compétition en cours sur Kaggle qui sera démarrée en jour 3 par l’ensemble des participants

TRAVAUX PRATIQUES :
 

Des travaux pratiques ainsi que des mises en situations concrètes viennent ponctuer cette formation afin de lier théorie à la pratique pour être autonome à l'issue du cours.

S'INSCRIRE À CETTE
FORMATION DATA SCIENTIST
Cliquez sur une date pour vous inscrire
Information pratiques sur
LA FORMATION
Lieu de la formation Paris - LA DEFENSE
Nous contacter 01 43 34 90 94
CETTE FORMATION SUR-MESURE Ce cours est réalisable en intra-entreprise, dans vos locaux ou nos salles de cours CONTACTER NOTRE SERVICE INTRA
D'autres formations
SUR LE MÊME THÈME

3 j

 
Le métier de Data Scientist est apparu ces dernières années pour faire face à la multiplication des données, à la diversité de leurs formes et de...

3 j

 
Le Big Data est un phénomène aux multiples facettes et il ne se résume pas à une technologie. La première question à laquelle répond ce...

2 j

 
Cette formation certifiante Big Data Foundation du CCC (Cloud Credential Council) vous permet de comprendre le Big Data, ses règles de gouvernance, ce que permettent les technologies Hadoop...

4 j

 
Cette formation vous présente l’architecture et l’infrastructure sous-jacente d’un projet Big Data. Elle commence par définir le cadre des projets Big Data puis...
Plus de formations sur le même thème

Des questions ?

ON VOUS RAPPELLE

 

0

Formations
Informatique
et Management
en ligne à ce jour

+ 0

Stagiaires dans nos
salles de cours sur
l'année

0%

De participants
satisfaits ou très
satisfaits de nos
formations

0

Formateurs experts
validés PLB