Les Big Data ou mégadonnées désignent l'ensemble des données numériques produites par l'utilisation des nouvelles technologies à des fins personnelles ou professionnelles.

 

OBJECTIFS PEDAGOGIQUES

  • Comprendre les concepts et les enjeux du Big Data Identifier les technologies et solutions pour réaliser un projet Big Data Apprendre à gérer des flux de données complexes, non structurés et massifs Implémenter des modèles d'analyses statistiques pour répondre aux besoins métiers Appréhender un outil de data visualisation pour restituer des analyses dynamiques

PROGRAMME

LES CONCEPTS ET ENJEUX DU BIG DATA

  • Origines et présentation du Big Data
  • Tour d'horizon des chiffres clés du marché dans le monde et en France
  • Les enjeux du Big Data : ROI, organisation, confidentialité des données
  • Présentation d'un cas pratique d'une architecture Big Data

LES TECHNOLOGIES DU BIG DATA

  • L'écosystème de la plateforme Hadoop et son origine
  • Les modes de stockage (NoSQL, HDFS) / principes de fonctionnement de MapReduce
  • Présentation des distributions principales du marché et des outils complémentaires
  • Installer une plateforme Hadoop
  • Présentation des technologies spécifiques pour le Big Data

GESTION DES DONNÉES STRUCTURÉES ET NON STRUCTURÉES

  • Gestion des données structurées et non structurées
  • Les fonctionnalités de Hadoop Distributed File System (HDFS)
  • Réalisation de requêtes SQL avec HIVE et utilisation de PIG pour traiter la donnée
  • Utilisation d'un ETL pour industrialiser la création de flux de données massives
  • Démonstration de Talend For Big Data

LES MÉTHODES DE DATAMINING DU BIG DATA

  • Les méthodes d'exploration et de description
  • Les méthodes de classification
  • Les méthodes d’estimation et de prévision
  • La méthode de régression linéaire
  • L'implémentation des modèles

DATA VISUALISATION ET CAS D'USAGE CONCRETS

  • Les outils de restitution du marché
  • Méthodologie de mise en forme des rapports
  • Apport du Big Data pour le "Social Business"
  • Mesurer l'e-réputation et la notoriété d'une marque
  • Mesurer l'expérience et la satisfaction clients, optimiser le parcours client

PUBLIC

Développeurs, chefs de projet, Data Miners, chargés d'études statistiques, consultants en informatique décisionnelle

PRÉREQUIS

  • Connaissances de base des modèles relationnels, des statistiques et des langages de programmation Connaissances de base des concepts de la Business Intelligence
  • INFORMATIONS PRATIQUES

    HORAIRES DE LA FORMATION
    de 9 h 00 à 12 h 30 et de 13 h 30 à 17 h 00

    MÉTHODOLOGIE PÉDAGOGIQUE
    Théorie | Cas pratiques | Synthèse

    MODALITÉS D'ÉVALUATION
    Évaluation qualitative des acquis tout au long de la formation et appréciation des résultats