Description

Typologie

Formation

La formation professionnelle est un facteur clé du succès de l’entreprise mais aussi des individus. Elle participe au développement des compétences, à l'employabilité et accompagne ainsi les changements structurels et organisationnels nécessaires pour relever les défis individuels et collectifs. appliquer l’analyse traditionnelle des données et les compétences de « business intelligence » aux Big Data manipuler et analyser des ensembles complexes de données en utilisant SQL et des langages de script familiers

À propos de cette formation

Prérequis

avoir de l’expérience avec SQL et les commandes UNIX ou Linux basiques, une connaissance préalable de Java et Apache Hadoop n’est pas requise

Questions / Réponses

Ajoutez votre question

Nos conseillers et autres utilisateurs pourront vous répondre

Saisissez vos coordonnées pour recevoir une réponse

J'accepte la Politique de confidentialité et les Conditions.

Nous ne publierons que votre nom et votre question

Emagister S.L. (responsable du traitement) traitera vos données pour mener des actions promotionnelles (par e-mail et/ou téléphone), publier des avis ou gérer des incidents. Vous pouvez consulter vos droits et gérer votre désinscription dans la politique de confidentialité.

Les Avis

Les matières

Analyse de résultats
Requêtes

Le programme

Fondamentaux d’Hadoop

L’intérêt d’Hadoop
Vue globale d’Hadoop
HDFS
MapReduce
L’écosystème Hadoop
Explication de scenarios de laboratoire
Exercices hands-On : ingestion de données avec les outils Hadoop

Introduction à Pig

Qu’est-ce que Pig ?
Les caractéristiques de Pig
Cas d’utilisation de Pig
Interagir avec Pig

Analyse de données basiques avec Pig

Syntaxe latine de Pig
Charger des données
Types de données simples
Définitions des champs
Data Output
Voir le Schema
Filtrer et trier les données
Les fonctions utilisées communément
Exercices Hands-On : utiliser Pig pour des process ETL

Traiter des données complexes avec Pig

Formats de stockage
Types de données complexes/emboités
Grouper
Fonctions built-in pour des données complexes
Itérer des données groupées
Exercices Hands-On : analyser des données de campagnes publicitaires avec Pig

Opérations « multi-dataset » avec Pig

Techniques pour combiner des ensembles de données
Assembler des ensembles de données avec Pig
Opérations de groupe
Séparer des ensembles de données
Exercise « Hans-On » : analyser des ensembles de données disparates avec Pig

Etendre Pig

Ajouter de la flexibilité avec les paramètres
Macros et imports
UDFs
Contributed functions
Utiliser d’autres langages pour traiter des données avec Pig
Exercice « Hans-On » : étendre Pig avec Streaming et UDFs

Troubleshooting et optimisation avec Pig

Résolution des problèmes avec Pig
Logging
Utiliser l’UI Web d’Hadoop
Demo optionnelle : résolution d’un "Failed Job" avec l’UI Web
Echantillonnage de données et débugage
Vue d’ensemble des performances
Comprendre le plan d’exécution
Astuces pour améliorer la performance de votre "Pig Jobs"

Introduction à Hive

Qu’est-ce qu’Hive ?
Schema Hive et stockage de données
Comparer Hive aux bases de données traditionnelles
Hive vs. Pig
Cas d’utilisation d’Hive
Interagir avec Hive

Analyse de données relation avec Hive

Bases de données et tableaux Hive
Syntaxe HiveQL basique
Types de données,
Assembler des ensembles de données
Fonctions communes de Built-in
Exercice "hands-on" : "Running Hive Queries on the Shell, Scripts and Hue"

Management de données Hive

Formats de données Hive
Créer des bases de données et tableaux de management Hive
"Altering Databases and Tables"
Tableaux auto-managés
Simplifier les requêtes avec Views
Stocker les résultats de requêtes
Contrôler l’accès aux données
Exercice "Hands-On" : management des données avec Hive

Traitement de texte avec Hive

Vue d’ensemble du traitement de texte
Fonctions String importantes
Utiliser des expressions habituelles dans Hive
« Sentiment Analysis » et « N-Grams »
Exercices « Hands-On » (optionnels) : se faire une idée de l’analyse de sentiment

Optimisation d’Hive

Comprendre la performance de requête
Contrôler le plan d’exécution des tâches
Partitionner
« Bucketing »
Indexer les données

Etendre Hive

SerDes
Transformation de données avec des Scripts personnalisés
Fonctions définies par l’utilisateur
Paramétrer les requêtes
Exercices « Hands-On » : transformation de données avec Hive

Introduction à Impala

Qu’est-ce qu’Impala ?
En quoi Impala diffère d’Hive et de Pig
Comment Impala diffère des bases de données relationnelles
Limitations et directions futures
Utiliser le Shell Impala

Analyser les données avec Impala

Syntaxe basique
Types de données
Filtrer, trier et restreindre les résultats
Assembler et grouper les données
Augmenter les performances d’Impala
Exercices « Hands-On » : analyse interactive avec Impala

Choisir le meilleur outil pour la tâche

Comparer MapReduce, Pig, Hive, Impala et les bases de données relationnelles
Lequel choisir ?

Catégories liées

Data Analyst Cloudera : Implémenter Pig, Hive, Impala avec Hadoop

Questions / Réponses

Les Avis

Les matières

Le programme

Ajoutez des cours similaires
et comparez-les pour mieux choisir.

Data Analyst Cloudera : Implémenter Pig, Hive, Impala avec Hadoop

Questions / Réponses

Les Avis

Les matières

Le programme

Ajoutez des cours similaireset comparez-les pour mieux choisir.

Ajoutez des cours similaires
et comparez-les pour mieux choisir.