Data analyst cloudera : utiliser hive et impala avec hadoop (certifiant cca data analyst)
Formation
À Paris
Avez-vous besoin d'un coach de formation?
Il vous aidera à comparer différents cours et à trouver la solution la plus abordable.
Description
-
Typologie
Formation
-
Lieu
Paris
-
Durée
3 Jours
appliquer l’analyse traditionnelle des données et les compétences de « business intelligence » aux Big Data utiliser les outils permettant de manipuler et d'analyser des ensembles complexes de données en utilisant SQL et des langages de script
Les sites et dates disponibles
Lieu
Date de début
Date de début
À propos de cette formation
analystes de données, business analysts, développeurs et administrateurs
expérience avec SQL et les commandes UNIX ou Linux basiques ; une connaissance préalable de Java et Apache Hadoop n’est pas requise
Les Avis
Les matières
- Analyse de résultats
Le programme
Fondamentaux d’Hadoop
L’intérêt d’Hadoop
Vue globale d’Hadoop
HDFS
MapReduce
L’écosystème Hadoop
Explication de scenarios de laboratoire
Exercices « Hands-On » : ingestion de données avec les outils Hadoop
Qu’est-ce que Hive ?
Schema Hive et stockage de données
Comparer Hive aux bases de données traditionnelles
Hive vs. Pig
Cas d’utilisation de Hive
Interagir avec Hive
Bases de données et tableaux Hive
Syntaxe HiveQL basique
Types de données
Assembler des ensembles de données
Fonctions communes de Built-in
Exercice « Hands-On » : « Running Hive Queries on the Shell, Scripts and Hue »
Formats de données Hive
Créer des bases de données et tableaux de management Hive
« Altering Databases and Tables »
Tableaux auto-managés
Simplifier les requêtes avec Views
Stocker les résultats de requêtes
Contrôler l’accès aux données
Exercice « Hands-On » : management des données avec Hive
Vue d’ensemble du traitement de texte
Fonctions String importantes
Utiliser des expressions habituelles dans Hive
« Sentiment Analysis » et « N-Grams »
Exercices « Hands-On » (optionnels) : se faire une idée de l’analyse de sentiment
Comprendre la performance de requête
Contrôler le plan d’exécution des tâches
Partitionner
« Bucketing »
Indexer les données
SerDes
Transformation de données avec des Scripts personnalisés
Informations complémentaires
Avez-vous besoin d'un coach de formation?
Il vous aidera à comparer différents cours et à trouver la solution la plus abordable.
Data analyst cloudera : utiliser hive et impala avec hadoop (certifiant cca data analyst)