Data analyst cloudera : utiliser hive et impala avec hadoop (certifiant cca data analyst)

Formation

À Paris

Prix sur demande

Appeler le centre

Avez-vous besoin d'un coach de formation?

Il vous aidera à comparer différents cours et à trouver la solution la plus abordable.

Description

  • Typologie

    Formation

  • Lieu

    Paris

  • Durée

    3 Jours

appliquer l’analyse traditionnelle des données et les compétences de « business intelligence » aux Big Data utiliser les outils permettant de manipuler et d'analyser des ensembles complexes de données en utilisant SQL et des langages de script

Les sites et dates disponibles

Lieu

Date de début

Paris ((75) Paris)
Voir plan
20, Rue de l'Arcade, 75008

Date de début

Consulter

À propos de cette formation

analystes de données, business analysts, développeurs et administrateurs

expérience avec SQL et les commandes UNIX ou Linux basiques ; une connaissance préalable de Java et Apache Hadoop n’est pas requise

Questions / Réponses

Ajoutez votre question

Nos conseillers et autres utilisateurs pourront vous répondre

À qui souhaitez-vous addresser votre question?

Saisissez vos coordonnées pour recevoir une réponse

Nous ne publierons que votre nom et votre question

Les Avis

Les matières

  • Analyse de résultats

Le programme

Fondamentaux d’Hadoop

L’intérêt d’Hadoop
Vue globale d’Hadoop
HDFS
MapReduce
L’écosystème Hadoop
Explication de scenarios de laboratoire
Exercices « Hands-On » : ingestion de données avec les outils Hadoop

Introduction à Hive

Qu’est-ce que Hive ?
Schema Hive et stockage de données
Comparer Hive aux bases de données traditionnelles
Hive vs. Pig
Cas d’utilisation de Hive
Interagir avec Hive

Analyse de données relation avec Hive

Bases de données et tableaux Hive
Syntaxe HiveQL basique
Types de données
Assembler des ensembles de données
Fonctions communes de Built-in
Exercice « Hands-On » : « Running Hive Queries on the Shell, Scripts and Hue »

Management de données avec Hive

Formats de données Hive
Créer des bases de données et tableaux de management Hive
« Altering Databases and Tables »
Tableaux auto-managés
Simplifier les requêtes avec Views
Stocker les résultats de requêtes
Contrôler l’accès aux données
Exercice « Hands-On » : management des données avec Hive

Traitement de texte avec Hive

Vue d’ensemble du traitement de texte
Fonctions String importantes
Utiliser des expressions habituelles dans Hive
« Sentiment Analysis » et « N-Grams »
Exercices « Hands-On » (optionnels) : se faire une idée de l’analyse de sentiment

Optimisation d’Hive

Comprendre la performance de requête
Contrôler le plan d’exécution des tâches
Partitionner
« Bucketing »
Indexer les données

Etendre Hive

SerDes
Transformation de données avec des Scripts personnalisés

Informations complémentaires

Formation Data Analyst Cloudera composée de 50% de travaux pratiques et de 50% de théorie Les participants apprendront comment naviguer dans l’écosystème Hadoop au travers d’échanges avec le formateur ainsi qu’en réalisant des exercices pratiques sur les sujets suivants : . Comment les données sont distribuées, stockées et enregistrées dans un cluster Hadoop ? . Comment utiliser Sqoop et Flume pour intégrer les données ? . Comment enregistrer des données distribuées avec Apache Spark ? . Comment modéliser des données structurées en tant que tableau dans Impala et Hive ? . Comment choisir le meilleur format de stockage de données pour différents patterns d’utilisation de données ? . Les meilleures pratiques pour le stockage de données À la suite de cette formation Data Analyst, les stagiaires auront la possibilité de passer l’examen de Certification « CCA Data Analyst » de Cloudera avec le voucher inclus dans le prix de la formation. Cet examen se déroule en dehors du temps de la formation. Ils deviendront alors des Data Analysts certifiés Cloudera dans leur entreprise. Nos formateurs sont sélectionnés et évalués selon nos processus qualité certifiés ISO 9001 et qualifiés OPQF.

Appeler le centre

Avez-vous besoin d'un coach de formation?

Il vous aidera à comparer différents cours et à trouver la solution la plus abordable.

Data analyst cloudera : utiliser hive et impala avec hadoop (certifiant cca data analyst)

Prix sur demande