Formation Les bases d'IBM Infosphere Big Insights

Formation

À Paris

Prix sur demande

Appeler le centre

Avez-vous besoin d'un coach de formation?

Il vous aidera à comparer différents cours et à trouver la solution la plus abordable.

Description

  • Typologie

    Formation

  • Lieu

    Paris

  • Dates de début

    Dates au choix

CETTE FORMATION LES BASES D'IBM INFOSPHERE BIG INSIGHTS VOUS PERMETTRA DE :
Vue d'ensemble de IBM BigInsights
Comprendre les objectifs des big data et savoir en quoi c'est important
Lister les sources de données
Décrire la solution IBM BigInsights
Utiliser les nombreux outils IBM BigInsights incluant Big SQL, BigSheets, Big R, Jaql et AQL
IBM Open Platform (IOP) avec Apache Hadoop
Lister et décrire les composants majeurs d'une pile open-source Apache Hadoop et des approches de l'Open Data Foundation.
Gérer et contrôler les clusters Hadoop avec Apache Ambari et les composants associés
Explorer Hadoop Distributed File System (HDFS) en lançant les commandes Hadoop
Comprendre les differences entre Hadoop 1 (avec MapReduce 1) et Hadoop 2 (avec YARN et MapReduce 2)
Créer et exécuter des tâches basiques MapReduce en ligne de commande
Expliquer comment Spark s'intègre dans l'écosystème Hadoop
Exécuter des algorythmes itératifs avec Spark RDD.
Expliquer le rôle de coordination, de gestion, et de gouvernance dans l'écosystème Hadoop en utilisant Apache Zookeeper, Apache Slider, et Apache Knox.
Explorer les méthodes communes pour assurer le mouvement des données
Configurer Flume pour le chargement de données et de fichiers logs
Déplacer les données dans HDFS depuis des bases relationnelles avec Sqoop
Comprendre quels formats de stockage de données utiliser (flat files, CSV/delimited, Avro/Sequence files, Parquet, etc.)
Etudier les différences entre les langages de programmation open-source généralement utilisés avec Hadoop (Pig, Hive) et pour la Data Science (Python, R)
Requêter des données depuis Hive
Assurer un accès aléatoire sur des données stockées dans HBase
Explorer les concepts avancés, incluant Oozie et Solr

Les sites et dates disponibles

Lieu

Date de début

Paris ((75) Paris)
Voir plan
37 Rue des Mathurins, 75008

Date de début

Dates au choixInscriptions ouvertes

À propos de cette formation

Il est conseillé d'avoir des connaissances sur Linux

Questions / Réponses

Ajoutez votre question

Nos conseillers et autres utilisateurs pourront vous répondre

À qui souhaitez-vous addresser votre question?

Saisissez vos coordonnées pour recevoir une réponse

Nous ne publierons que votre nom et votre question

Les Avis

Les exploits du centre

2017

Toutes les formations sont actualisées

L'évaluation moyenne est supérieure à 3,7

Plus de 50 opinions au cours des 12 derniers mois

Ce centre est avec Emagister depuis 9 ans.

Les matières

  • Apache
  • R&D
  • R&D

Le programme

Partie 1 Unit 1: Introduction to Big Data
Exercise 1: Setting up the lab environment
Unit 2: Introduction to IBM BigInsights
Exercise 2: Getting started with IBM BigInsights
Unit 3: IBM BigInsights for Analysts
Exercise 3: Working with Big SQL and BigSheets
Unit 4: IBM BigInsights for Data Scientist
Exercise 4: Analyzing data with Big R, Jaql, and AQL
Unit 5: IBM BigInsights for Enterprise Management Partie 2 Unit 1: IBM Open Platform with Apache Hadoop
Exercise 1: Exploring the HDFS
Unit 2: Apache Ambari
Exercise 2: Managing Hadoop clusters with Apache Ambari
Unit 3: Hadoop Distributed File System
Exercise 3: File access & basic commands with HDFS
Unit 4: MapReduce and Yarn
Topic 1: Introduction to MapReduce based on MR1
Topic 2: Limitations of MR1
Topic 3: YARN and MR2
Exercise 4: Creating and coding a simple MapReduce job (Possibly a more complex second Exercise)
Unit 5: Apache Spark
Exercise 5: Working with Spark's RDD to a Spark job
Unit 6: Coordination, management, and governance
Exercise 6: Apache ZooKeeper, Apache Slider, Apache Knox
Unit 7: Data Movement
Exercise 7: Moving data into Hadoop with Flume and Sqoop
Unit 8: Storing and Accessing Data
Topic 1: Representing Data: CSV, XML, JSON, and YAML
Topic 2: Open Source Programming Languages: Pig, Hive, and Other [R, Python, etc]
Topic 3: NoSQL Concepts
Topic 4: Accessing Hadoop data using Hive
Exercise 8: Performing CRUD operations using the HBase shell
Topic 5: Querying Hadoop data using Hive
Exercise 9: Using Hive to Access Hadoop / HBase Data
Unit 9: Advanced Topics
Topic 1: Controlling job workflows with Oozie
Topic 2: Search using Apache Solr
No lab exercises

Appeler le centre

Avez-vous besoin d'un coach de formation?

Il vous aidera à comparer différents cours et à trouver la solution la plus abordable.

Formation Les bases d'IBM Infosphere Big Insights

Prix sur demande