BigData Architecture et technologies
Formation
À Toulouse Cedex 1
Avez-vous besoin d'un coach de formation?
Il vous aidera à comparer différents cours et à trouver la solution la plus abordable.
Description
-
Typologie
Formation
-
Lieu
Toulouse cedex 1
Grâce à la formation que vous propose Iris Training vous allez pouvoir acquérir les compétences nécessaires afin d’approfondir un domaine particulier de votre métier. L’objectif de cette formation consiste en :Comprendre les concepts du BigData et savoir quelles sont les technologies implémentées.
Les sites et dates disponibles
Lieu
Date de début
Date de début
Les Avis
Le programme
Programme
Introduction
- Rappel des besoins et des caractéristiques techniques des projets BigData
- Le positionnement des technologies de cloud, BigData et noSQL.
- Eléments d'architecture.
- Caractéristiques NoSQL :
- adaptabilité, extensibilité,
- structure de données proches des utilisateurs, développeurs
- Les types de bases de données : clé/valeur, document, colonne, graphe.
- Données structurées et non structurées, documents, images,
- fichiers XML, JSON, CSV, ...
- Les différents modes et formats de stockage.
- Importance du théorème CAP.
- Stockage réparti : réplication, sharding, gossip protocol, hachage,
- Systèmes de fichiers distribués : GFS, HDFS,
- Les bases de données : HBase, BigTable, ..
- Quelques exemples de produits et leurs caractéristiques :
- Cassandra, MongoDB, CouchDB, DynamoDB, Riak, Hadoop.
- Qualité des données, gouvernance de données.
- Moteurs de recherche.
- Principe de fonctionnement.
- Méthodes d'indexation. Mise en oeuvre avec elasticsearch.
- Exemple de Lucene/solr.
- Recherche dans les bases de volumes importants.
- Exemples de produits et comparaison :
- Dremel, Drill, ElasticSearch, MapReduce,
- Différentes solutions : calculs en mode batch, ou en temps réel,
- sur des flux de données ou des données statiques.
- Les produits :
- langage de calculs statistiques, R Statistics Language, sas, RStudio.
- Ponts entre les outils statistiques et les bases BigData
- Outils de calcul sur des volumes importants :
- storm en temps réel, hadoop en mode batch.
- Zoom sur Hadoop :
- complémentarité de HDFS et MapReduce.
- Restitution et analyse : logstash, kibana, elk, pentaho
- Présentation de pig pour la conception de tâches MapReduce sur une grappe Hadoop.
Avez-vous besoin d'un coach de formation?
Il vous aidera à comparer différents cours et à trouver la solution la plus abordable.
BigData Architecture et technologies