Spark, développer des applications pour le Big Data, 3 jours (réf. SPK)

Formation

À Paris la Défense

1 960 € HT

Appeler le centre

Avez-vous besoin d'un coach de formation?

Il vous aidera à comparer différents cours et à trouver la solution la plus abordable.

Description

  • Typologie

    Formation

  • Lieu

    Paris la défense

  • Durée

    3 Jours

  • Dates de début

    Dates au choix

Vous développerez des applications en Java en vue de traiter en temps réel des données issues du Big Data. Vous collecterez, stockerez et traiterez avec Spark des données de formats hétérogènes afin de mettre en place des chaînes de traitement intégrées à votre système d'information.

Les sites et dates disponibles

Lieu

Date de début

Paris la Défense ((92) Hauts-de-Seine)
la Grande Arche, Paroi Nord, 92044

Date de début

Dates au choixInscriptions ouvertes
Dates au choixInscriptions ouvertes
Paris la Défense ((92) Hauts-de-Seine)
la Grande Arche, Paroi Nord, 92044

Date de début

Consulter

À propos de cette formation

Objectifs pédagogiques
Maîtriser les concepts fondamentaux de Spark
Développer des applications avec Spark Streaming
Faire de la programmation parallèle avec Spark sur un cluster
Exploiter des données avec Spark SQL
Avoir une première approche du Machine Learning

Questions / Réponses

Ajoutez votre question

Nos conseillers et autres utilisateurs pourront vous répondre

À qui souhaitez-vous addresser votre question?

Saisissez vos coordonnées pour recevoir une réponse

Nous ne publierons que votre nom et votre question

Les Avis

Les matières

  • Apache
  • Api
  • Algorithmes
  • Spark
  • Big data
  • Applications
  • Developpement des applications
  • Langage de programmation
  • Données structurées
  • Standalone

Le programme

PROGRAMME DE FORMATION » Présentation d'Apache Spark Historique du Framework. Les différentes versions de Spark (Scala, Python et Java). Comparaison avec l'environnement Apache Hadoop. Les différents modules de Spark. Travaux pratiques Installation et configuration de Spark. Exécution d'un premier exemple avec le comptage de mots. » Programmer avec les Resilient Distributed Dataset (RDD) Présentation des RDD. Créer, manipuler et réutiliser des RDD. Accumulateurs et variables broadcastées. Utiliser des partitions. Travaux pratiques Manipulation de différents Datasets à l'aide de RDD et utilisation de l'API fournie par Spark. » Manipuler des données structurées avec Spark SQL SQL, DataFrames et Datasets. Les différents types de sources de données. Interopérabilité avec les RDD. Performance de Spark SQL. JDBC/ODBC server et Spark SQL CLI. Travaux pratiques Manipulation de Datasets via des requêtes SQL. Connexion avec une base externe via JDBC. » Spark sur un cluster Les différents types d'architecture : Standalone, Apache Mesos ou Hadoop YARN. Configurer un cluster en mode Standalone. Packager une application avec ses dépendances. Déployer des applications avec Spark-submit. Dimensionner un cluster . Travaux pratiques Mise en place d'un cluster Spark. » Analyser en temps réel avec Spark Streaming Principe de fonctionnement. Présentation des Discretized Streams (DStreams). Les différents types de sources. Manipulation de l'API. Comparaison avec Apache Storm. Travaux pratiques Consommation de logs avec Spark Streaming. » Manipuler des graphes avec GraphX Présentation de GraphX. Les différentes opérations. Créer des graphes. Vertex and Edge RDD. Présentation de différents algorithmes. Travaux pratiques Manipulation de l'API GraphX à travers différents exemples. » Machine Learning avec Spark Introduction au Machine Learning. Les différentes classes d'algorithmes. Présentation de SparkML et MLlib. Implémentations des différents algorithmes dans MLlib. Travaux pratiques Utilisation de SparkML et MLlib.

Informations complémentaires

Sommaire • Présentation d'Apache Spark • Programmer avec les Resilient Distributed Dataset (RDD) • Manipuler des données structurées avec Spark SQL • Spark sur un cluster • Analyser en temps réel avec Spark Streaming • Manipuler des graphes avec GraphX • Machine Learning avec Spark Participants Développeurs, architectes. Prérequis Bonnes connaissances du langage Java. Travaux pratiques Mise en pratique des notions vues en cours à l'aide du langage Java.

Appeler le centre

Avez-vous besoin d'un coach de formation?

Il vous aidera à comparer différents cours et à trouver la solution la plus abordable.

Spark, développer des applications pour le Big Data, 3 jours (réf. SPK)

1 960 € HT