Formation Talend Open Studio : Initiation
Formation
À Paris
Description
-
Typologie
Formation intensive
-
Niveau
Niveau intermédiaire
-
Lieu
Paris
-
Heures de classe
21h
-
Durée
3 Jours
-
Dates de début
Dates au choix
La formation Talend Open Studio a pour objectif de vous permettre de prendre en main l’ETL Open Source Talend qui est un must dans l’intégration de données.
Nous commencerons par une présentation de l’environnement et des premiers flux avant d’aborder des sujets plus pointus tels que les métadonnées, les itérations et les fonctionnalités avancées. Pour finaliser cette formation nous aborderons la documentation de ses jobs et la génération des scripts.
Les sites et dates disponibles
Lieu
Date de début
Date de début
À propos de cette formation
Comprendre le processus d'intégration de données - Maîtriser l'outil Talend Open Studio et la bibliothèque de composants
Les Avis
Les matières
- Comprendre le processus
- D'intégration de données
- Maîtriser l'outil Talend Open
- Studio et la bibliothèque de composants
- Être capable d'utiliser
- Talend comme une
- Glue entre
- Différents fichiers/bases/applications
- Être en mesure
- De modéliser ses besoins
- Savoir prendre
- En main la bibliothèque de composants
- Maîtriser l'implémentation
- De ses Jobs
Professeurs
équipe des professeurs
Directeur
Le programme
Problématique d'intégration de données
Intégration Opérationnelle et Décisionnelle
Outils ETL (Extract Transform Load) disponibles
Talend Open Studio : présentation, licences, lien avec Eclipse
Support disponible : documentation, communauté, …
Atelier : Installation et présentation de l'environnement Talend Open Studio
Découvrir l'interfaceLes perspectives et les vues Talend
Utilisation du Business Modeler
Les jobs : grille, palette de composants
Les flux principaux (main)
La notion de schéma : types des colonnes
Premiers composants : entrée, sortie, génération de flux
Atelier pratique : création et exécution d'un job simple, génération de contenu dans un fichier
Les principaux composants de TalendComposants d'entrée (tFileInput, tMysqlInput, …)
Génération de contenu (tRowGenerator, tFixedFlowInput, ...)
Sorties et affichage (tLogRow, tFileOutput, tMysqlOutput, …)
Logique et chaînage des composants
Suivi pas à pas des traces de l'exécution du job
Gestion des rejets
Transformations simples (filtre, tri, remplacement, jointure)
Atelier pratique : génération de contenu dans une base de données, extraction et traitement des données pour affichage en console
Garantir la pérennité des jobsVersions et statuts des jobs
Les métadonnées : propriétés et schémas.
La découverte de schéma pour les fichiers CSV
Récupération des schémas de bases de données
Mises à jour des jobs depuis les métadonnées
Atelier pratique : insérer les sources et cibles de données dans les métadonnées du référentiel
Variables et contextesUtiliser des variables dans un job (tSetGlobalVar)
Mise en place d'un contexte local au job
Groupes de contexte dans le référentiel
Les métadonnées comme contextes
Atelier pratique : utiliser une variable dans un job, contextualiser les paramètres d'une métadonnées, créer un contexte de test, et de production
Le mappage de données : tMapLe composant ETL par excellence
Gérer les entrées : flux principal, secondaires, nommage des flux
Gérer les sorties : l'éditeur intégré de la tMap
Filtrer les données : en entrée, sortie
Sorties conjointes, capture des rejets de sortie, de jointure interne
L'éditeur d'expression
Les performances
Atelier pratique : extraction multi-sources, multi-destinations avec une tMap, sur un exemple complet
Orchestration des jobs, gestion d'erreursExécutions parallèles de sous-jobs
Déclencheurs Talend (triggers)
Enchaînement de sous-jobs et de composants (OnSubjobOK, OnComponentOK)
Gestion des erreurs de composants, sous-job (OnComponentError, OnSubjobError)
Composant de départ, et de fin (tPreJob, tPostJob)
Attraper et lever des erreurs : tWarn, tDie, tLogCatcher
Formation Talend Open Studio : Initiation
