Formation indisponible à l'heure actuelle
Formation Talend Open Studio Data Integration : Initiation + Appr…ment - 5 jours
Formation
À Brussels ()
Description
-
Typologie
Formation
Internet et les réseaux de communication sont au coeur de notre société et nous aident à conquérir de nouveaux marchés ou à nous organiser. Pour faciliter votre travail ou simplement pour le promouvoir, vous aurez besoin de professionnels réactifs, performants et dotés d'une forte culture technologique. Comprendre le processus d'intégration de données - Maîtriser l'outil Talend Open Studio et la bibliothèque de composants
Les Avis
Les matières
- Gestion
- Éditeur
Le programme
Introduction
Problématique d'intégration de données
Intégration
Opérationnelle et Décisionnelle
Outils ETL (Extract Transform
Load) disponibles
Talend Open Studio : présentation, licences,
lien avec Eclipse
Support disponible : documentation, communauté,
…
Atelier : Installation et présentation de l'environnement
Talend Open Studio
Découvrir l'interface
Les perspectives et les vues Talend
Utilisation du Business
Modeler
Les jobs : grille, palette de composants
Les flux
principaux (main)
La notion de schéma : types des
colonnes
Premiers composants : entrée, sortie, génération
de flux
Atelier pratique : création et exécution d'un job
simple, génération de contenu dans un fichier
Les principaux composants de Talend
Composants d'entrée (tFileInput,
tMysqlInput, …)
Génération de contenu (tRowGenerator,
tFixedFlowInput, ...)
Sorties et affichage (tLogRow, tFileOutput,
tMysqlOutput, …)
Logique et chaînage des composants
Suivi
pas à pas des traces de l'exécution du job
Gestion des
rejets
Transformations simples (filtre, tri, remplacement,
jointure)
Atelier pratique : génération de contenu dans une base
de données, extraction et traitement des données pour affichage en
console
Garantir la pérennité des jobs
Versions
et statuts
des jobs
Les métadonnées :
propriétés et schémas.
La
découverte de schéma pour les fichiers CSV
Récupération des
schémas de bases de données
Mises à jour des jobs depuis les
métadonnées
Atelier pratique : insérer les sources et cibles de
données dans les métadonnées du référentiel
Variables et contextes
Utiliser des variables dans un
job (tSetGlobalVar)
Mise en place d'un contexte local
au job
Groupes de
contexte dans le référentiel
Les métadonnées comme contextes
Atelier pratique : utiliser une variable dans un job,
contextualiser les paramètres d'une métadonnées, créer un
contexte de test, et de production
Le mappage de données : tMap
Le composant ETL par excellence
Gérer les entrées : flux
principal, secondaires, nommage des flux
Gérer les sorties :
l'éditeur intégré de la tMap
Filtrer les données : en
entrée, sortie
Sorties conjointes, capture des rejets de sortie,
de jointure interne
L'éditeur d'expression
Les performances
Atelier pratique : extraction multi-sources,
multi-destinations avec une tMap, sur un exemple complet
Orchestration des jobs, gestion d'erreurs
Exécutions parallèles de
sous-jobs
Déclencheurs
Talend (triggers)
Enchaînement
de sous-jobs et de composants (OnSubjobOK, OnComponentOK)
Gestion
des erreurs de composants, sous-job (OnComponentError,
OnSubjobError)
Composant
de départ, et de fin (tPreJob, tPostJob)
Attraper
et lever des erreurs : tWarn, tDie, tLogCatcher
Atelier pratique : assembler plusieurs jobs en un seul,
factoriser la gestion d'erreurs pour générer un fichier de
compte-rendu
Les flux de programmation : liens iterate
Différencier les flux
principaux des flux iterate
Boucles et programmation via tLoop,
tForeach
Passer d'un flux principal à un flux iterate, et
l'inverse (tFlowToIterate, tIterateToFlow)
Synchronisation
de jobs avec les tWaitForFile, tWaitForSocket, tWaitForSQL
Atelier pratique : paralléliser des sous-jobs,
synchroniser les jobs avec un événement
externe
Utilisation avancée
Utilisation de composants
évolués : Java ou expressions régulières
La
spécificité des flux XML
dans Talend
Réutilisation
du code : les routines
Atelier : Utilisation des composants tJavaRow,
tJavaFlex, utilisation de l'éditeur Java embarqué, déploiement
d'une routine personnalisée
Déboguage dans Talend
Rappels sur le débogage de traces
Utilisation du mode Debug
Java : perspective Debug, mode pas à pas
Visualisation et
modification à chaud des variables
Atelier : Debuggage basique/avancé de tâches
Déploiement et industrialisation
Rappel sur les contextes
Export des jobs pour exécution sur un
serveur
Passage de contexte entre jobs, à l'exécution
Utilisation
d'un fichier pour charger le contexte (tContextLoad)
Atelier : Déploiement de tâches et chargement
dynamique du contexte
Utilisation avancée
Utilisation de composants évolués : Java ou expressions
régulières
Création de logs spécifiques
Gestion des flux
XML
Réutilisation du code
Atelier : Utilisation des composants tJavaRow, tJavaFlex -
création de logs avec tCatch, tDie ... - utilisation de l'éditeur
Java embarqué
Les composants Talend
Concepts essentiels pour étendre Talend Open Studio
Création
de la maquette du composant avec tJavaFlex / interface
graphique
Découvrir la forge Talend et ses composants
communautaires
Intégration dans Talend Open Studio des plugins
créés ou téléchargés
Atelier : Création d'un
composant simple via tJavaFlex, intégration de
composants de la forge Talend
Formation Talend Open Studio Data Integration : Initiation + Appr…ment - 5 jours