Big data : introduction à la data science (r et hadoop)
Formation
A distance
Avez-vous besoin d'un coach de formation?
Il vous aidera à comparer différents cours et à trouver la solution la plus abordable.
Description
-
Typologie
Formation
-
Méthodologie
A distance
À propos de cette formation :L'analyse du Big Data permet aux entreprises de prendre de meilleures décisions. Au cours de cette formation Big Data, vous obtenez les compétences pour élaborer des stratégies concurrentielles axées sur l'analyse des données. Vous apprenez à utiliser une approche globale articulée autour du cycle de vie des données en appliquant des méthodes de modélisation des données sophistiquées à vos projets d'analyse du Big Data.
À propos de cette formation
À qui s'adresse cette formation ?Aux techniciens, professionnels des bases de données, managers, analystes de données, data scientists et assistants à maîtrise d'ouvrage. Cette formation est très utile pour les professionnels chargés de gérer les prévisions et les tendances.
Les Avis
Les exploits du centre
Toutes les formations sont actualisées
L'évaluation moyenne est supérieure à 3,7
Plus de 50 opinions au cours des 12 derniers mois
Ce centre est avec Emagister depuis 16 ans.
Les matières
- Analyse de résultats
- Analyse de données
- Modélisation
Le programme
Présentation de R
Exploration et analyse des données avec R
- Charger, interroger et manipuler des données avec R
- Nettoyer les données brutes avant la modélisation
- Réduire les dimensions avec l'analyse en composantes principales (ACP)
- Développer les fonctionnalités de R avec les packages définis par l'utilisateur
- Explorer les caractéristiques d'un ensemble de données à travers la visualisation
- Représenter graphiquement la distribution des données avec des boîtes à moustaches, des histogrammes et des diagrammes de densité
- Identifier les valeurs hors normes
Manipuler les ensembles volumineux et les données non structurées
Explorer les données non structurées pour les applications métier
- Traitement préliminaire et préparation des données non structurées pour une analyse plus approfondie
- Décrire un ensemble de documents avec une matrice termes-documents
- Examiner les architectures de MapReduce et Hadoop
- Intégrer R et Hadoop à RHadoop
Prédire les résultats avec des techniques de régression
Estimer les valeurs avec les règles de régression linéaire et logistique
- Modéliser la relation entre une variable de sortie et plusieurs variables d'entrée
- Interpréter correctement les coefficients des données continues et qualitatives
- Traiter les ensembles de données volumineux avec RHadoop
- Créer des modules de régression pour RHadoop
Classer les données par catégorie avec des règles de classification
Identification automatique de chaque nouvel élément de données
- Utiliser des arbres de décision pour prédire les valeurs cible
- Appliquer des règles de probabilité pour prédire les résultats avec le modèle Naive Bayes
- Combiner les variables de prédiction des arbres et les forêts aléatoires dans RHadoop
- Visualiser les performances des modèles avec une courbe ROC
- Évaluer les modèles de classification avec des matrices de confusion
Déceler des tendances dans un ensemble de données complexes avec le clustering et l'analyse des associations
Identifier des groupes encore inconnus dans un ensemble de données
- Segmenter le marché client avec l'algorithme K-Means
- Trouver des similarités avec les mesures des distances
- Créer des clusters en forme d'arbres et des mises en cluster hiérarchiques
- Mettre en cluster les tweets et les fichiers texte pour mieux les comprendre
- Identifier les connexions importantes avec l'analyse des réseaux sociaux
- Comprendre l'utilisation des résultats de l'analyse des réseaux sociaux à des fins marketing
Utiliser les données transactionnelles pour générer des recommandations et des règles d'association
Définir et évaluer des règles d'association
- Identifier les préférences réelles des clients à partir d'un ensemble de données transactionnelles pour améliorer l'expérience utilisateur
- Calculer les indices de support et de confiance et le lift pour différencier les bonnes règles des mauvaises
Informations complémentaires
Avez-vous besoin d'un coach de formation?
Il vous aidera à comparer différents cours et à trouver la solution la plus abordable.
Big data : introduction à la data science (r et hadoop)