Formation indisponible à l'heure actuelle
Analyse du Big Data : Les fondamentaux
Formation
À Paris ()
Description
-
Typologie
Formation
Vous apprendrez à Appliquer des techniques d’exploration des données pour améliorer la prise de décisions métier à partir de sources de données internes et externesPrendre une longueur d’avance sur vos concurrents avec l’analyse des données structurées et non structuréesPrédire un résultat en utilisant des techniques d’apprentissage automatique supervisé
Les Avis
Les exploits du centre
Toutes les formations sont actualisées
L'évaluation moyenne est supérieure à 3,7
Plus de 50 opinions au cours des 12 derniers mois
Ce centre est avec Emagister depuis 18 ans.
Les matières
- Analyse de résultats
Le programme
- Charger, interroger et manipuler des données avec R
- Nettoyer les données brutes avant la modélisation
- Réduire les dimensions avec l’analyse en composantes principales (ACP)
- Développer les fonctionnalités de R avec les packages définis par l’utilisateur
- Explorer les caractéristiques d’un ensemble de données à travers la visualisation
- Représenter graphiquement la distribution des données avec des boîtes à moustaches, des histogrammes et des diagrammes de densité
- Identifier les valeurs hors normes
- Traitement préliminaire et préparation des données non structurées pour une analyse plus approfondie
- Décrire un ensemble de documents avec une matrice termes–documents
- Examiner les architectures de MapReduce et Hadoop
- Intégrer R et Hadoop à RHadoop
- Modéliser la relation entre une variable de sortie et plusieurs variables d’entrée
- Interpréter correctement les coefficients des données continues et qualitatives
- Traiter les ensembles de données volumineux avec RHadoop
- Créer des modules de régression pour RHadoop
- Utiliser des arbres de décision pour prédire les valeurs cible
- Appliquer des règles de probabilité pour prédire les résultats avec le modèle Naive Bayes
- Combiner les variables de prédiction des arbres et les forêts aléatoires dans RHadoop
- Visualiser les performances des modèles avec une courbe ROC
- Évaluer les modèles de classification avec des matrices de confusion
- Segmenter le marché client avec l’algorithme K–Means
- Trouver des similarités avec les mesures des distances
- Créer des clusters en forme d’arbres et des mises en cluster hiérarchiques
- Mettre en cluster les tweets et les fichiers texte pour mieux les comprendre
- Identifier les connexions importantes avec l’analyse des réseaux sociaux
- Comprendre l’utilisation des résultats de l’analyse des réseaux sociaux à des fins marketing
- Identifier les préférences réelles des clients à partir d’un ensemble de données transactionnelles pour améliorer l’expérience utilisateur
- Calculer les indices de support et de confiance et le lift pour différencier les « bonnes » règles des « mauvaises »
Analyse du Big Data : Les fondamentaux
