Big data : introduction à la data science (r et hadoop)

Formation

A distance

Prix sur demande

Appeler le centre

Avez-vous besoin d'un coach de formation?

Il vous aidera à comparer différents cours et à trouver la solution la plus abordable.

Description

  • Typologie

    Formation

  • Méthodologie

    A distance

À propos de cette formation :L'analyse du Big Data permet aux entreprises de prendre de meilleures décisions. Au cours de cette formation Big Data, vous obtenez les compétences pour élaborer des stratégies concurrentielles axées sur l'analyse des données. Vous apprenez à utiliser une approche globale articulée autour du cycle de vie des données en appliquant des méthodes de modélisation des données sophistiquées à vos projets d'analyse du Big Data.

À propos de cette formation

À qui s'adresse cette formation ?Aux techniciens, professionnels des bases de données, managers, analystes de données, data scientists et assistants à maîtrise d'ouvrage. Cette formation est très utile pour les professionnels chargés de gérer les prévisions et les tendances.

Questions / Réponses

Ajoutez votre question

Nos conseillers et autres utilisateurs pourront vous répondre

À qui souhaitez-vous addresser votre question?

Saisissez vos coordonnées pour recevoir une réponse

Nous ne publierons que votre nom et votre question

Les Avis

Les exploits du centre

2016

Toutes les formations sont actualisées

L'évaluation moyenne est supérieure à 3,7

Plus de 50 opinions au cours des 12 derniers mois

Ce centre est avec Emagister depuis 16 ans.

Les matières

  • Analyse de résultats
  • Analyse de données
  • Modélisation

Le programme

Présentation de R

Exploration et analyse des données avec R

  • Charger, interroger et manipuler des données avec R
  • Nettoyer les données brutes avant la modélisation
  • Réduire les dimensions avec l'analyse en composantes principales (ACP)
  • Développer les fonctionnalités de R avec les packages définis par l'utilisateur
Faciliter la pensée analytique avec la visualisation des données
  • Explorer les caractéristiques d'un ensemble de données à travers la visualisation
  • Représenter graphiquement la distribution des données avec des boîtes à moustaches, des histogrammes et des diagrammes de densité
  • Identifier les valeurs hors normes

Manipuler les ensembles volumineux et les données non structurées

Explorer les données non structurées pour les applications métier

  • Traitement préliminaire et préparation des données non structurées pour une analyse plus approfondie
  • Décrire un ensemble de documents avec une matrice termes-documents
Difficultés supplémentaires liées au Big Data
  • Examiner les architectures de MapReduce et Hadoop
  • Intégrer R et Hadoop à RHadoop

Prédire les résultats avec des techniques de régression

Estimer les valeurs avec les règles de régression linéaire et logistique

  • Modéliser la relation entre une variable de sortie et plusieurs variables d'entrée
  • Interpréter correctement les coefficients des données continues et qualitatives
Techniques de régression pour manipuler le Big Data
  • Traiter les ensembles de données volumineux avec RHadoop
  • Créer des modules de régression pour RHadoop

Classer les données par catégorie avec des règles de classification

Identification automatique de chaque nouvel élément de données

  • Utiliser des arbres de décision pour prédire les valeurs cible
  • Appliquer des règles de probabilité pour prédire les résultats avec le modèle Naive Bayes
  • Combiner les variables de prédiction des arbres et les forêts aléatoires dans RHadoop
Évaluer les performances des modèles
  • Visualiser les performances des modèles avec une courbe ROC
  • Évaluer les modèles de classification avec des matrices de confusion

Déceler des tendances dans un ensemble de données complexes avec le clustering et l'analyse des associations

Identifier des groupes encore inconnus dans un ensemble de données

  • Segmenter le marché client avec l'algorithme K-Means
  • Trouver des similarités avec les mesures des distances
  • Créer des clusters en forme d'arbres et des mises en cluster hiérarchiques
  • Mettre en cluster les tweets et les fichiers texte pour mieux les comprendre
Mettre à jour les connexions avec l'analyse des associations
  • Identifier les connexions importantes avec l'analyse des réseaux sociaux
  • Comprendre l'utilisation des résultats de l'analyse des réseaux sociaux à des fins marketing

Utiliser les données transactionnelles pour générer des recommandations et des règles d'association

Définir et évaluer des règles d'association

  • Identifier les préférences réelles des clients à partir d'un ensemble de données transactionnelles pour améliorer l'expérience utilisateur
  • Calculer les indices de support et de confiance et le lift pour différencier les bonnes règles des mauvaises

Informations complémentaires

Travaux Pratiques :Analyser différents ensembles de données avec un environnement de programmation R et RHadoop Traitement préliminaire et préparation des données pour une analyse plus approfondie Analyse par clustering, classification et régression des ensembles de données Définir des règles d'association à partir de données transactionnelles

Appeler le centre

Avez-vous besoin d'un coach de formation?

Il vous aidera à comparer différents cours et à trouver la solution la plus abordable.

Big data : introduction à la data science (r et hadoop)

Prix sur demande