Concevoir une Solution de Data Mining avec les Technologies Microsoft
Formation
En présentiel
Avez-vous besoin d'un coach de formation?
Il vous aidera à comparer différents cours et à trouver la solution la plus abordable.
Description
-
Typologie
Formation
-
Dirigé à
Pour professionnels
-
Lieu
Toulouse
Objectifs: Le data mining utilise le contenu des bases de données pour déduire l'information stratégique que cherche à deviner » l'entreprise: le potentiel économique d'un prospect, ses goûts, ses achats types; les risques de défaillance d'un matériel, d'un client; les causes d'un évènement, d'un état. Destinataires: Ce cours s'adresse aux concepteurs, architectes, chefs de projet et développeurs chargés d'identifier et d'exploiter l'information utile enfouie dans les bases de données de l'entreprise. Les applications du data mining couvrent notamment les domaines de la relation client, du marketing, de la finance, et des sciences de la vie.
Précisions importantes
Modalité Formation continue
Les sites et dates disponibles
Lieu
Date de début
Date de début
Date de début
À propos de cette formation
* Connaissance des bases de données relationnelles et du langage SQL. * Familiarité avec les environnements de développement Microsoft .Net ou SQL Server 2005.
Les Avis
Le programme
Le data mining utilise le contenu des bases de données pour déduire l'information stratégique que cherche à « deviner » l'entreprise : le potentiel économique d'un prospect, ses goûts, ses achats types; les risques de défaillance d'un matériel, d'un client; les causes d'un évènement, d'un état...
Nouveautés majeures de SQL 2005, les moteurs d'intelligence artificielle réalisant l'analyse prédictive, deviennent accessibles au moyen de simples requêtes SQL.
Ce cours présente les enjeux, la démarche, l'architecture et la mise en OEuvre du data mining en environnement Microsoft.
Enjeux et positionnement du data mining
- origines et objectifs du data mining
- exemples d'utilisation
- démarche théorique et pratique
- comparaison avec l'approche OLAP
- comparaison avec l'approche statistique
- positionnement de l'offre data mining Microsoft
- structure technique de l'offre data mining Microsoft
- présentation des outils data mining de SQL BI Development Studio
- objectifs, typologie des données en entrée, données en sortie
- démarche générale
- définition d'une « mining structure »
- comprendre la segmentation par clustering
- définir le « mining model » depuis BI Dev. Studio
- réaliser la segmentation
- utiliser Microsoft Cluster Viewer
- interpréter les résultats et les paramètres de Microsoft Clustering
- intérêt d'une segmentation comme but en soit ou comme préalable à l'analyse prédictive
- comprendre les arbres de décisions
- avantages et inconvénients
- définir et instruire le « mining model » depuis BI Dev. Studio
- utiliser Microsoft Tree Viewer
- réaliser l'analyse prédictive sur les données cibles
- évaluer les résultats
- introduction au sur-apprentissage (overfitting)
- comprendre l'impact du paramétrage
- présentation des réseaux de neurones
- avantages et inconvénients
- définir le « mining model » depuis BI Dev. Studio
- réaliser l'apprentissage et l'analyse prédictive
- interpréter les résultats
- comprendre l'impact du paramétrage
- piloter l'exécution de l'analyse prédictive
- présentation des réseaux bayésiens
- avantages et inconvénients
- réaliser l'apprentissage du modèle depuis BI Dev. Studio
- présentation de Microsoft Naive Bayes Viewer
- réaliser l'apprentissage et l'analyse prédictive
- interpréter les résultats
- limites et extensions du modèle
- déployer un modèle d'analyse
- objectifs, exemples et paramètres
- prédire la prochaine page visitée, le prochain achat...
- exemples et paramètres
- principes d'une « analyse de ticket de caisse »
- niveaux de support et de confiance
- présentation des principaux paramètres
- types de requêtes (inclusive, exclusive, input_only, top count...)
- exemples de requêtes courantes
- comparaison aux autres moyens de favoriser les ventes croisées
- algorithmes « memory based » (plus proche voisin)
- filtrage collaboratif
- analyse de liens (link analysis)
- text mining
- sélection, transformation et enrichissement et des attributs
- évaluation des résultats : éviter les pièges classiques !
- des données pour...apprendre, paramétrer, évaluer ou exploiter ?
- sur-apprentissage, compromis précision/généralisation
- problèmes génériques rencontrés lors du paramétrage
- descente de gradient, recuit simulé, algorithmes génétique
- pratique et limite des lift charts
- faux positifs, faux négatifs : intégrer le coût économique d'une erreur
- validations croisées : 3-fold validation, stratified n-fold validation,...
- estimateurs « leave one out » et bootstrap
- comparer deux estimateurs sur un même échantillon
- couplage avec Microsoft Integration Services
- couplage avec une base OLAP
- recommandations Crisp-DM, XML for Analysis et PMML
- OLE DB for Data Mining
- ajouter des algorithmes d'autres éditeurs dans l'environnement Microsoft
- ajouter ou développer des plug-in de visualisation
- le langage DMX : l'extension Data Mining du SQL
- perspectives pour le programmeur et l'administrateur système
- automatiser la création d'une structure d'accueil (mining structure) avec DMX
- automatiser la création d'un modèle d'analyse (mining model) avec DMX
- automatiser l'apprentissage d'un mining model avec DMX
- automatiser l'analyse prédictive et la segmentation avec DMX
- structure détaillée des requêtes OLE DB for Data Mining
- exemples de requêtes avancées
- interopérabilité et interrogation distante avec XMLA
Avez-vous besoin d'un coach de formation?
Il vous aidera à comparer différents cours et à trouver la solution la plus abordable.
Concevoir une Solution de Data Mining avec les Technologies Microsoft