Entreposage et fouille de données
Formation
À Paris Cédex 03
Avez-vous besoin d'un coach de formation?
Il vous aidera à comparer différents cours et à trouver la solution la plus abordable.
Description
-
Typologie
Formation
-
Lieu
Paris cédex 03
-
Dates de début
Dates au choix
Public et conditions d'accès
être admis en M2 du master STIC, mention statistique ou être agréé.
La demande d'agrément est à faire uniquement pour les auditeurs qui souhaitent suivre STA211 en présentiel au semestre 1. Pour obtenir l'agrément, les auditeurs adresseront, à partir du 25 Août, par courrier électronique à l'enseignant responsable : , un CV détaillé et une lettre de motivation indiquant les raisons de la demande et le projet pédagogique dans lequel elle s'inscrit . Une réponse sera donnée dans un délai d'une dizaine de jours.
Niveau requis : NFA.008 (bases de données) et STA101 (analyse des données, méthodes descriptives). Ces prérequis sont indispensables pour obtenir l'agrément. Vérifier avant d'envoyer une demande d'agrément.
Mots-clés
Analyse statistique des données
Statistique décisionnelle
Aide à la décision
Data mining
Base de données
fouille de donnees
Les sites et dates disponibles
Lieu
Date de début
Date de début
Les Avis
Les matières
- Entreposage
- Analyse de données
- Data mining
- Statistique
- Analyse de résultats
Le programme
Contenu
Modèles prévisionnels et systèmes de gestion de l'entreprise
- structures spécifiques des bases de données de Data warehouse (star schema)
- OLAP
Méthodologies générales
- Méthodologies de Data Mining
Pré-traitement des données
- Analyses de la qualité des données,
- Techniques d'appréhension des valeurs manquantes ou aberrantes
- Techniques de construction de bases de travail (agrégations, etc. . . )
Données et techniques de fouille
Méthodes non supervisées :
- Cartes de Kohonen, Règles d'association
Méthodes supervisées :
- Rappels de théorie de l'apprentissage
- Arbres de décision, forêts aléatoires, SVM, Réseaux de neurones, deep learning
- Méta-algorithmes :
- boosting, bagging
Fouille dans de nouveaux types de données et méthodes associées :
- Données textuelles - Données multivues - Images et Multimedia
Outils :
- Environnements freeware : Weka, Tanagra, R, Python
- Outils spécifiques : SAS-EM, SPAD
- Data Mining et bases de données : OLAP Business Object
Bibliographie
- M.BARDOS : Analyse discriminante (Dunod, 2001)
- G.SAPORTA : Probabilités, analyse des données et statistique (Technip, 2006)
- S.TUFFERY : Data mining et statistique décisionnelle (Technip, 2005)
- S.TUFFERY : Etude de cas en statistique décisionnelle (Technip, 2009)
- T.HASTIE, J.FRIEDMAN, F.TIBSHIRANI : Elements of Statistical Learning (Springer, 2009)
- G.GOVAERT (ed) : Analyse des données (Hermes,2003)
- L. LEBART, A. MORINEAU, M. PIRON : Statistique exploratoire multidimensionnelle (1995)
- J.P.NAKACHE, J.CONFAIS : Statistique explicative appliquée (Technip, 2003)
- James, Witten, Hastie, & Tibshirani : An Introduction to Statistical Learning (2013) Téléchargeable ici:
Avez-vous besoin d'un coach de formation?
Il vous aidera à comparer différents cours et à trouver la solution la plus abordable.
Entreposage et fouille de données