Ingénierie de la fouille et de la visualisation de données massives

CNAM - Conservatoire National des Arts et Métiers
À Paris Cédex 03

Prix à consulter
Désirez-vous contacter un conseiller pour cette formation ?

Infos importantes

Typologie Formation
Lieu Paris cédex 03
Début Dates au choix
  • Formation
  • Paris cédex 03
  • Début:
    Dates au choix
Description

Objectifs pédagogiques Cet enseignement s'intéresse à l'impact des caractéristiques des données massives (volume, variété, vélocité) sur les méthodes de fouille de données. Sont examinées les approches actuelles qui permettent de faire passer à l'échelle les méthodes de fouille, en insistant sur les spécificités des opérations de fouille en environnement distribué.

Les caractéristiques mentionnées sont ensuite considérées de façon plus spécifique pour certains problèmes fréquents dans le traitement des données massives. Sont ainsi abordés les systèmes de recommandation et la recherche efficace par similarité, la classification automatique et l'apprentissage supervisé sur une plate-forme distribuée, les opérations spécifiques au traitement des données textuelles souvent hétérogènes, les implications de la vélocité sur la fouille de flux de données, l'analyse de grands graphes et de réseaux sociaux.

L'UE s'intéresse également au rôle de la visualisation et de l'interaction, non seulement dans la présentation des résultats mais aussi dans les opérations de fouille de données.

Installations

Où et quand

Début Lieu
Dates au choix
Paris Cédex 03
292 Rue Saint-Martin, 75141, (75) Paris, France
Voir plan
Début Dates au choix
Lieu
Paris Cédex 03
292 Rue Saint-Martin, 75141, (75) Paris, France
Voir plan

Foire aux questions

· Prérequis

Public et conditions d'accès Bonnes connaissances mathématiques et statistiques générales, maîtrise de méthodes statistiques pour la fouille de données, connaissance de techniques de gestions de données massives faiblement structurées, connaissance de techniques de passage à l'échelle par distribution. Capacité à utiliser le système d'exploitation linux, connaissance d'au moins un langage de programmation. . Vous êtes encouragés à évaluer votre capacité à suivre cette UE en répondant au questionnaire en ligne accessible sur http://cedric

Opinions

0.0
Non évalué
Évaluation de la formation
58,3%
Recommandé
3.8
fantastique
Évaluation du Centre

Opinions sur d'autres formations de ce centre

Opinion sur le centre

O
Omayra Naisseline
3.0 01/04/2015
Le meilleur de la formation: J'ai aimé le programme, le contenu des cours très enrichissant et je ne pensais pas que cela me rapporterai beaucoup sur le plan professionnel et personnel.
À améliorer: Ce qui m'a plu le moins se sont bien sûre les horaires de cours le soir, très difficile d'aller en cours après le travail.
Recommanderiez-vous cette centre de formation ?: oui

Opinion sur le centre

M
Mohamed Ait kaci
3.0 01/11/2012
Le meilleur de la formation: Les cours
À améliorer: Les moyens techniques n'étaient absolument pas au niveau
Recommanderiez-vous cette centre de formation ?: oui

Opinion sur le centre

T
THADDEE IKOSSO LOKOTONGO
5.0 01/02/2014
Le meilleur de la formation: Au Conservatoire National des Arts et Métiers (CNAM), j'étais inscrit pour suivre les cours à distance, car je travaillais et j'avais pas le temps de suivre les cours en jour. L'avantage et surtout ce que j'ai aimé c'est le fait je pouvais aller suivre les cours en présentiel et les mêmes cours je les ai aussi en vidéo; donc en suivant par deux fois les mêmes cours ça permettait bien maîtrise des leçons. Les professeurs étaient très compétents par leur façon d'expliquer, de donner des conférences avec un programme très riches. Quant aux frais, c'est très abordable, même quand c'est vous-même qui supportez. Franchement, s'il y a des gens qui seraient intéressés de tenter l'expérience au CNAM n'hésité pas, allez-y vous ne serez pas déçus.
À améliorer: Personnellement, je ne vois pas ce qui m'a le moins plu, ce n'était que du bénéfique et tout était à mon avantage, j'en ai bien profité de cette expérience.
Recommanderiez-vous cette centre de formation ?: oui

Opinion sur le centre

M
MiCKAEL HINGAN
4.0 01/05/2012
Le meilleur de la formation: Une très bonne formation sur un module très professionnel avec des formateurs issus de milieu professionnel. De plus le nombre de candidat étant réduit cela m'a permis d'avoir des formateurs réactifs à mes interrogations. Une bonne ambiance au sein du groupe et des horaires adaptés dans un lieu fonctionnel.
À améliorer: Durée courte pour un maximum d'information
Recommanderiez-vous cette centre de formation ?: oui

Licence professionnelle Industries chimiques et pharmaceutiques, parcours Développement et production pharmaceutique

L
Laurent Laviolette
3.0 01/03/2016
Le meilleur de la formation: Assiduité de ma conseilliere au suivi de la formation VAE LP032 via une VAP 85 du DIE 16p3.
À améliorer: Le temps de prise en charge financier est long.
Recommanderiez-vous cette formation ?: Non
Les voir toutes

Qu'apprend-on avec cette formation ?

Ingénierie formation
Ingénierie
Réseaux sociaux

Programme

Programme

Contenu

1. Introduction : applications, typologie des données, typologie des problèmes
2. Approches : réduction de la complexité, distribution
3. Passage à l'échelle de quelques problèmes fréquents
a. Recherche par similarité, systèmes de recommandation
b. Classification automatique
c. Fouille de données textuelles
d. Fouille de flux de données
e. Apprentissage supervisé à large échelle
f. Fouille de graphes et réseaux sociaux
4. Visualisation d'information : historique, applications, outils
5. Enjeux perceptifs de la visualisation d'information : couleurs, formes, immersion, lecture
6. Techniques de représentations : graphes, hiérarchies, lignes de temps
7. Techniques d'interaction : association focus/contexte, distorsion, filtrage
Le cours est complété par des travaux pratiques (TP) permettant de mettre en pratique des techniques présentées. Pour la partie fouille de données, les TP seront réalisés à l'aide de Apache Spark. Pour le travail sur le projet, l'auditeur devra installer le logiciel Spark (gratuit) sur un ordinateur personnel de capacité suffisante, suivant les instructions disponibles en ligne.
Les supports de cours et de TP, ainsi que d'autres explications concernant le déroulement de l'UE sont accessibles à partir de http://cedric.cnam.fr/vertigo/Cours/RCP216/

Modalité d'évaluation

Note finale = ((note de projet + note d'examen) / 2), avec la contrainte note d'examen >= 10

Bibliographie

  • Ryza, S., U. Laserson, S. Owen and J. Wills : Advanced Analytics with Spark, O'Reilly, 2014.
  • A. Rajaraman and J. D. Ullman : Cambridge University Press, New York, NY, USA, 2014.


Ceux qui ont consulté cette formation ont également consulté...
En voir plus