Cnam Languedoc-Roussillon

Ingénierie de la fouille et de la visualisation de données massives

Cnam Languedoc-Roussillon
À Montpellier

Prix à consulter
Ou préférez-vous appeler directement le centre?
46763... Voir plus

Infos importantes

Typologie Formation
Lieu Montpellier
Début Dates au choix
  • Formation
  • Montpellier
  • Début:
    Dates au choix
Description

Missions, moyens et organisation
Le Cnam est placé sous la présidence de Jean-Paul Herteman, P-DG du groupe Safran, et dirigé par Olivier Faron.
Il remplit trois missions principales:
la formation professionnelle supérieure tout au long de la vie,
la recherche technologique et l'innovation,
la diffusion de la culture scientifique et technique.
Le Cnam offre des formations développées en étroite collaboration avec les entreprises et les organisations professionnelles afin de répondre au mieux à leurs besoins et à ceux de leurs salariés. Cette UE apparaît dans les diplômes et certificats suivants : Entrée
CS59p-1 Certificat de spécialisation Analyste de données massives
Centres d'enseignement Entrée
MR085p-1 Master Sciences, technologies, santé mention statistique et mathématiques appliquées spécialité statistique (voie professionnelle)
Centres d'enseignement
Public et conditions d'accès Bonnes connaissances mathématiques et statistiques générales, maîtrise de méthodes statistiques pour la fouille de données, connaissance de techniques de gestions de données massives faiblement structurées, connaissance de techniques de passage à l'échelle par distribution. Capacité à utiliser le système d'exploitation linux, connaissance d'au moins un langage de programmation.

Installations (1)
Où et quand
Début Lieu
Dates au choix
Montpellier
989 Rue de la Croix Verte - Parc Euromédecine, 34093, (34) Hérault, France
Voir plan
Début Dates au choix
Lieu
Montpellier
989 Rue de la Croix Verte - Parc Euromédecine, 34093, (34) Hérault, France
Voir plan

Opinions

0.0
Non évalué
Évaluation de la formation
85,7%
Recommandé
3.6
fantastique
Évaluation du Centre

Opinions sur cette formation

Il n'y a pas encore d'opinions sur cette formation
* Opinions recueillies par Emagister et iAgora

Qu'apprend-on avec cette formation ?

Techniques du son
Techniques de formation
Statistique
Ingénierie formation
Ingénierie

Programme

Contenu 1. Introduction : applications, typologie des données, typologie des problèmes
2. Approches : réduction de la complexité, distribution
3. Passage à l'échelle de quelques problèmes fréquents
            a. Recherche par similarité, jointure par similarité
            b. Classification automatique
            c. Fouille de données textuelles
            d. Fouille de flux de données
            e. Apprentissage statistique à large échelle
            f. Fouille de graphes et réseaux sociaux
4. Visualisation d'information : historique, applications, outils
5. Enjeux perceptifs de la visualisation d'information : couleurs, formes, immersion, lecture
6. Techniques de représentations : graphes, hiérarchies, lignes de temps
7. Techniques d'interaction : association focus/contexte, distorsion, filtrage
 
Le cours est complété par des travaux pratiques (TP) permettant de mettre en pratique des techniques présentées. Pour la partie fouille de données, les TP seront réalisés à l'aide de Apache Spark. Pour le travail sur le projet, l'auditeur devra installer le logiciel Spark (gratuit) sur un ordinateur personnel de capacité suffisante.
Pour la partie visualisation, les TP seront effectués avec le logiciel Processing (gratuit) ; une séance d'introduction est réservée à son apprentissage.
Modalités de l'évaluation Note finale = ((note de projet + note d'examen) / 2), avec la contrainte note d'examen = 10
Bibliographie
  • Ryza, S., U. Laserson, S. Owen and J. Wills : Advanced Analytics with Spark, O’Reilly, 2014.
  • A. Rajaraman and J. D. Ullman : Cambridge University Press, New York, NY, USA, 2014.

Ceux qui ont consulté cette formation ont également consulté...
En voir plus