Traitement de la Parole Statut Type Avancé
Formation
À Paris
Description
-
Typologie
Formation
-
Niveau
Niveau avancé
-
Lieu
Paris
-
Durée
3 Jours
Objectifs: Acquérir une vue d'ensemble des technologies vocales (codage, synthèse et reconnaissance) ainsi que des éléments techniques pour mettre en place des applications les intégrant. . Les technologies de traitement numérique de la parole accompagnent l'évolution vers la société de l'information. Elles proposent des interfaces qui intègrent le mode…
Les sites et dates disponibles
Lieu
Date de début
Date de début
À propos de cette formation
Ingénieurs et techniciens développant ou utilisant des systèmes quiintègrent tous types de facilités vocales : radio-mobiles, messageries etinterfaces homme-machine. Des connaissances de base en traitement du signal numérique sontsouhaitables. Responsable Gaël RICHARD Professeur au département Traitement du Signal et...
Les Avis
Le programme
Objectifs et présentation
Acquérir une vue d''ensemble des technologies vocales (codage, synthèse et reconnaissance) ainsi que des éléments techniques pour mettre en place des applications les intégrant.
Les technologies de traitement numérique de la parole accompagnent l''évolution vers la société de l''information. Elles proposent des interfaces qui intègrent le mode principal de communication que l''homme utilise (la voix) et qui permettent un accès naturel et intuitif à l''information. Les types d''applications les plus significatifs abordés sont : le codage bas débit du signal de parole, la reconnaissance de la parole, la synthèse vocale à partir de texte.
Participants et prérequis
Ingénieurs et techniciens développant ou utilisant des systèmes qui intègrent tous types de facilités vocales : radio-mobiles, messageries et interfaces homme-machine.
Des connaissances de base en traitement du signal numérique sont souhaitables.
Participants et prérequis
Ingénieurs et techniciens développant ou utilisant des systèmes qui intègrent tous types de facilités vocales : radio-mobiles, messageries et interfaces homme-machine.
Des connaissances de base en traitement du signal numérique sont souhaitables.
Responsables
Gaël RICHARD
Professeur au département Traitement du Signal et des Images de Télécom ParisTech dans le domaine du traitement du signal audio. Membre (senior)de l''association scientifique IEEE Transactions on Audio Speech and Language Processing. Expert de la Commission
Européenne dans le domaine des sciences et techniques de l''information.
Ses recherches incluent l''indexation automatique des signaux audios, la spatialisation des sons et le traitement de la parole.
Programme
Intérêt des technologies vocales
· Bases de traitement de parole : production, perception
· Représentation et analyse du signal de parole
· Codage de la parole en bande téléphonique et en bande élargie
· Enjeux, recommandations UIT-T, normes ISO/MPEG4
· Rappels de quelques outils de base en traitement du signal (prédiction linéaire, modélisation autorégressive) et en codage de source (quantification scalaire, quantification vectorielle)
· Exploitation d''un modèle de production, codeurs de type « analyse par la synthèse »
· Principe du codeur CELP. Exemple du codeur UIT-T G.729 à 8 kbit/s
Synthèse de la parole à partir du texte
· Enjeux de la synthèse vocale
· Analyse syntaxique, transcription orthographique/phonétique, calcul de la prosodie
· Synthèse par formants, par concaténation d''unités acoustiques et par sélection d''unités
· Techniques de modification de paramètres prosodiques de la voix
· Applications et produits existants
Reconnaissance de la parole
· Bases de la reconnaissance automatique de parole (analyse, prétraitement, paramétrisation)
· Reconnaissance de mots isolés
· Modèles stochastiques de séquences (Modèles de Markov cachés ou HMM)
· Reconnaissance de grands vocabulaires, modèles d''unités contextuelles, modèles de langage, algorithmes de recherche optimale (Viterbi...)
· Applications
Dialogue et applications vocales
· Serveurs vocaux interactifs
· Notions de langage naturel (NLU)
· Applications vocales, VoiceXML
Synthèse et conclusion
Traitement de la Parole Statut Type Avancé
