Master : Spécialité Traitement Automatique des Langues, Dictionnaires, Terminiologies, Corpus
Master
À Villeneuve d'Ascq Cedex
Avez-vous besoin d'un coach de formation?
Il vous aidera à comparer différents cours et à trouver la solution la plus abordable.
Description
-
Typologie
Master
-
Lieu
Villeneuve d'ascq cedex
-
Durée
2 Ans
Les sites et dates disponibles
Lieu
Date de début
Date de début
Les Avis
Le programme
Mster 1
Semestres 1 et 2 - 60 crédits ECTS
TAL et Outillages informatiques
Différents aspects des activités du TAL
- Présentation des secteurs d'activité et des métiers des "industries de la langue".
- Analyse de projets et de produits développés en entreprises (choix théoriques, implications,
alternatives éventuelles).
Algorithmique
- Analyse de tâches à accomplir lors d'un traitement informatique de données linguistiques en
vue de la programmation de ce traitement et rédaction de patrons de programmes.
Programmation pour la linguistique : Perl ou Java (un langage par an, en alternance).
Ressources et outils informatiques pour la linguistique
Outils :
- Constitution de corpus (de données écrites ou d'oral transcrit) structurés en XML.
- Présentation de la Text encoding Initiative.
- Utilisation de la structuration en XML des corpus constitués afin d'extraire des données.
Linguistique
Théories linguistiques : sémantique - syntaxe - morphologie.
Séminaires de linguistique, à choisir dans l'offre de la mention SDL
Spécialisation
En fonction du projet de formation de l'étudiant, choix entre :
Lexicographie : Structure des répertoires lexicaux - Lexicographie bilingue et
d'apprentissage.
Linguistique : Séminaire de linguistique, à choisir dans la mention SDL.
Traitement automatique du japonais : Séminaire du Master études orientales et
extrême-orientales.
Informatique : Enseignement à choisir dans une sélection de ceux de la licence MIASHS ou
du Master Informatique et Document.
Langue vivante
A choisir dans l'offre de l'université
Stage en entreprise ou dans un établissement public
Exécution de missions correspondant aux contenus de formation
Projet de mini-mémoire
Mémoire relatif à une question de TAL, de lexicographie, de terminographie ou
de traitement automatique des corpus
- Première étape : fiches de lecture, plan, rédaction partielle.
- Deuxième étape : rédaction du mémoire et soutenance
Master 2
Semestres 3 et 4 - 60 crédits ECTS
Conditions de production des répertoires lexicaux et gestion des projets éditoriaux
- Lexicologie / lexicographie, terminologie / terminographie Les conditions économiques
de production des dictionnaires
- Typologie des répertoires lexicaux Les composantes et les
techniques d'élaboration d'un projet éditorial.
Structure des répertoires lexicaux
- La structure des ouvrages La structure des nomenclatures La structure d'adressage La
structure d'accès et les dispositifs de fléchage
- La structure des articles.
Lexicographie et terminographie monolingues : rédaction d'articles
- La diversité des modes rédactionnels : rédaction de textes originaux vs déclinaison d'ouvrages
- Le choix des acceptions en fonction des projets rédactionnels Le marquage des variations
sociolinguistiques
- La rédaction des définitions : sens et référence Les principes d'ordonnancement
des acceptions
- Les stratégies de sélection et de rédaction des contextualisations
- La matérialisation typographique de la structure des articles.
Lexicographie bilingue et d'apprentissage
- Quels dictionnaires pour les allophones : bilingues, monolingues, bilingualisés ? Les spécificités
des répertoires bilingues : directionnalité et fonctionnalités
- L'organisation du travail en
lexicographie bilingue
- Principes de structuration et de rédaction des articles Les spécificités
des dictionnaires monolingues pour apprenants : modes rédactionnels et choix du lexique de
description.
Linguistique pour la lexicographie
- Sensibilisation aux démarches des linguistiques empiriques contemporaines, sur un programme
de morphologie, de sémantique ou de syntaxe lexicale.
Les corpus comme ressources documentaires linguistiques et lexicographiques :
principes de constitution et techniques d'exploration
- La diversité des sources documentaires (sources linguistiques vs métalinguistiques, ressources
écrites vs orales, corpus textuels imprimés vs informatisés)
- Problèmes posés par la constitution
de corpus électroniques
- Familiarisation avec les outils existants d'extraction d'informations
en corpus électroniques.
Programmation pour le traitement automatique de corpus
- Éléments d'algorithmique Écriture d'expressions régulières, d'automates et de transducteurs à
des fins de recherches et d'actions en corpus
- Programmation en Awk et en Perl de scripts pour
le dépouillement de corpus à des fins d'exploitation en lexicographie ou en terminographie.
Structuration et balisages informatiques des répertoires lexicaux
- Théorie des balisages de documents : SGML / XML et XSL Pratique du balisage d'articles
de dictionnaires en langages SGML et XML : élaboration de DTD, rédaction d'articles balisés,
post-traitement du texte balisé (CSS, XSL) pour sa mise en forme ou la dérivation d'autres
documents (XML, HTML, PDF)
- Rétroconversion de dictionnaires imprimés.
Bases de données relationnelles pour le stockage d'informations linguistiques
et lexicographiques
- Conception et élaboration de bases de données relationnelles en vue du stockage structuré
de données linguistiques, lexicographiques ou terminographiques.
Stage en entreprise ou dans un établissement public
- Exécution de missions correspondant aux contenus de formation. À effectuer dans une entreprise
privée ou un établissement public développant des produits en rapport avec la
formation LTTAC.
Mémoire de projet professionnel
- Rédaction d'un mémoire développant un projet original en LTTAC.
Avez-vous besoin d'un coach de formation?
Il vous aidera à comparer différents cours et à trouver la solution la plus abordable.
Master : Spécialité Traitement Automatique des Langues, Dictionnaires, Terminiologies, Corpus