Master Européen
"Traitement Automatique des Langues Naturelles"
(Natural Language Processing)
Le premier en Europe
|
|
|
|
Allemagne | CIS, Ludwig Maximilian,München | S. Langer, F. Guenthner | stef@cis.uni-muenchen.de |
Espagne | Autónoma de Barcelona | X. Blanco | xavier.blanco@uab.es |
France | Franche-Comté, Besançon | S. Cardey-Greenfield * | sylviane.cardey@univ-fcomte.fr |
Irlande | Dublin City | Jennifer Pearson | jennifer.pearson@dcu.ie |
Italie | Ca' Foscari, Venezia | R. Delmonte | delmont@helios.unive.it |
Pologne | Uniwersytetu Warszawskiego | K. Bogacki | bogacki@topaz.irom.uw.edu.p |
Portugal | Universidade de Lisboa | E. Ranchhod | elisabet@label.ist.utl.pt |
* Coordonnateur responsable
Finalité et objectifs
La formation répond à un besoin de la société
en général, besoin de communication en différentes
langues et besoin de traiter l'information rapidement. De nombreux
métiers nouveaux font appel à la linguistique et plus spécifiquement
au traitement automatique des langues. Le traitement des langues par les
machines ayant considérablement évolué ces dernières
années, l'objectif du Master est d'apporter aux étudiants
une formation adaptée à la vie actuelle dans ce domaine pour
la recherche et le développement en industrie ou dans les organismes
internationaux.
Le traitement automatique des langues et l'ingénierie
linguistique
On peut définir le Traitement Automatique des Langues comme
l'ensemble des méthodes et techniques d'analyses en vue d'une utilisation
et d'un traitement de la langue par les machines. La recherche fondamentale
dans ce domaine s'accompagne de la création d'outils pour la recherche
elle-même ou en vue d'applications industrielles qui sont nombreuses
et diverses :
traduction automatique et assistée, vérification et correction
orthographique lexicale et grammaticale, communication homme/machine en
langue naturelle, dictionnaires électroniques, grammaires électroniques,
langages contrôlés, langages spécialisés, traitement
de l'information en général, etc.
Le Master a deux buts essentiels : développer les compétences des étudiants en deux langues étrangères et offrir des formations qui sont complémentaires. Les options et contenus en Traitement Automatique des Langues sont divers : syntaxe, terminologie, sémantique, phonétique, traduction, traitement de l'écrit, traitement de la parole, logique, programmation, informatique, génie logiciel, ingénierie linguistique, psycholinguistique, etc.
Inscription sur dossier
Les étudiants doivent pour s'inscrire avoir réussi leur
3ème année universitaire dans une discipline permettant l'accès
au Master Européen en TALN, (des équivalences peuvent être
accordées par le jury européen ou du pays d'inscription).
Organisation
Pour les étudiants des Universités partenaires des échanges
sont mis en place dans le cadre du programme Socrates. Les étudiants
ne faisant pas partie du programme européen Socrates qui choisissent
de s'inscrire à Besançon la première année
doivent envoyer leur demande pour l'acceptation pédagogique de leur
candidature à Besançon (l'acceptation est valable pour les
deux années du Master et est donnée avant le début
de la première année). Concernant les formalités administratives
et financières pour Besançon (voir Master Européen
hors programme Socrates). Parallèlement, et avant le début
de la première année, ces mêmes étudiants ont
à contacter les deux autres Universités choisies pour la
deuxième année afin de se renseigner sur les modalités
d'inscription administrative. Pour une inscription en première année
dans une autre Université partenaire, toujours pour les étudiants
hors programme Socrates, les étudiants prennent contact avec cette
autre Université pour les formalités pédagogiques
(dossier, CV), administratives et financières en sachant que les
conditions pédagogiques sont les mêmes pour toutes les Universités
partenaires.
Le Master comprend 800 heures (120 ECTS) décomposées en 450 heures (75 ECTS) de cours sur deux ans et 350 heures pour la rédaction d'un travail d'études approfondies et de recherche (45 ECTS) sur deux années également.
Les étudiants suivent deux semestres de formation dans l'une des Universités et deux semestres dans deux des autres Universités partenaires (un semestre dans chacune des deux choisies) soit un total de 4 semestres sur deux ans. Le choix des Universités par l’étudiant se fait en fonction des langues connues par l'étudiant (qui doit avoir des compétences en deux langues étrangères) et en fonction du complément de formation nécessaire ou qu'il désire. En cas de besoin, une formation en langue (avec coût supplémentaire) sera offerte au Centre de Linguistique Appliquée pour notre Université.
Ce Master européen avec mention "assez-bien" donne accès au Doctorat (PhD ou équivalent).
Dans chaque pays la formation est appuyée par une équipe de recherche.
Possibilité de stages courts (trois mois maximum) en entreprise ou dans des laboratoires de recherche dans les différents pays participants.
Les contrôles pour la délivrance des diplômes (crédits) se feront en fonction des modalités établies par chacun des établissements partenaires. Un jury constitué des partenaires responsables aura lieu à la fin de chaque année universitaire. L'étudiant devra obtenir 120 ECTS pour se voir délivrer les diplômes.
Diplôme
Les étudiants reçoivent en fonction des résultats,
un ou deux diplômes, un diplôme (reconnu) de l'Université
dans laquelle ils ont passé deux semestres, équivalent au
diplôme de Master Européen, c'est-à-dire équivalent
à 5 années dans le supérieur (il est par exemple en
France équivalent à un D.E.A (Diplôme d'Etudes
Approfondies)
si la mention "assez-bien" minimum est obtenue) et le diplôme de
Master Européen en TALN (s'ils ont réussi les épreuves
des examens).
Dates
Dépôt des candidatures pour le 15 juin (CV)
Réponse aux candidats le 7 juillet et communication des dossiers d'inscription.
Retour des dossiers d'inscription au plus tard le 30 septembre.
Début des cours en octobre.
Cours pour la partie Besançon
Tous les cours ont lieu au premier semestre
50 heures de cours sont équivalentes à 9 ECTS
Tous les modules représentent 50 h de cours sauf indication contraire
Les contenus pourront évoluer, voire changer, en fonction des besoins de la discipline et de la demande du jury européen.
Pour la première année
Cours obligatoires (150 h)
150 h au choix de l'étudiant sauf indication contraire
Traitement des langues naturelles pour les industries de la langue
La langue en tant que système, description, fonctionnement.
Modélisation des connaissances, utilisation des techniques d’analyse
permettant la construction de systèmes fonctionnant en reconnaissance
et génération.
Etude de l'apport de la psychologie cognitive et de la psycholinguistique en T.A.L.
Learn Software Engineering in order to implement computer systems applied to the domain of linguistics. Life cycle models; the limits of computing (decidability); how application domains such as linguistic engineering mature; quality assurance, software project management; configuration management; requirements specification; formal specification; metaprogramming and executable specialised languages using Prolog. Practical work centred on team projects involving the implementation of quality products.
Sémantique et dictionnairique
Un système traitant automatiquement des langues naturelles performant
comporte nécessairement une ou plusieurs bases de données
lexicales (dites également dictionnaires électroniques).
Dans ce type particulier de dictionnaire, des informations linguistiques
formelles standardisées (de nature morphologique, syntaxique et
sémantique) sont rattachées à chaque unité
lexicale.
Dans le cadre du cours, nous présenterons les principales analyses
formelles du lexique qui ont conduit à l’élaboration de ces
dictionnaires électroniques.
T.A.L.N (traitement automatique des langues naturelles)
Méthodes d’analyse et de traitement (théorie et pratique)
en morphologie, syntaxe, sémantique et représentation des
connaissances en vue de développer des outils de qualité
pour le traitement automatique des langues naturelles : traduction assistée
par ordinateur, correction automatique, interrogation en langage naturel
de banques de données, enseignement assisté par ordinateur...
La linguistique traditionnelle et la linguistique pour le T.A.L. La nécessité
d'une formalisation implémentable. Les approches actuelles. L'informatique
pour le T.A.L.N. : programmation, génie logiciel, outils...
Modélisation cognitive du lexique et de la syntaxe
Etude des approches classiques de l'accès lexical, du lexique
mental et de la modélisation de la syntaxe humaine. Limites des
dictionnaires et des graphes au profit des logogen models et cohort models.
Etude des outils de traitement connexioniste ( analyse et implémentation)
: perceptron, back propagation, kohonen… Utilisation de ces technologies
pour le traitement des données psycho-linguistiques et linguistiques
sur l'Internet.
Übersetzung und Übersetzungswissenschaf : historische, theoretishe und methodologische Schwerpunkte. Ein Teil des Seminars besteht aus praktischen Übungen (Übersetzungen ins Französische, kritische und vergleichende Übersetzungsanalysen.
Linguistics : A linguistic approach to the English language: the study of noun groups, verb groups and complex utterances in discourse. Texts, whether literary or not, will be analysed according to the major linguistic schools in France, basically the theory of enunciation; lexicology, terminology and semantics or lexicology between language and discourse. A linguistic explicative approach of texts will be devoted to the study of the various lexicogenic processes as well as to lexical and textual semantics.
Programa de licenciatura de Lengua Literatura y Civilización españolas : (curso 3°) abierto a los estudiantes del Máster europeo. Traducción (francés-español/español-francés) de textos literarios, clásicos y contemporáneos: curso en francés y español, 2 horas. Gramática historica : curso en francés, 1 hora. Lingüística del español : curso en español y en francés, 1 hora.
Linguistica e traduzione italiane : Questo "certificat" è costituito di quattro ore semestrali che saranno consacrate alla traduzione di testi letterari e di documenti specializzati o settoriali (due ore di traduzione dal francese all'italiano - due ore di traduzione dall'italiano al francese). Verranno tradotti testi tratti dalla letteratura italiana e francese dell'ottocento e del Novecento; documenti economici e commerciali; articoli della stampa settoriale. Questo insegnamento è destinato ad approfonfire e perfezionare le conoscenze lessicali e le strutture grammaticali nei campi linguistici indicati.
Lingüística portuguesa: Estudo comparativo dos aspectos
morfossintáctico, lexical, fonético das duas normas linguísticas
da língua portuguesa.
Contenus (intitulés) offerts par les Universités partenaires
Université Autonome de BARCELONE (Responsable Xavier BLANCO ESCODA)
Cours au second semestre
Premier Semestre (150 h)