Master Européen

"Traitement Automatique des Langues Naturelles"

(Natural Language Processing)

Le premier en Europe



 
 
 

Pays
Université
Responsable
E-mail
Allemagne CIS, Ludwig Maximilian,München S. Langer, F. Guenthner stef@cis.uni-muenchen.de
Espagne Autónoma de Barcelona X. Blanco xavier.blanco@uab.es
France Franche-Comté, Besançon S. Cardey-Greenfield * sylviane.cardey@univ-fcomte.fr
Irlande Dublin City Jennifer Pearson jennifer.pearson@dcu.ie
Italie Ca' Foscari, Venezia R. Delmonte delmont@helios.unive.it
Pologne Uniwersytetu Warszawskiego K. Bogacki bogacki@topaz.irom.uw.edu.p
Portugal Universidade de Lisboa E. Ranchhod elisabet@label.ist.utl.pt

* Coordonnateur responsable

Finalité et objectifs
La formation répond à un besoin de la société en général, besoin de communication en différentes langues et besoin de traiter l'information rapidement. De nombreux métiers nouveaux font appel à la linguistique et plus spécifiquement au traitement automatique des langues. Le traitement des langues par les machines ayant considérablement évolué ces dernières années, l'objectif du Master est d'apporter aux étudiants une formation adaptée à la vie actuelle dans ce domaine pour la recherche et le développement en industrie ou dans les organismes internationaux.

Le traitement automatique des langues et l'ingénierie linguistique
On peut définir le Traitement Automatique des Langues comme l'ensemble des méthodes et techniques d'analyses en vue d'une utilisation et d'un traitement de la langue par les machines. La recherche fondamentale dans ce domaine s'accompagne de la création d'outils pour la recherche elle-même ou en vue d'applications industrielles qui sont nombreuses et diverses :
traduction automatique et assistée, vérification et correction orthographique lexicale et grammaticale, communication homme/machine en langue naturelle, dictionnaires électroniques, grammaires électroniques, langages contrôlés, langages spécialisés, traitement de l'information en général, etc.

Le Master a deux buts essentiels : développer les compétences des étudiants en deux langues étrangères et offrir des formations qui sont complémentaires. Les options et contenus en Traitement Automatique des Langues sont divers : syntaxe, terminologie, sémantique, phonétique, traduction, traitement de l'écrit, traitement de la parole, logique, programmation, informatique, génie logiciel, ingénierie linguistique, psycholinguistique, etc.

Inscription sur dossier
Les étudiants doivent pour s'inscrire avoir réussi leur 3ème année universitaire dans une discipline permettant l'accès au Master Européen en TALN, (des équivalences peuvent être accordées par le jury européen ou du pays d'inscription).

Organisation
Pour les étudiants des Universités partenaires des échanges sont mis en place dans le cadre du programme Socrates. Les étudiants ne faisant pas partie du programme européen Socrates qui choisissent de s'inscrire à Besançon la première année doivent envoyer leur demande pour l'acceptation pédagogique de leur candidature à Besançon (l'acceptation est valable pour les deux années du Master et est donnée avant le début de la première année). Concernant les formalités administratives et financières pour Besançon (voir Master Européen hors programme Socrates). Parallèlement, et avant le début de la première année, ces mêmes étudiants ont à contacter les deux autres Universités choisies pour la deuxième année afin de se renseigner sur les modalités d'inscription administrative. Pour une inscription en première année dans une autre Université partenaire, toujours pour les étudiants hors programme Socrates, les étudiants prennent contact avec cette autre Université pour les formalités pédagogiques (dossier, CV), administratives et financières en sachant que les conditions pédagogiques sont les mêmes pour toutes les Universités partenaires.

Le Master comprend 800 heures (120 ECTS) décomposées en 450 heures (75 ECTS) de cours sur deux ans et 350 heures pour la rédaction d'un travail d'études approfondies et de recherche (45 ECTS) sur deux années également.

Les étudiants suivent deux semestres de formation dans l'une des Universités et deux semestres dans deux des autres Universités partenaires (un semestre dans chacune des deux choisies) soit un total de 4 semestres sur deux ans. Le choix des Universités par l’étudiant se fait en fonction des langues connues par l'étudiant (qui doit avoir des compétences en deux langues étrangères) et en fonction du complément de formation nécessaire ou qu'il désire. En cas de besoin, une formation en langue (avec coût supplémentaire) sera offerte au Centre de Linguistique Appliquée pour notre Université.

Ce Master européen avec mention "assez-bien" donne accès au Doctorat (PhD ou équivalent).

Dans chaque pays la formation est appuyée par une équipe de recherche.

Possibilité de stages courts (trois mois maximum) en entreprise ou dans des laboratoires de recherche dans les différents pays participants.

Les contrôles pour la délivrance des diplômes (crédits) se feront en fonction des modalités établies par chacun des établissements partenaires. Un jury constitué des partenaires responsables aura lieu à la fin de chaque année universitaire. L'étudiant devra obtenir 120 ECTS pour se voir délivrer les diplômes.

Diplôme
Les étudiants reçoivent en fonction des résultats, un ou deux diplômes, un diplôme (reconnu) de l'Université dans laquelle ils ont passé deux semestres, équivalent au diplôme de Master Européen, c'est-à-dire équivalent à 5 années dans le supérieur (il est par exemple en France équivalent à un D.E.A (Diplôme d'Etudes Approfondies) si la mention "assez-bien" minimum est obtenue) et le diplôme de Master Européen en TALN (s'ils ont réussi les épreuves des examens).

Dates

Dépôt des candidatures pour le 15 juin (CV)

Réponse aux candidats le 7 juillet et communication des dossiers d'inscription.

Retour des dossiers d'inscription au plus tard le 30 septembre.

Début des cours en octobre.
 
 

Cours pour la partie Besançon

Tous les cours ont lieu au premier semestre

50 heures de cours sont équivalentes à 9 ECTS

Tous les modules représentent 50 h de cours sauf indication contraire

Les contenus pourront évoluer, voire changer, en fonction des besoins de la discipline et de la demande du jury européen.

Pour la première année

Cours obligatoires (150 h)

Pour la deuxième année

150 h au choix de l'étudiant sauf indication contraire

Contenu des cours de Besançon

Traitement des langues naturelles pour les industries de la langue
La langue en tant que système, description, fonctionnement. Modélisation des connaissances, utilisation des techniques d’analyse permettant la construction de systèmes fonctionnant en reconnaissance et génération.

Les travaux de recherche portent sur différentes langues

Etude de l'apport de la psychologie cognitive et de la psycholinguistique en T.A.L.

Génie logiciel
Apprendre le génie logiciel qui permet la mise en application de systèmes informatiques linguistiques. Modèles de cycle de vie du logiciel ; limites des systèmes informatiques (décidabilité) ; maturation d'un domaine d'application (génie linguistique) ; assurance qualité ; gestion de projets logiciels ; gestion de la configuration ; spécification de besoins ; spécification formelle ; métaprogrammation et langages spécialisés exécutables au moyen de Prolog. Travaux pratiques autour des projets en équipe pour la réalisation des produits de qualité.

Learn Software Engineering in order to implement computer systems applied to the domain of linguistics. Life cycle models; the limits of computing (decidability); how application domains such as linguistic engineering mature; quality assurance, software project management; configuration management; requirements specification; formal specification; metaprogramming and executable specialised languages using Prolog. Practical work centred on team projects involving the implementation of quality products.

Sémantique et dictionnairique
Un système traitant automatiquement des langues naturelles performant comporte nécessairement une ou plusieurs bases de données lexicales (dites également dictionnaires électroniques). Dans ce type particulier de dictionnaire, des informations linguistiques formelles standardisées (de nature morphologique, syntaxique et sémantique) sont rattachées à chaque unité lexicale.
Dans le cadre du cours, nous présenterons les principales analyses formelles du lexique qui ont conduit à l’élaboration de ces dictionnaires électroniques.

T.A.L.N (traitement automatique des langues naturelles)
Méthodes d’analyse et de traitement (théorie et pratique) en morphologie, syntaxe, sémantique et représentation des connaissances en vue de développer des outils de qualité pour le traitement automatique des langues naturelles : traduction assistée par ordinateur, correction automatique, interrogation en langage naturel de banques de données, enseignement assisté par ordinateur... La linguistique traditionnelle et la linguistique pour le T.A.L. La nécessité d'une formalisation implémentable. Les approches actuelles. L'informatique pour le T.A.L.N. : programmation, génie logiciel, outils...

Modélisation cognitive du lexique et de la syntaxe
Etude des approches classiques de l'accès lexical, du lexique mental et de la modélisation de la syntaxe humaine. Limites des dictionnaires et des graphes au profit des logogen models et cohort models. Etude des outils de traitement connexioniste ( analyse et implémentation) : perceptron, back propagation, kohonen… Utilisation de ces technologies pour le traitement des données psycho-linguistiques et linguistiques sur l'Internet.

Übersetzung und Übersetzungswissenschaf : historische, theoretishe und methodologische Schwerpunkte. Ein Teil des Seminars besteht aus praktischen Übungen (Übersetzungen ins Französische, kritische und vergleichende Übersetzungsanalysen.

Linguistics : A linguistic approach to the English language: the study of noun groups, verb groups and complex utterances in discourse. Texts, whether literary or not, will be analysed according to the major linguistic schools in France, basically the theory of enunciation; lexicology, terminology and semantics or lexicology between language and discourse. A linguistic explicative approach of texts will be devoted to the study of the various lexicogenic processes as well as to lexical and textual semantics.

Programa de licenciatura de Lengua Literatura y Civilización españolas : (curso 3°) abierto a los estudiantes del Máster europeo. Traducción (francés-español/español-francés) de textos literarios, clásicos y contemporáneos: curso en francés y español, 2 horas. Gramática historica : curso en francés, 1 hora. Lingüística del español : curso en español y en francés, 1 hora.

Linguistica e traduzione italiane : Questo "certificat" è costituito di quattro ore semestrali che saranno consacrate alla traduzione di testi letterari e di documenti specializzati o settoriali (due ore di traduzione dal francese all'italiano - due ore di traduzione dall'italiano al francese). Verranno tradotti testi tratti dalla letteratura italiana e francese dell'ottocento e del Novecento; documenti economici e commerciali; articoli della stampa settoriale. Questo insegnamento è destinato ad approfonfire e perfezionare le conoscenze lessicali e le strutture grammaticali nei campi linguistici indicati.

Lingüística portuguesa: Estudo comparativo dos aspectos morfossintáctico, lexical, fonético das duas normas linguísticas da língua portuguesa.
 
 

Contenus (intitulés) offerts par les Universités partenaires

Université Autonome de BARCELONE (Responsable Xavier BLANCO ESCODA)

Cours au second semestre

Recherche
Université de BESANCON (Responsable Sylviane CARDEY-GREENFIELD)
Recherche
Université de DUBLIN (Responsable Jennifer PEARSON)
Université de LISBONNE (Responsable Elisabete RANCHHOD)

Premier Semestre (150 h)

Second Semestre (150 h) Domaines de Recherche
Université de MUNICH (Responsable Franz GUENTHNER, co-responsable Stefan LANGER)
Université de VARSOVIE (Responsable Krzysztof BOGACKI)
Université de VENISE (Responsable Rodolfo DELMONTE)
Ricerca in :