Fonaments de Processament del Llenguatge Natural

13305 – UPF - Lingüística

 

Temari

 

Teoria

1.   Introducció.

 

·        Breu història del Processament del Llenguatge Natural.

·        Objectius i àmbits d’aplicació del PLN

2.   Les paraules

 

·        Identificació d’unitats: els mots. Autòmats i Expressions Regulars.

·        Categories lèxiques i categories funcionals. Propietats estadístiques, morfològiques i semàntica lèxica

·        Compostos i col·locacions. Mesures d’associació lèxica.

·        Morfemes i analitzadors morfològics. Transductors d’estats finits i morfologia de doble nivell

 

3.   Cadenes de paraules i Models de llenguatge

 

·        Seqüències i models de n-grames.

·        Etiquetatge i Models de llenguatge. Categories, etiquetes, desambiguació basada en regles, estocàstica i Cadenes de Markov.

 

4.   Les oracions

 

·        Sintaxi: L’estructura de l’oració

x    Categories, constituents i funcions.

x    Gramàtiques, regles lliures de context i arbres.

x    Analitzadors: algoritmes i tècniques de cerca.

 

·        Processament d’informació sintàctica.

x    Concordança. Coordinació. Subcategorització.

x    Trets i unificació. Formalismes d’Unificació.

x    Gramàtiques lliures de context augmentades amb unificació.

 

·        Anàlisi sintàctica probabilística amb gramàtiques lliures de context. Anàlisi probabilística lexicalitzada.

 

·        Semàntica: El significat de les oracions

x    Principi de composicionalitat i lògica de primer ordre.

x    Predicats i arguments. Papers temàtics. Restriccions de selecció

x    Representació de la informació semàntica.

x    Informació semàntica a les gramàtiques d’unificació.

 

 

Pràctiques

 

  1. Fonaments de processament: expressions regulars i autòmats
  2. Dades estadístiques del llenguatge: anàlisi de corpus
  3. Morfologia computacional: el model de doble nivell
  4. Anàlisi sintàctica i analitzadors: gramàtiques lliures de context i formalismes d’unificació (DCG en PROLOG, PATR)

 

 

Bibliografia bàsica

 

Allen, J. 1995, Natural Language Understanding (second edition), Benjamin Cummins Publishing.

 

Dale, R., H. Moisl, H. Somers, 2000, Handbook of Natural Language Processing, Marcel Dekker, Inc., New York.

 

Gazdar G. y Ch. Mellish, 1989, Natural Language Processing in Prolog, Adison Wesley

 

Jurafsky, D. & J. Martin, 2000, Speech and Language Processing, Prentice Hall

 

            Els autors mantenen una pàgina web del llibre: http://www.cs.colorado.edu/~martin/slp.html

 

Bibliografia de suport de lingüística

 

Lyons, J. 1968, Introduction to theoretical linguistics, Cambridge University Press, Londres. [Versión española, Introducción en la lingüística teórica, Ed. Teide, Barcelona 1979]