Fonaments de Processament del Llenguatge Natural

13305 – UPF – 2009-2010

 

Prof. Núria Bel Rafecas

Institut Universitari de Lingüística Aplicada, IULA, Edifici 53 Roc Boronat, despatx 210

Telf. 93542 – 2307

correu_e: nuria.bel@upf.edu

Pàg. web personal: www.upf.edu/pdi/iula/nuria.bel

 

 

Podeu consultar més informació sobre:

 

Objectius

Temari i bibliografia bàsica

Recursos

Avaluació

Guia Docent

 

 

Horari de l’assignatura

Classe

divendres  17 a 18:30

Aula: 52.325

Seminari

dijous 19:35 a 20:30

Aula:  54.007

Tutoria

hores convingudes

Despatx  IULA

 

 

Programació

 

DIA  

Classe

lectures

DIA

Seminari

2-10

 

1. Introducció a PLN

 

Breu història. Objectius i àmbits d’aplicació

 Lectura

Qüestionari

CLASSE_0

CLASSE_1

 

 

Jurafsky, D. & J. Martin, Speech and Natural Language Processing, Prentice Hall, 2000. (cap. 1)

http://www.cs.colorado.edu/~martin/SLP/slp-ch1.pdf

 

N. Bel, Llengua i Societat de la Informació, Llengua i Ús n. 19, 2000

 

8-10

 

Farem un cop d’ull a algunes DEMOS : ELIZA, Interfícies i Traducció Automàtica..

 

EXERCICIS per lliurar el 14/10

9-10

2. Les paraules (1)

 

Identificació d’unitats: els mots.

 

Autòmats i expressions regulars

 

CLASSE 2

 

Jurafsky, D. & J. Martin, Speech and Natural Language Processing, Prentice Hall, 2000. (cap. 2)

15-10

 

Expressions Regulars

 

EXERCICIS per lliurar el 21/10

 

Materials pels exercicis: instal.bat practica_2.zip

AUTOAVALUACIÓ

 

 

 

 

16-10

 

2. Les paraules (2)

 

a. Categories lèxiques i categories funcionals.

 

b. Compostos i col·locacions.

Mesures d’associació lèxica

 

c. Els nombres de les paraules.

 

CLASSE 3

 

 

Church, K. i P Hanks. Word association norms, mutual information and lexicography. En Proceedings of the 27th Annual Meeting of the ACL, pg. 76-83. (1989)

22-10

 

EXERCICIS per lliurar el 28/10

Materials pels exercicis: practica_3.zip

 

23-10

2. Les paraules (3)

 

Morfemes i Analitzadors morfològics:

 

Transductors d’estats finits i morfologia de doble nivell.

 

CLASSE 4

 

 

Jurafsky, D. & J. Martin, Speech and Natural Language Processing, Prentice Hall, 2000. Cap. 3.

29-10

 

Un autòmat per distingir les paraules de les “no-paraules”

 

EXERCICIS per lliurar el 4/11

 

 

30-10

 

3. Cadenes de paraules i models de llenguatge

 

Seqüències i models de n-grames

Etiquetatge i models de llenguatge

 

CLASSE 5

 

 

Brill, E. (1992) A Simple Rule-Based Part of Speech Tagger,Proceedings of ANLP-92, 3rd Conference on Applied Natural Language Processing.

 

5-11

Avaluació de sistemes d’assignació automàtica d’etiquetes de categoria (‘PoS taggers’)

 

EXERCICIS per lliurar el 11/11

 

 

 

 

6-11

4. Les oracions

4.1. Sintaxi: L’estructura de l’oració

 

Categories, constituents i funcions.

Gramàtiques, regles lliures de context i arbres:  Representació de la informació estructural

Analitzadors: algoritmes i tècniques de cerca.

 

CLASSE 6

 

 

 

Gazdar, G. i C. Mellish Natural Language in Prolog, Addison Wesley 1989. pgs. 143-155

12-11

Gramàtiques d’unificació (1): Concordança

 

EXERCICIS per lliurar el 19/11

13-11

4.2. Processament d’informació sintàctica

 

Tractament per a  la concordança.

 

Trets i unificació. Formalismes d’Unificació.

 

PATR

Gramàtiques lliures de context augmentades amb unificació.

 

CLASSE 7

 

 

 

 

Shieber, S. (1986), An introduction to Unification-Based approaches to grammar, CSLI Lecture Notes. [Versión castellana: Introducción a los formalismos gramaticales de unificación, Editorial Teide, Barcelona, 1989.]

19-11

Gramàtiques d’unificació (2):

 

 

20-11

Gramàtiques d’unificació: Subcategorització

 

 

CLASSE 8

 

 

Jurafsky, D. & J. Martin, Speech and Natural Language Processing, Prentice Hall, 2000. Cap. 12

26-11

 

Gramàtiques d’unificació (3): Subcategorització

 

EXERCICIS per lliurar el 4/12

 

27-11

4.3. Anàlisi probabilística amb gramàtiques lliures de context.

 Anàlisi probabilística lexicalitzada.

 

CLASSE 9

 

Jurafsky, D. & J. Martin, Speech and Natural Language Processing, Prentice Hall, 2000. Cap. 15.

3-12

 

4-12

 

Parlarem de l’examen

 

Exàmens anteriors

Exàmens anteriors

Exàmens anteriors

 

 

 

 

 

 

Treball personal de l’alumne

 

·        Els continguts presentats a classe es complementen amb les lectures auxiliars que consten a la taula de programació. L’alumne ha de fer les lectures per obtenir comprensió dels detalls i més informació.

 

·        Pel que fa a les pràctiques, usarem uns 30 minuts de la sessió llarga per presentar  la pràctica  i ressaltar els punts més importants. Després els alumnes hauran de fer la resta d’exercicis de forma individual i lliurar-los abans de la següent sessió (la dedicació de l’alumne als exercicis pràctics serà d’aproximadament 2 hores setmanals).

 

·        Els exercicis s’hauran de lliurar en un fitxer adjunt per correu_e i el termini és les 23:59 del dia assenyalat. El nom del fitxer ha de ser:

 

            COGNOM_INICIALNOM_[Nombre del exercici].extensió, per exemple:

 

            SERRA_J_practica2.txt

 

·        En cas de dificultats, els alumnes podran utilitzar l’hora de tutoria del curs per resoldre-les amb el professor.

·        A més a més usarem els 45 minuts de la sessió curta per corregir les pràctiques entre tots, i, en cas necessari fer seguiment individualitzat.