13305 – UPF – 2009-2010
Prof. Núria Bel Rafecas
Institut Universitari de Lingüística Aplicada, IULA, Edifici 53 Roc
Boronat, despatx 210
Telf. 93542 – 2307
correu_e: nuria.bel@upf.edu
Pàg. web personal: www.upf.edu/pdi/iula/nuria.bel
Podeu consultar més informació sobre:
Horari de l’assignatura |
||
|
Classe |
divendres 17 a
18:30 |
Aula: 52.325 |
|
Seminari |
dijous 19:35 a 20:30 |
Aula: 54.007 |
|
Tutoria |
hores convingudes |
Despatx IULA |
Programació
|
DIA |
Classe |
lectures |
DIA |
Seminari |
|
2-10 |
1. Introducció a PLN Breu història. Objectius i àmbits d’aplicació |
Jurafsky, D. & J. Martin, Speech
and Natural Language Processing, Prentice Hall, 2000. (cap. 1) http://www.cs.colorado.edu/~martin/SLP/slp-ch1.pdf
N. Bel, Llengua i Societat de
la Informació, Llengua i Ús n. 19, 2000 |
8-10 |
Farem un cop d’ull a algunes DEMOS
: ELIZA, Interfícies i Traducció Automàtica.. EXERCICIS
per lliurar el 14/10 |
|
9-10 |
2. Les paraules (1)
Identificació
d’unitats: els mots. Autòmats i expressions regulars |
Jurafsky, D. & J. Martin, Speech
and Natural Language Processing, Prentice Hall, 2000. (cap. 2) |
15-10
|
Expressions Regulars EXERCICIS
per lliurar el 21/10 Materials pels exercicis: instal.bat
practica_2.zip
|
|
16-10 |
2. Les paraules (2) a. Categories lèxiques i categories funcionals. b. Compostos i
col·locacions. Mesures d’associació lèxica c. Els nombres de les paraules. |
Church, K. i P Hanks. Word association norms, mutual
information and lexicography. En Proceedings of the 27th Annual Meeting of
the ACL, pg. 76-83. (1989) |
22-10 |
EXERCICIS
per lliurar el 28/10 Materials pels exercicis: practica_3.zip |
|
23-10 |
2. Les paraules (3) Morfemes i
Analitzadors morfològics: Transductors
d’estats finits i morfologia de doble nivell. |
Jurafsky, D. & J. Martin, Speech and
Natural Language Processing, Prentice Hall, 2000. Cap. 3. |
29-10 |
Un autòmat per distingir les paraules de les
“no-paraules” EXERCICIS
per lliurar el 4/11 |
|
30-10 |
3. Cadenes de paraules i models de llenguatge Seqüències i models de n-grames Etiquetatge i models de llenguatge |
Brill, E. (1992) A
Simple Rule-Based Part of Speech Tagger,Proceedings
of ANLP-92, 3rd Conference on Applied Natural Language Processing. |
5-11 |
Avaluació de sistemes d’assignació automàtica d’etiquetes de categoria
(‘PoS taggers’)
EXERCICIS
per lliurar el 11/11 |
|
6-11 |
4. Les oracions 4.1. Sintaxi: L’estructura de l’oració Categories, constituents i
funcions. Gramàtiques, regles lliures de
context i arbres: Representació de la informació estructural Analitzadors: algoritmes i tècniques de cerca. CLASSE
6 |
Gazdar,
G. i C. Mellish Natural Language in Prolog, Addison Wesley 1989. pgs.
143-155 |
12-11
|
Gramàtiques d’unificació (1):
Concordança EXERCICIS
per lliurar el 19/11 |
|
13-11 |
4.2. Processament d’informació sintàctica Tractament per a la
concordança. Trets i unificació. Formalismes
d’Unificació. PATR Gramàtiques lliures de context augmentades amb
unificació. |
Shieber, S. (1986), An introduction to Unification-Based approaches
to grammar, CSLI Lecture Notes. [Versión
castellana: Introducción a los formalismos gramaticales de unificación,
Editorial Teide, Barcelona, 1989.] |
19-11 |
Gramàtiques d’unificació (2): |
|
20-11 |
Gramàtiques d’unificació:
Subcategorització CLASSE
8 |
Jurafsky, D. & J. Martin,
Speech and Natural Language Processing, Prentice Hall, 2000. Cap. 12 |
26-11 |
Gramàtiques d’unificació (3):
Subcategorització EXERCICIS
per lliurar el 4/12 |
|
27-11 |
4.3. Anàlisi probabilística amb
gramàtiques lliures de context. Anàlisi probabilística lexicalitzada. |
Jurafsky, D. & J. Martin, Speech and Natural Language Processing,
Prentice Hall, 2000. Cap. 15. |
3-12 |
|
|
4-12 |
Parlarem de l’examen |
|
|
|
·
Els continguts presentats a classe es complementen amb les lectures
auxiliars que consten a la taula de programació. L’alumne ha de fer les
lectures per obtenir comprensió dels detalls i més informació.
·
Pel que fa a les pràctiques, usarem uns 30 minuts de la sessió llarga per
presentar la pràctica i ressaltar els punts més importants. Després
els alumnes hauran de fer la resta d’exercicis de forma individual i
lliurar-los abans de la següent sessió (la dedicació de l’alumne als exercicis
pràctics serà d’aproximadament 2 hores setmanals).
·
Els exercicis s’hauran de lliurar en un fitxer adjunt per correu_e i el
termini és les 23:59 del dia assenyalat. El nom del fitxer ha de ser:
COGNOM_INICIALNOM_[Nombre del exercici].extensió, per exemple:
SERRA_J_practica2.txt
· En cas de dificultats, els
alumnes podran utilitzar l’hora de tutoria del curs per resoldre-les amb el
professor.
· A més a més usarem els 45
minuts de la sessió curta per corregir les pràctiques entre tots, i, en cas
necessari fer seguiment individualitzat.