Curs 2015-16

Aplicacions Intel·ligents per a la Web

Titulació: Codi: Tipus:
Grau en Enginyeria Informàtica 21449 Optativa
Grau en Enginyeria Telemàtica 22623 Optativa
Grau en Enginyeria en Sistemes Audiovisuals 21635 Optativa

 

Crèdits ECTS: 4 Dedicació: 100 hores Trimestre: 1r

 

Departament: Dept. de Tecnologies de la Informació i les Comunicacions
Coordinador: Horacio Saggion
Professorat:

Horacio Saggion, Francesco Barbieri

Idioma:

Castellà i anglès (la majoria dels temes es faràn en castellà a excepció dels que es detallen més avall)

Extracció d'informació (en anglès - material i explicació)

Resum automàtic (en anglès - material i explicació)

Mineria d'opinions (en anglès - material i explicació)

Horari:
Campus: Campus de la Comunicació - Poblenou

 

Presentació de l'assignatura

 

En aquesta assignatura s'estudiaran tècniques i algoritmes per al desenvolupament d'aplicacions intel·ligents per a la Web.

S'estudiaran algorismes tant supervisats com no supervisats per al tractament de dades de la Web i s'analitzaran els avantatges i desavantatges dels mètodes presentats.

Així mateix s'estudiaran aplicacions com l'extracció d'informació, la mineria de textos i opinions, i el resum automàtic.

També s'inclouran tòpics com el processament d'informació en xarxes socials (Twitter), els repositoris semàntics i el “linked data”.

Es requereix coneixement d'algorismes i estructures de dades i lògica per a computació. Es requereixen coneixements de programació Java per al desenvolupament de les pràctiques y seminaris.

 

Prerequisits

Coneixements de Java, aprenentatge automàtic (desitjable), processament de llenguatge natural (desitjable).

 

Competències

Competències transversalsCompetències específiques

Instrumentals

G1. Capacitat d'anàlisi i síntesi

G2. Capacitat d'organització i
planificació

G3. Capacitat per aplicar els coneixements a l'anàlisi de situacions i la resolució de problemes

G4. Habilitat en la cerca i la gestió de la informació

G5. Habilitat en la presa de
decisions

G6. Capacitat de comunicar-se amb propietat de forma oral i
escrita en català i en castellà, tant davant audiències expertes com
a inexpertes.

Interpersonals

G8. Capacitat de treball en equip

Sistèmiques

G11. Capacitat d'aplicar amb flexibilitat i creativitat els coneixements adquirits i d'adaptar-los a contextos i situacions noves

G12. Capacitat per progressar en els processos de formació i
aprenentatge de manera
autònoma i contínua

G14. Capacitat de motivació per tecnologies 
la qualitat i per l'assoliment

G15. Capacitat de generació de noves idees

Competències Específiques Professionals

H1. Capacitat de concebre i dur a terme projectes informàtics utilitzant els
principis i metodologies propis de l'enginyeria.

Competències Específiques de Formació Bàsica

B16-A. Conèixer els fonaments teòrics
de la programació i utilitzar de forma pràctica els mètodes i llenguatges de
programació per al desenvolupament
de sistemes programari.

Competències Específiques d'Enginyeria en Informàtica

IN16. Conèixer el funcionament de les
xarxes de dades en general i d'Internet en particular.

IN7. Conèixer les estructures de dades
bàsiques i els tipus abstractes de dades,
les seves aplicacions i propietats, i ser capaç de determinar les més adequades per a cada situació.

Competències Específiques Comunes a la branca de Telecomunicació

T1. Capacitat d'aprendre de manera autònoma nous coneixements i tècniques adequats per a la
concepció, el desenvolupament o
l'explotació de sistemes i serveis de telecomunicació.

Competències de tecnologia específica:
Enginyeria Telemàtica

TE3. Capacitat de construir, explotar i
gestionar serveis telemàtics, incloent
internet, web, disseny arquitectònic (dades i protocols), enginyeria i
tecnologies programari, etc

Competències de tecnologia específica:
Sistemes Audiovisuals

AU15. Adquirir els coneixements bàsics
sobre l'anàlisi de dades, estudiant les
seves regularitats, tècniques de
predicció i algorismes de classificació.

AU36. Dominar els formalismes principals de la representació del contingut en la web i capacitat per implementar fragments del coneixement d'un domini en aquests
formalismes.

AU37. Conèixer les tècniques bàsiques
de la mineria de dades i textos en la web i capacitat per aplicar-les per a problemes concrets.

AU38. Dominar les tècniques del resum
automàtic multilingüe de la informació
textual en la web en la teoria i en la
pràctica.

AU39. Domini de les tècniques avançades
de la cerca intel·ligent d'informació a la web

 

Avaluació

Teòriques:


Treballs teòrics (durant el curs): 20% de la nota final. Aquests treballs teòrics no es recuperen. 80% (aprox) dels treballs hauran d'estar lliurats.



Pràctiques:

   Pràctica 1 (dues sessions), 20% de la nota fina .

  Pràctica 2 (dues sessions), 20% de la nota final.

  Pràctica 3 (una sessió), 20% de la nota final.

Cal obtenir almenys 40% de la nota en cadascuna de les pràctiques per aprovar el curs.

Al final del curs es realitzarà una entrevista amb el grup de pràctiques per determinar el grau de participació

i coneixements adquirits en el desenvolupament de cada pràctica. Això permetrà avaluar individualment a cada participant iajustar la nota de manera apropiada.


NOTA: En cas que en una i només una de les pràctiques s'obtingui menys d'un 40% de la nota es donarà a l'estudiant la possibilitat d'aixecar la nota durant una sessió pràctica. Les pràctiques no poden recuperar-se en l'anomenat de juliol.


Seminaris:

20% de la nota final. Es realitzaran lliuraments individuals en cada un dels seminaris.

A cada seminari s'haurà d'obtenir almenys un 40% de la nota. Els seminaris no es poden recuperar.

 

Continguts

Bloc I: Manipulaciód'informacióen basesde dades textual si la Web.

    - Introducció a les aplicacions intel·ligents del web
    - Algorismes per a la classificació de textos
    - Algorismes d'agrupació ("clustering") de documents

Bloc II: Aplicacions amb informacions textuals.

    - Extracció d'informació
    - Resum automàtic
    - Mineria d'opinions

Bloc III: Tòpics avançats

   
     - Repositoris semàntics, “linked-data"

     - anàlisis de textos de xarxas socials

 

 

Metodologia

L'assignatura té classes teòriques, seminaris i laboratoris (pràctiques). Cada classe teòrica està aparellada amb una sessió de seminari o de pràctica.

Els professors presentaran les bases teòriques exposant els continguts preparats a partir de la bibliografia suggerida i d'articles científics pertinents. Els alumnes han de complementar els conceptes impartits amb lectures suggerides pels professors. Durant alguna de les teòriques es lliurarà un exercici de caràcter teòric perquè els estudiants els desenvolupin i lliurin per a la seva avaluació.

L'assignatura té quatre sessions de seminari, on se seguiran tutorials dirigits perquè els estudiants pugui preparar-se per

resoldre la pràctica que es donarà a la setmana següent o bé seminaris on es desenvolupa un

tema vist a la teòrica. A cada seminari es lliurarà el desenvolupament d'una o diverses tasques.

 

L'assignatura té cinc sessions de pràctiques, en les quals es desenvoluparan 3 pràctiques que es podran fer en grups de dues persones.

Cadascuna d'aquestes tres pràctiques compte en la nota final de l' assignatura. Per a les pràctiques s'utilitzaran eines (software) i dades lliures.

 

 

 

 Activitats a l'aulaActivitats fora de l'aula
TemesGrup granGrup mitjàGrup petit 

Bloc I

6

0

2

24

Bloc II 8 6 6 30

Bloc III

4

4

0

24

Examen 

 

 

 

 

Total:

18

10

8

68

Total: 104

 

Recursos

Bibliografia bàsica :

Manning, C.D. Prabhakar Raghavan, Hinrich Schütze. Introduction to information retrieval. New York: Cambridge University Press, 2008

Haralambos Marmanis and Dmitry Babenko. Algorithms of the intelligent web. Manning Publications, 2009.

Seguessin, programming collective intelligence: building smart web 2.0 applications. O'Reilly, 2007.

 

Bibliografia complementària

Ethem Alpaydin. 2010. Introduction to Machine Learning . Second Edition . MIT Press .

Baeza- Yates, R. Thier Rierol - Net. Modern information retrieval. Reading, Mass: Addison - Wesley Longman, 1999

Bramer, M. Principles of Data Mining. Springer. 2007.

GATE user guide. Disponible en http://gate.ac.uk/sale/tao/split.html

Grigoris Antoniou and Frank van Harmelen. A Semantic Web primer. The MIT Press, 2008.

Jurafsky, Dan & Martin, James. Speech and language processing: an introduction to natural language processing, computational linguistics, and speech recognition, Upper Saddle River, NJ.: Pearson Prentice Hall, 2009

Mani, Inderjeet. Automatic Summarization. John Benjamins Publishing Company. 2001.

Manning, C.D. Prabhakar Raghavan , Hinrich Schütze . Introduction to information retrieval . New York: Cambridge University Press , 2008

Manning , Christopher D. & Schutze, H. Foundations of statistical natural language processing Cambridge, Mass: MIT Press, 1999

Mitchell, Tom M. Machine learning. New York: McGraw - Hill, 1997.

Mitchell, Tom (2005) Generative and Discriminative Classifiers: Naive Bayes and Logistic Regression. Supplementary chapter for Mitchell, Tom (1997) Machine Learning. McGraw - Hill.

Pang, B. and Lillian Lee. Opinió mining and sentiment analysis. Foundations and Trends in Information Retrieval 2 (1-2), 2008.

Pazienza. MT. Information extraction: a multidisciplinary approach to an emerging information technology. Springer, 1997.

Ian H. Witten, Eibe Frank. Data mining: practical machine learning tools and techniques. Morgan Kaufman, 2005.

 

Altres recursos

Articles científics seran posats a disposició dels alumnes a través de l'aula global. Software.