Curs 2015-16

Aprenentatge Automàtic i Mineria de Dades

Titulació: Codi: Tipus:
Grau en Enginyeria Informàtica 21448 Optativa
Grau en Enginyeria Telemàtica 22622 Optativa
Grau en Enginyeria en Sistemes Audiovisuals 22685 Optativa

 

Crèdits ECTS: 4 Dedicació: 100 hores Trimestre: 3r

 

Departament: Dept. de Tecnologies de la Informació i les Comunicacions
Coordinador: Rafael Ramírez
Professorat:

Rafael Ramírez, Sergio Giraldo

Idioma:

anglès (materials, teoria), castellà (laboratoris i seminaris)

Horari:
Campus: Campus de la Comunicació - Poblenou

 

Presentació de l'assignatura

L'assignatura Aprenentatge Automàtic i Mineria de Dades és una assignatura optativa que s'ofereix durant el curs d'enginyeria en informàtica, audiovisual, telemàtica i biomèdica. L'assignatura té un component teòric i altre pràctic. Dintre del component teòric l'èmfasi esta en la comprensió dels conceptes a nivell intuïtiu mes que en la utilització estricta de llenguatge matemàtic.

L'assignatura esta composta de tres activitades principals: classes de teoria, seminaris i laboratoris. En les classes de teoria s'introduïxen els conceptes formals i matemàtics i es mostren exemples de la seva aplicació. En els seminaris els alumnes resolen petits problemes. Cada problema correspon a un dels conceptes introduïts en classe de teoria. En els laboratoris es presentin problemes de més complexitat i de caràcter més computacional perquè els alumnes tinguin l'oportunitat de posar en pràctica els conceptes apresos.

 

Prerequisits

Els coneixements previs per al seguiment de l'assignatura són nocions de matemàtiques bàsiques adquirides els primers dos cursos dels estudis. En particular, els coneixements previs requerits per a l'assignatura són:


Aquesta assignatura és assumeix l'assimilació dels conceptes bàsicos apresos en Algebra lineal, així com en calcul.

 

Competències

L'objectiu fonamental de l'assignatura és que els alumnes adquireixin els aspectes fonamentals relacionats amb la teoria i aplicació dels principals algoritmes d'aprenentatge automàtic i mineria de dades.

Més concretament, es pretén aconseguir que els alumnes desenvolupin la capacitat d'especificar problemes de aprenentatge automàtic, i implementar solucions per problemes practics. Així mateix, els estudiants haurien de desenvolupar competències per a entendre els propietats dels diferents algoritmes i identificar el millor algoritme en diferents problemàtiques.

 

Competències transversalsCompetències específiques
 

Instrumentals

1. Capacitat de raonar a nivell abstracte
2. Habilitats cognitives
3. Sentit comú

Interpersonals

4. Competència de comunicació

Sistèmiques

5. Capacitat d'identificar la millor metodologia per resoldre un problema.
6. Capacitat de solucionar problemes combinant de manera nova i no trivial elements ja coneguts
7. Capacitat de generar idees

 

1. Capacitat d'entendre a nivell intuïtiu i formal els diferents aspectes en algebra, calcul i algoritmes.

2. Capacitat d'aplicar els coneixements de algoritmes de aprenentatge automàtic en contextos pràctics.

3. Capacitat d'entendre les diferencies entre diversos algoritmes de aprenentage automatic a nivel teoric i sobre tot a nivel practic.

 

Avaluació

En l’avaluació continuada es té en compte cada una de les tres activitats que constitueixen l’assignatura: classes de teoria, laboratoris i seminaris:

Activitat

Avaluació

Recuperable?

Teoria

Avaluació mitjançant un examen final

Si

Laboratoris

Avaluació amb les pràctiques de programació (LP) i examen final de practiques (LE)

LP: No

LE: Si

Seminaris

Avaluació mitjançant resolució d'exercicis de seminari

No

 

T: l’avaluació de la teoria mitjançant un examen final (recuperable al juliol)

L: l’avaluació del laboratoris amb les pràctiques de programació (no recuperable) i examen final de practiques (recuperable al juliol).

S: l’avaluació dels seminaris (no recuperable)

 

En l’avaluació, cal aprovar cada una de les tres activitats per separat i la nota final s’obté fent la mitjana ponderada de la següent forma:

Nota Final = 0,6 * T + 0,3 * L + 0,1 * S

L’examen de teoria es realitzarà sobre els continguts desenvolupats a classe de teoria i als seminaris. És un examen escrit i individual que avalua totes les competències desenvolupades al llarg de l’assignatura. Aquesta avaluació és obligatòria i ha de ser qualificada amb com a mínim un 50% per tal de aprovar l’assignatura.

En els laboratoris es realitzen un sèrie de pràctiques que posen a prova la capacitat dels alumnes de aplicar la teoria en forma de programes en un ordinador. Les pràctiques es realitzen en parella, de manera que els alumnes hagin de cooperar i saber comunicar-se per resoldre els problemes. L’avaluació de les pràctiques també és obligatòria es qualificada en 2 parts: una evaluació continuada al llarg del trimestre en forma de entrega de programas de ordenador (LP), i l’altra com una part del examen final de l’assignatura dedicada a temes de pràctiques (LE). Cada una de les partes han de ser qualificadas com a mínim amb un 50% per aprovar l’assignatura.  La nota L correspondent a la nota de pràctiques s’obté fent la mitjana ponderada de la següent forma:

L = 0,6 * LP + 0,4 * LE

Els detalls dels terminis de lliurament de les pràctiques al llarg del trimestre i de les penalitzacions per retard en el seu lliurament serà publicada al campus global de l'assignatura.

Abans de cada seminari es presentaran problemes als alumnes per tal que ells els resolguin en equips de tres o quatre abans de la sessió, com a una preparació prèvia al seminari. Aquests problemes corresponen a conceptes o coneixements tractats a classe de teoria. Els alumnes tendrán tiempo para finalizar sus respuestas a los problemas al començament del seminari, después de lo cual pasarán aleatoriamente a pesentar les seves solucions a la pissarra. En l’avaluació es tindrà en compte la preparació del seminari, la presentació de la solució proposta, i l’aprofitament del seminari. L’avaluació del treball dels seminaris és obligatòria.

En cas de no aprovar l’assignatura en l’avaluació exposada en els punts anteriors, l’alumne té dret a una convocatòria en el mes de juliol. En la convocatòria de juliol solament serà possible recuperar la part de l'examen de teoria i la part de l'examen final de pràctiques. És a dir, la part de pràctiques de programació i la part de seminaris no són recuperables en la convocatòria de juliol. La nota d’aquesta convocatòria s’obtindrà de la mateixa manera que la nota de la convocatòria ordinària explicada anteriorment.

 

Concreció per competències:

Competències a assolir en l'assignaturaIndicador d'assolimentProcediment d'avaluacióTemporalització

Competències generals

1. Capacitat de raonar a nivell abstracte

2. Habilitats cognitives

3. Sentit comú

4. Competència de comunicació

5. Capacitat d'identificar la millor metodologia per resoldre un problema.

6. Capacitat de solucionar problemes combinant de manera nova i no trivial elements ja coneguts

7. Capacitat de generar idees

 

 

 

Competències específiques

1. Capacitat d'entendre a nivell intuïtiu i formal els diferents aspectes dels algoritmes d’aprenentage automatic I mineria de dades.


2. Capacitat de construir attributos para caracterizar instancias en problemas concretos.

3. Capacitat d'entendre i aplicar algorismes de selecció de atributs en contextos práctics.

 

4. Capacitat d'aplicar els diferents models/algoritmes de aprenentatge automatic supervisats I no supervisats i d'identificar el millor algoritme en diferents problemàtiques.

 

 

1. Capacitat de solucionar problemas abstractes

2. Capacitat de propasar solucions a problemes

3. Capacitat de propasar solucions a problemes

4. Solucions coherents i ben escrits a les pràctiques i seminaris

5. Solucions coherents a les pràctiques i seminaris

6. Solucions coherents a les pràctiques i seminaris

7. Solucions enginyoses a problemes presentats

 

 

1. Capacitat d'entendre pseudocódigo i expressions matemàtiques relacionades amb els algoritmes de aprenentatge automàtic i mineria de dades.

2. Capacitat d'especificar atributos representatives en problemes de classificación y regression en contextos pràctics.

3. Capacitat d'entendre i aplicar filters i wrappers para seleccionar atributos para problemes de classificación y regresión.

4. Capacitat de entender las diferencias entre algoritmes tales como SVM, ANN, Decision trees, k-NN, algoritmes evolutives, inductive logic programming, k-means clustering.

 

1. Avaluació de pràctiques, seminaris i de l’examen final

2. Avaluació de pràctiques, seminaris i de l’examen final

3. Avaluació de pràctiques, seminaris i de l’examen final

4. Avaluació de pràctiques i seminaris

5. Avaluació de pràctiques i seminaris

6. Avaluació de pràctiques, seminaris i de l’examen final

7. Avaluació de pràctiques, seminaris i de l’examen final

 

 

 

1. Avaluació de seminaris i de l’examen final

2. Avaluació de pràctiques, seminaris i de l’examen final

3. Avaluació de pràctiques, seminaris i de l’examen final

4. Avaluació de pràctiques, seminaris i de l’examen final

 

1. Tot el trimestre

2. Tot el trimestre

3. Tot el trimestre

4. Tot el trimestre

5. Tot el trimestre

6. Tot el trimestre

7. Tot el trimestre

 

 

 

 

 

 

1. Tot el trimestre

2. Tot el trimestre

3. Tot el trimestre

4. Tot el trimestre

 

Continguts

Bloc de contingut 1. Introducció a ML&DM, aprenentatge supervisat i no supervisat, regressió lineal, regressió logística, overfitting, model evaluation

Bloc de contingut 2. Decision trees, multilayer peceptron, suport vector machines, k-nearest neighbor, evolutionary algorithms, clustering

Bloc de contingut 3. Feature selection, practical machine learning, big data.

 

 

Bloc de contingut 1. Sintaxi, semàntica i verificació formal de programes:

Conceptes

Procediments

Actituds

1. inductive learning, supervised/unsupervised learning

2. overfitting, model evaluation

3. Regressió lineal, regressió logística

1. Entendre els conceptes de aprenentatge supervisat i no supervisat,

2. Entendre el concepte de overfitting i les diferents mesures d’evaluació per models induïts.

3. Poder implementar i aplicar les algorismes de regressió lineal y regressió logística para problemes de regressió y classificació

1. Apreciar els diferents tipus d’aprenentatge y les differents problematiques a les que se aplica

2. Disponibilitat a intentar entendre conceptes que inicialment semblen complexos.

 

 

 

 

Bloc de contingut 2. Compilació de programes:

Conceptes

Procediments

Actituds

1. Decision trees, multilayer peceptron, suport vector machines, k-nearest neighbor, evolutionary algorithms, clustering

1. Descriure el procés d'execució de diferents algorismes de aprenentatge automàtic

2. Elegir i aplicar diferents algorismes de aprenentatge automàtic en problemàtiques reals.

 

 

1. Disponibilitat a intentar entendre conceptes que
inicialment semblen

complexos.

2. Predisposició a adquirir coneixement sòlid de base

 

 

Bloc de contingut 3. Paradigmas de programació

Conceptes

Procediments

Actituds

1. Feature selection, practical machine learning, big data

 

 

1. Aplicar techniques d’aprenentatge automàtic  en problemàtiques reals.

2. Diferenciar entre els diferents mecanismes disponibles en aprenentatge automàtic, las seves avantatges i disavantatges

3. Analitzar els models entrenados i identificar mesures per optimitzar els resultats 

1. Disponibilitat a intentar entendre conceptes que inicialment semblen complexos.

2. Predisposició a
adquirir coneixement sòlid de base

3. Disponibilitat de dedicar el temps necessari a cada concepte


 

 

Metodologia

Classes de Teoria

En aquestes classes s'aborden els conceptes teòrics dels blocs de contingut de l'assignatura. Les classes de teoria consisteixen en 9 sessions de dues hores de durada. El professor portarà a terme les explicacions dels continguts teòrics de l'assignatura per a això es disposarà d'ordinador, projector i pissarra com material suport. S'empraran transparències que serviran com apunts de classe per als alumnes. Els conceptes analitzats en aquest tipus de sessions seran utilitzats en les dues activitats d'aprenentatge restants de l'assignatura; Sessions de Seminaris I Sessions de Pràctiques. L’estudiant haurà de complementar aquesta activitat amb un lectura detinguda dels seus propis apunts i el material addicional que el professor hagi proporcionat. Per exemple, un sessió de teoria de 2 hores, convenientment aprofitades, requerirà un treball addicional fora de l’aula d’1 hora per part de l’estudiant.

 

Sessions de Pràctiques

En aquestes sessions es desenvolupen els punts pràctics del bloc de contingut de l'assignatura. Aquestes sessions es fan en el laboratori i tenen una durada de dues hores. El professor de pràctiques lliurarà un enunciat en la qual s'explica el desenvolupament de la pràctica i donarà les directrius necessàries perquè els alumnes realitzin les comprovacions i el desenvolupament que se'ls sol·liciti en els enunciats de la pràctica. L'alumne lliurarà una memòria de la pràctica al final de la sessió, sobre la qual el professor avaluarà que s'han desenvolupat adequadament els conceptes pràctics que s'han plantejat en l'enunciat de la pràctica. Aquesta activitat es realitza per parelles i es pressuposa que continua fora de l’aula. Les sessions de pràctica estaran orientades a cobrir els punts pràctics dels continguts abordats a la classe de teoria.

 

Sessions de Seminaris

Aquestes sessions estan dedicades a descriure punts de particular rellevància dels blocs de contingut de l'assignatura. Les sessions de seminaris consisteixen en sessions de dues hores de durada. En aquestes sessions, el professor dirigirà i plantejarà problemes específiques que ajudaran a reforçar els coneixements adquirits en les sessions de teoria i en les pràctiques de l'assignatura. Els alumnes han de lliurar les solucions al començament del seminari, i a més a més es demanarà a els alumnes que presentin les seves solucions a la pissarra. Per aquesta activitat, el professor disposarà d'ordinador, projector i pissarra com material suport. Es podran emprar transparències i en general, qualsevol tipus de material que ajudi a reforçar els conceptes adquirits en les sessions de teoria de l'assignatura. Las activitats seran portadas a terme en grups de 3-4 estudiants.

 

Recursos

Data mining: practical machine learning tools and techniques / Ian H. Witten, Eibe Frank, Mark A. Hall

Machine learning / Tom M. Mitchell

Machine learning: an algorithmic perspective / Stephen Marsland

 

Web de la assignatura

Apunts

Colecció d’exercicis

Enunciats de les pràctiques

 

Matlab programming language

Weka software