We develop a large number of software tools and hosting infrastructures to support the research developed at the Department. We will be detailing in this section the different tools available. You can take a look for the moment at the offer available within the UPF Knowledge Portal, the innovations created in the context of EU projects in the Innovation Radar and the software sections of some of our research groups:

 

 Artificial Intelligence

 Nonlinear Time Series Analysis

 Web Research 

 

 Music Technology

 Interactive  Technologies

 Barcelona MedTech

 Natural Language  Processing

 Nonlinear Time Series  Analysis

UbicaLab

Wireless Networking

Educational Technologies

GitHub

 

 

Back Horacio Saggion publica un llibre sobre processament de llenguatge natural

Horacio Saggion publica un llibre sobre processament de llenguatge natural

Un recull d'articles titulat Multi-source, Multilingual Information Extraction and Summarization, del qual aquest investigador del grup de recerca TALN n'és co-editor i que acaba de publicar l'editorial Springer.
26.02.2012

 

Multi-source, Multilingual Information Extraction and Summarization (2012) és una obra que conté una selecció d'articles compilats per Horacio Saggion, investigador del  del Grup de Recerca en Tractament Automàtic del Llenguatge Natural (TALN) al Departament de Tecnologies de la Informació i les Comunicacions (DTIC) de la UPF, conjuntament amb T. Poibeau, J. Pirskoski i R. Yangarber en qualitat de co-editors, recentment que acaba de publicar Springer.

El processament del llenguatge natural s'ocupa de la interacció entre les computadores i els llenguatges humans o naturals i té els seus orígens en la intel·ligència artificial, a mig camí entre la informàtica i la lingüística. En mig de la societat de la informació, amb l'important volum de dades que es generen a l'actualitat, adquireixen cada cop més importància les tecnologies d'extracció de dades i de simplificació de textos per tal de presentar la informació en formats suficientment intel·ligibles a l'usuari.

horaciofotoEl volum que ara es publica conté una selecció de treballs d'un àmbit de recerca molt actiu en els darrers anys, presentant una varietat de mètodes per a la identificació de continguts i extracció de dades, així com també per a la fusió de diferents continguts i la regeneració d'informació. Depenent de la naturalesa de la informació hi ha diversos procediments per tal identificar, d'un gran volum de dades disponible, noms, esdeveniments, fluxos d'informació, identificació d'imatges; d'un nombre ingent de fonts, com per exemple la informació provinent de la recerca científica.

El professor Saggion, conjuntament amb Thierry Poibeau,   introdueix el volum explicant el passat, present i futur de la disciplina pel que fa a la simplificació i síntesi de textos i, a més, n'és l'autor d'un dels treballs que integren l'obra: " A study of the effect of document representations in clustering-based cross-document coreference resolution".

Horacio Saggion és investigador del grup de recerca en Tractament Automàtic del  Llenguatge Natural (TALN), grup que dirigeix Leo Wanner, professor ICREA al Departament de Ciències de la Informació i les Comunicacions (DTIC) de la UPF. Es va doctorar a la canadenca Universitat de Montreal (2000) i compta amb més de deu anys d'experiència en l'àmbit de la tecnologia del llenguatge. Fins arribar a la UPF, ha participat i dirigit diversos projectes de recerca al Regne Unit (SOCIS, CubReporter, MUMIS, MUSING, etc.).

Saggion és autor de més de seixanta treballs de recerca que ha presentat a congressos i publicat en revistes rellevants en l'àrea de la tecnologia del lenguatge humà. És requerit habitualment com a expert avaluador internacional i ha produït tecnologia competitiva sobre el processament del llenguatge natural. És un dels experts del sistema Gate Architecture for Text Engineering (GATE).

SIMPLEXT, una aplicació social del processament del llenguatge

El professor Saggion és el coordinador científic del projecte SIMPLEXT, una iniciativa impulsada a través del pla Avanza (2010-2012) del Ministeri d'Indústria, Turisme i Comerç que posa la tecnologia al servei de persones amb capacitats cognitives limitades. Simplext aplega dos àmbits de recerca ben definits, d'una banda el processament computacional del llenguatge natural i, d'altra banda, la recerca lingüística en simplificació de texts . Tot això aplicat a les més innovadores tendències tecnològiques pel que fa a l'accessibilitat dels usuaris.

Obra de referència:

Pobeau, T.; Saggion, H.; Piskorski, J.; Yangarber, R. (eds.) (2012), Multi-source, Multilingual Information Extraction and Summarization , Springer, 360 p., ISBN 978-3-642-28568-4.

Altres e-notícies relacionades:

Premi Vodafone a la Innovació en Telecomunicacions al projecte Simplext

 

 

 

 

 

Multimedia

Categories:

SDG - Sustainable Development Goals:

Els ODS a la UPF

Contact