Técnicas de Procesamiento del Lenguaje Natural en la Recuperación de Información
| dc.contributor.affiliation | Universidade de Santiago de Compostela. Centro de Investigación en Tecnoloxías da Información | gl |
| dc.contributor.affiliation | Universidade de Santiago de Compostela. Departamento de Lingua e Literatura Española, Teoría da Literatura e Lingüística Xeral | gl |
| dc.contributor.author | Gamallo Otero, Pablo | |
| dc.contributor.author | García González, Marcos | |
| dc.date.accessioned | 2018-11-12T13:26:11Z | |
| dc.date.available | 2018-11-12T13:26:11Z | |
| dc.date.issued | 2012 | |
| dc.description.abstract | En este artículo se describe el efecto de la integración de varias técnicas basadas en el procesamiento del lenguaje natural en sistemas de recuperación de información. Se estudiarán, en concreto, métodos de lematización, anotación de categorías morfosintácticas, identificación de nombres propios compuestos y análisis en dependencias. Una evaluación a gran escala con colecciones de documentos en español nos permitirá verificar que la combinación de estas técnicas con otras menos sofisticadas, tales como tokenización y eliminación de palabras gramaticales, contribuye a una mejora significativa de la calidad de los sistemas de recuperación | gl |
| dc.description.abstract | In this article, we describe the way in which different methods based on Natural Language Processing (NLP) can be integrated in Information Retrieval systems. More precisely, we will study NLP strategies such as lemmatization, PoS tagging, named entities recognition, and dependency-based parsing. A large scale evaluation on Spanish documents will be performed. This will allow us to verify whether these strategies combined with less complex NLP techniques (e.g., tokenization and stopwords removal) improve the quality of IR systems. The results reported at the end of the paper show that NLP-based strategies yield significant improvements | gl |
| dc.description.peerreviewed | SI | gl |
| dc.identifier.citation | Gamallo Otero, P. y García González, M. (2012). Técnicas de Procesamiento del Lenguaje Natural en la Recuperación de Información. NovATIca, 219, 42-47 | gl |
| dc.identifier.issn | 0211-2124 | |
| dc.identifier.uri | http://hdl.handle.net/10347/17692 | |
| dc.language.iso | spa | gl |
| dc.publisher | Asociación de Técnicos de Informática (ATI) | gl |
| dc.relation.publisherversion | http://www.ati.es/novatica2-2.html | gl |
| dc.rights | © 2012 Asociación de Técnicos de Informática (ATI) | gl |
| dc.rights.accessRights | open access | gl |
| dc.subject | Recuperación de información | gl |
| dc.subject | Procesamiento del lenguaje natural | gl |
| dc.subject | Análisis en dependencias | gl |
| dc.subject | Information retrieval | gl |
| dc.subject | Natural language processing | gl |
| dc.subject | Dependency-based parsing | gl |
| dc.title | Técnicas de Procesamiento del Lenguaje Natural en la Recuperación de Información | gl |
| dc.title.alternative | Methods on Natural Language Processing for Information Retrieval | gl |
| dc.type | journal article | gl |
| dc.type.hasVersion | VoR | gl |
| dspace.entity.type | Publication | |
| relation.isAuthorOfPublication | 898ee1bb-f9e8-4a75-9858-a6c9142bc99e | |
| relation.isAuthorOfPublication | ae090fc6-2387-4087-ba21-7271835b4b35 | |
| relation.isAuthorOfPublication.latestForDiscovery | 898ee1bb-f9e8-4a75-9858-a6c9142bc99e |
Files
Original bundle
1 - 1 of 1
Loading...
- Name:
- 2012_novatica_gamallo_procesamiento.pdf
- Size:
- 207.45 KB
- Format:
- Adobe Portable Document Format
- Description: