Técnicas de Procesamiento del Lenguaje Natural en la Recuperación de Información

dc.contributor.affiliationUniversidade de Santiago de Compostela. Centro de Investigación en Tecnoloxías da Informacióngl
dc.contributor.affiliationUniversidade de Santiago de Compostela. Departamento de Lingua e Literatura Española, Teoría da Literatura e Lingüística Xeralgl
dc.contributor.authorGamallo Otero, Pablo
dc.contributor.authorGarcía González, Marcos
dc.date.accessioned2018-11-12T13:26:11Z
dc.date.available2018-11-12T13:26:11Z
dc.date.issued2012
dc.description.abstractEn este artículo se describe el efecto de la integración de varias técnicas basadas en el procesamiento del lenguaje natural en sistemas de recuperación de información. Se estudiarán, en concreto, métodos de lematización, anotación de categorías morfosintácticas, identificación de nombres propios compuestos y análisis en dependencias. Una evaluación a gran escala con colecciones de documentos en español nos permitirá verificar que la combinación de estas técnicas con otras menos sofisticadas, tales como tokenización y eliminación de palabras gramaticales, contribuye a una mejora significativa de la calidad de los sistemas de recuperacióngl
dc.description.abstractIn this article, we describe the way in which different methods based on Natural Language Processing (NLP) can be integrated in Information Retrieval systems. More precisely, we will study NLP strategies such as lemmatization, PoS tagging, named entities recognition, and dependency-based parsing. A large scale evaluation on Spanish documents will be performed. This will allow us to verify whether these strategies combined with less complex NLP techniques (e.g., tokenization and stopwords removal) improve the quality of IR systems. The results reported at the end of the paper show that NLP-based strategies yield significant improvementsgl
dc.description.peerreviewedSIgl
dc.identifier.citationGamallo Otero, P. y García González, M. (2012). Técnicas de Procesamiento del Lenguaje Natural en la Recuperación de Información. NovATIca, 219, 42-47gl
dc.identifier.issn0211-2124
dc.identifier.urihttp://hdl.handle.net/10347/17692
dc.language.isospagl
dc.publisherAsociación de Técnicos de Informática (ATI)gl
dc.relation.publisherversionhttp://www.ati.es/novatica2-2.htmlgl
dc.rights© 2012 Asociación de Técnicos de Informática (ATI)gl
dc.rights.accessRightsopen accessgl
dc.subjectRecuperación de informacióngl
dc.subjectProcesamiento del lenguaje naturalgl
dc.subjectAnálisis en dependenciasgl
dc.subjectInformation retrievalgl
dc.subjectNatural language processinggl
dc.subjectDependency-based parsinggl
dc.titleTécnicas de Procesamiento del Lenguaje Natural en la Recuperación de Informacióngl
dc.title.alternativeMethods on Natural Language Processing for Information Retrievalgl
dc.typejournal articlegl
dc.type.hasVersionVoRgl
dspace.entity.typePublication
relation.isAuthorOfPublication898ee1bb-f9e8-4a75-9858-a6c9142bc99e
relation.isAuthorOfPublicationae090fc6-2387-4087-ba21-7271835b4b35
relation.isAuthorOfPublication.latestForDiscovery898ee1bb-f9e8-4a75-9858-a6c9142bc99e

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
2012_novatica_gamallo_procesamiento.pdf
Size:
207.45 KB
Format:
Adobe Portable Document Format
Description: