Resolución de correferencia de nombres de persona para extracción de información biográfica

Loading...
Thumbnail Image
Identifiers
ISSN: 1135-5948
E-ISSN: 1989-7553

Publication date

Advisors

Tutors

Editors

Journal Title

Journal ISSN

Volume Title

Publisher

Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN)
Metrics
Google Scholar
lacobus
Export

Research Projects

Organizational Units

Journal Issue

Abstract

Los sistemas de extracción de información necesitan un procesamiento previo que reconozca, entre otras cosas, elementos correferenciales tales como las variantes de nombres propios. El presente artículo tiene dos objetivos: por un lado, describe los principales tipos de correferencia de nombres de persona encontrados en textos enciclopédicos y periodísticos en castellano. Por otro lado, presenta un algoritmo que resuelve satisfactoriamente la mayor parte de los casos descritos. El sistema, que no necesita corpus de entrenamiento, permite unificar las variantes de nombres de persona que aparecen en un texto, mejorando así tareas como la extracción de información biográfica
Information extraction systems need a previous processing step in order to recognize coreferential elements, such as personal name variants. This paper has two aims: the first is to describe the main types of personal name coreference found in encyclopedic and journalistic texts in Spanish. Furthermore, we introduce an algorithm that solves most coreferential links between personal name variants succesfully. The system, which does not need a training corpus, unifies the coreferential elements found in a text, thereby improving tasks like biographical information extraction

Description

Bibliographic citation

, M., & , P. (2011). Resolución de Correferencia de Nombres de Persona para Extracción de Información Biográfica. Procesamiento Del Lenguaje Natural, 47, 47-55. Recuperado de http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/965

Relation

Has part

Has version

Is based on

Is part of

Is referenced by

Is version of

Requires

Sponsors

Este trabajo ha sido subvencionado por el Ministerio de Ciencia e Innovación, con cargo al proyecto con referencia FFI2010-14986

Rights

© 2011 Sociedad Española para el Procesamiento del Lenguaje Natural