Identificação e classificação de entidades mencionadas em galego
Loading...
Identifiers
Publication date
Advisors
Tutors
Editors
Journal Title
Journal ISSN
Volume Title
Publisher
Universidade de Santiago de Compostela. Servizo de Publicacións e Intercambio Científico
Abstract
A identificação e a classificação semântica automáti-cas de entidades mencionadas são tarefas de especial relevância para variadas aplicações do processamento da língua natural, tais como a tradução automática, a extracção de informação ou os sistemas de resposta a perguntas. O presente artigo descreve a adaptação e implementação de diversas ferramentas de código aberto para a identificação e classificação dos seguin-tes tipos de entidades em galego: (i) datas, (ii) nume-rais, (iii) quantidades e (iv) nomes próprios. A análise dos três primeiros tipos de entidades realiza-se com o software FreeLing através de máquinas de estados finitos. Para a identificação de nomes próprios com-param-se duas estratégias: (i) a utilização de máquinas de estados finitos e (ii) métodos de aprendizagem automática. Finalmente, a classificação semântica dos nomes próprios é realizada com um sistema baseado em regras e recursos obtidos automaticamente. O artigo mostra um conjunto de avaliações para cada um dos módulos apresentados, disponibilizados com licenças livres.
Description
Bibliographic citation
GARCÍA, Marcos; GAYO, Iria; GONZÁLEZ LÓPEZ, Isaac: «Identificação e classificação de entidades mencionadas em galego», Estudos de Lingüística Galega, vol. 4 (2012). ISSN 1889-2566, pp. 13-25








