Unha mellora do CORGA extrapolable a outros corpus e linguas: a etiquetaxe da nomenclatura científica binomial
Loading...
Identifiers
Publication date
Advisors
Tutors
Editors
Journal Title
Journal ISSN
Volume Title
Publisher
Universidade de Santiago de Compostela
Abstract
O tratamento das unidades multipalabra é unha tarefa inconclusa no procesamento da linguaxe natural. Neste contexto, illámo-las denominacións de nomenclatura científica binomial, cuxas principais características —expresións multipalabra latinas ou latinizadas e aceptación internacional— as afastan do acervo léxico do galego e converten o seu tratamento en extrapolable a outras linguas. Tras revisa-la súa caracterización no CORGA e noutros corpus peninsulares, propoñemos analizalas como un subtipo específico de substantivos, nomenclatura científica, sen concretar valores de xénero nin número. Describimos logo as actuacións desenvolvidas no kérnel ou núcleo e mais no corpus de adestramento para integra-la nova etiqueta no sistema XIADA e, a continuación, avaliamos dúas estratexias para a detección de candidatos: unha ferramenta específica para a súa extracción e inventarios dispoñibles en Internet. Por último, á luz dos datos que proporciona o CORGA, constatamos unha presenza notable de termos científicos binomiais e demostrámo-la importancia da nova etiqueta para a súa identificación e distribución.
Description
Bibliographic citation
Domínguez Noya, E. M., & Míguez, V. (2022). Unha mellora do CORGA extrapolable a outros corpus e linguas: A etiquetaxe da nomenclatura científica binomial. Estudos de Lingüística Galega, 14. https://doi.org/10.15304/elg.14.8452
Relation
Has part
Has version
Is based on
Is part of
Is referenced by
Is version of
Requires
Publisher version
https://revistas.usc.gal/index.php/elg/article/view/8452Sponsors
Rights
Copyright (c) 2022 Universidade de Santiago de Compostela. Todos os contidos distribúense en acceso aberto baixo unha licenza internacional Creative Commons BY-NC-ND 4.0








