Domínguez Noya, Eva MaríaMíguez, Vítor2024-01-192024-01-192022-12-07Domínguez Noya, E. M., & Míguez, V. (2022). Unha mellora do CORGA extrapolable a outros corpus e linguas: A etiquetaxe da nomenclatura científica binomial. Estudos de Lingüística Galega, 14. https://doi.org/10.15304/elg.14.84521989-578Xhttp://hdl.handle.net/10347/31906O tratamento das unidades multipalabra é unha tarefa inconclusa no procesamento da linguaxe natural. Neste contexto, illámo-las denominacións de nomenclatura científica binomial, cuxas principais características —expresións multipalabra latinas ou latinizadas e aceptación internacional— as afastan do acervo léxico do galego e converten o seu tratamento en extrapolable a outras linguas. Tras revisa-la súa caracterización no CORGA e noutros corpus peninsulares, propoñemos analizalas como un subtipo específico de substantivos, nomenclatura científica, sen concretar valores de xénero nin número. Describimos logo as actuacións desenvolvidas no kérnel ou núcleo e mais no corpus de adestramento para integra-la nova etiqueta no sistema XIADA e, a continuación, avaliamos dúas estratexias para a detección de candidatos: unha ferramenta específica para a súa extracción e inventarios dispoñibles en Internet. Por último, á luz dos datos que proporciona o CORGA, constatamos unha presenza notable de termos científicos binomiais e demostrámo-la importancia da nova etiqueta para a súa identificación e distribución.glgCopyright (c) 2022 Universidade de Santiago de Compostela. Todos os contidos distribúense en acceso aberto baixo unha licenza internacional Creative Commons BY-NC-ND 4.0corpus lingüísticoanotación morfosintácticanomenclatura científica binomialgalego570104 Lingüística informatizadaUnha mellora do CORGA extrapolable a outros corpus e linguas: a etiquetaxe da nomenclatura científica binomialjournal article10.15304/elg.14.8452open access