Etiquetaxe e desambiguación automáticas en galego: o sistema XIADA

dc.contributor.advisorRojo Sánchez, Guillermo
dc.contributor.advisorLópez Martínez, María Sol
dc.contributor.authorDomínguez Noya, Eva María
dc.contributor.otherFacultade de Filoloxía. Departamento de Lingua Española
dc.date.accessioned2013-12-27T12:15:56Z
dc.date.available2013-12-27T12:15:56Z
dc.date.issued2013-12-27
dc.description.abstractA construción de recursos lingüísticos, entre os que se encontran os corpus ou bases de datos textuais, é necesaria en toda lingua para continuar profundando no seu coñecemento, mais tamén é fundamental para o procesamento da linguaxe natural. Nos últimos anos, ademais, as novas tecnoloxías xorden como un parámetro máis de clasificación das linguas en función da súa presenza ou ausencia nelas. Neste marco sitúase o presente traballo, onde se recollen e describen polo miúdo os diferentes recursos lingüísticos elaborados –etiquetario, lexicón e corpus de adestramento, basicamente– para que poida executarse con garantías dunha alta taxa de acerto un etiquetador de tipo estatístico-probabilístico como é o Etiquetador/Lematizador do galego actual (XIADA), aplicado aos documentos que conforman o Corpus de Referencia do Galego Actual (CORGA) –corpus considerado representativo da lingua galega actual, cuxas características lingüísticas constatan as dificultades de traballar con lingua real–. Coa etiquetaxe permítese dar un salto cualitativo no sistema de consultas, de xeito que se facilita a recuperación de información a través dunha aplicación web mediante a consulta por forma, lema, etiqueta morfosintáctica ou calquera combinación destas; co engadido, naturalmente, das prestacións do CORGA. O resultado palpable da aplicación do sistema XIADA á análise de corpus en galego pode consultarse en liña accedendo ao Corpus de Referencia do Galego Actual etiquetado (CORGAetq). gl
dc.identifier.urihttp://hdl.handle.net/10347/9587
dc.language.isoglggl
dc.rightsEsta obra atópase baixo unha licenza internacional Creative Commons BY-NC-ND 4.0. Calquera forma de reprodución, distribución, comunicación pública ou transformación desta obra non incluída na licenza Creative Commons BY-NC-ND 4.0 só pode ser realizada coa autorización expresa dos titulares, salvo excepción prevista pola lei. Pode acceder Vde. ao texto completo da licenza nesta ligazón: https://creativecommons.org/licenses/by-nc-nd/4.0/deed.gl
dc.rights.accessRightsopen accessgl
dc.rights.urihttps://creativecommons.org/licenses/by-nc-nd/4.0/deed.gl
dc.subjectXIADAgl
dc.subjectCorpus de Referencia do Galego Actual etiquetadogl
dc.subjectbases de datos textuaisgl
dc.titleEtiquetaxe e desambiguación automáticas en galego: o sistema XIADAgl
dc.typedoctoral thesisgl
dspace.entity.typePublication
relation.isAdvisorOfPublicationa8b33ed7-a607-40fb-be4e-33ec153d97f2
relation.isAdvisorOfPublicationb87d7b27-8544-424c-b15d-9b9608cf7130
relation.isAdvisorOfPublication.latestForDiscoverya8b33ed7-a607-40fb-be4e-33ec153d97f2

Files

Original bundle

Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
rep_569.pdf
Size:
3.7 MB
Format:
Adobe Portable Document Format
Loading...
Thumbnail Image
Name:
Exemplos.zip
Size:
28.56 MB
Format:
Unknown data format