Estudio sobre el impacto del corpus de entrenamiento del modelo de lenguaje en las prestaciones de un reconocedor de habla

dc.contributor.affiliationUniversidade de Santiago de Compostela. Instituto da Lingua Galega (ILG)gl
dc.contributor.authorPiñeiro Martín, Andrés
dc.contributor.authorGarcía-Mateo, Carmen
dc.contributor.authorDocío Fernández, Laura
dc.contributor.authorRegueira Fernández, Xosé Luís
dc.date.accessioned2018-11-20T12:27:00Z
dc.date.available2018-11-20T12:27:00Z
dc.date.issued2018
dc.descriptionDentro del reconocimiento automático del habla, los modelos de lenguaje estadísticos basados en la probabilidad de secuencia de palabras (n-gramas) suponen uno de los dos pilares sobre los que se basa su correcto funcionamiento. En este trabajo se expone el impacto que tienen sobre las prestaciones de reconocimiento a medida que estos modelos se mejoran con más texto de mejor calidad, cuando estos se ajustan a la aplicación final del sistema, y por lo tanto, cuando se reducen el número de palabras fuera de vocabulario (Out Of Vocabulary - OOV). El reconocedor con los distintos modelos de lenguaje ha sido aplicado sobre cortes de audio correspondientes a tres marcos experimentales: oralidad formal, habla en noticiarios, y TED talks en gallego. Los resultados obtenidos muestran claramente una mejora sobre los marcos experimentales propuestosgl
dc.description.peerreviewedSIgl
dc.identifier.citationAndrés Piñeiro Martín, Carmen García-Mateo, Laura Docío-Fernández, Xosé Luís Regueira (2018): Estudio sobre el impacto del corpus de entrenamiento del modelo de lenguaje en las prestaciones de un reconocedor de habla. Procesamiento del Lenguaje Natural 61, 75-82gl
dc.identifier.doi10.26342/2018-61-8
dc.identifier.essn1989-7553
dc.identifier.issn1135-5948
dc.identifier.urihttp://hdl.handle.net/10347/17787
dc.language.isospagl
dc.publisherSociedad Española para el Procesamiento del Lenguaje Natural (SEPLN)gl
dc.relation.publisherversionhttp://dx.doi.org/10.26342/2018-61-8gl
dc.rights© 2018 Sociedad Española para el Procesamiento del Lenguaje Naturalgl
dc.rights.accessRightsopen accessgl
dc.rights.urihttp://creativecommons.org/licenses/by-nc/4.0/
dc.subjectGalego (lingua)gl
dc.subjectGallego (lengua)gl
dc.subjectGalician (language)gl
dc.subjectModelos de linguaxegl
dc.subjectModelos de lenguajegl
dc.subjectLanguage modelsgl
dc.subjectVariación lingüísticagl
dc.subjectLinguistic variationgl
dc.subjectReconocimiento automático da falagl
dc.subjectReconocimiento automático del hablagl
dc.subjectAutomatic speech recognitiongl
dc.subjectPalabras fóra de vocabulariogl
dc.subjectPalabras fuera de vocabulariogl
dc.subjectOut of vocabulary wordsgl
dc.titleEstudio sobre el impacto del corpus de entrenamiento del modelo de lenguaje en las prestaciones de un reconocedor de hablagl
dc.typejournal articlegl
dc.type.hasVersionVoRgl
dspace.entity.typePublication
relation.isAuthorOfPublicationc2412a10-e98f-4bc7-a0d1-d54104e84e86
relation.isAuthorOfPublication.latestForDiscoveryc2412a10-e98f-4bc7-a0d1-d54104e84e86

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Procesamiento_del_lenguaje_natural_2018.pdf
Size:
1.54 MB
Format:
Adobe Portable Document Format
Description: