Uso de corpora comparáveis para filtrar dicionários bilíngues gerados por transitividade

dc.contributor.affiliationUniversidade de Santiago de Compostela. Centro de Investigación en Tecnoloxías da Informacióngl
dc.contributor.affiliationUniversidade de Santiago de Compostela. Departamento de Lingua e Literatura Española, Teoría da Literatura e Lingüística Xeralgl
dc.contributor.authorGamallo Otero, Pablo
dc.date.accessioned2018-11-12T12:41:55Z
dc.date.available2018-11-12T12:41:55Z
dc.date.issued2014
dc.description.abstractEste artigo propõe um método para a construção de novos dicionários bilíngues a partir de dicionários já existentes e da exploração de corpora comparáveis. Mais concretamente, um novo dicionário para um par de línguas é gerado em duas etapas: primeiro, cruzam-se dicionários bilíngues entre essas línguas e uma terceira intermediária e, segundo, o resultado do cruzamento, que contém um número elevado de traduções espúrias causadas pela ambiguidade das palavras da língua intermediária, filtra-se com apoio em textos de temática comparável nas duas línguas alvo. A qualidade do dicionário derivado é muito alta, próxima dos dicionários construídos manualmente. Descreveremos um caso de estudo onde criaremos um novo dicionário Inglês-Português com mais de 7.000 entradas bilíngues geradas pelo nosso métodogl
dc.description.abstractThis article proposes a method for building new bilingual dictionaries from existing ones and the use of comparable corpora. More precisely, a new bilingual dictionary with pairs in two target languages is built in two steps. First, a noisy dictionary is generated by transitivity by crossing two existing dictionaries containing translation pairs in one of the two target languages and an intermediary one. The result of crossing the two existing dictionaries gives rise to a noisy resource because of the ambiguity of words in the intermediary language. Second, odd translation pairs are filtered out by making use of a set of bilingual lexicons automatically extracted from comparable corpora. The quality of the filtered dictionary is very high, close to that of those dictionaries built by lexicographs. We also report a case study where a new, non noisy, English-Portuguese dictionary with more than 7,000 bilingual entries was automatically generatedgl
dc.description.peerreviewedSIgl
dc.identifier.citationGAMALLO, Pablo. (2014). Uso de corpora comparáveis para filtrar dicionários bilíngues gerados por transitividade. DELTA: Documentação de Estudos em Lingüística Teórica e Aplicada, 30(2), 213-235. https://dx.doi.org/10.1590/0102-445034728151307539gl
dc.identifier.doi10.1590/0102-445034728151307539
dc.identifier.essn1678-460X
dc.identifier.issn0102-4450
dc.identifier.urihttp://hdl.handle.net/10347/17690
dc.language.isoporgl
dc.publisherPontifícia Universidade Católica de São Paulogl
dc.relation.publisherversionhttp://dx.doi.org/10.1590/0102-445034728151307539gl
dc.rightsThis is an Open Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly citedgl
dc.rights.accessRightsopen accessgl
dc.rights.urihttps://creativecommons.org/licenses/by-nc/3.0/deed.en
dc.subjectProcessamento da língua naturalgl
dc.subjectExtração de informaçãogl
dc.subjectCorpora comparáveisgl
dc.subjectDicionários bilínguesgl
dc.subjectNatural language processinggl
dc.subjectInformation extractiongl
dc.subjectComparable corporagl
dc.subjectBilingual dictionariesgl
dc.titleUso de corpora comparáveis para filtrar dicionários bilíngues gerados por transitividadegl
dc.title.alternativeUsing comparable corpora to filter bilingual dictionaries generated by transitivitygl
dc.typejournal articlegl
dc.type.hasVersionVoRgl
dspace.entity.typePublication
relation.isAuthorOfPublication898ee1bb-f9e8-4a75-9858-a6c9142bc99e
relation.isAuthorOfPublication.latestForDiscovery898ee1bb-f9e8-4a75-9858-a6c9142bc99e

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
2014_delta_gamallo_uso.pdf
Size:
624.24 KB
Format:
Adobe Portable Document Format
Description: