Methodology for the Corpus-based English-German-Ukrainian Dictionary of Collocations

dc.contributor.affiliationUniversidade de Santiago de Compostela. Facultade de Filoloxíagl
dc.contributor.authorPolova, Mariia
dc.contributor.tutorGarcía González, Marcos
dc.date.accessioned2023-03-13T14:25:36Z
dc.date.available2023-03-13T14:25:36Z
dc.date.issued2022-07
dc.descriptionTraballo Fin de Máster en Lexicografía. Curso 2021-2022gl
dc.description.abstract[EN]This Master’s thesis recounts the vision of the multilingual collocations dictionary project for the English, German, and Ukrainian languages (“Corpus-based English-German-Ukrainian Dictionary of Collocations” or EDU-Col) and elaborates on the methodology for compiling the dictionary and its key dictionary structures. The dictionary will cater to the needs of language learners, translators, text producers (journalists, copywriters), and native speakers. Tapping into the latest developments in NLP and the capabilities of corpora, the methodology for creating the proposed dictionary relies on the automatic extraction of dictionary information types, namely collocation candidates, example sentences, and translation equivalents for collocations. The automatic extraction is followed by manual validation in order to maintain the quality of the obtained lexicographic data.gl
dc.description.abstract[DE]Diese Masterarbeit befasst sich mit der Konzeption des mehrsprachigen Kollokationswörterbuchs für die englische, deutsche und ukrainische Sprache ("Corpus-based English-German-Ukrainian Dictionary of Collocations" oder EDU-Col) und erläutert die Methodik für die Erstellung des Wörterbuchs und seine wichtigsten Wörterbuchstrukturen. Das Wörterbuch ist auf die Bedürfnisse von Sprachlernern, Übersetzern, Redakteuren (Journalisten, Werbetextern) und Muttersprachler ausgerichtet. Die Methodik zur Erstellung des vorgeschlagenen Wörterbuchs basiert auf der automatischen Extraktion von Wörterbuchinformationen, nämlich Kollokationskandidaten, Beispielsätzen und Übersetzungsäquivalenten für Kollokationen. Auf die automatische Extraktion folgt eine manuelle Überprüfung, um die Qualität der erhaltenen lexikografischen Daten zu gewährleistengl
dc.identifier.urihttp://hdl.handle.net/10347/30305
dc.language.isoenggl
dc.rightsAtribución-NoComercial-CompartirIgual 4.0 Internacional
dc.rights.accessRightsopen accessgl
dc.rights.urihttp://creativecommons.org/licenses/by-nc-sa/4.0/
dc.subjectCollocationsgl
dc.subjectMultilingual dictionary projectgl
dc.subjectAutomatic generation of dictionary datagl
dc.subjectKollokationengl
dc.subjectMehrsprachiges Wörterbuchprojektgl
dc.subjectAutomatische Generierung von Wörterbuchdateigl
dc.titleMethodology for the Corpus-based English-German-Ukrainian Dictionary of Collocationsgl
dc.typemaster thesisgl
dspace.entity.typePublication
relation.isAdvisorOfPublicationae090fc6-2387-4087-ba21-7271835b4b35
relation.isTutorOfPublicationae090fc6-2387-4087-ba21-7271835b4b35
relation.isTutorOfPublication.latestForDiscoveryae090fc6-2387-4087-ba21-7271835b4b35

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
EMLex - Mariia Polova.pdf
Size:
12.38 MB
Format:
Adobe Portable Document Format
Description: