Extracção de relações semânticas. Recursos, ferramentas e estratégias
| dc.contributor.advisor | Gamallo Otero, Pablo | |
| dc.contributor.author | García González, Marcos | |
| dc.contributor.other | Universidade de Santiago de Compostela. Facultade de Filoloxía. Departamento de Lingua Española | |
| dc.date.accessioned | 2015-01-21T09:24:11Z | |
| dc.date.available | 2015-01-21T09:24:11Z | |
| dc.date.issued | 2015-01-21 | |
| dc.description.abstract | A extracção de relações, enquadrada dentro das tarefas de extracção de informação, visa obter automaticamente exemplos de relações semânticas presentes em textos. Esta informação pode ser posteriormente organizada em formatos legíveis por computadores, sendo útil para diversas aplicações que necessitem conhecimento semântico estruturado. A presente tese avalia diferentes estratégias para a extracção automática de relações semânticas de textos em português, espanhol e galego. Com esse fim, são utilizadas tanto técnicas de aprendizagem automática (com supervisãodistante e supervisionadas) como sistemas baseados em regras, sendo analisado o impacto de diferentes níveis de conhecimento linguístico nas várias abordagens avaliadas. Em relação ao domínio, as extracções lidam com conhecimento de carácter enciclopédico, mediante a criação de classificadores de relações biográficas (em domínio fechado) e a avaliação de sistemas de extracção de informação aberta. Com o objectivo de implementar os sistemas de extracção, foram também construídas diversas ferramentas para o processamento da linguagem natural nos três idiomas referidos: desde módulos de segmentação de orações e de tokenização, a sistemas de desambiguação morfossintáctica, de reconhecimento de entidades mencionadas e de resolução de correferência. Além disso, foram compilados e adaptados léxicos e corpora com anotação linguística de diferentes níveis, úteis para o treino e avaliação de modelos probabilísticos e baseados em regras. Como resultado do trabalho realizado nesta tese, disponibilizamse novas ferramentas e recursos para o processamento automático de textos em português, espanhol e galego. | gl |
| dc.identifier.uri | http://hdl.handle.net/10347/12074 | |
| dc.language.iso | glg | gl |
| dc.rights | Esta obra atópase baixo unha licenza internacional Creative Commons BY-NC-ND 4.0. Calquera forma de reprodución, distribución, comunicación pública ou transformación desta obra non incluída na licenza Creative Commons BY-NC-ND 4.0 só pode ser realizada coa autorización expresa dos titulares, salvo excepción prevista pola lei. Pode acceder Vde. ao texto completo da licenza nesta ligazón: https://creativecommons.org/licenses/by-nc-nd/4.0/deed.gl | |
| dc.rights.accessRights | open access | gl |
| dc.rights.uri | https://creativecommons.org/licenses/by-nc-nd/4.0/deed.gl | |
| dc.subject | extracção de informação | gl |
| dc.subject | processamento da linguagem natural | gl |
| dc.subject | reconhecimento de entidades mencionadas | gl |
| dc.subject | anotação morfossintáctica | gl |
| dc.subject | resolução de correferência | gl |
| dc.subject.classification | Materias::Investigación::57 Lingüística::5701 Lingüística aplicada::570103 Bilingüismo | gl |
| dc.subject.classification | Materias::Investigación::57 Lingüística::5701 Lingüística aplicada::570109 Traducción automática | gl |
| dc.title | Extracção de relações semânticas. Recursos, ferramentas e estratégias | gl |
| dc.type | doctoral thesis | gl |
| dspace.entity.type | Publication | |
| relation.isAdvisorOfPublication | 898ee1bb-f9e8-4a75-9858-a6c9142bc99e | |
| relation.isAdvisorOfPublication.latestForDiscovery | 898ee1bb-f9e8-4a75-9858-a6c9142bc99e | |
| relation.isAuthorOfPublication | ae090fc6-2387-4087-ba21-7271835b4b35 | |
| relation.isAuthorOfPublication.latestForDiscovery | ae090fc6-2387-4087-ba21-7271835b4b35 |
Files
Original bundle
1 - 1 of 1