Extracção de relações semânticas. Recursos, ferramentas e estratégias
Loading...
Identifiers
Publication date
Authors
Advisors
Tutors
Editors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
A extracção de relações, enquadrada dentro das tarefas de extracção de informação, visa
obter automaticamente exemplos de relações semânticas presentes em textos. Esta
informação pode ser posteriormente organizada em formatos legíveis por computadores,
sendo útil para diversas aplicações que necessitem conhecimento semântico estruturado.
A presente tese avalia diferentes estratégias para a extracção automática de relações
semânticas de textos em português, espanhol e galego. Com esse fim, são utilizadas
tanto técnicas de aprendizagem automática (com supervisãodistante
e supervisionadas)
como sistemas baseados em regras, sendo analisado o impacto de diferentes níveis de
conhecimento linguístico nas várias abordagens avaliadas. Em relação ao domínio, as
extracções lidam com conhecimento de carácter enciclopédico, mediante a criação de
classificadores de relações biográficas (em domínio fechado) e a avaliação de sistemas
de extracção de informação aberta.
Com o objectivo de implementar os sistemas de extracção, foram também construídas
diversas ferramentas para o processamento da linguagem natural nos três idiomas
referidos: desde módulos de segmentação de orações e de tokenização, a sistemas de
desambiguação morfossintáctica, de reconhecimento de entidades mencionadas e de
resolução de correferência. Além disso, foram compilados e adaptados léxicos e corpora
com anotação linguística de diferentes níveis, úteis para o treino e avaliação de modelos
probabilísticos e baseados em regras. Como resultado do trabalho realizado nesta tese,
disponibilizamse
novas ferramentas e recursos para o processamento automático de
textos em português, espanhol e galego.
Description
Bibliographic citation
Relation
Has part
Has version
Is based on
Is part of
Is referenced by
Is version of
Requires
Sponsors
Rights
Esta obra atópase baixo unha licenza internacional Creative Commons BY-NC-ND 4.0. Calquera forma de reprodución, distribución, comunicación pública ou transformación desta obra non incluída na licenza Creative Commons BY-NC-ND 4.0 só pode ser realizada coa autorización expresa dos titulares, salvo excepción prevista pola lei. Pode acceder Vde. ao texto completo da licenza nesta ligazón: https://creativecommons.org/licenses/by-nc-nd/4.0/deed.gl








