O processo de lematização no Tesouro do léxico patrimonial galego e português

Loading...
Thumbnail Image
Identifiers
ISBN: 978-85-7846-344-1

Publication date

Advisors

Tutors

Editors

Journal Title

Journal ISSN

Volume Title

Publisher

Universidade Estadual de Londrina
Metrics
Google Scholar
lacobus
Export

Research Projects

Organizational Units

Journal Issue

Abstract

O Tesouro do Léxico Patrimonial Galego e Português é uma base de dados léxica que permite o acesso à informação contida em trabalhos de léxico dialetal do galego, do português de Portugal e do português do Brasil. Os dados das fontes originais oferecem-se completos e organizados a partir de variantes, lemas, classificadores semânticos, categorias gramaticais e localização geográfica. Neste trabalho apresentam-se os principais critérios aplicados no processo de lematização, que implica a atribuição de lemas e de categorias gramaticais às variantes, quer dizer, às unidades léxicas registradas nas fontes. Os lemas têm como finalidade agrupar as diferentes variantes flexivas, ortográficas ou fônicas que se encontram nas obras introduzidas na base, já, as categorias servem para unificar a diversidade de etiquetas e de informação gramatical que se encontra nelas. Além disso, apresentam-se as duas vias de ampliação do projeto: o estabelecimento de geossinônimos e a conexão dos geossinônimos e dos lemários galegos e portugueses

Description

Bibliographic citation

Álvarez de la Granja, María; Negro Romero, Marta (2015). O processo de lematização no Tesouro do léxico patrimonial galego e português. En: Fabiane Cristina Altino / Gleidy Aparecida Lima Milani / Rosa Evangelina Santana Belli Rodrigues (coords.), Anais do III CIDS: Congresso Internacional de Dialetologia e Sociolinguística (pp. 848-862). Londrina (Brasil): Universidade Estadual de Londrina

Relation

Has part

Has version

Is based on

Is part of

Is referenced by

Is version of

Requires

Sponsors

Rights