CORTEGAL, Corpus de textos galegos escritos por estudantes no ámbito académico. Deseño do corpus e caracterización dos textos

Loading...
Thumbnail Image
Identifiers
ISSN: 2341-1198
ISBN: 978-84-9192-000-7

Publication date

Advisors

Tutors

Editors

Journal Title

Journal ISSN

Volume Title

Publisher

Universidade de Santiago de Compostela
Metrics
Google Scholar
lacobus
Export

Research Projects

Organizational Units

Journal Issue

Abstract

O obxectivo deste capítulo é dobre. Por un lado, realízase unha presentación xeral da metodoloxía empregada na elaboración de CORTEGAL, tanto no relativo á confección da mostra como no que ten que ver coa anotación e corrección das redaccións que o conforman. En primeiro lugar, descríbense con detalle os criterios de selección dos textos e ofrécese unha caracterización xeral destes desde o punto de vista cualitativo (tipo de textos, temas...). A seguir, amósase e xustifícase a estrutura e as características básicas do corpus, elaborado na plataforma TEITOK en formato TEI/XML, dando conta das anotacións textuais e lingüísticas que contén (metadatos, anotacións a nivel de token e anotacións standoff). A seguir, preséntanse os principios metodolóxicos xerais empregados no proceso de transcrición dos textos, así como na anotación e corrección das formas e secuencias non estándares. Esta presentación serve como marco xeral para situar e entender adecuadamente os datos que se ofrecen na segunda parte de capítulo e nas restantes contribucións que conforman o libro en que se insire este. Na segunda parte do traballo presentamos os datos cuantitativos globais do corpus, atendendo por un lado á caracterización xeral dos textos (número de palabras e lemas, media de parágrafos por texto, media de enunciados por parágrafo...) e por outro lado aos diferentes problemas detectados nos seis niveis analizados (ortográfico, morfolóxico, léxico, gramatical, semántico e discursivo). A partir dos datos encontrados, ofrecemos unha caracterización global dos textos que conforman o corpus, desde o punto de vista da súa estrutura e das diverxencias máis frecuentes con respecto ao estándar académico.

Description

Bibliographic citation

Álvarez de la Granja, M. e Rodríguez Rodríguez, R. (2023). CORTEGAL, Corpus de textos galegos escritos por estudantes no ámbito académico. Deseño do corpus e caracterización dos textos. En M. Álvarez de la Granja e Vítor Míguez Rego (Eds.), Perspectivas sobre a escrita académica en galego. Estudos baseados no corpus CORTEGAL de textos escritos por estudantes (pp. 19-91). Universidade de Santiago de Compostela.

Relation

Has part

Has version

Is based on

Is part of

Is referenced by

Is version of

Requires

Sponsors

A publicación deste libro foi posible grazas á colaboración do Ministerio de Cultura e Deporte do Goberno de España mediante subvención ao Instituto da Lingua Galega. A elaboración do corpus CORTEGAL en que se basean os traballos foi posible grazas ao apoio financeiro da Secretaría Xeral de Política Lingüística da Xunta de Galicia a través de convenios de colaboración co Instituto da Lingua Galega e grazas ao financiamento do proxecto PGC2018-096069-B-I00 por parte do Ministerio de Ciencia e Innovación e Universidades do Goberno de España

Rights

O copyright das obras e revistas editadas en acceso aberto é de titularidade da Universidade de Santiago de Compostela, que responde da protección legal dos seus contidos e determina as condicións e límites do seu uso nunha licenza Creative Commons BY-NC-ND 4.0, xenérica de todos os recursos dixitais da editorial en acceso aberto. En consecuencia, calquera forma de reprodución, distribución, comunicación pública ou transformación da obra non incluída na licenza de Creative Commons só poderá ser realizada con autorización expresa dos titulares, agás excepción prevista pola lei.