CORTEGAL, Corpus de textos galegos escritos por estudantes no ámbito académico. Deseño do corpus e caracterización dos textos
Loading...
Identifiers
ISSN: 2341-1198
ISBN: 978-84-9192-000-7
Publication date
Advisors
Tutors
Editors
Journal Title
Journal ISSN
Volume Title
Publisher
Universidade de Santiago de Compostela
Abstract
O obxectivo deste capítulo é dobre. Por un lado, realízase unha presentación xeral da metodoloxía empregada na elaboración de CORTEGAL, tanto no relativo á confección da mostra como no que ten que ver coa anotación e corrección das redaccións que o conforman. En primeiro lugar, descríbense con detalle os criterios de selección dos textos e ofrécese unha caracterización xeral destes desde o punto de vista cualitativo (tipo de textos, temas...). A seguir, amósase e xustifícase a estrutura e as características básicas do corpus, elaborado na plataforma TEITOK en formato TEI/XML, dando conta das anotacións textuais e lingüísticas que contén (metadatos, anotacións a nivel de token e anotacións standoff). A seguir, preséntanse os principios metodolóxicos xerais empregados no proceso de transcrición dos textos, así como na anotación e corrección das formas e secuencias non estándares. Esta presentación serve como marco xeral para situar e entender adecuadamente os datos que se ofrecen na segunda parte de capítulo e nas restantes contribucións que conforman o libro en que se insire este. Na segunda parte do traballo presentamos os datos cuantitativos globais do corpus, atendendo por un lado á caracterización xeral dos textos (número de palabras e lemas, media de parágrafos por texto, media de enunciados por parágrafo...) e por outro lado aos diferentes problemas detectados nos seis niveis analizados (ortográfico, morfolóxico, léxico, gramatical, semántico e discursivo). A partir dos datos encontrados, ofrecemos unha caracterización global dos textos que conforman o corpus, desde o punto de vista da súa estrutura e das diverxencias máis frecuentes con respecto ao estándar académico.
Description
Bibliographic citation
Álvarez de la Granja, M. e Rodríguez Rodríguez, R. (2023). CORTEGAL, Corpus de textos galegos escritos por estudantes no ámbito académico. Deseño do corpus e caracterización dos textos. En M. Álvarez de la Granja e Vítor Míguez Rego (Eds.), Perspectivas sobre a escrita académica en galego. Estudos baseados no corpus CORTEGAL de textos escritos por estudantes (pp. 19-91). Universidade de Santiago de Compostela.
Relation
Has part
Has version
Is based on
Is part of
Is referenced by
Is version of
Requires
Publisher version
https://www.usc.gal/libros/gl/categorias/1237-perspectivas-sobre-a-escrita-academica-en-galego-.htmlSponsors
A publicación deste libro foi posible grazas á colaboración do Ministerio de Cultura e Deporte do Goberno de España mediante subvención ao Instituto da Lingua Galega. A elaboración do corpus CORTEGAL en que se basean os traballos foi posible grazas ao apoio financeiro da Secretaría Xeral de Política Lingüística da Xunta de Galicia a través de convenios de colaboración co Instituto da Lingua Galega e grazas ao financiamento do proxecto PGC2018-096069-B-I00 por parte do Ministerio de Ciencia e Innovación e Universidades do Goberno de España
Rights
O copyright das obras e revistas editadas en acceso aberto é de titularidade da Universidade de Santiago de Compostela, que responde da protección legal dos seus contidos e determina as condicións e límites do seu uso nunha licenza Creative Commons BY-NC-ND 4.0, xenérica de todos os recursos dixitais da editorial en acceso aberto. En consecuencia, calquera forma de reprodución, distribución, comunicación pública ou transformación da obra non incluída na licenza de Creative Commons só poderá ser realizada con autorización expresa dos titulares, agás excepción prevista pola lei.








