RT Book,_Section T1 CORTEGAL, Corpus de textos galegos escritos por estudantes no ámbito académico. Deseño do corpus e caracterización dos textos A1 Álvarez de la Granja, María A1 Rodríguez Rodríguez, Reyes K1 Corpus de aprendentes K1 Análise de erros asistida por ordenador K1 Galego AB O obxectivo deste capítulo é dobre. Por un lado, realízase unha presentación xeral da metodoloxía empregada na elaboración de CORTEGAL, tanto no relativo á confección da mostra como no que ten que ver coa anotación e corrección das redaccións que o conforman. En primeiro lugar, descríbense con detalle os criterios de selección dos textos e ofrécese unha caracterización xeral destes desde o punto de vista cualitativo (tipo de textos, temas...). A seguir, amósase e xustifícase a estrutura e as características básicas do corpus, elaborado na plataforma TEITOK en formato TEI/XML, dando conta das anotacións textuais e lingüísticas que contén (metadatos, anotacións a nivel de token e anotacións standoff). A seguir, preséntanse os principios metodolóxicos xerais empregados no proceso de transcrición dos textos, así como na anotación e corrección das formas e secuencias non estándares. Esta presentación serve como marco xeral para situar e entender adecuadamente os datos que se ofrecen na segunda parte de capítulo e nas restantes contribucións que conforman o libro en que se insire este. Na segunda parte do traballo presentamos os datos cuantitativos globais do corpus, atendendo por un lado á caracterización xeral dos textos (número de palabras e lemas, media de parágrafos por texto, media de enunciados por parágrafo...) e por outro lado aos diferentes problemas detectados nos seis niveis analizados (ortográfico, morfolóxico, léxico, gramatical, semántico e discursivo). A partir dos datos encontrados, ofrecemos unha caracterización global dos textos que conforman o corpus, desde o punto de vista da súa estrutura e das diverxencias máis frecuentes con respecto ao estándar académico. PB Universidade de Santiago de Compostela SN 978-84-9192-000-7 SN 2341-1198 YR 2023 FD 2023-12-20 LK http://hdl.handle.net/10347/32678 UL http://hdl.handle.net/10347/32678 LA glg NO Álvarez de la Granja, M. e Rodríguez Rodríguez, R. (2023). CORTEGAL, Corpus de textos galegos escritos por estudantes no ámbito académico. Deseño do corpus e caracterización dos textos. En M. Álvarez de la Granja e Vítor Míguez Rego (Eds.), Perspectivas sobre a escrita académica en galego. Estudos baseados no corpus CORTEGAL de textos escritos por estudantes (pp. 19-91). Universidade de Santiago de Compostela. NO A publicación deste libro foi posible grazas á colaboración do Ministerio de Cultura e Deporte do Goberno de España mediante subvención ao Instituto da Lingua Galega. A elaboración do corpus CORTEGAL en que se basean os traballos foi posible grazas ao apoio financeiro da Secretaría Xeral de Política Lingüística da Xunta de Galicia a través de convenios de colaboración co Instituto da Lingua Galega e grazas ao financiamento do proxecto PGC2018-096069-B-I00 por parte do Ministerio de Ciencia e Innovación e Universidades do Goberno de España DS Minerva RD 24 abr 2026