Álvarez de la Granja, MaríaRodríguez Rodríguez, Reyes2024-02-092023-12-20Álvarez de la Granja, M. e Rodríguez Rodríguez, R. (2023). CORTEGAL, Corpus de textos galegos escritos por estudantes no ámbito académico. Deseño do corpus e caracterización dos textos. En M. Álvarez de la Granja e Vítor Míguez Rego (Eds.), Perspectivas sobre a escrita académica en galego. Estudos baseados no corpus CORTEGAL de textos escritos por estudantes (pp. 19-91). Universidade de Santiago de Compostela.978-84-9192-000-72341-1198http://hdl.handle.net/10347/32678O obxectivo deste capítulo é dobre. Por un lado, realízase unha presentación xeral da metodoloxía empregada na elaboración de CORTEGAL, tanto no relativo á confección da mostra como no que ten que ver coa anotación e corrección das redaccións que o conforman. En primeiro lugar, descríbense con detalle os criterios de selección dos textos e ofrécese unha caracterización xeral destes desde o punto de vista cualitativo (tipo de textos, temas...). A seguir, amósase e xustifícase a estrutura e as características básicas do corpus, elaborado na plataforma TEITOK en formato TEI/XML, dando conta das anotacións textuais e lingüísticas que contén (metadatos, anotacións a nivel de token e anotacións standoff). A seguir, preséntanse os principios metodolóxicos xerais empregados no proceso de transcrición dos textos, así como na anotación e corrección das formas e secuencias non estándares. Esta presentación serve como marco xeral para situar e entender adecuadamente os datos que se ofrecen na segunda parte de capítulo e nas restantes contribucións que conforman o libro en que se insire este. Na segunda parte do traballo presentamos os datos cuantitativos globais do corpus, atendendo por un lado á caracterización xeral dos textos (número de palabras e lemas, media de parágrafos por texto, media de enunciados por parágrafo...) e por outro lado aos diferentes problemas detectados nos seis niveis analizados (ortográfico, morfolóxico, léxico, gramatical, semántico e discursivo). A partir dos datos encontrados, ofrecemos unha caracterización global dos textos que conforman o corpus, desde o punto de vista da súa estrutura e das diverxencias máis frecuentes con respecto ao estándar académico.glgO copyright das obras e revistas editadas en acceso aberto é de titularidade da Universidade de Santiago de Compostela, que responde da protección legal dos seus contidos e determina as condicións e límites do seu uso nunha licenza Creative Commons BY-NC-ND 4.0, xenérica de todos os recursos dixitais da editorial en acceso aberto. En consecuencia, calquera forma de reprodución, distribución, comunicación pública ou transformación da obra non incluída na licenza de Creative Commons só poderá ser realizada con autorización expresa dos titulares, agás excepción prevista pola lei.Corpus de aprendentesAnálise de erros asistida por ordenadorGalego570104 Lingüística informatizada570111 Enseñanza de lenguasCORTEGAL, Corpus de textos galegos escritos por estudantes no ámbito académico. Deseño do corpus e caracterización dos textosbook part10.15304/9788419679970open access