RT Journal Article T1 Corpus lingüísticos de habla infantil y representatividad: el valor de los datos en repertorios de habla en desarrollo T2 Linguistic Corpus and Representativeness: The Usefulness of Data in Child Language Corpus A1 Fernández Pérez, Milagros K1 Inventarios de adquisición de la lengua K1 Datos significativos de habla infantil K1 Registros verbales evolutivos K1 Composición de corpus de habla en desarrollo K1 Corpus-driven vs. Corpus-oriented K1 Lenguaje infantil K1 Language Acquisition Inventories K1 Child Language Meaningful Data K1 Evolutionary Speech Records K1 Composition of Language Development Corpora K1 Child Language AB Este trabajo destaca la importancia de la composición sobre la cantidad en los inventarios de datos de habla infantil. Las garantías de representatividad exigidas a catálogos de muestras verbales suelen ceñirse a la dimensión cuantitativa, de modo que las propiedades cualitativas ligadas a la naturaleza del propio repertorio no siempre parecen bien definidas y, de manera particular, apenas se contemplan en fuentes de habla en desarrollo. Nuestra contribución, de orden teórico-metodológico, justifica la necesidad de atribuir relevancia a las muestras de habla infantil sobre criterios cualitativos que alcanzan a características genuinas de la lengua-en-proceso. El lenguaje de los niños no está suficientemente documentado, así que antes que “corpus de referencia” con garantías de representatividad cuantitativa, los inventarios de habla infantil sustentan su valor en el significado de las muestras por sus propiedades idiosincrásicas. En concreto, defendemos tres dimensiones requeridas para la pertinencia de los datos en un corpus de adquisición de la lengua: (a) que contengan registros evolutivos de datos longitudinales; (b) que incluyan variables de contexto idiomático y de entorno habitual que canalizan el input; y (c) que se trate de compilaciones densas de muestras, o de compilaciones con diversidad de sujetos, para que en todo caso revelen los patrones interesantes y no solo los frecuentes. AB This paper emphasizes the importance of composition over quantity in child language corpora. The ‘representativeness’ guaranteed in corpora of spoken language usually concerns only the quantitative aspects of the data, the qualitative properties associated to the nature of those corpora being not always well defined. Particularly, they are barely considered in language development corpora. The present, theoretical-methodological contribution explains the need of attributing relevance to child language samples, by using qualitative criteria related to the peculiar characteristics of the language-in-process. Child language is not documented enough, so rather than “reference corpora”, guaranteed to be quantitatively representative, child language corpora are valuable due to the meaning of the samples and their peculiar properties. More concretely, three aspects are argued to be of relevance in the data of a language acquisition corpus: (a) evolutionary records of longitudinal data; (b) variables of idiomatic context and usual environment, responsible of the input; and (c) dense sampling, or with a diversity of individuals, that can reveal relevant patterns and not only the most frequent ones. PB EUNSA YR 2020 FD 2020-06-15 LK https://hdl.handle.net/10347/40792 UL https://hdl.handle.net/10347/40792 LA spa NO Fernández-Pérez, M. (2020). Corpus lingüísticos de habla infantil y representatividad: el valor de los datos en repertorios de habla en desarrollo. Rilce. Revista De Filología Hispánica, 36(2), 651-73. https://doi.org/10.15581/008.36.2.651-73 NO Este trabajo se inscribe en el proyecto financiado por FEDER/Ministerio de Ciencia, Innovación y Universidades-Agencia Estatal de Investigación, Adquisición fónica y corpus. Tratamiento en PHON del corpus koiné de habla infantil (FFI2017-82752-P). DS Minerva RD 24 abr 2026