RT Journal Article
T1 Corpus lingüísticos de habla infantil y representatividad: el valor de los datos en repertorios de habla en desarrollo
T2 Linguistic Corpus and Representativeness: The Usefulness of Data in Child Language Corpus
A1 Fernández Pérez, Milagros
K1 Inventarios de adquisición de la lengua
K1 Datos significativos de habla infantil
K1 Registros verbales evolutivos
K1 Composición de corpus de habla en desarrollo
K1 Corpus-driven vs. Corpus-oriented
K1 Lenguaje infantil
K1 Language Acquisition Inventories
K1 Child Language Meaningful Data
K1 Evolutionary Speech Records
K1 Composition of Language Development Corpora
K1 Child Language
AB Este trabajo destaca la importancia de la composición sobre la cantidad en los inventarios de datos de habla infantil. Las garantías de representatividad exigidas a catálogos de muestras verbales suelen ceñirse a la dimensión cuantitativa, de modo que las propiedades cualitativas ligadas a la naturaleza del propio repertorio no siempre parecen bien definidas y, de manera particular, apenas se contemplan en fuentes de habla en desarrollo. Nuestra contribución, de orden teórico-metodológico, justifica la necesidad de atribuir relevancia a las muestras de habla infantil sobre criterios cualitativos que alcanzan a características genuinas de la lengua-en-proceso. El lenguaje de los niños no está suficientemente documentado, así que antes que “corpus de referencia” con garantías de representatividad cuantitativa, los inventarios de habla infantil sustentan su valor en el significado de las muestras por sus propiedades idiosincrásicas. En concreto, defendemos tres dimensiones requeridas para la pertinencia de los datos en un corpus de adquisición de la lengua: (a) que contengan registros evolutivos de datos longitudinales; (b) que incluyan variables de contexto idiomático y de entorno habitual que canalizan el input; y (c) que se trate de compilaciones densas de muestras, o de compilaciones con diversidad de sujetos, para que en todo caso revelen los patrones interesantes y no solo los frecuentes.
AB This paper emphasizes the importance of composition over quantity in child language corpora. The ‘representativeness’ guaranteed in corpora of spoken language usually concerns only the quantitative aspects of the data, the qualitative properties associated to the nature of those corpora being not always well defined. Particularly, they are barely considered in language development corpora. The present, theoretical-methodological contribution explains the need of attributing relevance to child language samples, by using qualitative criteria related to the peculiar characteristics of the language-in-process. Child language is not documented enough, so rather than “reference corpora”, guaranteed to be quantitatively representative, child language corpora are valuable due to the meaning of the samples and their peculiar properties. More concretely, three aspects are argued to be of relevance in the data of a language acquisition corpus: (a) evolutionary records of longitudinal data; (b) variables of idiomatic context and usual environment, responsible of the input; and (c) dense sampling, or with a diversity of individuals, that can reveal relevant patterns and not only the most frequent ones.
PB EUNSA
YR 2020
FD 2020-06-15
LK https://hdl.handle.net/10347/40792
UL https://hdl.handle.net/10347/40792
LA spa
NO Fernández-Pérez, M. (2020). Corpus lingüísticos de habla infantil y representatividad: el valor de los datos en repertorios de habla en desarrollo. Rilce. Revista De Filología Hispánica, 36(2), 651-73. https://doi.org/10.15581/008.36.2.651-73
NO Este trabajo se inscribe en el proyecto financiado por FEDER/Ministerio de Ciencia, Innovación y Universidades-Agencia Estatal de Investigación, Adquisición fónica y corpus. Tratamiento en PHON del corpus koiné de habla infantil (FFI2017-82752-P).
DS Minerva
RD 24 abr 2026