Mark-up and Annotation in the Corpus of Historical English Law Reports (CHELAR): Potential for Historical Genre Analysis
Loading...
Identifiers
ISSN: 0210-6124
E-ISSN: 1989-6840
Publication date
Advisors
Tutors
Editors
Journal Title
Journal ISSN
Volume Title
Publisher
Asociación Española de Estudios de Inglés, AEDEAN (Asociación Española de Estudios Anglo-Norteamericanos)
Abstract
Adding annotation and mark-up to linguistic corpora has become a standard practice in corpus
building over the past few decades as a way to facilitate data extraction and at the same time
guarantee that new corpora are compatible with existing and future tools. The purpose of this
article is twofold. First, we provide an overview of the main forms of annotation and mark-up
available to the research community and how they have been applied to the Corpus of Historical
English Law Reports 1535-1999 (CHELAR), a specialized corpus consisting of law reports or
records of judicial decisions. Second, we give an account of preliminary research based on the
annotated versions of CHELAR, which so far has been primarily aimed at identifying the
distinctive linguistic characteristics of law reports, as well as at investigating how the language
of law reports has evolved over a time span of almost five centuries. Our article illustrates the
multiple advantages of applying a simple annotation schema to a corpus and how this can
enhance the potential of a corpus for historical genre analysis.
El etiquetado y anotación lingüística de un corpus se ha convertido en una práctica generalizada en las últimas décadas, con el objetivo de facilitar la extracción de datos del propio corpus, así como garantizar que los corpus nuevos son compatibles con otros ya existentes o creados con posterioridad. El presente artículo tiene una doble finalidad. Por una parte, proporcionamos un análisis de las principales formas de etiquetado y anotación que están a nuestra disposición. Tomando como ejemplo el Corpus of Historical English Law Reports 1535-1999 (CHELAR), un corpus especializado de decisiones judiciales, ilustraremos el modo en que estos etiquetados pueden implementarse de forma sencilla para su posterior aprovechamiento. En segunda instancia, presentamos un resumen de los trabajos de investigación que se han llevado a cabo hasta la fecha con CHELAR, y que se han centrado principalmente en identificar las características lingüísticas significativas de las decisiones judiciales, así como en investigar la evolución del lenguaje de estos documentos durante casi cinco siglos. Nuestro trabajo ilustra las múltiples ventajas de la implementación de un sistema de anotación simplificado y las mejoras que este supone para el análisis textual desde la perspectiva histórica
El etiquetado y anotación lingüística de un corpus se ha convertido en una práctica generalizada en las últimas décadas, con el objetivo de facilitar la extracción de datos del propio corpus, así como garantizar que los corpus nuevos son compatibles con otros ya existentes o creados con posterioridad. El presente artículo tiene una doble finalidad. Por una parte, proporcionamos un análisis de las principales formas de etiquetado y anotación que están a nuestra disposición. Tomando como ejemplo el Corpus of Historical English Law Reports 1535-1999 (CHELAR), un corpus especializado de decisiones judiciales, ilustraremos el modo en que estos etiquetados pueden implementarse de forma sencilla para su posterior aprovechamiento. En segunda instancia, presentamos un resumen de los trabajos de investigación que se han llevado a cabo hasta la fecha con CHELAR, y que se han centrado principalmente en identificar las características lingüísticas significativas de las decisiones judiciales, así como en investigar la evolución del lenguaje de estos documentos durante casi cinco siglos. Nuestro trabajo ilustra las múltiples ventajas de la implementación de un sistema de anotación simplificado y las mejoras que este supone para el análisis textual desde la perspectiva histórica
Description
Bibliographic citation
Rodríguez-Puente, P., Blanco-García, C. and Tamaredo, I., 2019. Mark-up and Annotation in the Corpus of Historical English Law Reports (CHELAR): Potential for Historical Genre Analysis. Atlantis. Journal of the Spanish Association for Anglo-American Studies, 41(2), pp.63-84.
Relation
Has part
Has version
Is based on
Is part of
Is referenced by
Is version of
Requires
Publisher version
https://doi.org/10.28914/Atlantis-2019-41.2.03Sponsors
Rights
© The Author(s) Content is licensed under a Creative Commons Attribution NonCommercial ShareAlike 4.0 International Licence








