RT Journal Article T1 Análisis morfosintáctico y clasificación de entidades nombradas en un entorno Big Data T2 PoS tagging and Named Entitiy Recognition in a Big Data environment A1 Gamallo Otero, Pablo A1 Pichel Campos, Juan Carlos A1 García González, Marcos A1 Abuín Mosquera, José Manuel A1 Fernández Pena, Anselmo Tomás K1 Análisis morfosintáctico K1 Reconocimiento y clasificación de entidades nombradas K1 Big Data K1 Computación paralela K1 PoS tagging K1 Named Entity Recognition K1 Parallel computing AB Este artículo describe una suite de módulos lingüísticos para el castellano, basado en una arquitectura en tuberías, que incluye tareas de análisis morfosintáctico así como de reconocimiento y clasificación de entidades nombradas. Se han aplicado técnicas de paralelización en un entorno Big Data para conseguir que la suite de módulos sea más eficiente y escalable y, de este modo, reducir de forma significativa los tiempos de cómputo con los que poder abordar problemas a la escala de la Web. Los módulos han sido desarrollados con técnicas básicas para facilitar su integración en entornos distribuidos, con un rendimiento próximo al estado del arte AB This article describes a suite of linguistic modules for the Spanish language based on a pipeline architecture, which contains tasks for PoS tagging and Named Entity Recognition and Classification (NERC). We have applied run-time parallelization techniques in a Big Data environment in order to make the suite of modules more efficient and scalable, and thereby to reduce computation time in a significant way. Therefore, we can address problems at Web scale. The linguistic modules have been developed using basic NLP techniques in order to easily integrate them in distributed computing environments. The qualitative performance of the modules is close the the state of the art PB Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN) SN 1135-5948 YR 2014 FD 2014 LK http://hdl.handle.net/10347/17696 UL http://hdl.handle.net/10347/17696 LA spa NO Gamallo, P., Pichel, J., García, M., Abuín, J., & Fernández Pena, T. (2014). Análisis morfosintáctico y clasificación de entidades nombradas en un entorno Big Data. Procesamiento Del Lenguaje Natural, 53, 17-24. Recuperado de http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/5046/2934 NO Este trabajo ha sido subvencionado con cargo a los proyectos HPCPLN - Ref:EM13/041 (Programa Emergentes, Xunta de Galicia), Celtic - Ref:2012-CE138 y Plastic - Ref:2013-CE298 (Programa Feder-Innterconecta) DS Minerva RD 29 abr 2026