Framework para la construcción y despliegue de sistemas de procesamiento en tiempo real

dc.contributor.affiliationUniversidade de Santiago de Compostela. Escola Técnica Superior de Enxeñaríagl
dc.contributor.authorMartínez Castaño, Rodrigo
dc.contributor.tutorPichel Campos, Juan Carlos
dc.contributor.tutorLosada Carril, David Enrique
dc.date.accessioned2021-07-12T10:37:08Z
dc.date.available2021-07-12T10:37:08Z
dc.date.issued2018-06
dc.descriptionTraballo Fin de Máster en Tecnoloxías de Análise de Datos Masivos: Big Data. Curso 2017-2018gl
dc.description.abstractEn los últimos años se han desarrollado numerosas tecnologías destinadas al procesamiento de datos masivos, muchas de ellas de código abierto y de uso libre. Estas plataformas se centran en la escalabilidad horizontal, lo que implica que para el procesamiento de una mayor cantidad de datos sin grandes distorsiones en el ritmo, no es necesario aumentar o actualizar los recursos de una máquina (escalabilidad vertical), sino que es su ficiente con añadir más nodos con similares características a un clúster. La proliferación de este tipo de tecnologías de código abierto han democratizado y condicionado el gran número de aplicaciones que hacen uso de estas plataformas en multitud de ámbitos, tanto profesionales como académicos. Centrándonos en los frameworks de procesamiento, nos encontramos con una importante limitación: los datos han de poder dividirse en grupos independientes, de tal modo que sea posible paralelizar el trabajo en diferentes máquinas aunque existan puntos de procesamiento secuencial. Existen dos grandes tipos de tecnologías de procesamiento de este tipo: procesamiento de lotes (batch processing) y procesamiento de flujos (stream processing). En el primer caso, los resultados finales se obtienen juntos al fi nalizar el procesamiento del lote de datos compuesto por una o más etapas. Para de finir el trabajo a realizar, se define una topología de procesamiento que indica el flujo de los datos a través de las distintas etapas. Cada nodo (físico o virtual) puede ejecutar una instancia de la topología (aislada del resto de instancias), repartiéndose los datos de forma equitativa entre las instancias existentes. En las tecnologías de procesamiento de flujos, las distintas etapas de una topología son independientes y no pertenecen a una instancia concreta. Por tanto, las distintas etapas pueden ser paralelizadas de forma individual sin aumentar el grado de paralelismo de toda la topología. Estas tecnologías son adecuadas para aplicaciones que obtienen información en tiempo real y deben dar una respuesta inmediata, ya que cuando un dato completa su camino a través de las distintas etapas, el resultado puede obtenerse de forma instantánea. Sin embargo, con el procesamiento de lotes los resultados se obtienen cuando un lote de datos es procesado por completo. Un caso de aplicación de procesamiento en tiempo real es el análisis de contenidos en redes sociales para la detección temprana de riesgos. Este será el objetivo principal de este proyecto.gl
dc.identifier.urihttp://hdl.handle.net/10347/26566
dc.language.isospagl
dc.rightsAtribución-NoComercial-CompartirIgual 4.0 Internacional
dc.rights.accessRightsopen accessgl
dc.rights.urihttp://creativecommons.org/licenses/by-nc-sa/4.0/
dc.subjectProcesamiento de datosgl
dc.subjectProcesamiento en tiempo realgl
dc.subjectRedditgl
dc.subjectCatenaegl
dc.subjectAncorisgl
dc.subjectProcesamiento de flujosgl
dc.subjectProcesamiento de lotesgl
dc.subject.classificationMaterias::Investigación::33 Ciencias tecnológicas::3304 Tecnología de los ordenadoresgl
dc.titleFramework para la construcción y despliegue de sistemas de procesamiento en tiempo realgl
dc.typemaster thesisgl
dspace.entity.typePublication
relation.isAdvisorOfPublicationdb334853-753e-4afc-9f4f-ad847d0353a7
relation.isAdvisorOfPublication7ddb36fe-bf39-4c79-85bc-540ce4d9a23b
relation.isTutorOfPublicationdb334853-753e-4afc-9f4f-ad847d0353a7
relation.isTutorOfPublication7ddb36fe-bf39-4c79-85bc-540ce4d9a23b
relation.isTutorOfPublication.latestForDiscoverydb334853-753e-4afc-9f4f-ad847d0353a7

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
2018_TFM_Martínez_ProcesamientoTR.pdf
Size:
2.77 MB
Format:
Adobe Portable Document Format
Description: