Extendiendo una plataforma Big Data multilenguaje para su aplicación a la Bioinformática

dc.contributor.affiliationUniversidade de Santiago de Compostela. Escola Técnica Superior de Enxeñaríagl
dc.contributor.authorMuiño Argüelles, Gonzalo
dc.contributor.tutorPichel Campos, Juan Carlos
dc.contributor.tutorFernández Pena, Anselmo Tomás
dc.date.accessioned2023-01-11T11:46:44Z
dc.date.available2023-01-11T11:46:44Z
dc.date.issued2021-07
dc.description.abstractEn los últimos años, la cantidad de información digital recopilada se ha incrementado de forma significativa en numerosos campos como la biología, la física, la economía y la medicina, dando lugar a lo que llamamos la era del Big Data. Tal ha sido este crecimiento que se han creado nuevos frameworks específicos para gestionar el almacenamiento y posterior análisis de toda esta información y que facilitan el desarrollo de aplicaciones para el procesamiento de estas cantidades masivas en un tiempo razonable haciendo uso de clusters de computadores. Entre estos frameworks destaca Apache Spark que, a pesar de ser una de las herramientas más utilizadas del ámbito de Big Data, tiene limitaciones considerables, entre las cuales destaca la necesidad de hacer uso de determinados lenguajes de programación como Scala, Java, Python o R, requiriendo un esfuerzo significativo de conversión para poder aplicarlo a programas escritos en otros lenguajes de programación. Para solventar este problema se ha desarrollado Ignis, un nuevo framework Big Data que, a través del uso de RPC’s, permite la utilización de múltiples lenguajes de programación para conseguir la utilización del paradigma map-reduce. En este trabajo realizaremos una comparación entre Spark e Ignis, analizando el esfuerzo necesario para realizar el portado de aplicaciones de Spark a Ignis, comparando su escalabilidad y realizando una valoración final de ambos frameworks. Nos hemos centrado en aplicaciones de bioinformática, en concreto de genética, ámbito en el que, en los últimos, han aparecido soluciones basadas en tecnologías Big Data para resolver el problema del procesamiento de la enorme cantidad de datos de genoma proporcionados por los secuenciadores de última generación.gl
dc.identifier.urihttp://hdl.handle.net/10347/29836
dc.language.isospagl
dc.rightsAtribución-NoComercial-CompartirIgual 4.0 Internacional
dc.rights.accessRightsopen accessgl
dc.rights.urihttp://creativecommons.org/licenses/by-nc-sa/4.0/
dc.subjectIgnisgl
dc.subjectApache Sparkgl
dc.subjectBig Datagl
dc.subjectBioinformáticagl
dc.subject.classificationMaterias::Investigación::33 Ciencias tecnológicas::3304 Tecnología de los ordenadoresgl
dc.titleExtendiendo una plataforma Big Data multilenguaje para su aplicación a la Bioinformáticagl
dc.typemaster thesisgl
dspace.entity.typePublication
relation.isAdvisorOfPublicationdb334853-753e-4afc-9f4f-ad847d0353a7
relation.isTutorOfPublicationdb334853-753e-4afc-9f4f-ad847d0353a7
relation.isTutorOfPublicationdecb372f-b9cd-4237-8dda-2c0f5c40acbe
relation.isTutorOfPublication.latestForDiscoverydb334853-753e-4afc-9f4f-ad847d0353a7

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Muiño Arguelles Gonzalo.pdf
Size:
1.14 MB
Format:
Adobe Portable Document Format
Description: