Clasificación de imágenes de teledetección con técnicas de aprendizaje profundo en situaciones de escasez de datos
Loading...
Identifiers
Publication date
Authors
Advisors
Editors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Dentro del problema de clasificar imágenes multi e hiperespectrales, las técnicas
basadas en aprendizaje profundo son las opciones más empleadas. El motivo es que
son capaces de alcanzar mayores precisiones de clasificación que los métodos de
aprendizaje automático tradicionales empleados anteriormente. Concretamente, las
Redes Neuronales Convolucionales (CNN) han resultado ser la arquitectura más
popular en la actualidad para resolver estos problemas de clasificación multiclase.
No obstante, aunque las arquitecturas neuronales son herramientas muy efectivas,
también requieren una gran cantidad de datos de aprendizaje para extraer todo su
potencial. Además, los conjuntos de datos que se emplean en teledetección tienden
a presentar dos grandes problemas: la escasez de datos anotados y el desbalance
entre clases, de modo que ciertas clases de elementos tienen muchas más muestras
que otras. Esta problemática limita la capacidad de los métodos de aprendizaje
automático, y lo hace especialmente en las arquitecturas neuronales. Considerando
lo común que es el proceso de clasificación en teledetección, resulta de gran interés
encontrar vías para minimizar el impacto de las limitaciones de los conjuntos de datos
y evitar perjudicar así el desempeño de los clasificadores basados en aprendizaje
profundo que se emplean en la actualidad en este dominio.
En este trabajo se propone un esquema de clasificación de imágenes de teledetección fundamentado en aprendizaje profundo, cuyo diseño ha sido guiado por el
objetivo de minimizar el impacto de la escasez de muestras y desbalance de clases en
los conjuntos de datos, para maximizar así la calidad de las clasificaciones realizadas.
Para ello, se adopta como clasificador del esquema una arquitectura convolucional
profunda –CNN residual–, al ser la base de los mejores clasificadores de la actualidad.
El entrenamiento de esta red se apoya con técnicas de aumentado de datos. Por
una parte, se aplican técnicas de aumentado tradicionales a las muestras de entrenamiento reales. Por otra parte, se integra la CNN residual en un esquema Generative
Adversarial Networks (GAN), dentro del cual existe una red neuronal auxiliar que
genere nuevas muestras sintéticas realistas que suministrar al clasificador durante el
entrenamiento. Para mejorar la calidad de la información de entrenamiento, se aplica
una etapa de segmentación en superpíxeles a la imagen como preprocesamiento,
extrayéndose a posteriori una muestra real por cada segmento. Para maximizar la
calidad de las clasificaciones generadas, se evalúa el comportamiento de las arquitecturas neuronales bajo una multitud de configuraciones diferentes, para identificar
y preservar los criterios de diseño que les permiten alcanzar un mejor desempeño.
También se aplican diversas optimizaciones computacionales para reducir todo lo
posible el tiempo de entrenamiento del esquema desarrollado.
Desde el punto de vista investigador, el interés de este trabajo radica en la
combinación de diferentes técnicas que se habitúan emplear por separado en la
literatura, ahora bajo un único esquema de clasificación. Además, se adoptará un
diseño de GAN todavía no evaluado en el campo de la teledetección, que presenta
mejoras en su estructura para alcanzar mejores desempeños en problemas que
trabajen con conjuntos de datos limitados.
Description
Traballo Fin de Máster en Computación de Altas Prestacións. Curso 2021-2022
Bibliographic citation
Relation
Has part
Has version
Is based on
Is part of
Is referenced by
Is version of
Requires
Sponsors
Rights
Atribución-NoComercial-CompartirIgual 4.0 Internacional








