Tutorial de clasificación de imágenes de ArcMap: 2.5 – Exploración de los datos

Los datos de bandas multiespectrales diferentes, a menudo, están altamente correlacionados y contienen información similar. Por ejemplo, los sensores en la banda 4 y 5 de Landsat MSS (verde y rojo, respectivamente)producen imágenes de apariencia visual muy similares porque la reflectancia para el mismo tipo de superficie es casi idéntica. Las transformaciones de imagen basadas en el procesamiento estadístico complejo de datos multiespectrales se pueden utilizar para reducir la redundancia de datos y la correlación entre bandas. El análisis de componentes principales es una transformación de este tipo. El objetivo de esta transformación es reducir el número de dimensiones (número de bandas) y producir compresión de informaciónde múltiples bandas en un número menor de bandas. Las “nuevas” bandas que resultan de esta compresión estadística se llaman componentes . Este proceso apunta a maximizar (estadísticamente) la cantidad de información (ovarianza) de los datos originales en un número limitado de componentes. Por ejemplo, el análisis de componentes principales puede transformar datos de siete bandas de sensores TM / Landsat (Mapeador temático) de modo que los tres componentes principales de la transformación contengan más del 90% de la información contenida en las siete bandas iniciales. Interpretar y analizarestos tres componentes, combinándolos visual y numéricamente, es más simple y más eficiente que usar las siete bandas originales. El análisis de componentes principales u otras transformaciones complejas pueden ser usadas como técnicas de mejora visual para facilitar la interpretación o para reducir el número de bandas que se proporcionarán como datos de entrada a un procedimiento declasificación numérica.



La herramienta Componentes principals de ArcMap

La herramienta componentes principales convierte los datosde los canales de entrada en el espacio de atributos multivariados cuando se hace girar los ejes en relación con el espacio original. Los ejes (atributos)del nuevo espacio no están correlacionados. La razón principal para transformarlos datos en un análisis de componentes principales es comprimir los datos eliminando la redundancia.

Es obvio que los datos son redundantes en un raster multicanal incluyendo valores de altitud, pendiente y exposición (en una escala continua). Debido aque la pendiente y la exposición generalmente se derivan de la altitud, se puede explicar una gran proporción de la varianza en el área de estudio, gracias a la altitud.

El resultado es un raster multicanal con el mismo número de canales que los componentes designados (un canal por eje en el nuevo espacio multivariado).El primer componente principal tendrá la varianza más alta, el segundo componente la varianza más alta que no se describe por el primero, y así sucesivamente. A menudo, los primeros tres (o cuatro) rásteres del ráster multicanal generado con la herramienta de componentes principales pueden describir más de 95   % de la varianza. Puede eliminar los canales individuales restantes. Porque el nuevo ráster contiene menos capas y más de95.   % de la varianza del ráster original, los cálculos son más rápidos y se mantiene la precisión.

La herramienta Componentes principales precisa un ráster de entrada multicanal, el número de componentes principales para convertir los datos, el nombre del archivo de estadísticas de salida y el nombre del ráster de salida. El ráster de salida tiene el mismo número de canales que el número definido de componentes. Cada canal describe un componente.

Conceptos de análisis de componentes principales

Teóricamente, utilizando un ráster de dos canales, el desplazamiento, la rotación de los ejes y transformación de los datos se realizan de la siguiente manera   :

  • Los datos se representan en un diagrama de dispersión.

Se calcula una elipse para vincular los puntos contenidos en la nube de puntos

Límite de elipse dibujado Se indica el eje mayor de la elipse. El eje mayor se convierte en el nuevo eje x, el primer componente principal (PC1). PC1 describe la varianza más importante porque representa la sección transversal más grande en la elipse. La dirección de PC1 es el vector propio, y su magnitudel valor propio. El ángulo del eje de las x con respecto a PC1 esel ángulo de rotación utilizado en la transformación.

Primer componente principal

El sistema calcula una línea perpendicular a la línea ortogonal PC1. Esta línea es el segundo componente principal(PC2) y el nuevo eje para el eje de las y original (vea la figura a continuación). El nuevo eje describe la segunda varianza más grande que no aparece en PC1.   

Segundo componente principal

Utilizando los vectores propios, los valores propios y la matriz de covarianza calculada de la entrada del ráster multicanal, se crea una fórmula lineal que define el desplazamiento y la rotación. Esta fórmula se aplica para transformar el valor de cada celda en relación con el nuevo eje.

Ejemplo

Retomaremos la imagen del Landsat 8 de capítulos anteriores. Primero crearemos una imagen compuesta con las 11 bandas. Con la herramienta   Bandascompuestas de la caja de herramientas:  

El resultado se muestra en ArcMap.   

Usaremos
Toolbox-> Herramientas Spatial Analyst -> Multivariable ->
Componentes Principales

Introduzca un nombre para el ráster resultante. Contendrá los valores
calculados para cada componente solicitado, para cada píxel de la imagen.

El número de componentes principales se puede dejar por default al número de bandas de entrada, pero para ahorrar tiempo de cálculo y producir rásteres de resultados menos voluminosos, podemos ingresar directamente 3 como componentes para calcular. Es casi imposible encontrar imágenes donde un cuarto componente proporciona información adicional significativa. El último archivo es el archivo donde encontrará los resultados del análisis. Para nuestro ejemplo, en la parte inferior del archivo tenemos:   

La columna Percent EigenValues proporciona el porcentaje
de variación explicado por cada componente calculado. En nuestro caso:

  • El primer componente principal explica el 92% de la varianza de los datos de los 11 canales de entrada
  • El segundo componente principal representa el 7%.
  • El tercero y último explica el 1%de la   varianza total.

Aquí está la representación de cada banda calculada.
  

Banda 1 de los componentes principales.

Banda
2 de los componentes principales.

Banda 3 de los componentes principales.

Dependiendo del tipo de objetivo buscado   en la clasificación,puede ser mucho más sencillo crear un archivo de firma a partir de este nuevo ráster que a partir  del ráster original.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *