4.1 Clasificacion supervisada de imagenes.pdf

July 10, 2017 | Author: Faustino Laynez | Category: Statistical Dispersion, Statistics, Image, Standard Deviation, Pixel

Share Embed Donate

Report this link

Short Description

Download 4.1 Clasificacion supervisada de imagenes.pdf...

Description

CURSO

Grupo

Fundamentos de Procesamiento Digital de Imágenes

PR Grupo

PR

Percepción Remota y Aplicaciones Geográficas

UNIDAD 4

Percepción Remota y Aplicaciones Geográficas

Clasificación digital de imágenes, edición y presentación de resultados

Tema 1

Clasificación supervisada de imágenes

CIAF CIAF

CentrodedeInvestigación Investigación yy Centro Desarrolloen enInformación Información Geográfic Desarrollo Geográficaa

BOGOTÁ

, D. C.

Clasificación supervisada de imágenes 1. ¿En qué consiste la clasificación digital supervisada? La clasificación supervisada requiere de cierto conocimiento previo del terreno y de los tipos de coberturas presentes en el área de estudio, para lo que se realiza, en el mejor de los casos, una combinación de trabajo de campo, de análisis de fotografías aéreas, mapas e informes técnicos, así como referencias profesionales y locales. Con base de este conocimiento se definen y se delimitan sobre la imagen las áreas de entrenamiento o áreas piloto. Las características espectrales de tales áreas son utilizadas a fin de “entrenar” un algoritmo de clasificación, el cual calcula los parámetros estadísticos de cada banda para cada sitio piloto y de esta forma proceder a evaluar cada ND de la imagen, compararlo y asignarlo a una respectiva clase (ver Figura 1). Así entonces, la clasificación supervisada intenta definir las clases temáticas que no tengan claro significado espectral, razón por la que es considerada un método artificial (Posada, 2008).

Figura 1: Esquema de Clasificación digital supervisada

Fuente: Olaya, 2007

2. ¿Cuál es la metodología para implementar una clasificación digital supervisada? El proceso se puede resumir en las siguientes etapas: análisis visual y estadístico de la imagen y de sus bandas, elaboración de la leyenda del mapa, selección y delimitación de áreas pilotos, generación y evaluación tanto de sus estadísticas como de sus reajustes, elección y aplicación del algoritmo de clasificación, reajustes y nueva clasificación, y finalmente, la evaluación de los resultados y su presentación (Posada, 2008).

Instituto Geográfico Agustín Codazzi.Todos los derechos comerciales reservados. Prohibida su reproducción para fines no académicos o de investigación.

2

2.1 Análisis estadístico y visual de las bandas La etapa inicial consiste en realizar una valoración cualitativa y cuantitativa de la calidad de la imagen de modo multibanda (varias bandas), de su contraste y del comportamiento espectral de distintas cuberturas dentro las bandas espectrales; allí se evalúa la separabilidad espectral de las bandas en relación con las coberturas. Al final, se obtiene la primera apreciación sobre el número de posibles clases temáticas a discriminar, las bandas a utilizar, y los posibles procesos adicionales para derivar nuevas imágenes que podrían ser útiles en la fase de clasificación (Posada, 2008). Algunas de las ayudas métricas o datos gráficos útiles para el análisis de las bandas son las estadísticas multibanda, la correlación, la varianza y la covarianza, así como los gráficos de dispersión entre bandas, etc. Igualmente, se seleccionan y se recortan las ventanas de trabajo ya que es más eficiente realizar el procesamiento preliminar sobre las ventanas experimentales representativas y al final los procesos óptimos se extrapolan sobre la totalidad de la escena (Posada, 2008). En general, el análisis se orienta a definir las cuáles bandas de una imagen multiespectral se utilizarán en el proceso de clasificación. La idea se basa en elegir las bandas en las que se presente mayor contraste espectral entre las coberturas objeto del estudio. Intuitivamente, pareciera que cuando se utiliza un mayor número de bandas en un clasificador, el resultado de la clasificación es mejor (Posada, 2008). En general, hay un número óptimo relativamente pequeño de bandas que se utilizan, pues al aumentarse el número de bandas, aumenta el tiempo computacional requerido dada la gran cantidad de cálculos involucrados y también porque el contenido de la información puede estar contaminado por información insignificante en otras bandas. Este problema es particularmente crítico cuando se utiliza un número grande de bandas espectrales correlacionadas (Posada, 2008). En algunos casos se ha encontrado que la exactitud del clasificador comienza a decaer cuando se utilizan más de cuatro o cinco bandas espectrales, de ahí que sea beneficioso considerar un subconjunto de las bandas más representativas. La decisión sobre cuál de las bandas se debe utilizar se basa en un proceso llamado selección de rasgos o características. En este proceso se evalúan muchos subconjuntos de bandas para así determinar qué combinación es más útil para discriminar las categorías de intereses y el análisis de la clasificación se limitará a ese conjunto de bandas (Salvatierra, 2000 y citado por Posada, 2008).

2.2 Elaboración de la leyenda. Tomando en cuenta los objetivos del proyecto, el nivel de detalle requerido, la escala de trabajo y el tipo de imagen a utilizar, se revisan distintas sistemas de clasificación y se establece una leyenda específica (Posada, 2008).

2.3 Selección y delimitación de las áreas de entrenamiento Es la fase más importante del proceso. Requiere previo conocimiento de las características del área, así como de las categorías que se pretende discriminar. Con base en las experiencias locales y profesionales, el trabajo de campo, uso de fotografías aéreas y otra información secundaria, se definen y se delimitan las áreas de entrenamiento o áreas piloto representativas de cada una de las categorías de interés (P osada, 2008). Esta actividad se basa en los criterios pictórico-morfológicos de la imagen, tales como: tono o color, textura, tamaño, forma, sitio, etc. (ver Figura 2). La selección errónea de muestras conducirá a resultados erróneos. A partir de estas muestras el algoritmo clasificador calcula los ND que definen cada una de las clases y asigna el resto de los píxeles de la imagen a una de esas categorías.

Instituto Geográfico Agustín Codazzi.Todos los derechos comerciales reservados. Prohibida su reproducción para fines no académicos o de investigación.

3

Figura 2: Selección y estadísticas de las áreas de entrenamiento

Fuente: elaboración propia

La delimitación se realiza mediante un cursor sobre la pantalla del computador. Se recomienda seleccionar varias muestras por categoría fin de reflejar adecuadamente la variabilidad de la zona de estudio. Es importante contar con los datos de campo próximos a la fecha de adquisición de la imagen para garantizar la consistencia entre la realidad y la imagen. Se recomienda evitar la delimitación de muestras en los sitios de transición entre las dos clases, ya que éstas presentarán confusión espectral. Las áreas no deben ser muy homogéneas, obviando la variación real de las coberturas temáticas. El tamaño de la muestra, en teoría, puede ser de nueve píxeles. El número de píxeles recomendable es de 200 como mínimo, distribuidos sobre toda la imagen en varios campos pequeños y no en una muestra grande, para no subestimar la variabilidad de esa categoría. Deben tenerse en cuenta las características propias de la imagen intentando abarcar las variaciones que se presentan para cada clase, su orientación, pendiente, densidad, vigor, contenido de humedad y tipo del suelo (Posada, 2008).

Instituto Geográfico Agustín Codazzi.Todos los derechos comerciales reservados. Prohibida su reproducción para fines no académicos o de investigación.

4

Otra alternativa es señalar los píxeles puros y a partir de éstos crear regiones de manera automática, lo que garantiza las aéreas de entrenamiento suficientemente homogéneas, evitando incluir píxeles fronterizas a dos clases. Este método se recomienda para áreas urbanas y cuerpos de agua (Posada, 2008).

2.4 Evaluación estadística de las áreas de entrenamiento Las estadísticas evalúan el grado de representatividad de las áreas pilotos y dan una idea de la separabilidad espectral de las clases temáticas, lo que al final garantiza una buena clasificación. Existen métodos gráficos y numéricos para evaluar las estadísticas. Un ejemplo de estadísticas básicas se presenta en la Figura 2. Los más utilizados son los diagramas de signaturas espectrales y los diagramas de dispersión espectral. Estos diagramas se basan en el análisis de las medias aritméticas y desviaciones estándar, la primera indica el comportamiento espectral medio de los ND, mientras que la segunda indica el grado de heterogeneidad de la muestra. En un diagrama espectral se plasman las bandas que intervienen en una clasificación en el eje X y las medias de ND de cada clase; con este gráfico se evalúan las tendencias espectrales de cada clase, resaltándose el compartimiento de las bandas espectrales en relación con sus vecinas. Las líneas paralelas y cercanas indican una posible confusión espectral y las intersecciones entre las líneas, la buena separabilidad entre éstas (Posada, 2008). Otra forma de representación de los datos de un área de entrenamiento es el gráfico de dispersión espectral, en el que se plasman la media y la desviación estándar por clase temática y por banda (ver Figura 3). Este gráfico es un diagrama de barras que recoge en el eje X el rango digital correspondiente a la media y +/-, una o dos desviaciones estándar y en el eje Y los ND. Así, se visualiza de manera más integrada la situación de cada muestra en cuanto a la separabilidad por banda.

Figura 3: Gráficas de dispersión de áreas de entrenamiento en las bandas TM3, TM4 y TM5

Fuente: elaboración propia

Se puede observar que algunas clases se diferencian en cuanto a su media, pero al final no se garantiza la separabilidad debido al traslape entre sus desviaciones estándar (Posada, 2008). Dentro los métodos numéricos de evaluación estadística se encuentran los criterios de divergencia trasformada y la distancia de Bhattacharya, los cuales calculan con base en medias, varianzas y matrices de varianza-covarianza, además del grado de separabilidad entre las categorías. El mayor valor del criterio indica mayor separabilidad ente éstas. En el caso de la divergen-

Instituto Geográfico Agustín Codazzi.Todos los derechos comerciales reservados. Prohibida su reproducción para fines no académicos o de investigación.

5

cia transformada, la máxima separabilidad entre las bandas de una imagen se da cuando el valor es de 2000, en el caso del segundo criterio el valor es de 1414 (Posada, 2008). Al finalizar el análisis se llega a la conclusión de si las muestras delimitadas son similares estadísticamente, lo que conllevaría a una confusión entre ellas. Si por el contrario las estadísticas resultan ser diferentes, se indicaría un alto grado de separabilidad. En el primer caso se toman decisiones sobre la necesidad de reajustar las parcelas de entrenamiento o de reajustar y generalizar la leyenda, de la complementación de la información, del uso de las imágenes de otras fechas, de otras bandas o de reajustar el método planteado para conseguir los resultados. Una vez se solucionan estas interrogantes se procede a seleccionar algoritmos de clasificación y a la clasificación propiamente dicha (Posada, 2008).

2.5 Elección y aplicación del algoritmo de clasificación Con base en las áreas de entrenamiento delimitadas con anterioridad se puede iniciar el proceso de clasificación, que es automático. El proceso consiste en la agrupación de todos los píxeles de cada banda espectral en una de las clases predeterminadas en la etapa anterior. El resultado será una nueva imagen en la que los ND están categorizados en clases temáticas y ésta se considerará como un mapa digital de formato ráster. No obstante, antes de correr la clasificación se requiere elegir el criterio o algoritmo de asignación. Los más comunes son de mínima distancia, de paralelepípedos y de la máxima probabilidad o verosimilitud (Posada, 2008).

2.6 Algoritmo de mínima distancia Es el más sencillo de este tipo, agrupa los píxeles a una u otra clase, a partir de las distancias mínimas espectrales, calculadas a partir de los valores de ND de cada píxel en relación con la media muestral. En la Figura 4 se expone el concepto de este algoritmo. Figura 4: Principio del algoritmo de mínima distancia

Fuente: Kerle et al., 2004

Instituto Geográfico Agustín Codazzi.Todos los derechos comerciales reservados. Prohibida su reproducción para fines no académicos o de investigación.

6

La imagen clasificada con este algoritmo no tendrá píxeles sin clasificar, lo que puede conllevar a errores de comisión si las áreas piloto no son muy bien determinadas. No toma en cuenta la dispersión de los ND alrededor de su media ni la correlación existen entre las bandas. Se recomienda para imágenes con paisajes sencillos y homogéneos (Posada, 2008).

2.7 Algoritmo de Paralelepípedos Utilizando este algoritmo, los píxeles de las bandas espectrales se agrupan a una u otra clase con base en un rango determinado a partir de las medias muestrales y el rango de dispersión definido por la desviación estándar de cada banda. La forma de asignación es de paralelepípedos multidimensionales (Posada, 2008) (ver Figura 5). Figura 5: Principio del algoritmo de paralelepípedos

Fuente: Kerle et al., 2004

El algoritmo de paralelepípedo tiene una inconveniencia debido a que se pueden presentar situaciones de difícil decisión, igualmente es posible que se presenten píxeles incluidos en los dominios de dos clases temáticas y otros pueden quedarse fuera del rango, generándose así las áreas sin clasificar (Posada, 2008).

2.8 Algoritmo de máxima probabilidad La agrupación de píxeles se realiza a partir de la función de probabilidad. Es un algoritmo más complejo pero mucho más utilizado, ya que garantiza mejores resultados en comparación con los dos anteriores. El proceso consiste en la estimación de la probabilidad de pertenencia de cada píxel a cada clase temática a partir de la media, la desviación estándar y las matrices de varianza-covarianza de las muestras, así como para todas las bandas que intervienen en la clasificación. El píxel se asigna a una clase específica si su probabilidad es mayor que las probabilidades de las otras categorías. Los límites de las clases temáticas se representan en forma de elipses, encargados de definir el nivel de probabilidad de cada área (ver Figura 6). Al mayor traslape entre ellas, mayor riesgo de confusión espectral (Posada, 2008).

Instituto Geográfico Agustín Codazzi.Todos los derechos comerciales reservados. Prohibida su reproducción para fines no académicos o de investigación.

7

Figura 6: Principio del algoritmo de máxima probabilidad

Fuente: Kerle et al., 2004

Instituto Geográfico Agustín Codazzi.Todos los derechos comerciales reservados. Prohibida su reproducción para fines no académicos o de investigación.

8

4.1 Clasificacion supervisada de imagenes.pdf

Short Description

Description

Comments

We need your help!