Sie sind auf Seite 1von 18

ESTADSTICAS UNIBANDA

Son aquellas que se utilizan para la descripcin y evaluacin de la calidad de la imagen satelital en una sola banda o matriz de informacin. El primer valor estadstico es el Nivel digital mnimo que es el valor ms pequeo que toma una celda de la matriz o pixel dentro de una sola banda, este valor puede ser el nivel de reflectancia, brillo, etc.

As como hay un valor mnimo tambin existe un valor mximo que es todo lo contrario a la definicin dada para el Nivel Digital mnimo.

El rango es el total de niveles digitales que hay en la imagen para saber a priori que tipo de coberturas se podran encontrar en la imagen. Desafortunadamente, cuando existen valores extremos de niveles digitales esta medida no nos brinda mucha informacin acerca de la imagen. Se calcula con la diferencia entre el Nivel digital mximo y el mnimo.

La media es el promedio aritmtico y es definida como la suma de todos los valores de niveles digitales dividido entre la cantidad de estos. La frmula utilizada es la siguiente:

Donde

es el nivel digital i-esimo en la banda k.

La varianza es el promedio cuadrado de todos los errores que tienen los distintos valores con respecto a la media. La frmula para calcularla es la siguiente:

Desviacin estndar: Es la raz cuadrada positiva de la varianza. Un valor pequeo nos sugiere que los valores estn cerca al valor central mientras que un valor alejado todo lo contrario.

La Curtosis mide que tan plana o puntiaguda es una distribucin de probailidad. Esta medida determina el grado de concentracin que presentan los valores en la regin central de la distribucin. Entre ms concentracin de valores exista en el centro de la distribucin mas puntiaguda ser. Se calcula de la siguiente manera:

El Coeficiente de Asimetra nos permite identificar si los datos se distribuyen de forma uniforme alrededor del punto central (Media aritmtica).

Mediana: Es el valor central dentro de la serie ordenada de niveles digitales. Moda: Es el valor que tiene mayor frecuencia dentro de la muestra. Es el valor ms alto en una curva de distribucin de probabilidad, donde hay varios picos o puntos altos se le llama distribucin multimodal. Ya despus de explicados cada uno de los conceptos que van a ser utilizados para el anlisis por banda de la imagen de la zona de estudio, se proceder a estudiar cada una de las medidas para cada una de las bandas y as sacar conclusiones a cerca de la calidad e importancia de los datos.

Estadsticas Banda No 1 (Ultra Azul)

Figura 3.1. Banda 1 imagen zona de estudio

14000 12000 10000 8000 6000 4000 2000 0 8700

Histograma Banda 1

Frecuencia

10700

ND

12700

14700

Figura 3.2. Histograma Banda 1

Tabla 3.1. Estadsticas Banda 1 ND mnimo ND mximo Rango Media Varianza Desv. Estndar Mediana Moda Curtosis Asimetra 8803 34906 26103 9653,975 226532,21 475,954 9572 9456 391,318 13,128

La tabla 3.1 muestra las estadsticas que se obtuvieron de la banda 1. La banda tiene un rango de niveles digitales de 26.103, una media de 9653,975 lo cual nos indica que la distribucin esta hacia la izquierda como lo muestra el histograma en la figura 3.2, esto quiere decir que la mayora de niveles digitales tienden a ser oscuros o bajos comparado con el gran numero que hay en la matriz. La desviacin estndar de 475.954 nos seala que los valores estn un tanto alejados de la media lo cual da indicios de un contraste que nos permitir distinguir variedad de niveles visuales. Con respecto al valor de la curtosis da 391,318 lo cual quiere decir que la distribucin es leptocurtica, dicho en otras palabras, dice que la mayora de las valores estn cerca del centro o la media de la distribucin. Por ltimo, est el coeficiente de asimetra que da 13,128 que indica que la mayora de los valores estn hacia la derecha de la media. Estadsticas Banda No 2 (Azul)

Figura 3.3. Banda 2 imagen zona de estudio

Histograma Banda 2
10000 8000 Frecuencia 6000 4000 2000 0 7800

9800

11800 ND

13800

Figura 3.4. Histograma Banda 2

Tabla 3.2. Estadsticas Banda 2 ND mnimo 7856 ND mximo 36960 Rango 29104 Media 8899,373 Varianza 324731,302 Desv. Estndar 569,852 Mediana 8813 Moda 8612 Curtosis 263,398 Asimetra 10,26

Para la banda 2, la tabla 3.2 arroja las estadsticas de la misma, obteniendo un resultado en el rango de 29.104 niveles digitales, una media de 8899,373 que para una ms fcil interpretacin se puede recurrir a la figura 3.4, lo cual nos indica una situacin similar a la de la banda No 1 donde el brillo de la imagen puede ser no muy alto. La desviacin Estndar es de 569,852 ms alta que la primera lo cual significa que en esta banda podremos ver mayor cantidad de contrates entre los niveles digitales. Luego va la curtosis que arroja un valor de 263,398 que es ms baja que la anterior pero sigue siendo leptocurtica, esto quiere decir que los datos estn un poco ms dispersos del centro que en la anterior. Finalmente, est el coeficiente de asimetra que para este caso dio 10,26 que sigue indicando que la mayora de datos se encuentran a la derecha de la media. Estadsticas Banda 3

Figura 3.5. Banda 3 Imagen zona de estudio

7000 6000 5000 4000 3000 2000 1000 0 6500

Histograma Banda 3

Frecuencia

11500 ND

Figura 3.6. Histograma banda No 3 Tabla 3.3. Estadsticas banda 3 ND mnimo ND mximo Rango Media Varianza Desv. Estndar Mediana Moda Curtosis Asimetra 6713 38652 31939 8409,855 498246,81 705,866 8338 8370 148,486 7,012

Para la banda 3, en la tabla 3.3 se muestra los valores estadsticos obtenidos. Hay un rango de 31.939 niveles digitales, una media de 8409,855 lo cual significa, que la imagen va a estar un poco oscura porque est en la parte izquierda del histograma (Figura 3.6) que es donde se va a acercando al valor de cero que es ausencia de colores. La desviacin estndar es de 705,866 que es un valor grande lo cual indica que los datos no van a estar muy cerca al centro de la distribucin, que a su vez, quiere decir que va a ver muchos valores de contraste, es decir, va a ver muchas ms tonalidades al no estar cercanas al valor central. Finalmente, la curtosis arrojo un valor de 148,486, que se asocia con una distribucin de tipo leptocurtica del mismo tipo que las bandas 1 y 2. El coeficiente de asimetra da un valor de 7,012 el cual nos permite concluir que la mayora de los datos se encuentran en la parte derecha del valor central.

Estadsticas Banda 4

Figura 3.7. Banda 4 Imagen zona de estudio

5000 4000 Frecuencia 3000 2000 1000

Histograma Banda 4

0 5900

10900 ND

15900

Figura 3.8. Histograma Banda 4 Tabla 3.4. Estadsticas Banda 4 ND mnimo 5998 ND mximo 41537 Rango 35539 Media 7711,072 Varianza 1051793,82 Desv. Estndar 1025,57 Mediana 7539 Moda 7104 Curtosis 51,875 Asimetra 3,7952 Interpretando los resultados obtenidos para la banda No 4, da un rango de 35.539 niveles digitales, su media es de 7711,072, que nuevamente se encentra en la parte izquierda

obteniendo as una imagen sin mucho brillo, luego est la desviacin estndar que es 1025,57 mucho ms grande que las de las bandas anteriores queriendo decir, que esta imagen, por lo tanto, va a brindar mayor contraste de tonalidades de gris que las anteriores. En cuanto a la curtosis es de 51,875 que quiere decir que la distribucin es leptocurtica pero cada vez volvindose ms plana, por ltimo, est el coeficiente de asimetra que en este caso da un resultado de 3,7952 que sigue indicando que los datos en su gran mayora estn inclinados hacia la derecha, pero ya acercando bastante al valor de cero que sera una distribucin totalmente simtrica. En el histograma se pueden distinguir 3 modas, dos extremas con picos pequeos y una muy fcil de identificar entre las dos pequeas, lo cual sugiere, que en la banda se pueden estar distinguiendo tres coberturas diferentes. Estadsticas Banda 5

Figura 3.9. Banda 5 Zona de Estudio.

Histograma Banda 5
9000 8000 7000 6000 5000 4000 3000 2000 1000 0 4900

Frecuencia

9900

14900 ND

19900

24900

Figura 3.10. Histograma Banda 5.

Tabla 3.5. Estadsticas Banda 5 ND mnimo 4929 ND mximo 47559 Rango 42630 Media 14681,298 Varianza 19230461,4 Desv. Estndar 4385,255 Mediana 15865 Moda 5728 Curtosis 0,1754 Asimetra -1,0429

En la banda 5 hay un rango de 42.630 niveles digitales, un valor ms grande que los anteriores, tambin tiene una media de 14.681,298 lo cual da mucho ms a la derecha que todas las anteriores lo cual indica que la imagen en esta banda tiene ms brillo que las anteriores bandas. Tiene una desviacin de 4.385,255 que es relativamente grande, lo cual quiere decir que los valores estn muy dispersos de la media, que en trminos de la imagen, se ver representado en una gran cantidad de contrastes. El valor de curtosis de 0,1754 nos dice que la distribucin se comporta de una manera muy similar a la normal al igual que el coeficiente de asimetra que se aproxima a cero. Pero al mirar el histograma se ven tres picos diferentes, lo cual no se parece para nada a una distribucin normal, eso se debe a que las medidas de tendencia central (moda, mediana, media) no son iguales lo cual debe cumplirse para que exista una distribucin normal. Los tres picos pueden indicar, el mismo nmero de coberturas fcilmente identificables como puede ser los cuerpos de agua que en la imagen se ven de color oscuro, es decir, es el pico ms alto, por otra parte, los otros dos tipos pueden ser algn tipo de diferenciacin del terreno donde el que est ms a la derecha se ve ms blanco o brillante en la imagen. Estadsticas Banda 6

Figura 3.11. Banda 5 Zona de Estudio.

Histograma Banda 6
10000 Frecuencia 8000 6000 4000 2000 0 4800 9800 14800 ND 19800 24800

Figura 3.12. Histograma Banda 6. Tabla 3.6. Estadsticas Banda 6. ND mnimo 4848 ND mximo 53502 Rango 48654 Media 11612,425 Varianza 11856349,3 Desv. Estndar 3443,305 Mediana 12300 Moda 5280 Curtosis -0,1434 Asimetra -0,6315 Los valores estadsticos que arrojo la banda No 6 fueron los que estn en la tabla 3.6. El rango para la banda es de 48.654 niveles digitales ms grande que los de las anteriores bandas. La media es de 11.612,425 que nos indica que todava se encuentra a la izquierda del rango pero se ve con ms brillo que las bandas del visible (1, 2,3 y 4). La desviacin es de 3.443,305, un nmero grande para la estadstica, que indica mucha dispersin de los datos, reflejado en ms niveles de contraste dentro de la imagen. La curtosis y el coeficiente de asimetra arrojan valores muy cercanos a cero pero en los dos su signo es negativo, los valores son -0,1434 y 0,6315, respectivamente, la interpretacin de estos valores es que la distribucin se comporta de una forma similar a la normal pero no totalmente porque sus medidas de tendencia central no son iguales. En el histograma (Figura 3.12) se puede observar que la distribucin es totalmente diferente al comportamiento de una normal con dos picos o modas fciles de identificar, un pico a la izquierda y otro casi en el centro de la imagen pero mucho mas plano, que pueden estar indicando dos tipos de coberturas diferentes dentro de la banda claramente distinguibles (Agua y Tierra).

Estadsticas Banda 7

Figura 3.13. Banda 7 Zona de estudio.

Histograma Banda 7
12000 10000 Frecuencia 8000 6000 4000 2000 0 4500 9500 14500 ND 19500 24500

Figura 3.14. Histograma Banda 7 Tabla 3.7. Estadsticas Banda 7 ND mnimo 4977 ND mximo 57912 Rango 52935 Media 8338,233 Varianza 4217215,46 Desv. Estndar 2053,586 Mediana 8320 Moda 5179 Curtosis 1,3574 Asimetra 0,3813 Para la banda No 7 de la zona de estudio, se tiene un rango de 52.935 niveles digitales, con una media de 8338,233 que indica que la distribucin esta todava muy hacia el lado derecho de el histograma que a su vez quiere decir que la imagen se ve oscura. La desviacin estndar es de

2.053,586, un valor grande que nos indica que los valores estn dispersos lo cual en la imagen significa que habr mayor nmero de contrastes, es decir, muchas tonalidades diferentes. La curtosis de 1,3574 nos indica que la distribucin es todava leptocurtica acercndose al valor ideal de cero. El coeficiente de asimetra es de 0,3813 que quiere decir que los datos se distribuyen casi simtricamente hacia los dos lados pero existe una predileccin hacia el lado derecho. En el histograma se pueden distinguir dos modas diferentes una con un pico mucho ms elevado que la otra, que como se haba dicho, en anteriores ocasiones nos puede servir para inferir el nmero de coberturas fcilmente identificables en la banda. Estadsticas Banda 10

Figura 3.15. Banda 10 Zona de Estudio.

Histograma Banda 10
10000 Frecuencia 8000 6000 4000 2000 0 24000 26000 28000 ND 30000 32000 34000

Figura 3.16. Histograma Banda 10.

Tabla 3.8. Estadsticas banda 10 ND mnimo ND mximo Rango Media Varianza Desv. Estndar Mediana Moda Curtosis Asimetra 24175 33151 8976 28759,121 1113212,8 1055,089 28870 26710 -0,4004 -0,3227

En la tabla 3.8 se pueden observar los valores estadsticos de la banda 10. El rango para la banda 10 es de 8.976 niveles digitales, el ms bajo entre todas las bandas utilizadas. Tiene una media de 28.759,121 que indica que en esta banda los valores estn ms hacia el centroderecha del histograma que a su vez indica que la banda es la ms brillante de todas, presenta una desviacin de 1.055,089 que seala una dispersin no tan alta de los datos, que significan una cantidad media de valores de contraste en la imagen. En cuanto a la curtosis y el coeficiente de asimetra, los dos valores son negativos cercanos a cero que nos dice que estamos ante la presencia de una distribucin muy similar a la normal, pero nuevamente como se ve en el histograma no se asemeja a una normal totalmente, excepto la moda que est ms hacia la derecha, que se asemeja mucho. En el histograma hay tres picos una muy alto y puntiagudo, otro mucho ms pequeo y puntiagudo y el de la derecha en el medio de los dos, en cuanto a frecuencia, pero mucho ms plano, estos tres picos indican tres tipos de coberturas diferentes en la imagen.

3.2. ESTADSTICAS MULTIBANDA


Las estadsticas multibanda son aquellas que nos permiten relacionar el comportamiento de un mismo pixel en varias bandas. Dentro de estas estadsticas encontramos dos muy importantes, que relacionan varios conjuntos de datos o variables diferentes, estas son la covarianza y la correlacin. Segn (Jensen, 2005) la covarianza es la variacin comn que tienen dos variables sobre su media comn. Es definida por la ecuacin:

Donde es el i-esimo valor de nivel digital de la banda k, es la media de todos los niveles digitales de la banda k, n es el nmero total de pixeles involucrados. Los resultados de esta operacin se muestran en una matriz varianza-covarianza, en la cual su diagonal principal

est compuesta por las varianzas de las variables involucradas, mientras que en las otras celdas estn los valores de covarianza entre las diferentes variables. La otra medida importante es la correlacin ( ) que segn (Jensen, 2005) es la tasa de la covarianza entre dos variables sobre el producto de sus desviaciones estndar. Se calcula con la siguiente formula:

Donde son las desviaciones estndar de la banda k y de la banda l, respectivamente. Los resultados tambin se organizan en una matriz que es llamada de correlacin, cuando el valor de correlacin es 1, la variables son dependientes lo cual quiere decir que hay informacin redundante en las variables, cuando es cero, es que son totalmente independientes finalmente cuando es -1, quiere decir que estn inversamente relacionadas, es decir, mientras que una sube la otra puede bajar, por ejemplo. A continuacin se van a calcular para todas las bandas, sus respectivas matrices de varianzacovarianza y de correlacin. 3.2.1. Matriz Varianza-Covarianza Tabla 3.9. Matriz Varianza-Covarianza de la imagen de la zona de estudio.
Banda 1 Banda 1 Banda 2 Banda 3 Banda 4 Banda 5 Banda 6 Banda 7 Banda 10 226.471,32 268.423,85 282.494,54 358.815,14 Banda 2 Banda 3 Banda 4 358.815,14 465.892,38 665.254,67 Banda 5 -478.765,09 -553.554,89 343.637,59 716.306,77 Banda 6 129.161,20 242.462,89 937.422,14 Banda 7 290.912,01 407.355,36 797.921,23 Banda 10 -980,81 37.852,83 240.546,11 600.774,25

268.423,85 282.494,54 324.648,86 356.309,88 356.309,88 498.134,36

465.892,38 665.254,67 1.051.581,16

2.047.856,77 1.572.185,17

-478.765,09 -553.554,89 343.637,59 129.161,20 290.912,01 -980,81

716.306,77 19.226.602,52 11.354.800,07 5.135.073,87 2.568.003,53

242.462,89 937.422,14 2.047.856,77 11.354.800,07 11.854.795,82 6.733.908,33 3.132.701,74 407.355,36 797.921,23 1.572.185,17 37.852,83 240.546,11 600.774,25 5.135.073,87 2.568.003,53 6.733.908,33 4.216.674,95 1.848.886,02 3.132.701,74 1.848.886,02 1.112.983,85

En la tabla 3.9 se puede observar la matriz varianza- covarianza, donde su diagonal principal est compuesta por las varianzas de cada una de las bandas, y las dems celdas, compuestas por los valores de covarianza. Donde la covarianza sea mayor a cero, habr una relacin directa entre las dos bandas como, por ejemplo, en las combinaciones 1-2, 4-10, 6-5, etc., mientras que si este valor es menor a cero se dice, que estn inversamente relacionadas como pasa, en el caso, de las combinaciones 1-10, 5-2, etc. Adems se puede ver, los valores de las varianzas donde la mayor, es de la banda 5 y la menor es la de la banda 1.

3.2.2. Matriz de Correlacin. Tabla 3.10. Matriz de correlacin entre las distintas bandas.
Banda 1 Banda 1 Banda 2 Banda 3 Banda 4 Banda 5 Banda 6 Banda 7 Banda 10 1,00 0,99 0,84 0,74 -0,23 0,08 0,30 0,00 Banda 2 0,99 1,00 0,89 0,80 -0,22 0,12 0,35 0,06 Banda 3 0,84 0,89 1,00 0,92 0,11 0,39 0,55 0,32 Banda 4 0,74 0,80 0,92 1,00 0,16 0,58 0,75 0,56 Banda 5 -0,23 -0,22 0,11 0,16 1,00 0,75 0,57 0,56 Banda 6 0,08 0,12 0,39 0,58 0,75 1,00 0,95 0,86 Banda 7 0,30 0,35 0,55 0,75 0,57 0,95 1,00 0,85 Banda 10 0,00 0,06 0,32 0,56 0,56 0,86 0,85 1,00

En esta tabla se puede observar el grado de relacin que existe entre las distintas bandas de la imagen. Dentro de la tabla se pueden encontrar bandas muy relacionadas entre s como lo son la combinacin 1-2 (0,99), 3-4 (0,92) y la 6-7 (0,95), cuando estn muy relacionadas como en estos casos hay mucha informacin redundante entre las dos. Tambin pueden haber bandas entre las que no existe relacin alguna como entre la 1 y la 10 (0,00), la 2 y la 10 (0,06), etc., y por ultimo pueden existir bandas con una relacin inversa como lo son las combinaciones 1-5 (-0,23), la 2-5 (-0,22), etc. Como es de esperarse entre las cuatro bandas del espectro visible (1, 2,3 y 4), existe una correlacin muy alta. La ms alta corresponde a la combinacin 1-2 la cual se puede explicar, teniendo en cuenta las longitudes de onda de las dos bandas, que pertenecen al sector del visible perteneciente al color azul, lo cual las hace estar muy relacionadas entre s. La correlacin de la combinacin 1-10 que da cero tiene una posible explicacin en que el espacio que hay entre la banda 1 y la 10, hablando de longitud de onda es muy grande, adems que una es del visible y la otra es termal, una diferencia abismal entre las dos, porque mientras la 1 capta el color azul, la otra capta la temperatura que es emitida por la superficie. Para ver mejor el comportamiento de estos valores de correlacin se pueden hacer unos grficos que tambin van a depender de la frecuencia de los niveles digitales de las bandas interrelacionadas. Para lo grficos se va a escoger el valor ms alto, el ms bajo y tres intermedios. Estos grficos tienen el nombre de ploteo en el espacio espectral que segn (Jensen, 2005) es el que extrae los valores de los niveles digitales para cada pixel en la imagen en 2 bandas y grafica la frecuencia de ocurrencia en un sistema de coordenadas de 255 por 255 (asumiendo datos de 8 bits).

Figura 3.17. Ploteo espacio espectral bandas 1 y 2. r=0,99

En la figura 3.17 se puede observar como es el comportamiento de la correlacin entre las bandas 1 y 2 al que pertenece el valor de 0,99, el ms alto de todas las posibles combinaciones de a dos, se observa una diagonal perfecta muy angosta, lo que quiere decir que los datos se ajustan muy bien a la recta, es decir, hay muchos datos redundantes entre las dos bandas, lo que podra estar sugiriendo la eliminacin de alguna de las dos bandas para su posterior anlisis.

Figura 3.18. Ploteo espacio espectral bandas 1 y 5. r=-0,23

Ahora podemos encontrar el grafico de correlacin entre las bandas 1 y 5 (Figura 3.18), la cual tiene el valor de correlacin ms bajo (r=-0,23), como se puede observar los pixeles no tienen un comportamiento simtrico ni conocido, esto se deduce, al ver como es mucha la dispersin de los puntos a travs del espacio, lo cual quiere decir que entre las dos bandas se puede encontrar gran cantidad de informacin que no est repetida o es nica en alguna banda, la correlacin invertida quiere decir que mientras que , por ejemplo, un valor sube el otro tiende a bajar.

Figura 3.19. Ploteo espacio espectral bandas 1 y 10. r=0

La tercera grafica (Figura 3.19) de correlacin es entre las bandas 1 y 10, correspondientes a un valor de correlacin de 0 (cero), lo cual indica que entre las dos bandas no existe relacin alguna, cuando esto pasa la grfica tiende a ser horizontal (pendiente = 0), en la figura 3.19 se puede observar que la grfica es horizontal, pero adems tiene mucha dispersin por lo que es una buena combinacin para obtener gran cantidad de informacin para los propsitos que se requieran.

Figura 3.20. Ploteo espectral bandas 2 y 7. r= 0,35.

La figura 3.20 representa la correlacin entre las bandas 2 y 7, correspondiente a un valor de 0,35, que es un valor intermedio entre la mxima y mnima correlacin, se puede observar que la grfica tiende a un comportamiento casi diagonal o lineal, pero no es perfecto porque hay varios puntos que se encuentran lejos del patrn lineal por lo que es una combinacin con poca redundancia de datos para el posterior estudio de la zona de estudio de una manera ms detallada.

Figura 3.21. Ploteo Espectral bandas 4 y 7. r= 0,75

La ultima grafica de correlacin a analizar es la correspondiente a las bandas 4 y 7 con un valor de correlacin de 0,75, un numero ya un poco ms cercano al 1, se puede observar que es muy similar a la grfica de las bandas 2 y 7, pero esta es ms delgada asemejndose ms a la diagonal delgada y perfecta, pero sigue habiendo aun dispersin de los puntos con respecto al comportamiento lineal, lo cual indica que la redundancia cada vez es ms a medida que la correlacin se acerca 1 o se acerca al comportamiento de tipo lineal que podemos ver en la combinacin de bandas 1-2.

Das könnte Ihnen auch gefallen