Analisis Geoestadistico Con ArcGIS
Short Description
Download Analisis Geoestadistico Con ArcGIS...
Description
Análisis geoestadístico con ArcGIS. Estadística descriptiva Antes de abordar en firme, el modulo de geoestadistica que viene con ArcGIS, es necesario recordar algunos conceptos de estadística, en particular de estadística descriptiva, que son necesarios para realizar un análisis geoestadístico con el software. La estadística descriptiva, se dedica a los métodos de recolección, descripción, visualización y resumen de datos originados a partir de los fenómenos de estudio. Para analizar los datos usualmente se construyen las tablas de frecuencias y se utilizan: la media, mediana, moda, desviación estándar, la varianza, coeficiente de curtosis, coeficiente de sesgo, coeficiente de variación, cuartiles, deciles y percentiles. Estos parámetros se agrupan en varias categorías conocidas como medidas de tendencia central, medidas de dispersión y medidas de forma. Tablas de Frecuencias Una forma de presentar ordenadamente un grupo de observaciones, es a través de tablas de distribución de frecuencias. Para construir una tabla de frecuencia se deben ordenar los datos de menor a mayor e incluir los siguientes parámetros.
Frecuencia Absoluta (ni) Frecuencia Relativa (fi) Frecuencia Absoluta Acumulada (Ni) Frecuencia Relativa Acumulada (Fi) Numero de clases Amplitud de la clase o intervalo Marca de clase
Es el número de datos que están en un mismo intervalo. Es la frecuencia absoluta dividida por el número total de datos. Es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado. La última frecuencia absoluta acumulada es igual al número de casos. Es el resultado de dividir cada frecuencia absoluta acumulada por el número total de datos. Indica el número de intervalos en que se agruparan los datos. Se obtiene al dividir por dos, la diferencia del valor máximo y mínimo de los datos. Es el promedio de la suma del límite superior e inferior de cada intervalo o clase.
En el caso de datos agrupados se deberán determinar el número de intervalos, la amplitud de los mismos y la marca de clase, de la siguiente forma:
Distribución normal Una distribución de probabilidad sigue una distribución normal, cuando la representación gráfica de su función de densidad es una curva positiva continua, simétrica respecto a la media, de máximo en la media, y que tiene 2 puntos de inflexión situados a ambos lados de la media y a distancia igual a la desviación estándar, es decir de la forma:
Propiedades. Tiene una única moda, que coincide con su media y su mediana. La curva normal es asintótica al eje de abscisas. Es simétrica con respecto a su media. Según esto, para este tipo de variables existe una probabilidad de un 50% de observar un dato mayor que la media, y un 50% de observar un dato menor. Cuanto mayor sea la desviación estándar, más se dispersarán los datos en torno a la media y la curva será más plana. Un valor pequeño de este parámetro indica, por tanto, una gran probabilidad de obtener datos cercanos al valor medio de la distribución.
El coeficiente de sesgo es igual a cero (0). La curtosis es igual a cero (0).
Para la aplicación de los métodos geoestadísticos es necesario verificar la función de probabilidad del conjunto de datos se aproximen a un comportamiento normal, esto lo veremos más adelante en el análisis exploratorio de los datos. Con el fin de que este sea un ejemplo práctico para abordar el análisis geoestadistico con ArcGIS, ilustraremos todo los conceptos con un ejemplo a partir de datos de monitoreo de niveles piezométricos de agua subterránea que se presentan en la tabla siguiente. Para ello se seguirán los siguientes pasos. 1. 2. 3. 4.
Organizar los datos de menor a mayor. Calcular la tabla de frecuencia. Realizar el histograma de frecuencias. Calcular los parámetros geoestadístico. Paso 1. Organizar los datos de menor a mayor
Pozo
X
Y
Pozo
X
Y
1.368.620
Nivel Pz (msnm) 2,0
28
1.044.694
1.371.405
Nivel Pz (msnm) 6,00
1
1.038.638
2
.034.835
1.344.198
2,1
29
1.041.841
1.363.397
6,1
3 4
1.039.637
1.368.963
2,2
30
1.040.838
1.356.677
8,0
1.039.628
1.368.960
2,2
31
1.044.135
1.364.301
8,07
5
1.042.236
1.377.584
2,44
32
1.046.740
1.377.526
8,08
6
1.039.030
1.370.440
2,49
33
1.046.626
1.374.772
9,02
7 8
.036.835 1.043.217
1.354.454 1.357.777
2,9 2,99
34 35
1.042.604 1.039.466
1.360.903 1.348.279
9,21 10,1
9
1.040.082
1.373.095
3,2
36
1.041.429
1.333.870
10,3
10
1.039.392
1.374.231
3,3
37
1.045.207
1.363.183
10,8
11
1.040.434
1.368.119
3,33
38
1.044.733
1.360.337
11,5
12
1.039.720
1.368.500
3,35
39
1.048.893
1.374.744
11,82
13
1.042.060
1.376.470
3,43
40
1.040.383
1.355.006
12,2
14
1.041.545
1.369.212
3,7
41
1.042.263
1.354.636
12,3
15 16
1.042.045 1.040.269
1.371.752 1.377.908
3,8 3,97
42 43
1.039.411 1.048.342
1.336.953 1.369.941
12,8 14,62
17 18
1.040.731 1.042.360
1.371.643 1.376.070
4,0 4,29
44 45
1.046.214 1.044.935
1.355.644 1.336.931
14,9 16,6
19 20
1.040.390 1.035.335
1.376.776 1.356.941
4,5 4,5
46 47
1.041.256 1.048.313
1.339.628 1.360.466
18,16 19,14
21 22
1.047.035 1.042.020
1.371.548 1.370.310
4,62 4,66
48 49
1.044.224 1.044.765
1.348.328 1.341.254
24,1 24,2
23 24
1.033.716 1.042.570
1.352.675 1.377.470
5,0 5,10
50 51
1.046.735 1.045.454
1.356.327 1.346.959
25,57 27,15
25 26
1.035.564 1.042.520
1.343.433 1.368.530
5,2 5,38
52 53
1.050.523 1.052.106
1.361.111 1.361.728
30,08 35,32
27
1.042.932
1.368.255
5,87
Paso 2. Calcular la tabla de frecuencia.
Luego la tabla de frecuencias queda como la siguiente No
1 2 3 4 5 6
Intervalo
2,0076 6,1776 10,3476 14,5176 18,6876 22,8576
-
6,1776 10,3476 14,5176 18,6876 22,8576 27,0276
Marca de clase
frecuencia absoluta
4,0926 8,2626 12,4326 16,6026 20,7726 24,9426
29 7 6 4 1 4
frecuencia absoluta acumulada 29 36 42 46 47 51
frecuencia relativa 0,55 0,13 0,11 0,08 0,02 0,08
frecuencia relativa acumulada 0,55 0,68 0,79 0,87 0,89 0,96
7 8
27,0276 31,1976 -
31,1976 35,3676
29,1126 33,2826
1 1
52 53
0,02 0,02
0,98 1,00
Paso 3. Realizar el histograma de frecuencias. A partir de la tabla anterior se construye el histograma de frecuencias, el cual nos da una idea del comportamiento de los datos. Como primer acercamiento, se observa que los datos están dispersos, sesgados y la moda, la media y la mediana son diferentes, por tanto los datos no obedecen a una distribución normal.
Paso 4. Calcular los parámetros geoestadístico a. Medidas de tendencia central Intentan identificar el dato más representativo de la distribución del conjunto. Son las siguientes. Media. Se le suele llamar promedio, se define como la suma de los valores de todas las observaciones divididas por el número total de datos. Se denota con µ o X. En su cálculo intervienen todos los datos, por lo tanto, se ven influenciados por la variación de cualquiera de ellos. En particular, es sensible a los valores extremos, pues estos producen grandes modificaciones.
Para los datos agrupados del ejemplo, tenemos lo siguiente…. No 1 2 3 4 5 6 7 8
Intervalo 2,0076 6,1776 10,3476 14,5176 18,6876 22,8576 27,0276 31,1976
-
6,1776 10,3476 14,5176 18,6876 22,8576 27,0276 31,1976 35,3676
Marca de clase 4,0926 8,2626 12,4326 16,6026 20,7726 24,9426 29,1126 33,2826
frecuencia absoluta 29 7 6 4 1 4 1 1 Suma Media (suma/53)
Para los datos no agrupados Pozo 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27
NP
Pozo
2,0076 2,1313 2,2000 2,2100 2,4449 2,4946 2,8554 2,9876 3,2347 3,2930 3,3317 3,3506 3,4291 3,6896 3,7990 3,9651 3,9980 4,2921 4,4900 4,5286 4,6227 4,6637 5,0499 5,1009 5,2438 5,3826 5,8690
NP
28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53
6,0000 6,1496 8,0054 8,0724 8,0827 9,0188 9,2078 10,1156 10,2553 10,8373 11,5066 11,8241 12,2268 12,3280 12,8004 14,6244 14,9301 16,6351 18,1630 19,1410 24,0632 24,2354 25,5698 27,1534 30,0800 35,3188
Suma Media (suma/53)
497,0104 9,3776
producto 118,685 57,838 74,596 66,410 20,773 99,770 29,113 33,283 500,468 9,443
Mediana. Es el valor de la serie de datos que deja la mitad de las observaciones por debajo de ella y la otra mitad por encima, es decir, divide al conjunto de datos en dos partes iguales y se denota por Me. Dado que sólo depende del orden de los datos, tiene la ventaja de que no es sensible a los valores extremos. En datos agrupados se calcula de la siguiente forma. 1. Calcular: n/2 2. La mediana será el valor de la variable cuya frecuencia absoluta acumulada primero iguale o supere a N/2. Este será el intervalo en el que se encuentra la mediana. 3. Aplicar la formula sustituyendo los valores correspondientes.
Para datos agrupados, tenemos lo siguiente…. Se calcula n/2 = 53/2 = 26.5, se busca este valor en la columna de la frecuencia acumulada de la tabla de frecuencia. Si no se encuentra, tomamos el valor siguiente, el cual es 29, por lo cual el intervalo donde se encuentra la moda es (2.0076 – 6.1776]. Fi=29 Fi-1=8 Li= 2.0076 a= 4.17
Para datos no agrupados, tenemos lo siguiente….
Como el número de datos de la muestra es impar e igual a 53, la mediana es el dato que ocupa el puesto 27(divide la muestra en dos partes iguales), el cual es: Me= 5.8690 Moda. Es el dato que más veces se repite, es decir, aquel dato o rango que presenta mayor frecuencia absoluta. Puede haber más de una moda en una distribución. Se denota por Mo.
Para datos agrupados, tenemos lo siguiente…. De los datos agrupados en la tabla de frecuencia, se observa que la mayor frecuencia absoluta es 29, por lo tanto el intervalo donde está la moda es (2.0076 – 6.1776]. Li=2.0076 a=4.17 d2=29-7 = 22 d1=29-0 = 29
b. Medidas de dispersión Las medidas de dispersión indican la mayor o menor concentración de los datos con respecto a las medidas de centralización. Nos dan una idea sobre la homogeneidad o que tan agrupado están los datos.
Desviación estándar. Indica cuánto tienden a alejarse los valores puntuales de la media. Se suele representar por una S. Una desviación estándar grande indica que los puntos están lejos de la media, y una desviación pequeña indica que los datos están agrupados cerca de la media.
Para datos agrupados, tenemos lo siguiente…. No Intervalo Marca de clase (Xi) 1 2,0076 6,1776 4,0926 2 6,1776 10,3476 8,2626 3 10,3476 - 14,5176 12,4326 4 14,5176 - 18,6876 16,6026 5 18,6876 - 22,8576 20,7726 6 22,8576 - 27,0276 24,9426 7 27,0276 - 31,1976 29,1126 8 31,1976 - 35,3676 33,2826
Para datos no agrupados…. Pozo NP (Xi-X)² 1 2,0076 54,3169 2 2,1 52,5089 3 2,2 51,5179 4 2,2 51,3745 5 2,44 48,0623 6 2,49 47,3757 7 2,9 42,5391 8 2,99 40,8321 9 3,2 37,7352 10 3,3 37,0224 11 3,33 36,5529 12 3,35 36,3247 13 3,43 35,3852
Pozo 28 29 30 31 32 33 34 35 36 37 38 39 40
frecuencia absoluta 29 7 6 4 1 4 1 1 Suma n-1 S NP 6,000 6,150 8,005 8,072 8,083 9,019 9,208 10,116 10,255 10,837 11,507 11,824 12,227
(Xi-X)²*fi 830,111 9,750 53,634 205,052 128,365 960,977 386,901 568,337 3143,12 52 7,774 (Xi-X)² 11,4082 10,4200 1,8829 1,7035 1,6768 0,1287 0,0288 0,5446 0,7704 2,1307 4,5326 5,9854 8,1179
14 15 16 17 18 19 20 21 22 23 24 25 26 27
3,7 3,8 3,97 4,0 4,29 4,5 4,5 4,62 4,66 5,0 5,10 5,2 5,38 5,87
32,3533 31,1208 29,2952 28,9401 25,8628 23,8886 23,5128 22,6091 22,2209 18,7290 18,2902 17,0883 15,9600 12,3103
41 42 43 44 45 46 47 48 49 50 51 52 53
12,328 12,800 14,624 14,930 16,635 18,163 19,141 24,063 24,235 25,570 27,153 30,080 35,319 suma n-1 S
8,7049 11,7156 27,5289 30,8303 52,6713 77,1833 95,3240 215,6668 220,7542 262,1873 315,9791 428,5894 672,9459 3.363,14 52 8,042
Varianza. Describe la variabilidad de la distribución. Es la medida de la desviación o dispersión de la distribución. Se calcula mediante la ecuación.
Para datos agrupados, tenemos lo siguiente…. S² = 7.774² = 60.44 Para datos no agrupados, tenemos lo siguiente…. S² = 8.042² = 64.675 Coeficiente de variación. Mide la representatividad de la media. Valores extremos del mismo nos llevarán a concluir que la media no es representativa, es decir, existirán valores entre las observaciones que se separan significativamente de las demás.
Para datos agrupados, tenemos lo siguiente…. C.V = 7.74/9.443*100 = 82% Para datos no agrupados, tenemos lo siguiente…. C.V = 8.042/9.3776*100 = 85.8% c. Medidas de forma
Miden el grado de deformación respecto a una curva patrón (distribución normal). Coeficiente de curtosis. Mide el grado de aplastamiento o apuntamiento de la gráfica de la distribución de la variable estadística. Datos concentrados respecto a la media (desviación estándar pequeña) dará una grafica alargada; si los datos están dispersos la gráfica será achatada o aplastada.
Nota: El valor calculado a través de la herramienta Geostatistical Analyst de ArcGIS no le resta 3 como aparece en la ecuación anterior.
Para datos no agrupados tenemos, lo siguiente: Pozo NP (Xi-X)4 1 2,0076 2.950,3256 2 2,1 2.757,1808 3 2,2 2.654,0983 4 2,2 2.639,3382 5 2,44 2.309,9875 6 2,49 2.244,4559 7 2,9 1.809,5744 8 2,99 1.667,2604 9 3,2 1.423,9469 10 3,3 1.370,6549 11 3,33 1.336,1150 12 3,35 1.319,4859 13 3,43 1.252,1157 14 3,7 1.046,7389 15 3,8 968,5028 16 3,97 858,2062 17 4,0 837,5292 18 4,29 668,8854 19 4,5 570,6668 20 4,5 552,8518 21 4,62 511,1702 22 4,66 493,7663 23 5,0 350,7750
Pozo 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50
NP 6,000 6,150 8,005 8,072 8,083 9,019 9,208 10,116 10,255 10,837 11,507 11,824 12,227 12,328 12,800 14,624 14,930 16,635 18,163 19,141 24,063 24,235 25,570
(Xi-X)4 130,1466 108,5761 3,5454 2,9021 2,8115 0,0166 0,0008 0,2966 0,5935 4,5400 20,5448 35,8246 65,9010 75,7746 137,2543 757,8409 950,5047 2.774,2665 5.957,2546 9.086,6611 46.512,1891 48.732,4260 68.742,2017
24 25 26 27
5,10 5,2 5,38 5,87
334,5301 292,0101 254,7224 151,5428
51 52 53
27,153 30,080 35,319 suma n-1 S4 K
99.842,7699 183.688,8444 452.856,1270 954.116,25 52 4182,95 1,38
Coeficiente de sesgo o asimetría. Evalúa el grado de distorsión o inclinación que adopta la distribución de los datos respecto a su valor promedio tomado como centro de gravedad. El coeficiente de simetría de Pearson es:
Si CS = 0, la distribución es simétrica, en ese caso las desviaciones a la derecha y a la izquierda de la media se compensan. Si CS < 0, la distribución es asimétrica negativa. La mayoría de las observaciones están a la derecha de la proyección de la media. Si CS > 0 la distribución es asimétrica positiva. La mayoría de las observaciones están a la izquierda de la proyección de la media.
Para datos no agrupados tenemos, lo siguiente: Pozo 1 2 3 4 5 6 7 8 9 10 11 12 13 14
NP 2,0076 2,1 2,2 2,2 2,44 2,49 2,9 2,99 3,2 3,3 3,33 3,35 3,43 3,7
(Xi-X)3 -400,3156 -380,4950 -369,7752 -368,2318 -333,2017 -326,0869 -277,4485 -260,9171 -231,8037 -225,2662 -220,9952 -218,9291 -210,4909 -184,0258
Pozo 28 29 30 31 32 33 34 35 36 37 38 39 40 41
NP 6,000 6,150 8,005 8,072 8,083 9,019 9,208 10,116 10,255 10,837 11,507 11,824 12,227 12,328
(Xi-X)3 -38,5323 -33,6357 -2,5838 -2,2235 -2,1712 -0,0462 -0,0049 0,4019 0,6761 3,1102 9,6500 14,6432 23,1296 25,6828
15 16 17 18 19 20 21 22 23 24 25 26 27
3,8 3,97 4,0 4,29 4,5 4,5 4,62 4,66 5,0 5,10 5,2 5,38 5,87
-173,6104 -158,5600 -155,6861 -131,5267 -116,7581 -114,0136 -107,5039 -104,7469 -81,0534 -78,2215 -70,6396 -63,7603 -43,1918
42 43 44 45 46 47 48 49 50 51 52 53
12,800 14,624 14,930 16,635 18,163 19,141 24,063 24,235 25,570 27,153 30,080 35,319 suma n-1 S3 Sesgo
40,1000 144,4387 171,1850 382,2620 678,0858 930,6861 3.167,1971 3.279,9221 4.245,3899 5.616,7807 8.872,8285 17.457,0231 39.576,74 52 520,13 1,46
A continuación se muestran los resultados obtenidos a través de las ecuaciones de datos agrupados y no agrupados, también se incluyen los resultados arrojados por la herramienta Geostatistical Analyst (la cual se verá más adelante). Se observa que los resultados obtenidos tanto por las ecuaciones aplicadas a datos no agrupados y los obtenidos por la herramienta Geostatistical Analyst son similares. Módulo Datos Datos no Geostatistical Parámetro Observaciones agrupados agrupados analyst de ArcGIS Media 9.443 9.3776 9.3776 Mediana 4.6678 5.869 5.869 Moda 4.378 Desviación 7.74 8.0421 8.0421 estándar Varianza 60.44 64.675 64.675 Coeficiente de 82% 85.8% 85.75% Variación A la curtosis que Curtosis 1.38 1.4709 calcula ArcGIS se le debe restar 3 Sesgo o 1.46 1.4773 asimetría
Según Matheron (1992), la Geoestadística es la aplicación de la teoría de las variables regionalizadas a la estimación de los depósitos. A su vez una variable regionalizada, es una variable distribuida en el espacio de forma que presenta una estructura espacial de correlación. En fin cuando hablemos de Geoestadística se debe pensar en la variable y su relación espacial.
Ejemplo de variables regionalizadas en hidrogeología son la trasmisividad y conductividad hidráulica, la porosidad y el nivel piezométrico; a este último hacemos referencia en el presente artículo. La mayoría de los métodos geoestadísticos sólo son óptimos si la variable de estudio sigue una distribución normal. Recordemos que la distribución normal tiene las siguientes propiedades:
Tiene una única moda, que coincide con su media y su mediana.
La curva normal es asintótica al eje de abscisas.
Es simétrica con respecto a su media. Según esto, para este tipo de variables existe una probabilidad de un 50% de observar un dato mayor que la media, y un 50% de observar un dato menor. Cuanto mayor sea la desviación estándar, más se dispersarán los datos en torno a la media y la curva será más plana. Un valor pequeño de este parámetro indica, por tanto, una gran probabilidad de obtener datos cercanos al valor medio de la distribución.
El coeficiente de sesgo es igual a cero (0). La curtosis es igual a cero (0).
Para determinar si la variable sigue una distribución se deben aplicar alguna de las pruebas de normalidad como Prueba X², Kolmogorov, cálculo del coeficiente de asimetría, curtosis, mediana, mediana y la moda y su comparación de con los de la distribución normal. Si a través de estas pruebas se concluye que la variable puede ser aceptada o se aproxima a una distribución normal, el problema se simplifica y se puede continuar con el análisis geoestadístico; de lo contrario, es necesario realizar una transformación de los datos que puede ser de raíz cuadrada o logarítmica (Carrera, 1990) y hacer nuevamente las verificaciones. Este es un tema extenso y la idea de estos artículos es hacerlos algo prácticos, por ello al final dejaré bibliografía a la cual se puede consultar. Para resumir, los pasos a seguir en el análisis exploratorio de los datos son los siguientes. 1. 2. 3. 4. 5. 6. 7. 8. 9.
Organizar los datos de menor a mayor. Calcular la tabla de frecuencia. Realizar el histograma de frecuencias. Calcular los parámetros geoestadístico. Verificación de la normalidad con respecto a la media, moda y mediana. Verificación de la normalidad con respecto a la asimetría horizontal (coeficiente de sesgo). Verificación de la normalidad con respecto al coeficiente de variación. Realización de la transformación de los datos, si es necesario. Recalculo de los parámetros estadísticos y comparación para verificar la normalidad de los datos. Los pasos 1 al 4 fueron realizados en el tutorial “Módulo de Geostadística Analyst con ArcGIS parte 1. Estadística descriptiva”, aquí se continuará con los pasos siguientes
Se continua con el ejemplo de los datos del monitoreo de niveles piezométricos que se muestran en la siguiente tabla. Pozo
X
Y
NP
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
1.038.638 1.034.835 1.039.637 1.039.628 1.042.236 1.039.030 1.036.835 1.043.217 1.040.082 1.039.392 1.040.434 1.039.720 1.042.060 1.041.545 1.042.045 1.040.269 1.040.731 1.042.360 1.040.390 1.035.335 1.047.035 1.042.020 1.033.716 1.042.570 1.035.564 1.042.520 1.042.932 1.044.694
1.368.620 1.344.198 1.368.963 1.368.960 1.377.584 1.370.440 1.354.454 1.357.777 1.373.095 1.374.231 1.368.119 1.368.500 1.376.470 1.369.212 1.371.752 1.377.908 1.371.643 1.376.070 1.376.776 1.356.941 1.371.548 1.370.310 1.352.675 1.377.470 1.343.433 1.368.530 1.368.255 1.371.405
2,0076 2,1313 2,2000 2,2100 2,4449 2,4946 2,8554 2,9876 3,2347 3,2930 3,3317 3,3506 3,4291 3,6896 3,7990 3,9651 3,9980 4,2921 4,4900 4,5286 4,6227 4,6637 5,0499 5,1009 5,2438 5,3826 5,8690 6,0000
29
1.041.841
1.363.397
6,1496
30 31 32 33 34 35 36 37 38 39
1.040.838 1.044.135 1.046.740 1.046.626 1.042.604 1.039.466 1.041.429 1.045.207 1.044.733 1.048.893
1.356.677 1.364.301 1.377.526 1.374.772 1.360.903 1.348.279 1.333.870 1.363.183 1.360.337 1.374.744
8,0054 8,0724 8,0827 9,0188 9,2078 10,1156 10,2553 10,8373 11,5066 11,8241
40 41 42 43 44 45 46 47 48 49 50 51 52 53
1.040.383 1.042.263 1.039.411 1.048.342 1.046.214 1.044.935 1.041.256 1.048.313 1.044.224 1.044.765 1.046.735 1.045.454 1.050.523 1.052.106
1.355.006 1.354.636 1.336.953 1.369.941 1.355.644 1.336.931 1.339.628 1.360.466 1.348.328 1.341.254 1.356.327 1.346.959 1.361.111 1.361.728
12,2268 12,3280 12,8004 14,6244 14,9301 16,6351 18,1630 19,1410 24,0632 24,2354 25,5698 27,1534 30,0800 35,3188
Los parámetros estadísticos calculados anteriormente se resumen en la siguiente tabla. Parámetro Media Mediana Moda Desviación estándar Varianza Coeficiente de Variación Curtosis Sesgo o asimetría
Datos no agrupados 9.3776 5.869 4.378
Observaciones
Se tomó la moda calculada a través de la ecuación datos agrupados.
8.0421 64.675 85.8% 1.38 1.46
5. Verificación de la normalidad con respecto a la media, moda y mediana. Para que la distribución sea normal o se aproxime, la media, la moda y la mediana deben ser similares, se acepta una diferencia de una unidad entre ella. Para el ejemplo de estudio tenemos. Media = 9.3776 Mediana = 5.869 Moda = 4.378 Se observa la media, la mediana y la moda son diferentes, por lo cual los datos no cumplen el criterio de verificación con respecto a estos parámetros. 6. Verificación de la normalidad con respecto a la asimetría horizontal (coeficiente de sesgo).
Como el coeficiente de sesgo permite verificar la normalidad de los datos, en caso de existir asimetría horizontal, es decir los datos no se ajustan a una distribución normal, Wester-Oliver proponen evaluar lo siguiente. 0
View more...
Comments