Elementos de Geoestadistica
Short Description
Download Elementos de Geoestadistica...
Description
Elementos de Geoestadística.
Autores: MSc. José Quintín Cuador Gil. (Departamento de Computación, Universidad de Pinar del Río)
Lic. Arelys Quintero Silverio. (Departamento de Matemática, Universidad de Pinar del Río)
Ing. Elmidio Estévez Cruz. (Departamento de Geología, Universidad de Pinar del Río)
Ing. Robert Ramirez Hernández. (Departamento de Geología, Universidad de Pinar del Río)
Universidad de Pinar del Río 1997
Indice Pág. 1.- Introducción.
1
2.- Problema de Ciencias de la Tierra que dió origen a la Geoestadística.
3
3.- Variables aleatorias regionalizadas.
4
3.1.- Conceptos de Variable Aleatoria Regionalizada.
5
4.- Hipótesis de la Geoestadística.
6
5.- Conceptos básico de estadística.
8
6.- El semivariograma Experimental.
12
6.1.- Construcción del Semivariograma.
13
6.2.- Variogramas relativos (efecto proporcional).
13
6.3.- Variogramas Cruzados.
14
6.4.- Problemas más comunes encontrados en el cálculo de semivariograma. 14 6.5.- Nube de variogramas.
15
7.- Modelado de Semivariogramas.
16
7.1.- Parámetros del semivariograma.
16
7.2.- Modelos Teóricos más importantes.
17
8.- Ajuste Visual y Automático.
21
9.- Análisis de anisotropía.
22
10.- Validación del Modelo Teórico.
22
10.1.- Problemas más comunes encontrados durante el modelaje de semivariogramas. 11.- Estimación.
25 26
11.1.- Triangulación.
27
11.2.- Inverso de la distancia.
28
12.- Interpolación Geoestadística.
28
12.1.- Kriging Simple (KS).
29
12.2.- Kriging Ordinario (KO).
30
13.- Análisis de Tendencia, Kriging Universal (KU):
32
14.- Variables correlacionadas, Co-Kriging.
33
15.- Otras Aplicaciones.
33
1.- Introducción.
La búsqueda, exploración y evaluación de yacimientos minerales útiles es una rama muy antigua de la Geología, destacándose entre otras tareas: el pronóstico científico de la localización de los yacimientos minerales útiles, la elaboración de métodos eficaces para la exploración y la evaluación geólogo económica de los yacimientos para su explotación [Lepin,1986a].
Los trabajos de búsqueda y exploración se dividen en estadios [Lepin,1986a], división por estadios que es el resultado de la aplicación de un principio importante del estudio del subsuelo, el principio de Aproximaciones Sucesivas, Esta división está vigente en Cuba por una Instrucción del Ministerio de la Industria Básica que presenta una clasificación actualizada de estos trabajos Geológicos en la cual se incluyen los levantamientos a diferentes escalas, los trabajos de prospección orientativa y detallada, la exploración orientativa y detallada, y la exploración de explotación, se establece una clasificación de las reservas técnicas que incluye las reservas abiertas, parcialmente preparadas y listas siendo esta última las que se explotan.
Cada uno de lo estadios de Exploración Orientativa y Exploración Detallada culmina con la presentación de un informe con los datos geológicos y económicos necesarios sobre el yacimiento, para esto es necesario realizar la determinación los más aproximada posible de las reservas minerales del yacimiento, actividad fundamental de las Empresas Geólogo Mineras conocida como Cálculo de Reservas.
Con el objetivo de acercar lo más posible nuestra clasificación de las reservas minerales a las utilizadas en el mundo, existe la Instrucción para la clasificación de las reservas minerales de 1 de Febrero de 1996 del Ministerio de la Industria Básica. En la cual se establece una nomenclatura común, mostrándose que los cambios realizados son imprescindibles en la situación actual para la colaboración y los contratos económicos con otros países.
Esta instrucción se refiere a:
1.- Términos y definiciones como son: Recursos Minerales Sólidos y Reservas. 2
Recursos Minerales Sólidos: Concentración de minerales útiles sólidos que existen en o sobre la corteza terrestre cuyas características hacen posible la extracción económica actual o perspectiva de algún mineral útil de dicha concentración. Se divide en identificados y no identificados. Reservas: Es la parte de los recurso minerales sólidos identificados, de la que puede extraerse económicamente uno o varios minerales o elementos útiles en el momento de su determinación, por los que solo incluye los componentes económicos y marginalmente económicos.
2.- Clasificación de los recursos y la reservas de minerales útiles sólidos, la cual se presenta en la Tabla 1.
Criterios Económicos
Grado de Conocimiento Recursos Identificados
Recursos no Identificados
Demostrados Probados
Pobables Posibles Hipotéticos Especulativos
Económicos Marginalmente Económicos
RESERVAS
Subeconómicos Tabla 1. Clasificación de las reservas.
a) Criterios económicos, según la cual se dividen en Recursos Económicos, Recursos Marginalmente Económicos y Recursos Subeconómicos. b) Grado de conocimiento, según el cual se dividen en Recursos Identificados y Recursos no Identificados. Los identificados se dividen en: Probados, Probables y Posibles, de estos los dos primeros se conocen como recursos demostrados, y los no identificados se dividen en: Hipotéticos y Especulativos.
3.- Requisitos generales para cada uno de los criterios anteriores, reflejándose que debe tenerse en cuenta la Protección del Medio Ambiente y el uso racional de los recursos minerales.
3
Esta Instrucción plantea que con la clasificación no se eliminan las imprecisiones en la delimitación y determinación de las diferentes categorías, lo cual debe precisarse con la realización del análisis dinámico de las reservas utilizando los procedimientos “Geoestadísticos”.
2.- Problema de Ciencias de la Tierra que dió origen a la Geoestadística.
El desarrollo de la minería ha traído unido el perfeccionamiento de los métodos de búsqueda de los minerales útiles, y los de la determinación de su utilidad para la extracción [Lepin,1986a], existiendo actualmente varias formas de realizar el cálculo de reservas, los métodos clásicos y los modernos, de los clásicos se pueden destacar, el de “Bloques Geológicos” y el de “Perfiles Paralelos”, estos se caracterizan por el uso de valores medios o media ponderadas de los contenidos de la exploración en bloques definidos convenientemente, los cuales son eficientes cuando la información disponible presenta
determinada
regularidad,
pero
en
la
práctica
como
señala
[Journel,1978],[David,1977] la gran diversidad de formas en que se presentan los datos ha llevado a la utilización de técnicas matemáticas y estadísticas para resolver un único problema, estimar valores desconocidos, a partir de los conocidos, claro está, no existe un método por muy sofisticado que sea, que obtenga resultados exactos. Nuestro objetivo será discutir los métodos más eficientes que proporcionen la mayor información de los datos disponibles, es decir, los modernos, de los que se pueden citar entre los Geomatemáticos: El Inverso de la Distancia, Mínimo de Curvatura, Splines, etc. Aún mas, buscando el mejor estimador que minimice la varianza del error de estimación surge la Geoestadística por inspiración de un ingeniero en minas Sudafricano “Danie G Krige”. [Olea,1988], conceptos iniciales que fueron tomados por la escuela francesa de Geología con “George Matheron”, la cual se consolidó y desarrollo en los últimos 30 años como ciencia aplicada casi exclusivamente en el campo minero, existiendo únicamente como respuesta a necesidades prácticas concretas, reconociéndose como una rama de la estadística tradicional, que parte de la observación de que la variabilidad de las variables distribuidas en el espacio tienen una estructura particular [Journel,1978], desarrollando herramientas matemáticas para el estudio de estas variables dependientes entre si, llamadas según Matheron variable 4
regionalizada [Journel,1978], [David,1977], [Olea,1988], elaborando una teoría como se presenta en [Journel,1978],[David,1977], de modo que la aplicación de la teoría de los procesos estocásticos a las Ciencia Naturales y en particular a los problemas de evaluación de reservas de distintos tipos de materias primas minerales dió origen a la Geoestadística. [Alfonso,1989b]
El término Geoestadística fue inventado por el profesor George Matheron [Olea,1988] en su trabajos de 1960 interesado en los problemas de estimación de reservas minerales.
3.- Variables aleatorias regionalizadas. Continuando con el caso minero la información inicial para realizar el cálculo de reservas es el resultado del análisis de los testigos de perforación, o muestras de afloramiento, que se obtiene en los laboreos de exploración, que como una variable estadística aleatoria puede tomar cualquier valor dentro de un rango determinado, todos con una característica fundamental que las distingue, además de su valor, una posición en el espacio, hecho este al que Matheron denominó variable aleatoria regionalizada [Olea,1988] al referirse en este al artículo “Matheron, G, 1962, Traiteé de Geostatistique Applique, Memories du Bureau de Researches Geológiques et Minieres, Vol. 14, Paris”. Al respecto en
[Journel,1978] y
[David,1977] se dedica el Capítulo II y V
respectivamente a la Teoría de la Variable Regionalizada. Capítulos donde se presentan los conceptos fundamentales de la Geoestadística, en la que particularmente [Journel,1978] plantea que la definición de variable regionalizada como una variable distribuida en el espacio es puramente descriptiva y no envuelve una interpretación probabilística, refiriéndose a que desde el punto de vista matemático una variable regionalizada es simplemente una función f(x) que toma valores en todos los puntos x de coordenadas (xi, yi, zi) en el espacio tridimensional, sin embargo, es muy frecuente que esta funciones varíen tan irregularmente en el espacio que impiden un estudio matemático directo, y se hace necesario realizar un análisis de variabilidad de la información disponible, sugiriendo un estudio profundo de la función variograma como veremos más adelante.
5
Es importante aclarar que una Variable Aleatoria (VA) es una variable que puede tomar ciertos valores de acuerdo a cierta distribución de probabilidades. Un valor medido es una realización de la VA Z(x1) definida en el punto x1. Al conjunto de todas las mediciones en el área de estudio de la variable regionalizada Z(x) puede considerarse como una realización del conjunto VA (Z(x), x ∈ área de estudio), a este conjunto de VA es llamada Función Aleatoria. y se escribe Z(x). [Pág. 29, Journel,1978]
3.1.- Conceptos de Variable Aleatoria Regionalizada. Según [Alfonso,1989b] es importante aclarar varios conceptos en el estudio de la variable aleatorias regionalizadas, conceptos que se presentan en [Journel,1978], [David,1977] y que son utilizados en la mayoría de los artículos consultados donde se aplican los métodos Geoestadísticos como herramienta fundamental de trabajo. Estos conceptos son: Región: se refiere al espacio en el cual existe y se estudia el fenómeno natural. Localización: Es el punto de una región en la cual se define una variable aleatoria regionalizada. Soporte Geométrico: Está determinado por el elemento físico sobre el cual se realiza la determinación de la variable aleatoria regionalizada, Esto no es más que la muestra unitaria, sobre la cual estudiaremos el atributo de interés. Momentos de primer orden: - Si la función de distribución de Z(xi) tiene una media definida, será una función de la localización xi. m(xi) = E{Z(xi)}
Momento de segundo orden: - Si la varianza (Var) de Z(xi) existe, entonces se define como el momento de segundo orden y será también una función de la localización xi. Var {Z(xi)} = E{[Z(xi) - m(xi)]2} - Si la varianza de las variables Z(xi) y Z(xj) existe entonces la covarianza (Cov) de las estas también existe y es función de las localizaciones xi y xj. Cov[Z(xi), Z(xj)] = E{[Z(xi) - m(xi)][Z(xj) - m(xj)]} 6
si xi = xj ;
Cov[Z(xi), Z(xj)] = Var {Z(xi)}
- La función variograma o función estructural se define como la varianza de la diferencia Z(xi) - Z(xj). Var{Z(xi) - Z(xj)} = 2γ(xi, xj} la magnitud γ(xi, xj} = ½ Var{Z(xi) - Z(xj)} se denomina semivariograma. - También se puede definir el correlograma estandarizando la covarianza para los valores xi - xj = h = 0 como: C(h) ρ (h) = ____ C(0)
-1 ≤ ρ ≤ 1
donde: C(h) es la covarianza a la distancia h, C(0) es la covarianza en el origen.
- Existen relaciones entre estas medidas de correlación: γ(h} = C(0) - C(h)
con γ(0) = 0
γ(h) ρ (h) = 1 - ____ C(0)
4.- Hipótesis de la Geoestadística. Como la forma en que se presenta la información inicial es muy diversa, según [Alfonso,1989b] aspecto que trata [Journel,1978], para aplicar la Geoestadística es necesario aceptar el cumplimiento de ciertas hipótesis sobre el carácter de la función aleatoria o procesos estocásticos estudiados.
Las hipótesis de la Geoestadística son:
I- Estacionaridad Estricta.
Se dice que Z(x) es estrictamente estacionaria si la función de distribución de probabilidades de las variables aleatorias regionalizadas Z(xi) son iguales entre sí, independiente de la localización xi. Esto requiere que los momentos de distinto orden para cada variable aleatoria regionalizada sean completamente independientes de la 7
localización xi. Esta condición como su nombre lo indica. Es demasiado restricta al estudiar la mayoría de los fenómenos encontrados en la práctica.
II- Estacionaridad de Segundo Orden.
Esta condición es más frecuente en la práctica, la misma requiere que: 1) E{Z(xi)} = m, existe y no depende de la localización xi. 2) La función de covarianza Cov{Z(xi) - Z(xj)} exista y solo dependa de la longitud del vector h = xi - xj. o sea. C(h) = Cov{Z(xi), Z(xj)} = E{Z(xi), Z(xi+h)} - m2
Esta hipótesis requiere la estacionaridad solo para la media y para la función de covarianza de la variable aleatoria regionalizada. La segunda condición
implica,
estacionaridad de la varianza y del variograma. 1o
Var[Z(xi)] = E{[Z(xi) - m]2} = C(0)
∀x
2o
γ(h) = E{[Z(xi)]2} - E{Z(xi), Z(xi+h)}
∀x
como E[Z(xi), Z(xi+h)] = C(h) + m2 y
E[Z2(xi)] = C(0) + m2 γ(h) = C(0) + m2 - (C(h) + m2) γ(h) = C(0) - C(h). Como se observa en la última expresión γ(h) y C(h), son dos herramientas que
permiten expresar la correlación entre la variable aleatoria regionalizada Z(xi) y Z(xi+h), separadas por el vector h.
III- Hipótesis Intrínseca.
Un función aleatoria Z(x) se dice intrínseca cuando: a) Su esperanza matemática existe y no depende de la localización Xi. E{Z(x)} = m
∀x
b) Para todo vector h el incremento [Z(x+h) - Z(x)] tiene varianza finita y no depende de la localización xi: 8
Var{Z(x+h) - Z(x)} = E{[Z(x+h) - Z(x)]2} = 2γ(h)
∀x
Cuando se cumple esta condición se dice que la función
aleatoria Z(x) es
homogénea. Esta condición se encuentra con bastante frecuencia en la naturaleza, pues existen muchos procesos que no tiene varianza finita y sin embargo, poseen una función variograma finita.
La estacionaridad de segundo orden, siempre implica la condición intrínseca (homogeneidad), sin embargo la relación inversa no siempre se cumple.
IV- Procesos Cuasiestacionarios.
En la práctica la función estructural, covarianza o semivariograma, es solo usada por límites |h| ≤ b. El límite b representa la extensión de la región en la que el fenómeno estudiado conserva cierta homogeneidad del comportamiento de Z(xi).
5.- Conceptos básico de estadística. Con el objetivo de conocer la información disponible se presenta en [Krajewsky,1993] y [David,1977] los conceptos estadísticos necesarios. Así en [Krajewsky,1993] se relacionan los siguientes conceptos divididos en tres secciones:
A: Cálculos Estadísticos. Utilizados para determinar si la distribución de los datos es normal, lognormal, o si no se ajustan a una distribución teórica de probabilidad, lo cual implica tener conocimiento de:
1.- Numero de Casos: Es el número de valores muestreados del fenómeno en estudio, representados por n y los datos por xi, i = 1, . . . , n, que llamamos distribución. 2.- Rango de la Distribución: Es la diferencia entre el valor máximo y el mínimo.
9
3.- Media: Es la media aritmética de la distribución, dado por la fórmula:
Xm=
1 n ∑ Xi n i =1
4.- Moda: Es el valor más frecuente de la distribución.
5.- Mediana: Es el valor para el cual la mitad de los datos son menores y la otra
mitad están por encima de este valor. Si ordenamos los datos su orden ascendente podemos calcular la mediana como. ⎧ X(n+1)/2
si n es impar.
M = ⎨ ⎩ (Xn/2 + Xn/2+1)/2
si n es par.
La mediana es también llamada percentil 50, además los datos no solo se dividen en dos grupos, sino que se pueden dividir en cuatro partes, cuartiles, donde Q1 = percentil 25, y Q3 = percentil 75, si los datos se dividen en 10, tenemos los deciles. De forma general estas medidas se pueden calcular por: [p(n+1)/100] ésima observación de los datos ordenados ascendentemente, donde p es el percentil que se desea calcular, y n la cantidad de datos ordenados.
6.- Varianza: Describe la variabilidad de la distribución. Es la medida de la
desviación o dispersión de la distribución y se calcula por:
σ
2
=
1 n ∑ n − 1 i =1
( Xi − X m)
2
La razón principal por la que se aboga por la división entre n-1 en la estimación de la varianza es porque proporciona un mejor estimado; si dividimos por n-1 nos referimos a la varianza muestral (S2) como un estimador insesgado de la varianza poblacional (σ2), esto significa que si un experimento fuera repetido muchas veces se podría esperar que el promedio de los valores así obtenidos para S2 igualaría a σ2; por otra parte si dividimos entre n los valores obtenidos para S2 serían como promedio demasiado pequeño [Freund,1980].
7.- Desviación Estándar: Describe la tendencia o dispersión de la distribución. 10
Es la medida de desviación alrededor de la media. Se calcula por: σ=
σ2
8.- Asimetría: Describe la simetría de la distribución relativa a la distribución
normal. Se calcula por:
α3 =
1 n ( Xi − X m )3 S 3 ∑ n i =1
En la distribución normal la asimetría tiene valor cero, un valor negativo indica una cola a la izquierda y un valor positivo indica una cola a la derecha.
9.- Curtosis: Describe la esbeltez de la distribución, y se puede calcular por:
1 n 4 α 4 = ∑(Xi − Xm) S 4 n i =1
La distribución normal tiene curtosis igual a cero. y es llamada mesocúrtica. A las distribuciones más agudas, con colas relativamente anchas, se les llama leptocúrticas, tienen valores de curtosis mayores que cero, y la distribuciones más bien achatadas en el centro se llaman platicúrticas, tienen valores menores que cero.
10.- Error Estándar: Describe el grado de conocimiento de los datos y se puede
calcular por: ε=
σ2 /n
La distribución normal tiene una valor de error estándar menor que 1.25 y la distribución lognormal o una distribución con tendencia positiva, tiene valores de error estándar mayores que 1.25.
11.- Coeficiente de Variación: Es una medida de la variación relativa de los
datos y puede ser calculado por: CV = S/Xm y en porcentaje como: 100 CV = 100 (S/Xm) % 11
Proporciona una comparación entre la variación de grandes valores y la variación de pequeños valores.
Las técnicas de Geoestadística Lineal producen buenos resultados cuando el coeficiente de variación es menor que uno, CV < 1. Para CV > 1 se recomiendan técnicas Geoestadísticas no lineal.
12.- Prueba Chi-Cuadrado: Se utiliza para determinar si la distribución es
normal, lognormal o alguna otra distribución probabilística.
13.- Prueba t-Student: Se utiliza para determinar si en una distribución bimodal
la medias de las poblaciones son estadísticamente diferentes.
B: Construcción de Gráficos Estadísticos: Estos permiten ilustrar y entender las
distribuciones de los datos, e identificar datos errados, donde se incluyen: 1.- Mapa base, sección cruzada y vista en perspectiva: Estos tres gráficos son usados para visualizar la relación espacial en 2 y 3 dimensiones, y encontrar errores. 2.- Histogramas: Son usados para ver las características descriptivas de la distribución. Es un gráfico de barras donde en las abscisas aparecen los límites de las clases y en las ordenadas las frecuencias correspondientes a cada clase.
C: Frecuencia Acumulativa: Usado para identificar el tipo de distribución y
ayuda a determinar si están presentes poblaciones mixtas.
En el punto A12 se utiliza la prueba Chi-Cuadrado para la determinación de si la distribución es normal, lognormal u otra por ser este el estándar, en su lugar puede ser usado la prueba “Kolmogorov Smirnov”, la cual es más robusta [Alfonso,1989a].
En el caso de gráficos estadísticos es útil usar los gráficos de frecuencia absoluta, relativa, acumulativa y el diagrama de dispersión, como se presenta en el software GEOEAS 2.1.
Todos estos elementos permiten decidir las condiciones de estacionaridad vistas 12
anteriormente.
6.- El semivariograma Experimental
El concepto de variograma es uno de los más importantes en la teoría y la práctica geoestadística. En [Alfonso,1989b], [Krajewsky,1993], [Journel,1978], [David,1977], se define el variograma como la varianza de las diferencias de los valores de la variable regionalizada en las localizaciones separadas una distancia h, o sea: Var(xi, xi+h) = Var{Z(xi) - Z(xi+h)} = 2 γ(xi,xi+h) donde la magnitud:
γ (h ) =
1 N (h) 2 Z (x i ) − Z (x i + h)] [ ∑ 2 N (h ) i =1
(1)
Se llama semivariograma, donde N(h) es la cantidad de pares separados a la distancia h de la totalidad de pares posibles en los n puntos de que se dispone en la información inicial.
El semivariograma es una herramienta geoestadística importante en la determinación de las características espaciales de una variable, jugando el rol central en la geoestadística, se le llama el prerrequisito para la estimación Geoestadística.
Aquí aunque no existe un criterio fijo, ni una justificación teórica para determinar el número de pares necesarios para calcular cada valor del semivariograma, en [Journel,1978] se sugieren 30 pares como mínimo para obtener una masa estadística suficientemente grande.
6.1.- Construcción del Semivariograma.
El cálculo del semivariograma experimental no consiste en un simple cálculo de la ecuación (1), según se plantea en [Krajewsky,1993], [Journel,1978], [David,1977] y [Pannatier,1993], su cálculo esta relacionado con: la dirección (α y β) en que se estudiará la variabilidad del atributo de interés y las distancias (h) en las cuales se quiere obtener los valores del semivariograma. El ángulo que fija la dirección debe variar entre 13
0o y 179o, lo que requiere para no ser estrictos en el cálculo, de definir tolerancias angular (dα y dβ) y lineal (dh).
Para cada distancias (h), calcular la expresión (1), con la cantidad de pares que se encuentran separados a una distancia h-dh ≤ h ≤ h+dh, y que esten incluidos en los ángulos (α-dα ≤ αp ≤ α+dα) para dos dimensiones y además (β-dβ ≤ βp ≤ β+dβ) para tres dimensiones, donde αp.y βp son los ángulos definido por la dirección de la recta que une los dos puntos del par en cuestión.
Ocho
pasos
para
la
construcción
del
semivariograma
en dos y tres
dimensiones se presentan [Cuador,1997].
6.2.- Variogramas relativos (efecto proporcional). Cuando en el cálculo del semivariograma se detecta que existe una relación lineal entre el valor medio de las muestras usadas en el cálculo de cada γ(h) y la desviación estándar correspondiente, aspecto que se puede obtener ploteando los valores de Xm contra σ, es decir el coeficiente de variación σ/Xm es aproximadamente constante. Esta situación se conoce como efecto proporcional (heterosedasticidad) y ocurre cuando los datos presentan una distribución lognormal. [Journel,1978]
La solución a este problema propuesta por Michel David en 1977 consiste en dividir cada valor del semivariograma local por el cuadrado de la media local. Y obtener lo que se conoce como variograma relativo [David,1977]. γ(h) F(h) = ------Xm2(h) Este variograma se puede modelar y usar en el proceso de estimación que veremos posteriormente.
Se puede obtener el semivariograma relativo por:
14
1 N ( h ) [ Z (x i ) − Z (x i + h )] F (h ) = ∑ 2 N (h ) i =1 ( Z (x ) − Z (x + h )) 2 i i 2
[
]
2
usando los paso anteriores.
6.3.- Variogramas Cruzados. Cuando es posible usar en el proceso de estimación dos variables, por ejemplo, el contenido de dos minerales diferentes, obtenidos en el análisis de los testigos de perforación, que estén correlacionadas, conviene usar los variogramas cruzados como se presentan en [Journel,1978] y [David,1977], El variograma cruzado se obtiene por la ecuación: 1 N (h) γ (h ) = ∑ [ Z A (xi ) − Z A (xi + h)][ Z B (xi ) − Z B (xi + h)] 2 N (h ) i =1
donde ZA y ZB son variables correlacionadas.
6.4.- Problemas más comunes encontrados en el cálculo de semivariograma.
Muchos libros de Geoestadística dan la impresión descabellada de que es fácil calcular el semivariograma experimental, y ajustar este a un modelo teórico, ajuste que veremos posteriormente, pero quién ha tratado de hacerlo sabe que no es así. [Armstrong,1984a] El primer semivariograma siempre es errático y se necesita mucho esfuerzo para lograr un semivariograma que represente realmente la variabilidad del fenómeno es estudio, se presentan en [Armstrong,1984a] tres de los problemas que más se presentan en este proceso, que son: 1.- Pobre elección de la distancias. 2.- Población mixta presente en los datos. 3.- Valores fuera de límites o distribuciones asimétricas. En [Krajewsky,1993] se presentan otras razones por los que los semivariogramas son erráticos: 1.- No hay suficientes muestras. 15
2.- Las muestras no son representativas del fenómeno. 3.- Las clasificaciones de las muestras no son válidas. 4.- El área estudiada es no homogénea. 5.- Pequeños o largos conjuntos son necesarios. 6.- Pequeñas o largas distancia deben ser calculadas. 7.- Mas o menos distancias deben ser calculadas. 8.- Pequeñas tolerancias es necesarias. 9.- Las muestras pueden tener localizaciones incorrectas. 10.- Las valores muestreados pueden ser malos.
De acuerdo a la experiencia, el problema fundamental en la obtención de un semivariograma correcto es, la elección adecuada de los intervalos de distancias en los cuales será calculado el semivariograma, de modo que en estos la cantidad de pares encontrados sea suficiente desde el punto de vista estadístico [Armstrong,1984a], [Krajewsky,1993].
6.5.- Nube de variogramas.
Una solución a las dificultades planteadas anteriormente puede ser la visualización de la nube de variogramas, que consiste en un gráfico de valores del semivariograma de los pares en función de la distancia de separación entre los dos puntos del par, esto puede ser útil para determinar el espaciamiento óptimo a utilizar en el cálculo del semivariogra experimental, [Pannatier,1993].
7.- Modelado de Semivariogramas.
Una vez construido el semivariograma experimental o empírico es necesario ajustar a este un modelo teórico, con el objetivo de determinar los parámetros descriptivos del semivariograma que posteriormente serán usados en la estimación. [Krajewsky,1993], [Journel,1978], [David,1977], [Pannatier,1993].
7.1.- Parámetros del semivariograma. 16
Los parámetros del semivariograma caracterizan tres elementos importantes en la variabilidad de un atributo que son: la discontinuidad en el origen (Efecto Pepita), el valor máximo de variabilidad (Meseta), y el área de influencia de la correlación (Alcance), (Figura 1). como se presentan en [Krajewsky,1993], [Journel,1978], [David,1977], y se describen a continuación.
El Efecto Pepita: (Nugget)
El semivariograma por definición es nulo en el origen, pero en la práctica las funciones obtenidas pueden presentar discontinuidad en el origen, a esta discontinuidad se le llama efecto pepita, en ingles (Nugget effect) y puede ser obtenido trazando una línea recta entre los primeros puntos del semivariograma empírico y extender este hasta que se intercepte con el eje Y. Si esta intercepción ocurre por debajo de cero, el valor asumido por este efecto es cero, pues valores negativos de γ(0) no tiene significado y no es común. El Efecto Pepita se representa como Co.
La Meseta: (Sill)
Es el valor de γ(h) para el cual con el aumento de h su valor permanece constante, se representa como (CT = C + Co) y se denomina meseta. Puede obtenerse trazando una línea paralela a la abscisa y que se ajuste a los puntos de mayor valor del semivariograma, y su valor se puede leer en la intecepción de esta línea con la ordenada.
El Alcance: (Range)
La distancia h para la cual las variables Z(x) y Z(x+h) son independientes, se denomina Alcance y se representa por (a), es decir las distancias para la cual la variable no está más correlacionada, o lo que es lo mismo, la distancia
para la cual el
semivariograma alcanza su meseta.
El alcance siempre tiene valor positivo, y puede ser obtenido a partir de la intercepción de las líneas descritas en los puntos anteriores, ese punto leído en la 17
abscisa es una fracción del propio alcance, fracción que se detallara posteriormente en la explicación de los modelos teóricos γ(h)
C
Co h a Figura 1: Parámetros del semivariograma.
La traducción de los tres parámetros del semivariograma fue tomada de [Alfonso,1989b], único libro consultado escrito en idioma Español, además de la experiencia adquirida en participación en las discusiones en los Talleres Nacionales de Matemáticas en las Geociencias.
7.2.- Modelos Teóricos más importantes.
Dos características importantes en el modelado de variogramas son: [Journel,1978] 1.- Su comportamiento en el origen, el cual puede ser linear, parabólico y con efecto pepita. 2.- La presencia o ausencia de meseta.
Los modelos teóricos
pueden ser clasificados según [Krajewsky,1993],
[Journel,1978], [David,1977] en: Modelos con meseta.
Con comportamiento linear en el origen a) Esférico. b) Exponencial. 18
Con comportamiento parabólico en el origen c) Gaussiano. Modelos sin meseta.
d) Modelo con exponente. e) Logarítmico.
Modelo Esférico.
C ( 3h/2a - ½(h/a)3
h≤a
C
h>a
γ(h) = Co +
Este modelo alcanza su meseta para un calor
finito h = a, en el alcance
precisamente, un alcance práctico puede ser: a´ = 2/3 a →
a =3/2 a´
donde a´ representa la fracción que planteamos en la explicación anterior del alcance (Figura 2).
γ(h)
(2/3)a
a
h
Figura 2: Modelo Esférico
Modelo Exponencial.
γ(h) = Co + C ( 1 - exp(-h/a) )
Este modelo alcanza su meseta asintóticamente (Figura 3), un alcance práctico puede ser: a´ = 1/3 a →
a = 3 a´
γ(h) 19
a Figura 3: Modelo Exponencial. Modelo Gaussiano.
γ(h) = Co + C ( 1 - exp([-h/a]2) )
Este modelo también alcanza su meseta asintóticamente (Figura 4), el alcance práctico puede ser obtenido como a´ =
3 a
→ a = (1/ 3 ) a´.
γ(h)
a
3a
Figura 4: Modelo Gaussiano.
Modelos con exponentes.
γ(h) = hθ
con θ ∈]0, 2[
Este modelo es frecuentemente usado en la práctica cuando θ = 1, que es el linear. γ(h)=ωh, donde ω representa el buzamiento o inclinación en el origen.
Modelo Logarítmico.
γ(H) = Log h
20
Note que en este modelo log h → -∞ cuando h → 0, por tanto este modelo no puede ser usado para describir la variabilidad de regionalizaciones en soportes puntuales.
Modelo Lineal.
γ(h) = Co + C (h/a)
Note en este modelo, que a medida que aumenta h, el valor de el Alcance (a) permanece constante, de modo que (h/a) es el valor de la pendiente de la recta del modelo que varia de 0 hasta el consiente de la distancia máxima de h y a.
Estos modelos pueden ser ajustados individualmente, aunque es posible encontrar en la práctica aplicaciones donde los semivariogramas experimentales se pueden ajustar con más de uno de estos modelos teóricos es decir a través de combinaciones aditivas, nombrándose estructuras imbricadas. [Krajewsky,1993], [Journel,1978], [David,1977]
La selección del modelo y los parámetros apropiados a las características del semivariograma empírico, para ser usados en la interpolación Geoestadística que veremos posteriormente, es el punto más importante en este proceso planteando, además que esta selección es especialmente crucial si el yacimiento en el caso particular de la minería se incluye en una de las siguientes categorías:
1.- Yacimientos con irregularidad en la densidad de barrenos. 2.- Yacimientos sin una adecuada perforación. 3.- Yacimientos con alta asimetría en la distribución. 4.- Yacimientos que carecen de un modelado geológico propio. Es importante destacar el efecto negativo que tiene en la estimación un posible error en la selección del modelo de semivariograma y sus parámetros.
8.- Ajuste Visual y Automático.
La selección del modelo del semivariograma se puede realizar de forma visual o automática. 21
De forma visual como se presenta en
[Krajewsky,1993], [Journel,1978],
[David,1977], que consiste en seleccionar uno de los modelos teóricos de semivariograma conocido que mejor se ajuste a las características
o aspecto del
semivariograma experimental, tomando de este entonces los valores de los parámetros del semivariograma. La forma automática ha sido presentada por varios autores, en [Cressie,1985] se sugiere una forma particular de aplicar el método de los mínimos cuadrados y de esta forma obtener el modelo y sus parámetros. El ajuste realizado de forma automática no tiene porque reportar mejores resultados en el proceso de estimación, recomendándose en [Journel,1978], [David,1977] y otros validar el modelo seleccionado de acuerdo al estimador a utilizar. Un criterio decisivo independiente de la forma utilizada en la elección del modelo teórico y sus parámetros, se discutirá en la validación del modelo más adelante.
9.- Análisis de anisotropía. Conviene aquí realizar un análisis sobre el comportamiento de la variabilidad del atributo en estudio. Como se conoce el semivariograma describe las características de la variable regionalizada en una dirección, pero estas características pueden variar en otras direcciones
como se discute en [Krajewsky,1993], [Journel,1978], [David,1977],
exigiendo la aplicación de esta forma un análisis de anisotropía.
Cuando el semivariograma calculado en diferentes direcciones (Norte-Sur, EsteOeste, y en direcciones intermedias de 45º, con tolerancia de 22.5o, etc.), muestra similar comportamiento, se dice que es isotrópico . Cuando muestra diferentes comportamientos es anisotrópico [Krajewsky,1993].
Los
tipos
de
anisotropías
más
comunes
son
Geométrica
y
Zonal.
[Krajewsky,1993], [Journel,1978]
Anisotropía Geométrica: Está presente cuando los semivariogramas en
diferentes direcciones tiene la misma meseta pero distinto rango. 22
Anisotropía Zonal: Está presente cuando los semivariogramas en diferentes
direcciones tiene diferentes mesetas y alcances.
En estos casos conviene realizar transformaciones de coordenadas con el objetivo de obtener modelos isotrópicos. [Journel,1978]
10.- Validación del Modelo Teórico. El ajuste de los modelos teóricos al semivariograma experimental, como hemos visto se hace de forma visual, variando los valores Co (Efecto Pepita), C + Co (Meseta) y a (Alcance), hasta coincidir con los parámetros que mejor se ajustan, o de forma automática.
Puesto que uno de los posibles usos del semivariograma ajustado es la estimación espacial de una variable regionalizada Z(x), parece razonable plantear un estimador del semivariograma que se base en la idea de minimizar los errores de estimación de Z(x), esto es, existen dos términos, Jackknife y Validación Cruzada que tiene como objetivo validar el ajuste realizado. [Journel,1978], [David,1977].
Algunos autores distinguen entre estos dos términos planteando que, mientras que la técnica “jackknifing” es un método para estimar las características estadísticas de una variable, basado en la división de los datos en grupos, la validación cruzada es un método para la evaluación de errores de estimación. En este trabajo, dada las características del uso que se le dan a estos términos, conviene no distinguir entre estos. como lo hacen otros autores.
El método de validación cruzada ha sido ampliamente utilizado para evaluar el grado de bondad de un modelo de semivariograma y reconocido como un método óptimo de estimación de sus parámetros. La operación de validar un semivariograma teórico ajustado a uno experimental siempre toma mucho tiempo [Krajewsky,1993], este se considera como el último de los pasos importantes del análisis de variabilidad, ya que, una vez obtenido este resultado, la estimación es sólo cuestión de cálculos.
23
Sea Z(x) una Función Aleatoria estacionaria con semivariograma γ(h), su función de covarianza C(h) viene dada por C(h) = σ2 - γ(h) donde σ2 es la varianza de Z(x). Sea Zx1, Zx2, . . . , Zxn los valores de Z(x) en n puntos medidos. La validación cruzada consiste en suprimir el i-ésimo valor medido Z(xi) y estimarlo a partir del resto de los datos. El valor estimado Z*(xi) se calcula por Krigeage explicado más adelante. Si se repite este proceso para los n puntos, de modo que se pueden calcular n errores de validación: E(xi) = Z*(xi)- Z(xi)
i = 1, 2, . . . , n.
Así se van probando diferentes valores de los parámetros del semivariograma hasta que
los errores de validación cumplen los siguientes criterios estadísticos:
[Journel,1978], [David,1977].
a) La media de los errores sea próxima a cero. En realidad este criterio es de escaso interés en la estimación del semivariograma, ya que los valores krigeados son insesgados independientemente del modelo de semivariograma utilizado. Por tanto los E(xi) tendrán siempre media nula cualquiera que sea el semivariograma que se utilice. b) Mínimo error cuadrático medio. Este criterio tiene el inconveniente de que no tiene en cuenta la geometría y la localización espacial de los datos ya que asigna el mismo peso a todos los errores. Los errores de krigeado, sin embargo suelen ser mayores en los puntos muy distanciados del resto de los datos. De esta forma los mayores errores normalmente situados en el contorno de la zona de estudio, tiene un efecto dominante en el error total. c) Error cuadrático medio adimensional próximo a 1: 1 N
N
∑ [ E (x ) σ ] i
i
2
≈1
i =1
donde: N es el número de puntos en los que se realiza la validación. Puesto que σi2 es la varianza de E(xi), su valor esperado es igual a uno. Esta condición puede interpretarse también como una condición de consistencia entre los errores calculados E(xi) y las dimensiones estándar proporcionadas por el krigeado (σi2). d) Mínimo valor medio de las varianzas del Krigeado (σi2). e) Valor medio de las varianzas del krigeado igual a la varianza de los errores de 24
validación. f) Ausencia de correlación (Corr) entre los errores y los valores de [Z*(xi) - Z(xi)] donde Z(xi) es el valor medio de Z(x) en el entorno del punto i y Z*(xi) es valor estimado. g) Coeficiente de correlación entre los valores krigeados y los medidos próximo a uno. h) Los errores normalizados [Z*(xi) - Z(xi)]/ σi deben situarse a los largo de una recta en papel probabilístico normal. En otras palabras E(xi)/σi deben seguir una distribución de Gauss con media nula y varianza igual a la unidad. Este criterio se cumple cuando las variables Z(x) siguen una distribución
normal, en general sin
embargo los errores normalizados no tienen porque satisfacer este criterio.
La medidas fundamentales a tener en cuenta para aceptar un ajuste son: [Myers,1992] 1.- El error medio, dado por
T1 = (1/n) ∑i=1,n [Z(xi) - Z*(xi)], debe ser
aproximadamente igual a cero. 2.- El error medio cuadrado, dado por T2 = (1/n) ∑i=1,n [Z(xi) - Z*(xi)]2, debe ser pequeño. 3.- La medida, T3 = (1/n) ∑i=1,n {[Z(xi) - Z*(xi)]/σ}2, debe ser igual a uno. 4.- La medida, T4 = Corr{[Z(xi) - Z*(xi)]/σ, Z*(xi)}, debe ser cero. 5.- La medida, T5 = Corr{Z(xi), Z*(xi)}, debe ser uno.
Otros autores solo plantean que la medidas fundamentales son la indicada por T1 y T3.
10.1.- Problemas más comunes encontrados durante el modelaje de semivariogramas. Según [Krajewsky,1993] al modelar semivariogramas se pueden presentar los siguientes problemas, que complican este proceso.
1.- Anisotropía geométrica esta presente:
Indica que los variogramas 25
direccionales tienen la misma meseta pero diferentes alcances, esta puede ser corregida a través de una transformación linear de coordenadas que permita reducir la elipse a un circulo.
2.- Anisotropía
zonal esta presente: indica que tanto la meseta como los
alcances son diferentes para los semivariogramas direccionales, puede ser corregido separando el semivariograma en sus componentes isotrópicos, horizontal y anisotrópico vertical.
3.- La tendencia de los datos esta presente: indica que los valores medidos
aumentan o disminuyen dramáticamente en la zona estudiada con el aumento de la distancia. Esto puede ser resuelto aplicando pilonomios a la ecuación del variograma.
4.- El efecto proporcional esta presente: Indica que la desviación estándar local
es proporcional al cuadrado de la media local y que los datos presentan una distribución lognormal, puede ser resuelto dividiendo cada valor del semivariograma local por el cuadrado de la media local, es decir usando semivariogramas relativos.
5.- Estructuras anidadas esta presente: indica que diferentes procesos operan a
diferentes escalas, como por ejemplo alguno o todos los siguientes: A muy pequeñas distancias la variabilidad puede estar presente debido a cambios de una composición mineral a otra. A pequeñas distancias la variabilidad puede estar presente debido a errores, A grandes distancia la variabilidad puede estar presente debido a casos transitorios de desgaste mineral. El cual puede ser resuelto aplicando varios modelos simultáneamente.
6.- Efecto hueco esta presente: indica que muy pocos pares están disponible para
la comparación a una distancia específica. Y puede ser resuelto recuperando más casos para la distancia definida.
7.-
Periodicidad
esta
presente:
indica
que
el
comportamiento
del
semivariograma repite por si mismo periodicidades, por ejemplo: El valor de la meseta puede aumentar o disminuir sistemáticamente, o un caso en que los valores son tomados 26
alternativamente a través de diferentes estratos, como piedras areniscas, esquistos, etc. Esto puede ser resulto si es un problema real y no un antifaz del análisis, la periodicidad puede ser también un fenómeno real mostrado por zonal ricas y pobres repetidas a espacios similares.
11.- Estimación. Todo lo expresado hasta aquí tiene un único objetivo, conocer la información disponible para realizar estimaciones, planteamiento que se deduce de [Journel,1978], [David,1977] y de la totalidad de la bibliografía consultada.
Existen varias técnicas de estimación muy utilizadas en la actividades de estimación de reservas según [Barnes,1989], donde se presenta una investigación acerca de la efectividad y limitaciones de las técnicas más populares las cuales son: Kriging Ordinario, Aproximación por Polígonos, Interpolación Triangular, Splines Cúbicos y el Método del Inverso de la Distancia. Se concluye que la ejecución de las técnicas de estimación
pueden ser peor que la calidad esperada por los mineros, que serios
problemas de estimación pueden ser evitados observando los resultados obtenidos en su trabajo, los cuales permiten hacer una mejor elección de la aproximación de reservas minerales.
Teniendo en cuenta la gran cantidad de aplicaciones y autores que usan técnicas de estimación y en particular la estimación Geoestadística podemos asegurar que los resultados en la aplicación de estas no son tan descabellados, solo se hace necesario buscar el estimador óptimo.
Los métodos de interpolación se pueden clasificar en clásicos y modernos, a su vez los modernos se pueden dividir en Modelación Matemática y Geoestadísticos. Los métodos clásicos como su nombre lo indica son los más sencillos e información sobre estos se puede encontrar en [Lepin,1986b], prestamos aquí mayor atención a los métodos modernos de estimación entre los que se destacan los siguientes:
11.1.- Triangulación. 27
Este método consiste en ajustar un plano que pase por las tres muestras mas cercanas y adyacentes a la localización que se desea estimar. [Barnes, 1989] La ecuación del plano es: Z=ax+by+c
(2)
Cada muestra tiene coordenadas (x, y) y z representa el valor muestreado. Con el objetivo de obtener la ecuación del plano que pase por las tres muestras construimos el siguiente sistema de ecuaciones lineales: a x1
+
b y1
+
c
=
z1
a x2
+
b y2
+
c
=
z2
a x3
+
b y3
+
c
=
z3
y así obtenemos los coeficientes a, b y c, entonces el valor de z en cualquier localización dentro del triángulo se puede obtener sustituyendo su coordenadas en la ecuación (2).
Existen varios métodos para obtener los triángulos dentro de los cuales el más utilizado es el de Delauney [Barnes,1989],[David,1977]
11.2.- Inverso de la distancia. Este método se basa en una combinación lineal dada por: [Barnes,1989] Z*(x) = ∑ λi Z(xi) En la que λi son loa pesos proporcionales a la distancia euclidiana entre las localización que se desea estimar igual a: 1/doi λi = ----------∑1/doj donde: doi es la distancia Euclidiana entre la localización a estimar y la localización de la muestra i. Generalizando obtenemos: 1/doi Z (x) = ∑i+1,n ------------ Z(xi) *
(3)
28
∑i=1,n1/doj Se pueden obtener distintos estimadores si escribimos la ecuación anterior como: (1/doi)ω Z*(x) = ∑i=1,n ---------------- Z(xi) ∑i=1,n(1/doj)ω Note que si ω = 1 Obtenemos la ecuación (3).
Estas dos técnicas matemáticas de estimación utilizan directamente los valores muestreados en la estimación y refieren pesos de acuerdo a la distancia euclidiana entre los datos, sin tener en cuanta un análisis de variabilidad en la información disponible. Veamos ahora un método que utiliza estos términos denominado krigeage.
12.- Interpolación Geoestadística. La interpolación Geoestadística se basa fundamentalmente en 3 pasos [Journel,1978], [David,1977] 1.- Análisis de variabilidad, obtención del semivariograma empírico. 2.- Ajuste a un modelo teórico, y selección adecuada del semivariograma y sus parámetros. 3.- Uso del semivariograma teórico ajustado , el proceso de estimación por el popular (dentro de la Geoestadística) método llamado Kriging.
Kriging es un término creado por George Matheron en sus trabajos en 1960, el cual interesado en los problemas de estimación de reservas minerales, se apoyo en la ideas iniciales de un ingeniero en minas sudafricano Danie G. Krige quien desarrollaba sus trabajos sobre evaluación de minas de oro. [Olea,1988],
Inicialmente Matheron denominó a esta técnica Krigeage que en ingles se convierte en Kriging [Olea,1988] término que tiene su origen en el apellido de Krige reconociendo de esta forma su inspiración inicial de minimizar la varianza de estimación, hecho por el que surge este interpolador y la Geoestadística en general.
Kriging en una técnica de estimación que proporciona el mejor estimador lineal 29
imparcial (BLUE, en ingles, Best Linear Unbiased Estimator) [Journel,1978], [David,1977], [Myers,1992], [Myers,1991]. El sistema Kriging, deducción teórica que se puede encontrar en [Journel,1978], [David,1977], puede presentarse en su formulación final de acuerdo a las siguientes variantes.
12.1.- Kriging Simple (KS). Su formulación final es: Estimador: Z*KS(xo) = m + ∑i=1,n λi(xo) [Z(xi) - m] Sistema: ∑j=1,n λj γ(xi, xj) = γ(xo, xi)
∀ i = 1, ...,n
Con varianza de estimación: σ2KS = ∑j=1,n λj γ(xo, xj) - γ(xo, xo) y en forma matricial el sistema KS puede ser expresado como: [K] [λ] = [M2] [λ] = [K]-1 [M2] y
σ2KS = [λ]t [M2] - γ(xo,xo)
donde: [λ]t es la transpuesta del vector [λ]. xo es la localizacion a estimar, xi y xj son la localizaciones i y j respectivamente. λi(xo) son los pesos de cada localización conocida con respecto a xo. m es el valor medio de los datos muestreados. γ(xi, xj) es el valor se semivariograma teórico obtenido en el ajuste. γ(x1,x1)
γ(x1,xj)
γ(x1,xn)
[K] = γ(xi,x1)
γ(xi,xj)
γ(xi,xn)
γ(xn,x1)
γ(xn,xj)
γ(xn,xn)
[λ] =
λ1
γ(x1,xo)
λ2
γ(xi,xo)
.
[M2] =
. 30
γ(xn,xo)
λn
12.2.- Kriging Ordinario (KO). Su formulación final es: Estimador: Z*KO(x) = ∑i=1,n λi(x) Z(xi) Sistema: ∑j=1,n λj γ(xi, xj) - μ = γ(xo, xi)
∀ i = 1, ...,n
∑j=1,n λj = 1 Con varianza de estimación: σ2KO = ∑j=1,n λj γ(xo, xj) + μ - γ(xo, xo) donde: μ es el parámetro de Lagrange. y en forma matricial el sistema KO puede ser expresado como: [K] [λ] = [M2] [λ] = [K]-1 [M2] y
σ2KO = [λ]t [M2] + μ - γ(xo, xo) γ(x1,x1)
γ(x1,xj)
γ(x1,xn)
1
[K] = γ(xi,x1)
γ(xi,xj)
γ(xi,xn)
1
γ(xn,x1)
γ(xn,xj)
γ(xn,xn)
1
1
1
1
0
[λ] =
λ1
γ(x1,xo)
λ2
γ(xi,xo)
.
[M2] =
.
λn
γ(xn,xo)
μ
1
El sistema Kriging puede escribirse en términos de covariograma, si tenemos en cuenta que γ(h) = C(0) - C(h). Particularmente cuando la función aleatoria Z(x) es intrínseca solamente y la covarianza C(h) no está definida, se utiliza el sistema Kriging 31
en términos de variograma. [Journel,1978], [David,1977]
Observaciones: Según [Journel,1978]: 1.- El sistema Kriging tiene una solución única si y solo sí la matriz de K es definida estrictamente positiva, es decir: ∑i=1,n∑j=1,n λiλj C(xi, xj) ≥ 0 o en términos de variograma: - ∑i=1,n∑j=1,n λiλj γ(xi, xj) ≥ 0 y no existen datos con las mismas coordenadas.
2.- Kriging, el cual es un estimador imparcial, es también un interpolador exacto. Note que, aunque la suma de los pesos λi es 1, no necesariamente estos tienen que ser positivos, y por tanto los valores estimados pueden ser negativos.
La efectividad de estos procedimientos se ha presentado en mucho trabajos, donde los autores aseguran resultados satisfactorios.
Es importante señalar que este procedimiento no es tan complejo, comparándolo con la cantidad de cálculos que requiere, donde su desarrollo ha sido favorecido por el auge de la informática moderna.
13.- Análisis de Tendencia, Kriging Universal (KU):
Uno de los problemas encontrados al modelar semivariogramas según [Krajewsky,1993] es cuando está presente la tendencia en los datos, es decir que los valores medidos aumentan o diminuyen con la distancia en el área de estudio. Un análisis en este sentido se ofrece en [Journel,1978], [David,1977], donde se plantea que las características de la variabilidad de un atributo, en estos casos, se describen mejor con la suma de dos componentes distintos, uno determinístico m(x) y un componente estocástico R(x) obteniéndose la estimación por Z(x) = m(x) + R(x).
Para el componente determinístico sugieren utilizar una función polinomial de las 32
coordenadas para modelar la tendencia, es decir: m(x) = ∑l=1,L al fl(x) donde al son coeficientes y fl es la función que describe la tendencia. Una variante de Kriging que tiene en cuenta esta situación, fue desarrollada por Goldberger, A, S. en 1962 y descrita por Matheron en 1969, para tratamiento de datos débilmente estacionarios y con tendencia llamada Kriging Universal (KU) [Carr,1990].
La aplicación de KU a datos débilmente estacionarios es difícil por tres razones: [Carr,1990] 1.- Es difícil obtener el semivariograma para datos débilmente estacionarios. 2.- El orden de la tendencia para datos débilmente estacionarios debe ser modelado. 3.- La solución de la ecuación para KU difiere de la solución para KS o KO. Concluye que estas tres dificultades no son insuperables. Al respecto [Armstrong,1984b] presenta los problemas más comunes al utilizar KU que son: 1.- La indeterminación en la tendencia. 2.- La indeterminación en el variograma. El sistema KU puede ser reducido a KO si L=0. [Journel,1978]
14.- Variables correlacionadas, Co-Kriging.
Es posible encontrar casos de variables insuficientemente muestreadas, pero que se conoce su correlación con otras variables en la zona de interés [Journel,1978], [David,1977],
utilizando
esta
correlación
es
posible
estimar
las
variables
insuficientemente muestreadas a partir de la información de la propia variable además de las correlacionadas con ellas [Journel,1978], [David,1977].
En este caso se utiliza una variante conocida como Co-Kriging, siendo una extensión 33
del procedimiento Kriging, que requiere del conocimiento de su variograma cruzado.
15.- Otras Aplicaciones.
Los método Geoestadísticos, en la actualidad toman auge fuera de las aplicaciones mineras, siendo utilizados en gran cantidad de aplicaciones de Ciencias de la Tierra, este trabajo no sólo se limita a realizar este planteamiento, sino, se señalan ejemplos donde los método Geoestadísticos han sido aplicados en éxito: En la estimación de reservas de petróleo. En el estudio de la precipitaciones. En el tratamientos de imágenes. En análisis de movimientos sísmicos. En el filtraje de sonidos. En el estudio de aguas subterráneas y caracterización de acuíferos. En la nematología en el cultivo de las plantas. En el monitoreo y estudio ambiental. En la identificación de anomalías Geoquímicas, etc.
En un estudio más profundo de Geoestadística pueden ser utilizado durante el análisis bibliográfico dos libros que merecen especial atención, estos son [Journel,1978] y [David,1977], en los cuales se presentan los conceptos y definiciones fundamentales de la Geoestadística aplicada a la estimación de reservas minerales.
Journel, A., and Huijbregts, Ch., 1978, “Mining Geostatistics”, presenta los siguientes capítulos.
I. Geostatistics and Mining Application: Hace una introducción
a la
geoestadística aplicada a la industria minera, presentando problemas donde puede se aplicada, los problemas de variabilidad estructural de variable de interés. Introduce la terminología de la geoestadística.
II. The Theory of Regionalized Variables: Es el capítulo teórico fundamental,
presentando los conceptos básicos de la geoestadística. Introduce tres de los principales conceptos y herramientas: El variograma, la estimación de la varianza, y la dispersión de la varianza.
III. Structural Analysis: Se presenta un análisis estructural del fenómeno
34
regionalizado, que consiste en construir un modelo de variograma que caracterice los principales rasgos de las regionalizaciones.
IV. Case Study of Structural Analysis: Se analizan quince casos de estudio,
donde se tienen en cuenta: modelos de variogramas, ajuste de modelos que presentan efecto hueco y efecto proporcional, casos de regionalización y su ajuste en modelos lineales, modelos con anisotropía, análisis estructural en tres dimensiones (3D), casos de la práctica minera con dos herramientas fundamentales, estimación y dispersión de la varianza.
V. Kriging and the estimation of in situ resources: Presenta como objetivo del
capítulo la estimación de reservas in situ, Introduciendo la técnica Kriging, Kriging Universal para el caso no estacionario, Co-Kriging para variables correlacionadas, presentando ejemplos de aplicación de la técnica para distintos casos posibles.
VI. Selection and Estimation of Recoverables Reserves: Presenta el estudio de
la influencia de la regionalización de la variable seleccionada en la recuperación de las reservas de un yacimiento.
VII. Simulation of Deposits: Presenta los conceptos fundamentales de la
simulación condicional, el original Método de las Bandas Rotantes “Turning Bands”, y aplicaciones prácticas de la simulación condicional.
VIII. Introduction to non-linear geostatistics: Se dan los elementos
fundamentales a la pregunta ¿Por qué la geoestadística no linear?, presentando las variantes de Kriging para estos casos, Kriging Disyuntivo, y sus aplicaciones.
David, M., 1977, Geostatistical Ore Reserve Estimation, presenta los siguientes capítulos.
I. Elementary Statistics Theory and Applications: Presenta los conceptos
fundamentales de estadística básica.
35
II. Constribution of Distribution to Mineral Reserve Problems: Hace una
breve introducción a la herramientas de estadística elemental que pueden ser usadas en los problemas de estimación de reservas.
III. What is Ore Reserve Calculation?: Presenta los problemas fundamentales
de la estimación de reservas minerales, refiriéndose al salto de los métodos tradicionales a la geoestadística.
IV. What is a Variogram?: Introduce el variograma, presentando los problemas
de variabilidad, presentando dos ejercicios a fin de mostrar lo real de los resultados.
V. Theoretical Basic of Approach: The Theory of Regionalized Variables:
Presenta la teoría de la variable regionalizada formalizada por Matheron en 1965.
VI. The practice of Variogram Modelling: Presenta un estudio Geoestadístico
de los diferentes modelos de variogramas que representan la variabilidad de la variable de interés, una guía paso a paso del cálculo de variogramas y su modelaje, hace un estudio de los problemas más frecuentemente encontrados en este proceso a través de problemas reales.
VII. The Effective Computatión of Block Variances: Un corto capítulo
dedicado únicamente al cálculo y aplicación de la varianza de bloques de cualquier tamaño, presentando ejemplos aplicados.
VIII. Computing Estimation Variances: Precision Problems: Capítulo
dedicado a la aplicación de la varianza del error obtenido cuando estimamos volúmenes, presentando un pequeño programa para calcular la varianza y su solución en muchos problemas de exploración , incluyendo la precisión.
IX. Optimization of grade estimation: Kriging: Presenta al interpolador
Kriging puntual y de bloque, respuesta teórica a los problemas de estimación óptima de bloques, presentando ejemplos de aplicación , el Kriging Universal para fenómenos no estacionarios. 36
X. The practice of Kriging: Presenta varios pasos que son reflexiones necesarias
al hacer Kriging, un método de estimación eficiente, presentando aplicaciones, presenta al Co-Kriging en el uso de unas variables para predecir otras.
XI. Grade-Tonnage Curves, Ore-Waste Selection and Planning Problems: En
este capítulo se da respuesta a muchas interrogantes, su propósito es mostrar un conjunto de problemas de tonelaje, comenzando con las definiciones de reservas y su diferentes parámetros y su influencia en las reservas.
XII. Orebody Modelling: Se refiere a dos clases de problemas a ser resuelto por
el modelo minero, la estimación y la simulación, presentando ejemplos.
XIII. Statistical Problems in Sample Preparation: Hace referencias a los
problemas de representatividad de las muestras.
Referencias Bibliográficas. [Alfonso,1989a] Alfonso Roche, J.R., 1989a, Estadísticas en las Ciencias Geológicas,
Tomo 1, Editorial ISPJAE, Ciudad de la Habana, 308 p.
[Alfonso,1989b] Alfonso Roche, J.R., 1989b, Estadísticas en las Ciencias Geológicas,
Tomo 2, Editorial ISPJAE, Ciudad de la Habana, 380 p.
[Armstrong,1984a] Armstrong, M., 1984a, Common Problems Seen in Variograms,
Mathematical Geology, Vol.16, No. 3, p.305-313.
[Armstrong,1984b] Armstrong, M., 1984b, Problem with Universal Krigimg,
Mathematical Geology, Vol. 16, No. 1, p.101-108.
[Barnes,1989] Barnes, M.W., 1989, The Limitations of popular techniques for
preproducction reserve estimation, thesis of Master of Sciences, Department of Mining Engineerng, The University of Utah, 86 p.
37
[Carr,1990] Carr, J.R.,
1990a, UVKRIG: A Frotram-77 Program for Universal
Krigimg, Computers & Geosciences, Vol.16, No.2, p.211-236.
[Cressie,1985] Cressie, N., 1985, Fitting Models by Weighted Least Squares,
Mathematical Geology, Vol. 17, No.5, p.563-586.
[Cuador,1997] Cuador Gil, J.Q., 1997, Aplicación Geoestadística para el Cálculo de
Reservas, Tesis de Maestria en Informática Aplicada, CREPIAI, ISPJAE, Ciudad Habana.
[David,1977] David, M., 1977, Geostatitical Ore Reserve Estimation, Elsevier,
Amsterdam, 364 p.
[Freund,1980] Freund, J. E., 1980, Estadística Elemental Moderna, Editorial Publo y
Educación, 466 p.
[Journel,1978] Journel, A, G. and Huijbregts, C. J., 1978, Mining Geostatistics,
Academic Press, New York, 600 p.
[Krajewski,1993] Krajewski, S. A. and Gibbs, B.L., 1993, A Variaogram Primer,
Gibbs Associates, 93 p.
[Lepin,1986a] Lepin, O. V., and Ariosa, J. D., 1986a, Búsqueda, Exploración y
Evaluación Geólogo Económica de Yacimientos Minrales Sólidos, Editorial Pueblo y Educación, Ciudad de La Habana, Primera Parte, 348 p.
[Lepin,1986b] Lepin, O. V., and Ariosa, J. D., 1986b, Búsqueda, Exploración y
Evaluación Geólogo Económica de Yacimientos Minrales Sólidos, Editorial Pueblo y Educación, Ciudad de La Habana, Segunda Parte, 191 p.
[Myers,1991] Myers, D.E., 1991a, Interpolation and Estimation with Spatially
Located Data, Chemometrics and Intelligent Laboratory Systems, 11, Elsevier Science Publishers B.V., p.209-228. 38
[Myers,1992] Myers, D.E., 1992, Krigimg, Cokrigimg, Radial Basic Functions and
The Role of Positive Definiteness, Computers Mathematical Application, Vol. 24, No.12, p.139-148.
[Olea,1988] Olea, R.A., 1988, Geostatistical Semantics, Geostatistics, Vol.2, No. 2,
p.4-7.
[Pannatier,1993] Pannatier, Y., 1993, MS-WINDOWS Program for exploratory
variography and variogram modeling in 2D, International Workshop on Statistics of Spatial Processes-Theory and Applications, Bari, Italy 27-30 September 1993.
39
View more...
Comments