Tema 04 - Metodos de Modelizacion Geofisica

April 8, 2019 | Author: Alejandra Jesús Zegarra Cáceres | Category: Correlation And Dependence, Sampling (Statistics), Statistical Dispersion, Regression Analysis, Scatter Plot
Share Embed Donate


Short Description

mínimos cuadrada - diagrama de dispersión- correlación lineal...

Description

METODOS DE MOD MO DELIZACION GEOFISICA GEOFISICA ING. NINO PUMA SACSI

2017

In en enie ierí ría a Ge Geof ofís ísic ica a

METODOS DE MODELIZACION GEOFISICA METODOS DE MODELIZACION GEOFISICA

INTRODUCCION RESUMEN OBJETIVOS 1.

CORRELACIÓN LINEAL .............................................................. ........................................................................................................... ............................................. 6 1.1 Coeficiente de correlación lineal de pearson.............................................................. 12 1.1.1 Fórmula utilizada ............................................................................. ................................................................................................. .................... 13 1.1.2 Significación del coeficiente de correlación ........................................................ 16

2.

DIAGRAMA DE DISPERSIÓN.................................................................. ................................................................................................. ............................... 18 2.1. Definición .............................................................. .................................................................................................................... ...................................................... 18 2.2. Características principales ............................................................ ........................................................................................... ............................... 18 2.3. Construcción...................................................................... Construcción................................................................................................................ .......................................... 1 9 2.3.1.Pasos previos a la construcción de un Diagrama de Dispersión......................... 19 2.3.2.Ejemplo ........................................................................................... ............................................................................................................... .................... 20 2.4. Tipos de diagrama ............................................................ ....................................................................................................... ........................................... 24 2.5. Utilización .............................................................. .................................................................................................................... ...................................................... 25 2.5.1.Utilización del diagrama de dispersión en mineralogía magnética de suelos volcánicos en una topo secuencia del valle de teotihuacán........................................ 25

3.

REGRESIÓN LINEAL CON ERRORES DE REDONDEO ............................................................. 28 3.1. Criterio para un mejor ajuste .................................................................. ...................................................................................... .................... 29 3.2. Ajuste de una línea línea recta por mínimos cuadrados...................................................... 31 3.2.1.Ejemplo aplicativo.................................................... aplicativo............................................................................................... ........................................... 32 3.3. Cuantificación del error en la regresión lineal ............................................................ 32 3.4. Linealización de relaciones no lineales ....................................................................... ....................................................................... 38 3.5. Ejemplos en ingeniería geofísica ............................................................. ................................................................................. .................... 41

4.

REGRESIÓN POR MÍNIMOS CUADRADOS...................................................................... ............................................................................ ...... 46 4.1. Ajuste............................................... Ajuste.................................................................................................................. ............................................................................ ......... 46 4.2. Interpolación y ajuste ................................................................... .................................................................................................. ............................... 46

1

   a    c    i    s     í     f    o    e    G    a     í    r    e    i    n    e    g    n    I

METODOS DE MODELIZACION GEOFISICA 4.3. Proyecciones ..................................................................... ............................................................................................................... .......................................... 47 4.4. Caso de una recta ............................................................. ........................................................................................................ ........................................... 47 4.5. Generalización ................................................................... ............................................................................................................. .......................................... 49 4.6. Recta de mínimos cuadrados .................................................................. ...................................................................................... .................... 53 4.7. La parábola de los mínimos cuadrados .............................................................. ....................................................................... ......... 53 CONCLUSIONES BIBLIOGRAFIA PAGINAS WEB ANEXOS

In g e n ie r ía G e

a

ic

ís

f

o

2

METODOS DE MODELIZACION GEOFISICA

Este documento describe el proceso completo a seguir para analizar la existencia de una relación lógica entre dos variables. Describe la construcción de los Diagramas de Dispersión a partir de la recogida de datos acerca de dichas variables y el análisis posterior necesario para confirmar la correlación que puede mostrar dicho diagrama, ya que ésta no implica la existencia de una relación lógica. Las relaciones estadísticas se obtienen mediante una primera fase de exploración conocida como análisis de correlación. Consiste en analizar los datos muestrales para saber el grado de asociación o correlación entre dos o más variables de una población. El grado de correlación se expresa como un número comprendido entre -1 y +1 y se le conoce como coeficiente de correlación.

Como corresponde a un estudio exploratorio, el análisis de correlación no es un fin en sí mismo sino que su objetivo es establecer la pertinencia de la segunda fase o análisis de regresión. Este da lugar a una función y = f (x) que describe estadísticamente la asociación o relación entre las variables en estudio y, por tanto, su fin no es calcular sin error sino obtener predicciones del valor de una variable, para un valor dado de la otra variable. Debido a que los cálculos para el coeficiente de correlación y los parámetros que definen la función se basan en una muestra aleatoria, se espera que varíen de una muestra a otra (tal como la media varía de una muestra a otra). Esto Esto plantea preguntas de significancia del coeficiente de correlación, de los parámetros de la función y de los valores de predicción obtenidos con ella. Tales preguntas son respondidas mediante intervalos de confianza y pruebas de hipótesis; esto es, mediante análisis inferencial.

3

   a    c    i    s     í     f    o    e    G    a     í    r    e    i    n    e    g    n    I

METODOS DE MODELIZACION GEOFISICA

En Ingenierías, la aplicación de software para procesamiento de datos de campo es imprescindible para una mejor elaboración e interpretación i nterpretación de resultados. resultados. Es por ello que el trabajo está enfocado en los métodos de modelización geofísica. El presente informe consta de cuatro ítems principales que serán explicados en forma general. Correlación lineal es la relación entre dos variables, para determinar su afinidad. Todo análisis de correlación lineal debe estar acompañado de un diagrama de dispersión para poder visualizar mejor dicha relación, teniendo como posibles resultados una relación positiva, negativa o en su defecto ninguna relación. Abarca conceptos tales como el coeficiente de Pearson. Diagrama de dispersión dispersión es la relación entre entre dos parámetros parámetros ya sea sea X y Y, su utilidad es para visualizar la correlación entre dichos valores, esto nos sirve para concluir un análisis de datos. Abarca conceptos tales como tipos de diagramas respecto a la correlación, pasos para realizar un diagrama y finalmente un ejemplo práctico en relación a Ingeniería Geofísica. Regresión Lineal es un paso posterior a la realización del diagrama de dispersión, el cual nos indica el grado de relación entre las variables independientes y dependientes dependientes a nivel algebraico. Se muestra además el ajuste correcto que se debe seguir al momento de elaborar dicha regresión. Además, no toda relación en campo es lineal, lin eal, por ello se presenta la transformación para convertir una ecuación de relación no lineal a una que es intrínsecamente lineal. Como ítem final tenemos la explicación especifica del Método de mínimos cuadrados.

In g e n ie r ía G e

a

ic

ís

f

o

4

METODOS DE MODELIZACION GEOFISICA



Estudiaremos la “correlación” los problemas referentes a la variación

conjunta de dos variables, su intensidad y su sentido (positivo o negativo). •

Definir las reglas básicas a seguir para la construcción e interpretación de los Diagramas de Dispersión, resaltando las situaciones en que pueden o deben, ser utilizados.



Analizar y comprender la elaboración de la Regresión lineal a partir de Diagramas de Dispersión considerando ajustes por mínimos cuadrados, tanto en teoría como aplicación práctica en Ingeniería Geofísica.



Enfatizar la importancia del Método de los Mínimos Cuadrados como parte importante del constatado de validez y relación de datos experimentales.

5

   a    c    i    s     í     f    o    e    G    a     í    r    e    i    n    e    g    n    I

METODOS DE MODELIZACION GEOFISICA

Se entiende por correlación el grado de relación existente entre dos variables. Concepto Cuando entre dos variables existe una correlación total, se cumple que a cada valor de una, le corresponde un único valor de la otra (función matemática). Es frecuente que dos variables estén relacionadas de forma que a cada valor de una de ellas le correspondan varios valores de la otra. En este caso es interesante investigar el grado de correlación existente entre ambas. La correlación mide el grado en que las variables: ❖  ❖ ❖

covarían dependen uno del otro predecir el uno al otro

El grado de correlación entre dos variables, por convención, se denota r , y la correlación entre la variable X y la variable Y se indica por r XY . Las correlaciones están estandarizados para variar entre -1 y 1, donde 0 representa ninguna relación, -1 una relación negativa perfecto, y 1 una relación positiva perfecta. Una variedad de estadísticas de correlación de dos variables están disponibles, la elección de las cuales depende de las variables nivel de medición: ❖ 

Nominal por nominal: Tabla de contingencia , prueba de chicuadrado de Pearson , Phi / V de Cramer ❖ Ordinal por ordinal: rho de Spearman , de Kendall tau-b ❖  Dicotómica por intervalo / relación coeficiente de correlación biserial Point ❖  Intervalo / ración por intervalo / proporción: coeficiente de correlación momento-producto de Pearson Análisis correlacional deben ir acompañadas de gráficos bi variados apropiados, tales como: Nominal por nominal: Agrupado gráficos de barras ❖ Ordinal por ordinal: Diagrama de dispersión (con los compartimientos de punto) ❖  Intervalo / relación de intervalo / proporción: Diagrama de dispersión e

g

In



Dicho lo anterior y con el fin de contextualizar el estudio de la correlación lineal, se recurre a una situación real. El diagrama de dispersión permite visualizar las parejas y establecer algún patrón de comportamiento gráfico. e

G

ía

r

ie

n

a

ic

ís

f

o

6

METODOS DE MODELIZACION GEOFISICA En la figura 1 se confirma la relación al aumentar x “aumenta” y; además, se resaltan algunos aspectos de interés, como el que los valores extremos (encerrados en círculos) pudieran ser atípicos, dada la dimensión de los huecos entre éstos y los racimos más cercanos No obstante el valor de la información anterior, hay, sin embargo, un aspecto visual importante:

La disposición de los puntos sigue un patrón gráfico “lineal ”

Figura 1 Diagrama de dispersión del Alquitrán-CO.

Los diagramas de dispersión de la figura 2 pueden ser descritos también con la expresión al aumentar x “aumenta” y; no obstante, su patrón gráfico

no corresponde al tipo lineal sino al de otras curvas.

Figura 2 Gráficas de dispersión no lineales en las que al aumentar x “aumenta” 

7

   a    c    i    s     í     f    o    e    G    a     í    r    e    i    n    e    g    n    I

METODOS DE MODELIZACION GEOFISICA Un comportamiento global descrito por la expresión al aumentar x “aumenta” y (en lo que resta de esta sección nos referiremos al tipo lineal)

suele describirse como una correlación o asociación positiva de y respecto a x (vea figura 3 a). En caso contrario, esto es, si al aumentar x disminuye globalmente y siguiendo un patrón gráfico lineal (vea figura 3 b), se dice que hay una correlación o asociación negativa de y respecto a x. Por otro lado, si el diagrama de dispersión es del tipo mostrado en el inciso c) de la figura 3, el recorrido de izquierda a derecha en el eje x no muestra asociación o relación de ningún tipo entre los valores de x y y ya que, al aumentar x igualmente aumenta y disminuye y. Un diagrama de estas características, es indicativo de que no hay relación (correlación) entre las variables en estudio.

Figura 3 Distintos tipos de correlación o asociación de datos

En el caso de variables aleatorias es poco probable tener una correlación lineal perfecta; sin embargo, para fines de análisis, resulta útil e importante considerarla. En los incisos a) y b) de la figura 4 se muestra una correlación lineal positiva y una negativa perfectas respectivamente. Como se observa, los puntos están distribuidos a lo largo de líneas rectas.

Figura 4 correlaciones lineales positivas y negativas perfectas

La “no relación” puede también manejarse mediante una serie de puntos a lo largo de una línea recta horizontal (ver figura 5). El significado g

In

algebraico de esto es que y es independiente de x o, en términos estadísticos, que no hay correlación entre x e y. ie

n

e r ía G e

a

ic

ís

f

o

8

METODOS DE MODELIZACION GEOFISICA

Figura 5. No asociación

Una consideración importante que se desprende de esto es que: Las relaciones deterministas vistas en otros cursos, pueden verse como correlaciones perfectas y por tanto como un caso particular de las relaciones estadísticas. Las descripciones de correlación lineal vistas hasta ahora son de tipo cualitativo. Para avanzar a una descripción cuantitativa se procede a dividir el diagrama de dispersión en cuatro regiones, dibujando líneas paralelas a los ejes por un punto central. El punto central puede ser el de las medianas o el de las medias; en este capítulo se considerará el punto central correspondiente a las medias (x, y) promedios, llamado Calculando las medias de las columnas x e y, se obtiene x =12.216 y y=12.528. Colocando el punto central (12.2, 12.5) en el diagrama de la figura 1 y trazando paralelas a los ejes por ese punto se llega a la figura 6.

Figura 6. División del diagrama de dispersión en cuatro regiones.

Cualquier punto ubicado en la región I o III apoya una correlación positiva; cualquier punto en la región II o IV apoya en cambio una correlación negativa. Tomando en cuenta que se trabaja con muestras de n puntos o datos, puede llamarse n(I) al número de puntos en la región I y de igual forma n(II), n(III) y n(IV) el número de puntos de las regiones II, III y IV respectivamente.

9

   a    c    i    s     í     f    o    e    G    a     í    r    e    i    n    e    g    n    I

METODOS DE MODELIZACION GEOFISICA Con estos elementos, se puede definir un número c que permita establecer tipo y grado de correlación o asociación entre las variables en estudio, de la siguiente manera (Peter Holmes, Correlation: From Picture to Formula, Teaching Statistics volume 23, Num. 3, Autumn 2001 p p. 6770): n(I)  n(III)  n(II)  n(IV)

(1)

n

A la clase de números a que pertenece c se les conoce genéricamente como coeficientes de correlación. Analizando la definición de correlación pueden verse algunas de las ideas generales con que se construyen tales coeficientes. Propiedades del coeficiente de correlación c . a) Si todos los puntos están en I y III, entonces c =1. b) Si todos los puntos están en II y IV, entonces c = -1. c) Si los puntos están repartidos equitativamente en las cuatro

regiones, entonces c =0. d) Si todos los puntos están en tres o cuatro regiones, entonces c estará entre -1 y +1: si los puntos están predominantemente en I y III, entonces c será positivo, pero si los puntos están predominantemente en II y IV, entonces c será negativo. Con el fin de avanzar en el estudio de los coeficientes de correlación se recurre a una situación distinta a la vista pero también en un contexto real. Tabla 1. Tabla ordenada de menor a mayor considerando la temperatura

(ºF)

1996 1980

4 5

1982 1981 1998 1989 1991

5 5 5 5 5

1997 1995

6 6

1986 1988

6 6

g

1985

7

ie

1993 1978 1984 1979

7 7 7 8

e

G

ía

r

n

e

In

 Año

a

ic

ís

f

o

10

t

Mujeres (min )

148.300 145.700 . 147.233 145.483 145.283 145.500 147.533 . 148.717 148.100 . 148.100 148.117 . 148.567 . 146.400 152.500 149.500 147.550

Observe que

la temperatura media pueda repetirse en algunas ocasiones (i.e. 73o F) y que, sin embargo, le corresponda n tiempos distintos.

METODOS DE MODELIZACION GEOFISICA Al recorrer simultáneamente las columnas de T y t de arriba abajo, no logra apreciarse una asociación entre las variables. Construyendo el diagrama de dispersión con las temperaturas en el eje horizontal y los tiempos de las ganadoras en el eje vertical, se llega a la figura 7.

Figura 7 Diagrama de dispersión temperatura vs. Tiempo

El diagrama tampoco es muy revelador del tipo de asociación, por lo que se obtiene el punto central y se trazan por éste las líneas de división. Punto central: T = 63.048; t= 147.757.

Figura 8 Diagrama de dispersión con líneas de división

La división permite distinguir que la distribución de los puntos se da predominantemente en las regiones I y III y por tanto considerar una correlación positiva entre las variables. Los puntos, sin embargo, se encuentran muy dispersos respecto a lo que pudiera ser un patrón gráfico lineal, por lo que se esperaría un grado de asociación débil. Con el fin de tener medidas numéricas se calcula el coeficiente de correlación c: n = 21; n(I) = 7; n(II) = 3; n(III) = 8; n(IV) = 3 7+8-3-3 c= = 0.42857 21

11

   a    c    i    s     í     f    o    e    G    a     í    r    e    i    n    e    g    n    I

METODOS DE MODELIZACION GEOFISICA El signo positivo de c indica la preponderancia de los puntos en las regiones I y III confirmando la asociación positiva; la magnitud de c (0.42857), sin embargo, refleja un grado de correlación débil ya que se encuentra más bien cercana a cero. Pudiera pensarse que la magnitud de c indica la dispersión de los puntos de un diagrama, sin embargo, puede no resultar así en todos los casos, ya que por ejemplo en las dos gráficas de la figura 9 se obtiene c =1, el grado máximo de correlación. Esta falla de la magnitud del coeficiente c a diferenciar el grado de dispersión en ambos diagramas, sugiere construir un coeficiente de correlación que, por ejemplo, deje el grado máximo de asociación exclusivamente a los casos en que se tienen las correlaciones lineales positiva y negativa perfectas. Asimismo, que refleje que el diagrama de dispersión del inciso b) corresponde a una correlación de mayor grado que la correlación que guardan los puntos del diagrama del inciso a).

Figura 9 Correlación positiva débil y fuerte

El científico Inglés Karl Pearson desarrolló un coeficiente de correlación que cumple con los requisitos mencionados y es uno de los más ampliamente usados en ingeniería y ciencias.

G

ía

r

ie

n

e

g

In

El coeficiente de correlación de Pearson, pensado para variables cuantitativas (escala mínima de intervalo), es un índice que mide el grado de covariación entre distintas variables relacionadas linealmente. Adviértase que decimos "variables relacionadas linealmente". Esto significa que puede haber variables fuertemente relacionadas, pero no de forma lineal, en cuyo caso no proceder a aplicarse la correlación de Pearson. Por ejemplo, la relación entre la ansiedad y el rendimiento tiene forma de U invertida; igualmente, si relacionamos población y tiempo la relación será de forma exponencial. En estos casos (y en otros muchos) no es conveniente utilizar la correlación de Pearson. Insistimos en este punto, que parece olvidarse con cierta frecuencia. El coeficiente de correlación de Pearson es un índice de fácil ejecución e, igualmente, de fácil interpretación. Digamos, en primera instancia, que sus valores absolutos oscilan entre 0 y 1. Esto es, si tenemos dos variables X e Y, y definimos el coeficiente de correlación de Pearson entre e

a

ic

ís

f

o

12

METODOS DE MODELIZACION GEOFISICA estas dos variables como x y r entonces: 0 ≤r ≤ 1

Hemos especificado los términos "valores absolutos" ya que en realidad si se contempla el signo el coeficiente de correlación de Pearson oscila entre  –1 y +1. No obstante ha de indicarse que la magnitud de la relación viene especificada por el valor numérico del coeficiente, reflejando el signo la dirección de tal valor. En este sentido, tan fuerte es una relación de +1 como de -1. En el primer caso la relación es perfecta positiva y en el segundo perfecta negativa. Pasamos a continuación a desarrollar algo más estos conceptos. Decimos que la correlación entre dos variables X e Y es perfecta positiva cuando exactamente en la medida que aumenta una de ellas aumenta la otra. Esto sucede cuando la relación entre ambas variables es funcionalmente exacta. Difícilmente ocurrirá en psicología, pero es frecuente en las ciencias físicas donde los fenómenos se ajustan a leyes conocidas, Por ejemplo, la relación entre espacio y tiempo para un móvil que se desplaza a velocidad constante. Se dan a continuación las propiedades de coeficiente de correlación r. Propiedades del coeficiente de correlación r de Pearson. a). El valor de r es independiente de las unidades en que se midan  x y y . b). r  1 si y sólo si todos los pares de puntos de la muestra están en una recta con pendiente positiva y r  1 si y sólo si todos los pares de

puntos de la muestra están en una recta con pendiente negativa. c). El rango de valores de r está dado por el intervalo 1  r  1. d). Simetría: El valor de r no depende de cuál de las dos variables bajo estudio se designe como x y cuál como y . e). r mide la fuerza de una relación lineal. No está diseñado para medir la

El coeficiente de correlación de Pearson viene definido por la siguiente expresión:

Esto es, el coeficiente de correlación de Pearson hace referencia a la media de los productos cruzados de las puntuaciones estandarizadas de X y de Y. Esta fórmula reúne algunas propiedades que la hacen preferible a otras. A operar 13

   a    c    i    s     í     f    o    e    G    a     í    r    e    i    n    e    g    n    I

METODOS DE MODELIZACION GEOFISICA con puntuaciones estandarizadas es un índice libre de escala de medida. Por otro lado, su valor oscila, como ya se ha indicado, en términos absolutos, entre 0 y 1. Téngase en cuenta que las puntuaciones estandarizadas muestran, precisamente, la posición en desviaciones tipo de un individuo respecto a su media. Reflejan la medida en que dicho individuo se separa de la media. En este sentido, supongamos que para cada individuo tomamos dos medidas en X e Y. La correlación entre estas dos variables será perfecta positiva cuando cada individuo manifieste la misma superioridad o inferioridad en cada una de ellas. Esto se cumple cuando su posición relativa sea la misma, es decir, cuando sus puntuaciones tipo sean iguales (Zx = Zy). En este caso la fórmula de la correlación se transforma en:

Ya que tal expresión equivale a la varianza de Zx , que como se sabe vale la unidad. Cuando la correlación es perfecta negativa los valores de Zx y Zy son exactamente iguales pero de signo contrario, resultando los productos cruzados de Zx y Zy negativos. En este caso, el valor de la correlación es el mismo que anteriormente pero de signo negativo:

Cuando la correlación es nula, para un valor obtenido de X se podrá obtener cualquier valor de Y; es decir, para un valor determinado de Zx la misma cantidad de valores positivos y negativos de Zy. De todo ello resulta que la suma de productos cruzados valdrá cero ya que habrá tantos productos positivos como negativos. Así pues: In g e n ie r ía G e

a

ic

ís

f

o

14

METODOS DE MODELIZACION GEOFISICA La fórmula anterior (1.5) puede expresarse de forma más sencilla de la siguiente manera:

Efectivamente:

Esta fórmula es especialmente útil cuando se conocen las medias de X e Y así como sus desviaciones tipo, lo cual es relativamente frecuente. Si por cualquier circunstancia no dispusiéramos de la información de estos estadísticos podríamos calcular rxy recurriendo a la expresión en puntuaciones directas:

Podemos expresar, igualmente, el coeficiente de correlación de Pearson en puntuaciones diferenciales o centradas mediante la siguiente formula:

Donde x = X - X e y = Y - Y.

15

   a    c    i    s     í     f    o    e    G    a     í    r    e    i    n    e    g    n    I

METODOS DE MODELIZACION GEOFISICA Para su demostración partamos de (1.5):

Una vez calculado el valor del coeficiente de correlación interesa determinar si tal valor obtenido muestra que las variables X e Y están relacionadas en realidad o tan solo presentan dicha relación como consecuencia del azar. En otras palabras, nos preguntamos por la significación de dicho coeficiente de correlación. Un coeficiente de correlación se dice que es significativo si se puede afirmar, con una cierta probabilidad, que es diferente de cero. Más estrictamente, en términos estadísticos, preguntarse por la significación de un cierto coeficiente de correlación no es otra cosa que preguntarse por la probabilidad de que tal coeficiente proceda de una población cuyo valor sea de cero. A este respecto, como siempre, tendremos dos hipótesis posibles: ❖ 

H0:rxy = 0

⇒  El coeficiente de correlación obtenido

procede de una población cuya correlación es cero ( ρ = ❖

0 ). H1 : rxy = 0   El coeficiente de correlación obtenido procede de una población cuyo coeficiente de



correlación es distinto de cero ( 0 ρ ≠ ).

e

G

ía

r

ie

n

e

g

In

Un ejemplo aplicado a las ciencias de la tierra se le denomina autocorrelacion o autovarianza. La auto correlación, también conocido como la correlación en serie, es la correlación de una señal con una copia retardada de sí mismo como una función de retardo. De manera informal, es la similitud entre las observaciones en función del tiempo que transcurre entre ellos. El análisis de autocorrelación es una herramienta matemática para encontrar patrones que se repiten, como la presencia de una señal periódica oscurecida por el ruido, o la identificación de la frecuencia fundamental faltante en una

a

ic

ís

f

o

16

METODOS DE MODELIZACION GEOFISICA señal implícita en sus armónicos frecuencias. A menudo se utiliza en el procesamiento de señales para el análisis de funciones o serie de valores, tales como el dominio del tiempo señales. Unidad de raíz procesos estacionarios tendencia procesos, procesos autor regresivos, y en movimiento procesos medias son formas específicas de procesos con autocorrelación.

Figura 10 Correlación lineal de una señal

17

   a    c    i    s     í     f    o    e    G    a     í    r    e    i    n    e    g    n    I

METODOS DE MODELIZACION GEOFISICA

Los Diagramas de Dispersión o Gráficos de Correlación permiten estudiar la relación entre 2 variables. Dadas 2 variables X e Y, se dice que existe una correlación entre ambas si cada vez que aumenta el valor de X aumenta proporcionalmente el valor de Y (Correlación positiva) o si cada vez que aumenta el valor de X disminuye en igual proporción el valor de Y (Correlación negativa). Se utiliza para conocer si efectivamente existe una correlación entre dos magnitudes o parámetros de un problema y, en caso positivo, de qué tipo es la correlación. Figura 10 En un gráfico de correlación representamos cada par X, Y como un punto donde se cortan las coordenadas de X e Y: Y

X

Figura10 Ejemplo de diagrama de dispersión

ie

n

e

g

In

A continuación se comentan una serie de características que ayudan a comprender la naturaleza de la herramienta. ❖

Impacto visual:



Comunicación:



Guía en la investi gación:

Un Diagrama de Dispersión muestra la posibilidad de la existencia de correlación entre dos variables de un vistazo. Simplifica el análisis de situaciones numéricas complejas. El análisis de datos mediante esta herramienta proporciona mayor información que el simple análisis matemático de correlación, sugiriendo posibilidades y alternativas de estudio, basadas en la necesidad de conjugar datos y procesos en su utilización.

r ía G e

a

ic

ís

f

o

18

METODOS DE MODELIZACION GEOFISICA

Paso 1:  Elaborar una teoría admisible y relevante sobre la

supuesta relación entre dos variables. Este paso previo es de gran importancia, puesto que el análisis de un Diagrama de Dispersión permite obtener conclusiones sobre la existencia de una relación entre dos variables, no sobre la naturaleza de dicha relación. Paso 2:  Obtener los pares de datos correspondientes a las

dos variables Al igual que en cualquier otra herramienta de análisis de datos, éstos son la base de las conclusiones obtenidas, por tanto cumplirán las siguientes condiciones: •

• • • •

En cantidad suficiente: Se consideran necesarios al menos 40 pares de datos para construir un Diagrama de Dispersión. Datos correctamente emparejados: Se estudiará la relación entre ambos. Datos exactos: Las inexactitudes afectan a su situación en el diagrama desvirtuando su apariencia visual. Datos representativos: Asegúrese de que cubren todas las condiciones operativas del proceso. Información completa: Anotar las condiciones en que han sido obtenidos los datos.

Paso 3:  Determinar los valores máximo y mínimo para cada

una de las variables. Paso 4:  Decidir sobre qué eje representará a cada una de

las variables. Si se está estudiando una posible relación causa-efecto, el eje horizontal representará la supuesta causa. Paso 5:  Trazar y rotular los ejes horizontal y vertical.

La construcción de los ejes afecta al aspecto y a la consiguiente interpretación del diagrama. 1. Los ejes han de ser aproximadamente de la misma longitud, determinando un área cuadrada. 2. La numeración de los ejes ha de ir desde un valor ligeramente menor que el valor mínimo de cada variable hasta un valor ligeramente superior al valor 19

   a    c    i    s     í     f    o    e    G    a     í    r    e    i    n    e    g    n    I

METODOS DE MODELIZACION GEOFISICA máximo de las mismas. Esto permite que los puntos abarquen toda el área de registro de los datos. 3. Numerar los ejes a intervalos iguales y con incrementos de la variable constantes. 4. Los valores crecientes han de ir de abajo a arriba y de izquierda a derecha en los ejes vertical y horizontal respectivamente. 5. Rotular cada eje con la descripción de la variable correspondiente y con su unidad de medida. Paso 6:  Marcar sobre el diagrama los pares de datos

1. Para cada par de datos localizar la intersección de las lecturas de los ejes correspondientes y señalarlo con un punto o símbolo. Si algún punto coincide con otro ya existente, se traza un círculo concéntrico a este último. 2. Cuando coinciden muchos pares de puntos, el Diagrama de Dispersión puede hacerse confuso. En este caso es recomendable utilizar una "Tabla de Correlación" para representar la correlación. 3. En el caso en que se construye un Diagrama de Dispersión estratificado separando los pares de datos, por ejemplo, según el turno de trabajo, lote de materia prima, etc.), deben escogerse símbolos que pongan de manifiesto los diferentes grupos de puntos de forma clara. Paso 7:  Rotular el gráfico.

Se rotula el título del gráfico y toda aquella información necesaria para su correcta comprensión. En general, es conveniente incluir una descripción adicional del objeto de las medidas y de las condiciones en que se han realizado, ya que esta información puede ayudar en la interpretación del diagrama.

n

e

g

In

Veamos un ejemplo. Supongamos que tenemos un grupo de personas adultas de sexo masculino. Para cada persona se mide la altura en metros (Variable X) y el peso en kilogramos (Variable Y). Es decir, para cada persona tendremos un par de valores X, Y que son la altura y el peso de dicha persona ver tabla 2.3 ie r ía G e

a

ic

ís

f

o

20

METODOS DE MODELIZACION GEOFISICA

21

   a    c    i    s     í     f    o    e    G    a     í    r    e    i    n    e    g    n    I

METODOS DE MODELIZACION GEOFISICA

Entonces, para cada persona representamos su altura y su peso con un punto en un gráfico: Una vez que representamos a las 50 personas quedará un gráfico como el siguiente, ver figura 11. (a) y figura 11. (b)

Figura 11 (a) Persona representada por su altura y su peso. In g e n ie r ía G e

a

ic

ís

f

o

22

METODOS DE MODELIZACION GEOFISICA

Figura 11 (b). Personas representadas por su altura y su peso.

Qué nos muestra este gráfico? En primer lugar podemos observar que las personas de mayor altura tienen mayor peso, es decir parece haber una correlación positiva entre altura y peso. Pero un hombre bajito y gordo puede pesar más que otro alto y flaco. Esto es así porque no hay una correlación total y absoluta entre las variables altura y peso. Para cada altura hay personas de distinto peso, figura 11 (c)

Figura 11 (c) Para cada altura hay personas de distinto peso.

Sin embargo podemos afirmar que existe cierto grado de correlación entre la altura y el peso de las personas.

23

   a    c    i    s     í     f    o    e    G    a     í    r    e    i    n    e    g    n    I

METODOS DE MODELIZACION GEOFISICA El resultado de un diagrama de dispersión puede ser de diversos tipos. Si los puntos trazados en el diagrama están dispersos al azar, sin un patrón discernible, significa que los dos conjuntos de mediciones no tienen relación entre sí. Si los puntos forman algún patrón, se denota la existencia de relación entre los dos grupos de mediciones. Generalmente, el diagrama de dispersión mostrará los siguientes posibles tipos de relación (Ver figura 12):

In g e ía

r

ie

n

Figura 12 Tipos de relación en diagramas de dispersión G e

a

ic

ís

f

o

24

METODOS DE MODELIZACION GEOFISICA El Diagrama de Dispersión es una herramienta útil para comprobar (aceptar o rechazar) teorías respecto a la supuesta existencia de una relación entre dos variables. Hay tres puntos de dicho proceso en los que el Diagrama de Dispersión puede ser una herramienta útil: • • •

Durante la fase de diagnóstico, para ensayar teorías sobre las causas e identificar las causas raíz. Durante la fase de corrección, en el diseño de soluciones. Para el diseño de un sistema de control que mantenga los resultados de una acción de mejora de la calidad.

Relacion es entr e parámetros magnéti cos de los suelos

Los gráficos entre parámetros magnéticos en diagramas de dispersión son de gran utilidad, ya que permiten comparar las características de las propiedades magnéticas de todos los perfiles en su conjunto (Figura 13 ). La relación χ vs. MRIS1T es útil para determinar la concentración de minerales ferrimagnéticos y evaluar la presencia de minerales paramagnéticos o antiferrimagnéticos y las mezclas de tamaños (Thompson y Oldfield, 1986). En este diagrama, las concentraciones crecientes de (Ti-) magnetita se ubican hacia el extremo superior derecho. Los minerales paramagnéticos contribuyen de manera moderada a la χ

pero no a MRIS1T, mientras que los minerales de alta coercitividad (hematita/ goethita) tienden a ubicarse en la parte baja y derecha del diagrama. Las magnetitas DS tienden a describir la diagonal de mayor pendiente y las mezclas con altas concentraciones de partículas MD y SP tienden a situarse por debajo de ésta, debido a que contribuyen a la χ pero en men or medida a MRIS 1T (Figura 13a). En esta figura, los suelos analizados se distribuyen a lo largo de una diagonal en la que el perfil CGBE presenta la mayor concentración de minerales ferrimagnéticos de todos los suelos analizados. Por el contrario, las muestras del perfil CED, que se distribuyen en dos grupos, presentan las menores concentraciones. SNP y OTM se ubican entre los anteriores. El perfil MAS y un grupo de CED se sitúan por 25

   a    c    i    s     í     f    o    e    G    a     í    r    e    i    n    e    g    n    I

METODOS DE MODELIZACION GEOFISICA

e

G

ía

r

ie

n

e

g

In

debajo de la diagonal, lo que se puede interpretar de forma diferente. Los bajos valores en ambos parámetros en CED sugieren poca presencia de ferrimagnéticos y probablemente mayor contribución de minerales para- y antiferrimagnéticos, mientras que el comportamiento de las muestras de MAS (bajo MRIS1T y alto χ) indican una mayor abundancia de minerales paramagnéticos. La relación entre la concentración magnética y el tamaño de partícula DS se ilustra en el diagrama χ vs. MRA/MRI100  (Figura 13b). En general, los suelos presentan una relación inversa, en donde los suelos con mayor concentración (CGBE, CGN) presentan también la menor abundancia de partículas finas DS, en tanto que el suelo con menor concentración (OTM) presenta una mayor abundancia de DS (MRA/MRI 100 > 0.05). Esta relación inversa sugiere que un posible enriquecimiento en la concentración no está asociado a un aumento en partículas finas. Los suelos MAS y CGN presentan la mayor dispersión, entre los valores extremos, lo que indica la mayor variabilidad en el tamaño de partículas en ellos. CED presenta valores bajos e intermedios en MRA/MRI100, lo que sugiere variaciones menores en el contenido de DS. El diagrama χfd% vs. MRA/MRI100 permite analizar las variaciones en las fracciones de partículas más finas, SP y DS, respectivamente (Figura 13c). Aunque con cierta dispersión, se observa una relación directa entre ambos parámetros, lo que sugiere que aquellos suelos con la mayor abundancia de partículas DS también presentan la mayor abundancia de partículas ultrafinas SP (OTM). En este diagrama, las muestras de CGN se distribuyen mayormente a lo largo de la diagonal; sin embargo, aunque CGBE y un grupo de MAS contienen de manera moderada partículas SP, tienen una abundancia baja y alta, respectivamente, de partículas DS. Por otro lado, la relación entre la concentración absoluta y relativa de minerales de alta coercitividad (hematita/ goethita) se muestra en el diagrama S300  vs. MRIA 300  (Figura 13d). En general, se presenta una relación inversa entre ellos, en la que las muestras de suelos analizados describen dos trayectorias. MAS, OTM y SNP se agrupan en una diagonal de menor pendiente, con valores relativamente bajos de MRIA 300 y altos de S300, lo que indica bajas concentraciones de hematita/goethita. Por arriba de ellos, a lo largo de una diagonal de mayor pendiente se agrupan CGBE y CGN; sin embargo, éstos presentan altos valores en S 300  y en MRIA300. Ya que en estos suelos se presenta la mayor concentración absoluta tanto de hematita/goethita como de ferrimagnéticos, es posible que la importancia de los

a

ic

ís

f

o

26

METODOS DE MODELIZACION GEOFISICA minerales de alta coercitividad decrezca debido a un aumento aún mayor en los ferrimagnéticos de baja coercitividad. Por otra parte, en CED las bajas concentraciones de minerales ferrimagnéticos permiten que las moderadas concentraciones de antiferrimagnéticos resalten en S300.

Figura 13 Diagramas de dispersión de algunos parámetros magnéticos. a) χ vs. MRIS 1T muestra principalmente la concentración de minerales ferrimagnéticos; las concentraciones crecientes de (Ti-) magnetita se ubican hacia el extremo superior derecho; los minerales paramagnéticos contribuyen a la χ pero no a MRIS 1T; los minerales de alta coercitividad (hematita y goethita) tienden a ubicarse en la parte baja y derecha del diagrama. b) χ vs. MRA/MRI 100 ilustra la relación entre la concentración magnética y el tamaño de partícula DS-PDS. c) χ fd% vs. MRA/MRI100  permite analizar las variaciones en las fracciones de partículas más f inas, SP y DS, respectivamente d) S300  vs. MRIA300  muestra la relación entre la concentración absoluta y relativa de minerales de alta coercitividad (hematita y goethita).

27

   a    c    i    s     í     f    o    e    G    a     í    r    e    i    n    e    g    n    I

METODOS DE MODELIZACION GEOFISICA

El paso siguiente en el análisis de dos variables aleatorias X y Y consiste en encontrar la función lineal y  a 0  a1 x que sirve para modelar la relación entre ellas. Este proceso es llamado regresión lineal y la línea resultante recta de regresión.

Cuando los datos tienen errores sustanciales, la interpolación polinomial es inapropiada y puede dar resultados poco satisfactorios cuando se utiliza para predecir valores intermedios. Con frecuencia los datos experimentales son de este tipo. Por ejemplo, en la figura 14 a se muestran siete datos obtenidos experimentalmente que presentan una variabilidad significativa. Una inspección visual de esos datos sugiere una posible relación entre y y x. Es decir, la tendencia general indica que valores altos de y están asociados con valores altos de x. Ahora, si un polinomio de interpolación de sexto grado se ajusta a estos datos (figura 14 b), pasará exactamente a través de todos los puntos. Sin embargo, a causa de la variabilidad en los datos, la curva oscila mucho en el intervalo entre los puntos. En particular, los valores interpolados para x = 1.5 y x = 6.5 parecen estar bastante más allá del rango sugerido por los datos. Una estrategia más apropiada en tales casos consiste en obtener una función de aproximación que se ajuste a la forma o a la tendencia general de los datos, sin coincidir necesariamente en todos los puntos. La figura 14c ilustra cómo se utiliza una línea recta para caracterizar de manera general la tendencia de los datos sin pasar a través de algún punto específico. Una manera para determinar la línea de la figura 14 c es inspeccionar en forma visual los datos graficados y después trazar una “mejor” línea a través de los puntos. Aunque tales procedimientos “a ojo” apelan al sentido común y son válidos para cálcu los “superficiales”, resultan

deficientes por ser arbitrarios. Es decir, a menos que los puntos definan una línea recta perfecta (en cuyo caso la interpolación resultaría apropiada), diferentes analistas dibujarían líneas distintas. Para dejar a un lado dicha subjetividad se debe encontrar algún criterio para establecer una base para el ajuste. Una forma de hacerlo es obtener una curva que minimice la discrepancia entre los puntos y la curva. Una técnica para lograr tal objetivo, llamada regresión por mínimos cuadrados. In g e n ie r ía G e

a

ic

ís

f

o

28

METODOS DE MODELIZACION GEOFISICA

FIGURA 14: a) Datos que muestran un error significativo. b) Ajuste polinomial oscilando más allá del rango de los datos. c) Resultados más satisfactorios mediante el ajuste por mínimos cuadrados.

El ejemplo más simple de una aproximación por mínimos cuadrados es ajutar una línea recta a un conjunto de observaciones definidas por puntos: (x1, y1), (x2, y2),…, (xn, yn). La expresión matemática para la línea recta es y = a0 + a1x + e

(2)

donde a0 y a1 son coeficientes que representan la intersección con el eje Y y la pendiente, respectivamente, e es el error, o diferencia, entre el modelo y las observaciones, el cual se representa al reordenar la ecuación (2) como: e = y – a0 – a1x

Así, el error o residuo es la discrepancia entre el valor verdadero de Y y el valor aproximado, a0 + a1x, que predijo la ecuación lineal.

La finalidad de la recta es representar algebraicamente a los datos, es decir, con una ecuación del tipo y  a0  a1 x . se desearía entonces que la recta trazada representara los datos muestrales de la “mejor manera posible”.

Uno de los criterios formales más ampliamente usado es el del ajuste por mínimos cuadrados.  Se presenta a continuación el criterio de ajuste por mínimos cuadrados, mediante una serie de pasos gráficos: Con una relación de datos plasmada en un diagrama de dispersión, se trazan líneas verticales desde cada uno de los puntos a la recta trazada arbitrariamente (ver figura 15). Se dan las distancias verticales de algunos de estos puntos a la recta (el cálculo de tales distancias en este momento es irrelevante ya que solo tiene fines ilustrativos del método).

29

   a    c    i    s     í     f    o    e    G    a     í    r    e    i    n    e    g    n    I

METODOS DE MODELIZACION GEOFISICA

Figura 15 Trazo de líneas verticales de los puntos a la recta

Luego se toma cada una de las verticales trazadas como el lado de un cuadrado. A cada cuadrado le corresponde un área igual a lado x lado; por ejemplo, la distancia del punto correspondiente a Now (1, 1.5) a la recta es 2.94 y su área es 8.64, mientras que la distancia de Salem Ultra (4.5, 4.9) es 1.62 y su área es 2.62. en el caso de la marca Bull Durham el área es 5.52 como se ve en la figura 16.

Figura 16 Construcción de los cuadrados y calculo de sus áreas.

El siguiente paso consiste en sumar las áreas de los cuadrados generados por cada uno de los 25 puntos.

Si se traza arbitrariamente otra recta por entre los puntos se generaría otro juego de 25 cuadrados, cuya suma daría un área total seguramente distinta a la del caso inicial. Con estas consideraciones el escenario queda listo para enunciar el criterio para seleccionar una recta de ajuste: ía

r

ie

n

e

g

In

G e

a

ic

ís

f

o

30

METODOS DE MODELIZACION GEOFISICA La recta de ajuste por mínimos cuadrados es aquella que pasa por entre los puntos de la muestra, de tal modo que produce el área total mínima. El criterio así establecido da lugar a una recta única. Su deducción o, dicho de otra forma, la deducción del cálculo de la ordenada al origen a0 y la pendiente a 1 es un proceso técnico que minimizan la ecuación:

(3)

Para determinar los valores de a0 y a1, la ecuación (3) se deriva con respecto a cada uno de los coeficientes:

Observe que hemos simplificado los símbolos de la sumatoria; a menos que se indique otra cosa, todas las sumatorias van desde i=1 hasta n. Al igualar estas derivadas a cero, se dará como resultado un Sr  mínimo. Si se hace esto, las ecuaciones se expresan como:

Ahora, si observamos que a0 = na0, expresamos las ecuaciones como un conjunto de dos ecuaciones lineales simultáneas, con dos incógnitas (a0 y a1): …. (4) …. (5)

Éstas se llaman ecuaciones normales, y se resuelven en forma simultánea

…. (6)

Este resultado se utiliza conjuntamente con la ecuación (4) para obtener 31

   a    c    i    s     í     f    o    e    G    a     í    r    e    i    n    e    g    n    I

METODOS DE MODELIZACION GEOFISICA … (7)

Donde

y

son las medias de y y x, respectivamente.

Ajuste a una línea recta los valores x y y en las dos primeras columnas de la tabla 2. Tabla 2 Cálculos para el análisis de error en el ajuste lineal

Se calculan las siguientes cantidades:

Mediante las ecuaciones (6) y (7)

Por lo tanto, el ajuste por mínimos cuadrados es y = 0.07142857 + 0.8392857x Varias propiedades de este ajuste se observan al examinar más de cerca la forma en que se calcularon los residuos. Recuerde que la suma de los cuadrados se define como: In g e n

…8 ie r ía G e

a

ic

ís

f

o

32

METODOS DE MODELIZACION GEOFISICA En la ecuación (8), el cuadrado del residuo representa el cuadrado de la distancia vertical entre el dato y otra medida de tendencia central: la línea recta (figura 17).

Figura 17 El residuo en la regresión lineal representa la distancia vertical entre un dato y la línea recta.

Una “desviación estándar” para la línea de regresión se determina como sigue:

… (9)

donde a Sy/x se le llama error estándar del estimado. El subíndice “y/x” designa que el error es para un valor predicho de y correspondiente a un valor particular de x. También observamos que ahora dividimos entre n  – 2 debido a que se usaron dos datos estimados (a0 y a1), para calcular Sr. Así como en el caso de la desviación estándar, el error estándar del estimado cuantifica la dispersión de los datos. Aunque, Sy/x cuantifica la dispersión alrededor de la línea de regresión, como se muestra en la figura 18b, a diferencia de la desviación estándar original Sy que cuantifica la dispersión alrededor de la media (figura 18a).

33

   a    c    i    s     í     f    o    e    G    a     í    r    e    i    n    e    g    n    I

METODOS DE MODELIZACION GEOFISICA Figura 18 Datos de regresión que muestran a) la dispersión de los datos alrededor de la media de la variable dependiente y b) la dispersión de los datos alrededor de la línea de mejor ajuste. La reducción en la dispersión al ir de a) a b), como lo indican las curvas en forma de campana a la derecha, representa la mejora debida a la regresión lineal.

Los conceptos anteriores se utilizan para cuantificar la “bondad” de nuestro ajuste. Esto es en particular útil para comparar diferentes regresiones (figura 19). Para hacerlo, regresamos a los datos originales y determinamos la suma total de los cuadrados alrededor de la media para la variable dependiente (en nuestro caso, y).

Figura 19 Ejemplos de regresión lineal con errores residuales a) pequeños y b) grandes.

Los valores estimados ŷi no coinciden con los valores observados

Yi correspondientes. Con el fin de analizar estas desviaciones, considérese un diagrama de dispersión y la correspondiente línea de regresión (ver figura 20). se ha adicionado al diagrama una línea horizontal y = , a la que se llamara línea base; su finalidad es servir de referente para el análisis de las desviaciones. A fin de cuentas es el valor representativo de los valores de esa variable.

In g e r

ie

n

Figura 20 Análisis de la desviación total ía G e

a

ic

ís

f

o

34

METODOS DE MODELIZACION GEOFISICA Considere un punto cualquiera (Xi, Yi). La desviación (o diferencia) del valor Yi respecto a la linea base se representa por Yi - y se conoce como desviación total. La desviación total puede dividirse en dos partes: •

La desviación explicada ŷi - que expresa la desviación del valor ŷi a la línea base. Podría decirse que la línea de regresión “explica” esa parte de la desviación: imagine un punto que

puede desplazarse sobre la línea base (ver figura 21), al mover el punto a la derecha, la desviación, representada por las líneas en gris, aumenta (tome en cuenta que son valores negativos); llega a cero en la intersección con la recta de regresión y sigue aumentando al avanzar a la derecha.

Figura 21 Desviación explicada ŷ i -



La desviación no explicada Yi - ŷ i que indica la desviación del

valor yi de la línea de regresión. Suponga ahora un punto móvil que se desplaza sobre la recta de regresión (ver figura 22). Al desplazarse sobre esta, la desviación de los puntos de la muestra a la recta de regresión no sigue un patrón ya que su distribución es aleatoria: su posición (arriba o debajo de la recta) asi como su magnitud son aleatorios. En resumen, hay factores aleatorios y de otro tipo que la recta no explica en forma alguna.

35

   a    c    i    s     í     f    o    e    G    a     í    r    e    i    n    e    g    n    I

METODOS DE MODELIZACION GEOFISICA

Figura 22 Aleatoriedad de los puntos respecto a la recta de regresión.

Para analizar algebraicamente las desviaciones considérese la siguiente relación:

Elevando al cuadrado ambos miembros y sumando sobre todos los puntos:

Desarrollando algebraicamente el lado derecho:

Como se incluye a todos los puntos de la muestra, el termino variación resulta más apropiado que el de desviación.

In g e

… (10) ie

n

Dividiendo entre la variación total ambos lados de la ecuación 10 ía

r G e

a

ic

ís

f

o

36

METODOS DE MODELIZACION GEOFISICA

Simplificando:

… (11)

El primer término del lado derecho es denotado como r 2 ya que la raíz cuadrada es equivalente al coeficiente de correlación de Pearson r. Se conoce como el coeficiente de determinación y suele manejarse así:

… (12)

La expresión 12 da pie a continuar el análisis iniciado con el coeficiente de correlación de Pearson, pero tomando ahora en cuenta la recta de regresión. Para ellos se da primero un resumen y después su aplicación. El valor de r 2  es la razón de la variación explicada sobre la variación total. Es decir, r 2 es la fracción de la variación total en Y que puede explicarse usando el modelo lineal ŷ = b0 + b1x. • 1  – r 2 es la fracción de la variación total en y debida al azar o a la posibilidad de variables ocultas (desconocidas) que influyen en y. En el caso de la tabla 2 se tiene r = 0.932 con lo que el coeficiente de determinación es r 2 = 0.868. Puede decirse entonces, de acuerdo al primer punto, que alrededor de 87% del comportamiento (variación) de la variable Y, puede explicarse por medio del correspondiente comportamiento (variación) de la variable X mediante la ecuación de regresión. Como r 2 = 0.87, 1 - r 2 = 0.13. De acuerdo al segundo punto, el comportamiento (variación) de alrededor de 13% de la variable Y se •

37

   a    c    i    s     í     f    o    e    G    a     í    r    e    i    n    e    g    n    I

METODOS DE MODELIZACION GEOFISICA debe al azar o a posibles variables, desconocidas para el investigador, que influencian Y.

La regresión lineal ofrece una poderosa técnica para ajustar una mejor línea a los datos. Sin embargo, se considera el hecho de que la relación entre las variables dependiente e independiente es lineal. Éste no es siempre el caso, y el primer paso en cualquier análisis de regresión deberá ser graficar e inspeccionar los datos en forma visual, para asegurarnos que sea posible usar un modelo lineal. Por ejemplo, la figura 23 muestra algunos datos que obviamente son curvilíneos. En algunos casos, las técnicas como la regresión polinomial son apropiadas. En otros, se pueden utilizar transformaciones para expresar los datos en una forma que sea compatible con la regresión lineal.

Figura 23 a) Datos inadecuados para la regresión lineal por mínimos cuadrados. b) Indicación de que es preferible una parábola.

Si bien el diagrama es importante, no lo es menos la teoría o experiencia de la situación en estudio. Conjuntando estos elementos se puede advertir que la relación entre dos variables de interés sea curvilínea, algunos ejemplos típicos son las reacciones químicas, el crecimiento poblacional, la relaciones entre gasto en publicidad y ventas, etcétera. En tales casos, es importante analizar la posibilidad de usar un modelo matemático cuyos parámetros por las funciones “intrínsecamente lineales”. Un ejemplo típico de ellas es el de la

función exponencial …(13)

Para ver el significado de la expresión “intrínsecamente lineal”, se In

toman logaritmos base e en ambos lados de la ecuación 13, quedando: ie

n

e

g r ía G e

a

ic

ís

f

o

38

METODOS DE MODELIZACION GEOFISICA Aplicando las propiedades de los logaritmos se llega a …(14)

Como Y es una variable, también lo es In(y), de modo que puede llamarse y´a esta “nueva” variable. Por otro lado, dado que b0 es una constante, también lo es In (b 0) y puede denotarse como b 0´a la “nueva” constante. Sustituyendo en la ecuación anterior: Y´= b0´+ b1 X …. (15) La exponencial 13 se ha transform ado en una “nueva” función 15 cuya relevancia consiste en que es lineal y por tanto el que sus parámetros b0´ y b1 se puedan calcular en la forma vista en la sección anterior. Una función y= f(x) que relaciona a Y con X es intrínsecamente lineal, si por medio de una transformación en X o en Y o en ambas, la función se puede expresar en general como una función lineal Y´= b0´+ b1´ x´, con x´= variable predictiva transformada, y´= variable respuesta transformada y parámetros b 0´+ b1´. Cuatro de las funciones intrínsecamente lineales más empleadas se dan en la tabla 3. En los incisos a) y b) la transformación apropiada es logarítmica y en los incisos c) y d) es simplemente un cambio de variable. Tabla 3 Funciones intrínsecamente lineales más comunes *.

*cuando aparece log(*), se puede usar ya sea el logaritmo base 10 o el logaritmo base e . Las gráficas representativas de las cuatro funciones se ilustran en la figura 24. Tales graficas corresponderían a correlaciones perfectas, por lo que sirven de modelos para comparar los diagramas de dispersión con que se trabaje.

39

   a    c    i    s     í     f    o    e    G    a     í    r    e    i    n    e    g    n    I

METODOS DE MODELIZACION GEOFISICA

g

In

Figura 24 Correlaciones perfectas de funciones intrínsecamente lineales n

e ie r ía G e

a

ic

ís

f

o

40

METODOS DE MODELIZACION GEOFISICA

METODO DE REFRACCION SISMICA La construcción de las domocronas desde los registros de campo requiere de un proceso matemático conocido como regresión lineal. Como los puntos no están alineados, debe encontrarse la recta que mejor se ajusta a ellos. Esto porque que el suelo donde se “clava” cada geófono generalmente no

es siempre el mismo, ni tampoco el anclaje ni la fijación. Cuando se presenta una interfaz inclinada la determinación se complica más, pero no lo suficiente como para que sea resuelto también sencillamente.

Figura 25 Construcción de las domocronas en relación al terreno

Resulta interesante analizar las domocronas para una interfaz horizontal y una inclinada ascendente hacia la derecha (Ver figura 26 y 27), manteniendo los contrastes de velocidad y la profundidad en un extremo. En la gráfica vemos que la pendiente de la segunda recta (refractada) disminuye, o lo que es lo mismo, la velocidad aumenta. Quiere decir que la inclinación del estrato distorsiona el valor verdadero de la velocidad, razón por la que se la llama velocidad aparente. Concretamente, si la interfaz se inclina ascendente hacia la

41

   a    c    i    s     í     f    o    e    G    a     í    r    e    i    n    e    g    n    I

METODOS DE MODELIZACION GEOFISICA derecha la velocidad aparente es mayor, y si se inclina ascendente a la izquierda la velocidad aparente disminuye. Pareciera entonces que el método falla, es decir que no sabremos si estamos en presencia de un estrato horizontal o inclinado y por lo tanto obtendremos el valor de una velocidad que tampoco sabremos si es verdadera. Afortunadamente a alguien se le ocurrió realizar lo que se conoce como contraperfil . Esto implica colocar la fuente en el otro extremo de la ristra. En la práctica esto es sencillo, porque la ristra de geófonos se coloca una sola vez y solo debe generarse la perturbación en los dos extremos del perfil.

Figura 26 Construcción de las domocronas en relación al terreno horizontal

In g e ía

r

ie

n

e

G

Figura 27 Construcción de las domocronas en relación al terreno inclinado ascendente hacia la derecha

a

ic

ís

f

o

42

METODOS DE MODELIZACION GEOFISICA Primero analicemos las domocronas con perfil y contraperfil para estratos horizontales. Vemos que son totalmente simétricas o espejadas, y las pendientes de las rectas son idénticas tanto de ida como de vuelta. Cuando el estrato está inclinado notamos que el primer tramo o recta de propagación directa es idéntico y espejado como en el caso horizontal, pero el segundo tramo presenta algo interesante: las pendientes no son iguales, aunque los tiempos totales de ida y de vuelta llamados tiempos recíprocos sí son iguales. Esto porque el camino que recorre la onda de ida o de vuelta es el mismo. Lo que cambia en cada caso es la longitud de los caminos parciales que componen el camino total. Un detalle importante que simplifica aún más el proceso es que, si la pendiente de la interfaz es menor del 10%, la velocidad verdadera resulta bien determinada al promediar las velocidades aparentes de ida y de vuelta, también llamadas descendente y ascendente. La ecuación de tiempo de viaje con una capa inclinada es esencialmente la misma que para capa horizontal, aunque inicialmente tiene más términos y pasos algebraicos para llegar al resultado final. Entonces: t = EM/V1 + MN/V2 + NGV1

...(16)

Figura 28 Variables usadas en la ecuación 16

El método de Refracción también permite detectar cambios laterales de material en superficie, incluso cuando este cambio está cubierto o tapado por otro material (Ver figura 29).

43

   a    c    i    s     í     f    o    e    G    a     í    r    e    i    n    e    g    n    I

METODOS DE MODELIZACION GEOFISICA

Figura 29 Cambios laterales de material en superficie

Otro caso particular se presenta cuando existe un salto o escalón por falla. Como se ve en la figura 30, es lógico que la recta correspondiente al estrato fallado esté cortada y que el tramo de la parte inferior se retarde respecto del superior.

In g e n ie r ía G e

a

ic

ís

f

o

44

METODOS DE MODELIZACION GEOFISICA

Figura 30 Salto o escalón por falla

45

   a    c    i    s     í     f    o    e    G    a     í    r    e    i    n    e    g    n    I

METODOS DE MODELIZACION GEOFISICA

Es una técnica de Análisis Numérico en la que, dados un conjunto de pares (o ternas, etc.), se intenta encontrar la función que mejor se aproxime a los datos (un “mejor ajuste”).

En su forma más simple, intenta minimizar la suma de cuadrados de las diferencias ordenadas (llamadas residuos) entre los puntos generados por la función y los correspondientes en los datos.

Para estudiar el comportamiento de una serie de datos obtenidos empíricamente, constituidos por puntos dados mediante pares ordenados de números, asociados con los valores de dos variables, es necesario contar con una función, que exprese analíticamente la relación funcional que guardan las variables en cuestión.

La interpolación se caracteriza por suponer que los datos que intervienen en el problema son exactos; por lo cual en la construcción de la FUNCION DE INTERPOLACION se exige que la misma satisfaga todos y cada uno de los valores que constituyen los datos. El ajuste supone que los datos ingresados están afectados en cierto grado de errores debido al modelado, por lo que, no resulta indispensable que la CURVA DE AJUSTE correspondiente, pase exactamente por los puntos que representan los datos, sino que, en promedio la aproximación sea óptima de acuerdo a un cierto y determinado criterio, denominado CRITERIO DE AJUSTE. El iniciador de estos procedimientos fue Gauss, quien desarrollo el tan conocido METODO DE LOS MINIMOS CUADRADOS. Se le conoce también bajo el nombre de Regresión. Con el tiempo se le han dado otros nombres como Lineal o Cuadrática dependiendo de la curva que se desea aproximar (Figura 31). Para este caso en particular, se comenzará con la regresión lineal. Luego se generalizará para cualquier curva que se desee. In g e n ie r ía G e

a

ic

ís

f

o

46

METODOS DE MODELIZACION GEOFISICA

Figura 31 Regresión Lineal y Cuadrática.

Una proyección no es más que la representación de un elemento de un espacio vectorial a un sub espacio del mismo. Con esto se quiere decir que un vector a de un conjunto W es representado por otro vector α de un conjunto V más pequeño, cuando el conjunto V está contenido en el conjunto W. (Figura 32)

Figura 32 Proyección de un vector de un espacio a un sub espacio.

Los casos más comunes que se utilizan para ejemplificar esto, es el de un vector sobre una recta y el de un vector sobre un plano. La generalización de ambos casos termina siendo una matriz que realiza la proyección de un especio a otro. La matriz es particular para cada proyección, sin embargo, el concepto es el mismo en todos los casos. A esta matriz se le llama matriz de proyección. Se comenzará asumiendo que se tiene una cantidad n de puntos en el plano. Cada punto tendrá una coordenada x i y una coordenada yi . Se quiere aproximar la tendencia de estos mediante una recta de la forma: g(x) = a + bx

47

   a    c    i    s     í     f    o    e    G    a     í    r    e    i    n    e    g    n    I

METODOS DE MODELIZACION GEOFISICA Se intentará hacer que todos los puntos pasen por la recta, por lo que se tendrá n   ecuaciones de una recta expresadas de la siguiente forma:

Donde es una aproximación de la coordenada en y   de cada punto. Esto se puede reescribir de forma matricial de la siguiente manera:

Que, reescribiéndolo, es lo mismo que:

…………..(16)

La matriz que contiene a los xi  se la ha identificado como  A, al vector de incógnitas (a y b) como x y al vector que contiene a las como v . Pero para todo xi habrá un diferente de yi ya que la recta no pasará realmente por todos los puntos. Entonces se cuenta con cierto error para cada punto (Figura 33).

In g e n ie r G

ía

Figura 33 Distancia de las que se compone el error.

a

ic

ís

f

o

e

48

METODOS DE MODELIZACION GEOFISICA El error se medirá en forma de distancias entre yi y . Nótese que en este caso se utilizará la forma vista con anterioridad. El error para cada x i  estará dado por: Y entonces, el error total ε² en todo el método se puede expresar de la siguiente forma:

En esta sección se intentará generalizar el concepto que se vio en la sección anterior. Para ello se considerará que la curva que describe la tendencia de la colección de puntos es un polinomio P de grado m . Entonces la ecuación será la siguiente:

Entonces las n  ecuaciones para los puntos dados se verán de la siguiente forma:

……………..(17)

Nótese que la ecuación (01) y ecuación (02) terminan de la misma forma. Por lo que el procedimiento a partir de estas será el mismo. Ahora, se procederá a ver el error generalizado a polinomios. Para ello la ecuación principal será de la forma:

Entonces el error total ε² se puede expresar de la siguiente forma:

Una manera más metódica y aplicativa para entender el método de mínimos cuadros tenemos:

49

   a    c    i    s     í     f    o    e    G    a     í    r    e    i    n    e    g    n    I

METODOS DE MODELIZACION GEOFISICA •  Aj us te d e cur vas

Para determinar una ecuación que relacione variables, un primer paso es recolectar datos que muestran los valores correspondientes de las variables en consideración. El siguiente paso es graficar los puntos (x 1, y 1), (x2, y 2),..., (xn, yn) en un sistema rectangular de coordenadas. El conjunto de puntos resultante suele denominarse diagrama de dispersión. A partir del diagrama de dispersión es posible visualizar una curva suave que se aproxima a los datos. Tal curva se denomina curva de aproximación. El problema general para encontrar ecuaciones de curvas de aproximación que se ajusten a conjuntos de datos se denomina ajuste de curvas. •

Ecuaciones de Curvas de Aproximación

A continuación se presenta una lista de varios tipos de curvas de aproximación y sus ecuaciones, con el propósito de tener una referencia. Todas las letras, excepto X y Y representan constantes. Las variables X y Y se conocen como variable independiente y variable dependiente, respectivamente, aunque estos papeles pueden intercambiarse.

Las partes derechas de las ecuaciones se denominan polinomios de primero, segundo, tercero, cuarto y n-ésimo grados, respectivamente. Las funciones definidas por las primeras cuatro ecuaciones se llaman funciones lineal, cuadrática, cúbica y cuartica, en ese orden. Las siguientes son algunas otras de las muchas ecuaciones usadas en la práctica con frecuencia:

In g e n ie r ía G e

a

ic

ís

f

o

50

METODOS DE MODELIZACION GEOFISICA

Para decidir qué curva debe utilizarse es necesario obtener diagramas de dispersión de variables transformadas. Por ejemplo, si un diagrama de dispersión de log Y contra X muestra una relación lineal, la ecuación tiene la forma (7), mientras que si logY contra log X indica una relación lineal la ecuación es de la forma (8). A menudo se usa papel milimétrico para facilitar la decisión sobre cuál curva utilizar. El papel para graficar que contiene una escala dividida en forma logarítmica se conoce como papel gráfico semilogarítmico (o semilog), y aquel con las dos escalas divididas en forma logarítmica se llama papel gráfico log-log. •

Método de Ajus te de Curvas a Mano

Con frecuencia puede utilizarse el juicio personal para dibujar una curva de aproximación que ajuste un conjunto de datos. Éste se denomina método de ajuste de curvas a mano. Si se conoce el tipo de ecuación de esta curva, es posible obtener las constantes de la ecuaciones eligiendo tantos puntos de la curva como constantes haya en la ecuación. Por ejemplo si la curva es una línea recta, se requieren dos puntos; si es una parábola, se necesitan tres puntos. El método tiene la desventaja de que distintos observadores obtendrán diferentes y ecuaciones. •  Aplic aci ón del Méto do de Mín im os Cuad rados

Para evitar el juicio personal en la construcción de rectas, parábolas u otras curvas de aproximación para ajustar los conjuntos de datos, es necesario tener una definición de una "recta de mejor ajuste", "parábola de mejor ajuste", etcétera. Para lograr tal definición, considérese la figura 34, en donde los 51

   a    c    i    s     í     f    o    e    G    a     í    r    e    i    n    e    g    n    I

METODOS DE MODELIZACION GEOFISICA datos están dados por los puntos (X 1 ,Y1), (X2 ,Y2),..., (XN ,YN). Para un valor determinado de X por ejemplo X1, habrá una diferencia entre el valor Y1 y el valor correspondiente deducido a partir de la curva C. Como se muestra en la figura, esta diferencia se simboliza con D, y se conoce como una desviación, un error o un residual, y puede ser positiva, negativa o cero. De manera similar, se obtienen las desviaciones D2,..., Dn correspondientes a los valores X2,..., Xn . Una medida de la "bondad de ajuste" de la curva C de los datos está proporcionada por la cantidad D ²₁ + D²₂ + • • • + D²n. Si ésta es pequeña, el ajuste es bueno; si es grande, el ajuste es malo. Por lo tanto, se tiene la siguiente definición: De todas las curvas que se aproximan a un conjunto de datos definidos por puntos, la curva que tiene la propiedad de que D ²₁ + D ²₂ + • • • + D²n es un mínimo se denomina curva de ajuste óptimo. Se dice que una curva con esta propiedad se ajusta a los datos en el sentido de mínimos cuadrados y se le llama curva de mínimos cuadrados. Entonces, una recta con esta propiedad se denomina recta de mínimos cuadrados, una parábola con esta propiedad se denomina parábola de mínimos cuadrados, etcétera

. Figura 34 Distancia de las que se compone el error.

Es habitual emplear la definición anterior cuando X es la variable independiente Y y es la variable dependiente. Si X es la variable dependiente, la definición se modifica pues en este caso se consideran desviaciones horizontales en lugar de desviaciones verticales, que es lo mismo que intercambiar los ejes X y Y. Estas dos definiciones generalmente conducen a G

ía

r

ie

n

e

g

In

e

a

ic

ís

f

o

52

METODOS DE MODELIZACION GEOFISICA curvas diferentes de mínimos cuadrados. A menos que se especifique lo contrario, se debe considerar Y como la variable dependiente y X como la variable independiente. Es posible definir otra curva de mínimos cuadrados si se toman en cuenta distancias perpendiculares a partir de cada uno de los puntos de la curva, en lugar de distancias horizontales o verticales; sin embargo, esto no suele utilizarse. La recta de mínimos cuadrados que se aproxima al conjunto de puntos (X1, Y1), (X2 ,Y2),..., (XN , YN) tiene por ecuación:

Donde las constantes a ₀ y a₁  se determinan resolviendo simultáneamente las ecuaciones

Denominadas ecuaciones normales para la recta de mínimos cuadrados. Las constantes a ₀ y a₁ de estas ecuaciones pueden calcularse a partir de las fórmulas:

La parábola de mínimos cuadrados que se aproxima al conjunto de puntos (X1, Y1), (X2,Y2) ………(XN ,YN) tiene por ecuación

Donde las constantes a ₀, a₁ y a₂  se determinan resolviendo simultáneamente las ecuaciones.

Denominadas ecuaciones normales de la parábola de mínimos cuadrados.

53

   a    c    i    s     í     f    o    e    G    a     í    r    e    i    n    e    g    n    I

METODOS DE MODELIZACION GEOFISICA CONCLUSIONES



La observación de relaciones claras y estables entre variables ayuda a comprender los fenómenos y a encontrar explicaciones de los mismos e indica las vías probablemente más eficaces para intervenir sobre las situaciones.



El diagrama de dispersión es una herramienta muy útil para la determinación de causas, diseño de soluciones y controles, priorización de Causas



La regresión lineal muestra la relación entre las variable independiente y dependiente, las cuales deben ser ajustadas por mínimos cuadrados con el fin de que la recta represente los datos muestrales de la mejor manera posible



En la práctica los datos no siempre se ajustan a una relación lineal netamente, sin embargo, se puede realizar transformaciones para expresar los datos en una forma que sea compatible con la regresión lineal.



Para evitar el juicio personal en la construcción de rectas, parábolas u otras curvas de aproximación para ajustar los datos proporcionados, es necesario tener una definición de una "recta de mejor ajuste", "parábola de mejor ajuste", etcétera, y estos serán proporcionados por el método de Mínimos Cuadrados.



El Método de los Mínimos Cuadrados nos permite ver el porcentaje de relación de los datos y un modelo matemático de ajuste.

In g e n ie r ía G e

a

ic

ís

f

o

54

METODOS DE MODELIZACION GEOFISICA BIBLIOGRAFIA



Métodos Numéricos para Ingenieros, Steven C. Chapra  –  Raymond P. Canale, 5ta Edicion, Pag. 466



Método de Mínimos Cuadrados, Universidad de San Carlos de Guatemala



Análisis Numérico y Métodos Numéricos

❖ 

Ajuste de Datos Por Mínimos Cuadrados, Escuela de Ingeniería Aeronáutica y del espacio, Laboratorio Fisica II



Ajuste de Curvas y el Método de Mínimos Cuadrados, Pag. 284



Análisis de correlación y regresión Lineal , Anónimo.



Estudios de Refracción Sísmica, Ensayos de MASW, Lima- Perú

PAGINAS WEB



http://curso.unach.mx/~rarceo/docs/Chapra.pdf



file:///C:/Users/RUBBY/Downloads/4024-20078-1-PB.pdf

❖ https://catedras.facet.unt.edu.ar/geofisica/wp-

content/uploads/sites/4/2014/02/Sismica-para-Geologos.pdf ❖

http://www.geofisica.cl/English/pics3/FUM6.htm



http://www.ingenieria.unam.mx/~revistafi/ejemplaresHTML/V13N4/V13N 4_art07.php

❖ http://www.ugm.org.mx/publicaciones/geos/pdf/geos06-

1/sesiones_regulares/EG.pdf ❖

https://www.aiteco.com/diagrama-de-dispersion/



http://walker.dgf.uchile.cl/Explorador/Marino/info/Documentacion_Explor  ador_Marino.pdf



http://www.scielo.org.mx/scielo.php?script=sci_arttext&pid=S102687742015000100009

55

   a    c    i    s     í     f    o    e    G    a     í    r    e    i    n    e    g    n    I

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF