Estadistica Aplicada al Analisis Quimico

March 28, 2017 | Author: Joan Hoyos | Category: N/A
Share Embed Donate


Short Description

Download Estadistica Aplicada al Analisis Quimico...

Description

CUANDO SE APLICA LA ESTADISTICA A UN ANALISIS

DEPARTAMENTO DE QUIMICA

(QUIMIOMETRIA)

ESTADISTICA APLICADA AL ANALISIS QUIMICO ADQUISICION DE DATOS

Bases para la Validación de Métodos Analíticos Recopilado por J. Sandoval

DURANTE

ANALISIS

DISEÑO

MANIPULACION

EXPERIMENTAL ANTES

DESPUES

DE DATOS

“LA GENTE SOLO VE LO QUE ESTA PREPARADA PARA VER” Emerson

LA APLICACION DE LA ESTADISTICA EN TODOS LOS PASOS DE UNA MEDICION QUIMICA ASEGURA LA CALIDAD DE LA MEDICION 1

CONTROL ESTADISTICO DE CALIDAD EN LAS MEDICIONES QUIMICAS

2

DEFINICION PRACTICA DE

ESTADISTICA

CALIDAD  CONFIABILIDAD

HERRAMIENTA UTILIZADA PARA DISCRIMINAR UN RESULTADO CONFIABLE ES AQUEL QUE DEMUESTRA SER VALIDO

ENTRE LAS PARTES SISTEMATICA (DETERMINADA) Y AL AZAR (INDETERMINADA) DE UNA SEÑAL O RESULTADO ANALITICO

VALIDEZ: GRADO AL CUAL UNA MEDICION (REALIZADA MEDIANTE UN INSTRUMENTO Y/O PROCEDIMIENTO ANALITICO ESPECIFICOS) PRODUCE EL RESULTADO ESPERADO

y = Total

3

D + d Sistemática

Al azar

4

1

OBJETIVO DE UNA MEDICION: CERCANIA AL VALOR “VERDADERO”

DETERMINAR LA MAGNITUD DE LA PARTE SISTEMATICA DE LA SEÑAL PARA SEPARAR LA PARTE SISTEMATICA DE UNA SEÑAL ESPECIFICA, EL ANALISTA DEBERA TENER UN CONOCIMIENTO PREVIO DE LAS POSIBLES FUENTES DE ESA PARTE SISTEMATICA LA ESTADISTICA ES UN COMPLEMENTO QUE LE AYUDA INDIRECTAMENTE EN DICHA SEPARACION

EXACTITUD Y PRECISION

REPRODUCIBILIDAD

5

ERROR SISTEMATICO •



SU PRESENCIA PUEDE SER DETECTADA MEDIANTE PRUEBAS ESTADISTICAS SENCILLAS. DICHAS PRUEBAS, SIN EMBARGO, NO PERMITEN IDENTIFICAR EL ORIGEN DEL ERROR SISTEMATICO LA MANERA MAS SIMPLE DE DETERMINAR LA PRESENCIA DE ERROR SISTEMATICO ES CUANTIFICAR EL ANALITO EN UN MATERIAL DE REFERENCIA (ESTANDAR)*

6

ERROR ALEATORIO (AL AZAR, INDETERMINADO) TIENE SU ORIGEN EN LOS EFECTOS DE VARIABLES FUERA DE CONTROL (TAL VEZ INCONTROLABLES) EN LAS MEDICIONES TIENE IGUAL PROBABILIDAD DE SER POSITIVO O NEGATIVO

* MATERIAL DE REFERENCIA:

 CONTIENE UNO O MAS ANALITOS EN CONCENTRACION CONOCIDA CON

ESTA SIEMPRE PRESENTE Y NO PUEDE

ALTAS EXACTITUD Y PRECISION

CORREGIRSE

 PUEDEN OBTENERSE EN National Institute of Standards and Technology (NIST) American Society for Testing and Materials (ASTM)

7

8

2

PUNTOS IMPORTANTES EN ESTADISTICA

DOS CONCEPTOS BASICOS:

POBLACION Y MUESTRA



POBLACION

ESTRICTAMENTE, LAS LEYES DE LA ESTADISTICA SE APLICAN SOLO A POBLACIONES. CUANDO ESTAS LEYES SE APLICAN A MUESTRAS DE DATOS DE LABORATORIO, SE ASUME QUE LA MUESTRA ES REPRESENTATIVA DE LA POBLACION

COLECCION COMPLETA DE OBJETOS QUE COMPARTEN UNA O MAS CARACTERISTICAS DESDE UN PUNTO DE VISTA ANALITICO:

LA ESTADISTICA TIENE SUS BASES EN LA TEORIA DE PROBABILIDADES (UNA TEORIA UTILIZADA PARA EXPLICAR EVENTOS AL AZAR)

EL NUMERO INFINITO DE RESULTADOS QUE, EN PRINCIPIO, SE PUEDE OBTENER CON UNA INFINITA CANTIDAD DE MUESTRA Y EN UNA INFINITA CANTIDAD DE TIEMPO



LA ESTADISTICA NO MANEJA “ABSOLUTOS”: SOLO PUEDE DECIR

MUESTRA

SI UN EVENTO ES ESTADISTICAMENTE SIGNIFICATIVO O

UN SUBCONJUNTO DE UNA POBLACION

ESTADISTICAMENTE INSIGNIFICANTE 9

10

DOS DEFINICIONES BASICAS EN ESTADISTICA: MEDIA Y DESVIACION ESTANDAR

DOS DEFINICIONES BASICAS EN ESTADISTICA:

MEDIA Y DESVIACION STANDARD

DESVIACION ESTANDAR

MEDIA

n

x

i

POBLACION:

n

  lim i 1 n n 

POBLACION:

s  lim

 x    i 1

n

n 

n

x

GRADOS DE LIBERTAD

i

MUESTRA:

n xi

x

2

i

n

i 1

MUESTRA:

n

s

 x  x  i 1

2

i

n 1

UN GRADO DE LIBERTAD SE PIERDE CUANDO LA MEDIA SE USA EN EL CALCULO POSTERIOR DE CUALQUIER PARAMETRO

NÚMERO DE MEDICIONES

sn-1

i-ÉSIMA MEDICIÓN DE x 11

en su calculadora 12

3

DESVIACION ESTANDAR RELATIVA

DESVIACION ESTANDAR

(RSD)

LA DESVIACION ESTANDAR ES UNA MEDIDA CUANTITATIVA DE LA PRECISON (REPRODUCIBILIDAD o DISPERSION DE LAS MEDICIONES ALREDEDOR DE LA MEDIA)

RSD  % RSD 

s x

s  100 x

TAMBIEN CONOCIDA COMO COEFICIENTE DE VARIACION (CV) 13

14

GRADOS DE LIBERTAD

GRADOS DE LIBERTAD

(CONTINUACION)

NUMERO DE VALORES NO RESTRINGIDOS



Ejemplo:





10

11.275

PARA OBTENER UN PROMEDIO DE 8 Y UNA DESVIACION ESTANDAR DE 6 , SOLAMENTE LOS NUMEROS 3.725 Y 11.275 PUEDEN SER EL 4oY EL 5o VALORES, DESPUES DE ESCOJER LOS PRIMEROS 3 NUMEROS

ESCOJA UN TOTAL DE 5 VALORES CON UN PROMEDIO DE 8:

3 5 17 2 4 GRADOS DE LIBERTAD

ESCOJA UN TOTAL DE 5 VALORES CON UN PROMEDIO DE 8 Y UNA DESVIACION ESTANDAR DE 6:

3 5 17 3.725 3 GRADOS DE LIBERTAD

ESCOJA UN TOTAL DE 5 VALORES AL AZAR:

3 5 17 2 5 GRADOS DE LIBERTAD

Ejemplo:

13 EN GENERAL...

PARA OBTENER UN PROMEDIO DE 8 DESPUES DE ESCOJER LOS PRIMEROS 4 VALORES, EL 13 Y SOLAMENTE EL 13 PUEDE SER EL 5o VALOR 15

SI UNO TIENE n DATOS Y CALCULA m PARAMETROS ESTADISTICOS, LOS GRADOS DE LIBERTAD SON DE (n

- m) 16

4

DISTRIBUCIONES

HISTOGRAMA DE LOS DATOS DE CONCENTRACION DE ION NITRATO LA DISTRIBUCION DE LAS MEDICIONES ES CERCANAMENTE SIMETRICA CON RESPECTO A LA MEDIA

14

0.51 0.52 0.53 0.48 0.49 0.50 0.52 0.49 0.49 0.50 12

0.49 0.48 0.46 0.49 0.49 0.48 0.49 0.49 0.51 0.47

10

0.51 0.51 0.51 0.48 0.50 0.47 0.50 0.51 0.49 0.48

Frecuencia

50 determinaciones de la concentración (g/mL) del ión nitrato en una muestra de agua

0.51 0.51 0.51 0.50 0.51 0.49 0.52 0.53 0.50 0.47

0.51 0.50 0.50 0.53 0.52 0.52 0.50 0.50 0.51 0.51 TABLA DE FRECUENCIA

Concentracion

Frecuencia

0.46

1

0.47

3

0.48

5

0.49

10

0.50

10

0.51

13

0.52

5

0.53

3

8 6

media= 0.500 g/mL

4

desv. estd. = 0.0165 g/mL

2 0 0.46

0.47

0.48

0.49

0.50

0.51

0.52

0.53

Concentracion, g/mL

LA DISTRIBUCION SE PUEDE VISUALIZAR

LA SIMETRIA SE HACE MAS APARENTE A MEDIDA QUE

MEDIANTE UN HISTOGRAMA

 x 

n

SE INCREMENTA

ES UN ESTIMADO DE 

S ES UN ESTIMADO DE s

17

LA DISTRIBUCION NORMAL O GAUSSIANA

18

LA DISTRIBUCION NORMAL O GAUSSIANA  x   2  exp   2s 2   y s 2

 x   2  exp   2s 2   y s 2

El área total encerrada bajo la curva es igual a 1:







ydx  1

Funcion de densidad de probabilidad La probabilidad de que la variable aleatoria x tome un valor dentro de un determinado rango es la integral de la función y sobre dicho rango

dN  ydx N

b

P(a  x  b)   ydx a

FRACCION DE LA POBLACION CUYOS VALORES SE ENCUENTRAN ENTRE

x Y x+dx 19

20

5

LA DISTRIBUCION NORMAL O GAUSSIANA RELACION MUY UTIL:

LA DISTRIBUCION NORMAL “ESTANDAR” Se llama distribución normal "estándar" a aquélla en la que sus parámetros toman los valores μ = 0 y σ = 1. En este caso la función de densidad tiene la siguiente expresión:

x  z s

2

dN 1  x2  e dx N 2

DIFERENCIA EN UNIDADES DE DESVIACION ESTANDAR

 x   2  exp   2s 2   y s 2

Que, naturalmente, coincide con: 2

 x   2  exp   2s 2   y s 2

2

ECUACION MAS COMPACTA:

dN 1  z2  e dz N 2

dN 1  z2  e dz N 2 Puesto que...

z

x

s



x0 x 1

21

INTERPRETACION GEOMETRICA DE LA DESVIACION ESTANDAR s

22

OTRAS DISTRIBUCIONES COMUNES

A MAYOR s, MAS ANCHA LA CURVA

DISTRIBUCIONES APROXIMADAMENTE LOG-NORMAL: CONCENTRACION DEL ANTICUERPO INMUNOGLOBULINA M EN SUERO DE INDIVIDUOS MACHOS EL TAMAÑO DE LAS GOTITAS FORMADAS POR LOS NEBULIZADORES DE ABSORCION/ EMISION ATOMICA TAMBIEN EXHIBEN ESTA DISTRIBUCION

DISTRIBUCIONES NORMALES CON LA MISMA MEDIA PERO DIFERENTES VALORES DE LA DESVIACION ESTANDAR 23

24

6

OTRAS PROPIEDADES DE LA DISTRIBUCION NORMAL PREGUNTA: CUAL ES LA PROBABILIDAD DE QUE REPLICAS DE UNA MEDICION SE ENCUENTREN DENTRO DE UN RANGO PARTICULAR ALREDEDOR DE LA MEDIA?

z 1

x     1s En el intervalo [μ - 2σ, μ + 2σ] se encuentra comprendida, aproximadamente, el 95% de la distribución

z2

 x     2s z3

x    3s 25

26

OTRAS PROPIEDADES DE LA DISTRIBUCION NORMAL OTRA PREGUNTA: CUAL ES RANGO ALREDEDOR DE LA MEDIA PARA EL CUAL HAY UNA PROBABILIDAD DADA DE QUE REPLICAS DE UNA MEDICION SE ENCUENTREN DENTRO DE EL? EN OTRAS PALABRAS: CUAL ES EL VALOR DE z PARA UN PORCENTAJE DADO DE VALORES OBSERVADOS?

%Valores Observados

Intervalo alrededor de 

Desviaciones estandares, z

50

 ± 0.67s

0.67

68

 ± 1.00s

1.00

80

 ± 1.29s

1.29

90

 ± 1.64s

1.64

95

 ± 1.96s

1.96

98

 ± 2.33s

2.33

99

 ± 2.58s

2.58

99.7

 ± 3.00s

3.00

99.9

 ± 3.29s

3.29

LA DISTRIBUCION DE MEDIAS RESULTADOS DE 50 DETERMINACIONES DE LA CONCENTRACION DE ION NITRATO, EN g/mL

0.51

0.51

0.51

0.50

0.51

0.49

0.52

0.53

0.50

0.47

0.51

0.52

0.53

0.48

0.49

0.50

0.52

0.49

0.49

0.50

0.49

0.48

0.46

0.49

0.49

0.48

0.49

0.49

0.51

0.47

0.51

0.51

0.51

0.48

0.50

0.47

0.50

0.51

0.49

0.48

0.51

0.50

0.50

0.53

0.52

0.52

0.50

0.50

0.51

0.51

0.506

0.504

0.502

0.496

0.502

0.492

0.506

0.504

0.500

0.486

PARTE DE UNA POBLACION DE MEDIAS

NOTESE QUE ESTAS MEDIAS EXHIBEN UNA DISPERSION MENOR QUE LOS DATOS ORIGINALES 27

A SU DESVIACION ESTANDARD SE LE CONOCE COMO ERROR ESTANDARD DE LA MEDIA 28

7

TEOREMA DEL LIMITE CENTRAL

CONFIABILIDAD DE UN RESULTADO ANALITICO

INDEPENDIENTEMENTE DEL TIPO DE DISTRIBUCION DE LOS DATOS...

RESULTADO ANALÍTICO: ENTRE MAS MUESTRAS DE DATOS SE TOMAN, MAS NORMALMENTE DISTRIBUIDA SE HACE LA DISTRIBUCION DE LAS MEDIAS DE ESAS MUESTRAS

x  int ervalo de confianza

INTERVALO DE CONFIANZA*_ RANGO DENTRO DEL CUAL UNO PUEDE RAZONABLEMENTE ASUMIR QUE SE ENCUENTRA EL VALOR REAL

EN OTRAS PALABRAS,

AUN SI LA POBLACION ORIGINAL NO ES NORMALMENTE DISTRIBUIDA, LA DISTRIBUCION DE LAS MEDIAS TIENDE A SER MAS NORMALMENTE DISTRIBUIDA A MEDIDA QUE

LIMITES DE CONFIANZA_

n AUMENTA

LOS VALORES EXTREMOS DE ESE RANGO

sx

sm 

sx n

sm xi EN LA PRACTICA,

* “CONFIANZA” SIGNIFICA QUE UNO PUEDE AFIRMAR CON UN GRADO ESPECIFICO DE CERTEZA (i. e. , UNA CIERTA PROBABILIDAD) QUE EL INTERVALO INCLUYE EL VALOR REAL

xi

sm 

sx n

29

30

LIMITES DE CONFIANZA

RANGO DE CONFIANZA Y DISTRIBUCION DE LAS MEDIAS

SI SE CONOCE s :

IC  x  zs

Z=

n

1.96

(95%)

2.58

(99%)

  1 P

DISTRIBUCION DE MEDIAS MOSTRANDO EL RANGO DENTRO DEL CUAL SE ENCUENTRA EL 95% DE LAS MEDIAS 31

32

8

VALORES DE

t

LIMITES DE CONFIANZA

t  t  f , P

SI NO SE CONOCE s (MUESTRAS PEQUEÑAS):

IC  x  ts

n

P=0.95

t  t  f , P

14.00 12.00

t ES FUNCIÓN DE:

10.00 t-value

f  n 1  LOS GRADOS DE LIBERTAD  LA PROBABILIDAD, P, DE QUE  SE

8.00 6.00 4.00

ENCUENTRE DENTRO DEL RANGO ESTABLECIDO

2.00 0.00

ALGUNAS VECES SE USA  (LA PROBABILIDAD DE QUE  SE ENCUENTRE FUERA DEL RANGO ESTABLECIDO)

0

20

40

60

80

100

120

Degrees of freedom

  1 P 33

LIMITES DE CONFIANZA

34

Intervalo de confianza

EJEMPLO

x  10.1 ppb

SE DETERMINÓ LA CONCENTRACIÓN DE PLOMO EN LA SANGRE DE 50 NIÑOS DE UNA ESCUELA CERCA A UNA CARRETERA CON MUCHO TRÁFICO. LA MEDIA DE LAS MUESTRAS FUÉ DE 10.1 ng/mL Y LA DESVIACIÓN ESTÁNDAR FUÉ DE 0.6 ng/mL.

s  0.6 ppb

IC  x  t

n  50

(a) CALCULAR EL INTERVALO DE CONFIANZA DE LA CONCENTRACIÓN MEDIA DE PLOMO EN TODOS LOS NIÑOS DE LA ESCUELA. (b) CUAL DEBERÍA SER EL TAMAÑO DE LA MUESTRA PARA REDUCIR EL RANGO DE CONFIANZA A 0.2 ng/mL (ES DECIR, ±0.1 ng/mL)?

35

IC  10.1  2.01 

s n

0.6  10.1  0.17 50

10.27 9.93

lim. superior

lim. inferior

10.1 0.17

0.17 0.34 Rango de confianza

36

9

Tamaño de la muestra

LIMITES DE CONFIANZA

x  10.1 ppb s  0.6 ppb

IC  x  t

n ?

 ts  n   0.1 

2

s n

t

s  0.1 n

EN GENERAL_ EL TAMAÑO DE MUESTRA (n) NECESARIO PARA ESTIMAR LA PRECISION DENTRO DE ± C ES

 2  0.6  2 n   144  1.4  10  0.1  2

 ts  n  C 

10.1 0.1

2

0.1 0.2

37

MAS SOBRE LA DISTRIBUCION NORMAL

38

USO DE LAS “COLAS“ DE UNA DISTRIBUCION NORMAL DE ERROR

EN GENERAL UNO ASUME QUE REPETIDAS DETERMINACIONES

HAY SITUACIONES EN LAS QUE ES IMPORTANTE DETERMINAR LA FRECUENCIA CON LA CUAL CIERTOS RESULTADOS EXTREMOS PODRIAN OCURRIR EN UNO DE LOS LADOS DE LA CURVA NORMAL DE ERROR:

DE UN ANALITO SIGUEN UNA DISTRIBUCION NORMAL LA ASUNCION NO ES DEL TODO GRATUITA: 

ESTUDIOS MATEMATICOS DE LA DISTRIBUCION NORMAL (AL MENOS POR 300 AÑOS) HAN MOSTRADO QUE EN SITUACIONES EN LAS QUE MUCHOS PEQUEÑOS ERRORES AFECTAN CADA MEDICION, EL ERROR TOTAL EN EL

TIPICAMENTE, EL ANALISTA DEBE ASEGURARSE QUE NO MAS QUE UN PEQUEÑO PORCENTAJE DE LAS MUESTRAS SEA MAYOR O MENOR QUE ALGUN VALOR LIMITE PREDETERMINADO

RESULTADO SIGUE SIEMPRE UNA DISTRIBUCION NORMAL 

MUCHOS CIENTIFICOS HAN ENCONTRADO UN GRAN NUMERO DE SITUACIONES EN LAS QUE MEDICIONES REPETIDAS SIGUEN UNA DISTRIBUCION NORMAL 39

40

10

USO DE LAS “COLAS“ DE UNA DISTRIBUCION NORMAL DE ERROR

“COLAS“ DE LA DISTRIBUCION NORMAL EL PORCENTAJE REQUERIDO PUEDE OBTENERSE DE LA

RETOMEMOS LAS DETERMINACIONES DE LA CONCENTRACIÓN (ppm) DE IÓN NITRATO EN UNA MUESTRA DE AGUA

TABLA DE DISTRIBUCION NORMAL “ESTANDAR” (VIDE INFRA), PERO PARA USAR ESTA TABLA DEBEMOS PRIMERO

MEDIA= 0.500 ppm

ESTANDARIZAR EL VALOR (0.53) EN EL QUE ESTAMOS

DESV. ESTD. = 0.0165 ppm

INTERESADOS.

SUPONGAMOS QUE DESEAMOS ESTIMAR EL PORCENTAJE DE DETERMINACIONES QUE EXCEDE 0.53 ppm

ESTO SE HACE EN TERMINOS DE z, LA DESVIACION DEL VALOR CON RESPECTO A LA MEDIA, EXPRESADA EN UNIDADES DE DESVIACION ESTANDAR, ES DECIR :

z QUE PORCENTAJE DE LAS DETERMINACIONES EXCEDE 0.53?

x   xlim  x 0.53  0.50    1.818 s s 0.0165

41

“COLAS“ DE DISTRIBUCION NORMAL

42

TABLA DE DISTRIBUCION NORMAL ESTANDAR

2.00 1.95 1.90 1.85 1.80 1.75 1.70 1.65 1.60 1.55 1.50 1.45 1.40 1.35 1.30 1.25 1.20 1.15 1.10 1.05 1.00 0.95 0.90 0.85 0.80 0.75 0.70 0.65 0.60 0.55

0.50 0.49 0.48 0.47 0.46 0.45 0.44 0.43 0.42 0.41 0.40 0.39 0.38 0.37 0.36 0.35 0.34 0.33 0.32 0.31 0.30 0.29 0.28 0.27 0.26 0.25 0.24 0.23 0.22 0.21

2.877 2.885 2.893 2.901 2.910 2.919 2.928 2.937 2.946 2.956 2.966 2.977 2.987 2.998 3.010 3.022 3.034 3.047 3.060 3.074 3.089 3.104 3.120 3.136 3.154 3.172 3.192 3.214 3.237 3.261

% exceeding the value

2.575 2.582 2.589 2.597 2.604 2.612 2.619 2.627 2.635 2.643 2.652 2.660 2.669 2.678 2.687 2.696 2.706 2.716 2.726 2.736 2.747 2.758 2.770 2.781 2.794 2.806 2.819 2.833 2.847 2.862

0.200 0.195 0.190 0.185 0.180 0.175 0.170 0.165 0.160 0.155 0.150 0.145 0.140 0.135 0.130 0.125 0.120 0.115 0.110 0.105 0.100 0.095 0.090 0.085 0.080 0.075 0.070 0.065 0.060 0.055

% exceeding the value

2.054 2.064 2.075 2.086 2.097 2.108 2.120 2.132 2.144 2.157 2.170 2.183 2.197 2.211 2.226 2.241 2.257 2.273 2.290 2.308 2.326 2.345 2.365 2.386 2.409 2.432 2.457 2.483 2.512 2.542

% exceeding the value

Standardized value

% exceeding the value 5.0 4.9 4.8 4.7 4.6 4.5 4.4 4.3 4.2 4.1 4.0 3.9 3.8 3.7 3.6 3.5 3.4 3.3 3.2 3.1 3.0 2.9 2.8 2.7 2.6 2.5 2.4 2.3 2.2 2.1

Standardized value

1.645 1.655 1.664 1.675 1.685 1.695 1.706 1.717 1.728 1.739 1.751 1.762 1.774 1.786 1.799 1.812 1.825 1.838 1.852 1.866 1.881 1.896 1.911 1.927 1.943 1.960 1.977 1.995 2.014 2.033

Standardized value

20.0 19.5 19.0 18.5 18.0 17.5 17.0 16.5 16.0 15.5 15.0 14.5 14.0 13.5 13.0 12.5 12.0 11.5 11.0 10.5 10.0 9.5 9.0 8.5 8.0 7.5 7.0 6.5 6.0 5.5

Standardized value

% exceeding the value

Standardized value 0.842 0.860 0.878 0.896 0.915 0.935 0.954 0.974 0.994 1.015 1.036 1.058 1.080 1.103 1.126 1.150 1.175 1.200 1.226 1.254 1.282 1.311 1.341 1.372 1.405 1.439 1.476 1.514 1.555 1.598

% exceeding the value

43

50.0 49.0 48.0 47.0 46.0 45.0 44.0 43.0 42.0 41.0 40.0 39.0 38.0 37.0 36.0 35.0 34.0 33.0 32.0 31.0 30.0 29.0 28.0 27.0 26.0 25.0 24.0 23.0 22.0 21.0

Standardized value

USANDO EL VALOR DE z Y LA TABLA DE DISTRIBUCION NORMAL ESTANDAR, VEMOS QUE APROXIMADAMENTE 3.45% DE LAS DETERMINACIONES EXCEDEN 0.53 ppm

0.000 0.025 0.050 0.075 0.101 0.126 0.151 0.176 0.202 0.228 0.253 0.279 0.305 0.332 0.358 0.385 0.412 0.440 0.468 0.496 0.524 0.553 0.583 0.613 0.643 0.674 0.706 0.739 0.772 0.806

% exceeding the value

RECUERDE QUE ESTE VALOR DE z NOS DICE QUE EL VALOR (0.53) ESTA 1.818 DESVIACIONES ESTANDAR POR ENCIMA DE LA MEDIA (0.50)

Standardized value

Standardized value = (value – mean)/SD

z  1.818

3.287 3.317 3.349 3.385 3.427 3.476 3.534 3.607 3.707 3.869

0.050 0.045 0.040 0.035 0.030 0.025 0.020 0.015 0.010 0.005

44

11

“COLAS“ DE DISTRIBUCION NORMAL

“COLAS“ DE DISTRIBUCION NORMAL

LA TABLA DE DISTRIBUCION NORMAL ESTANDAR TAMBIEN PUEDE USARSE “EN REVERSA”: QUE VALOR ES PROBABLE DE SER EXCEDIDO POR EL 10% DE LAS DETERMINACIONES MAS ALTAS?

LOCALIZANDO EL 10% EN LA COLUMNA DE LA DERECHA DE LA TABLA DE DISTRIBUCION NORMAL ESTANDAR, OBTENEMOS UN VALOR, z, DE 1.282, DEL CUAL SE PUEDE OBTENER EL VALOR DESCONOCIDO:

1.282 

xlim  0.50 0.0165

xlim  0.50  1.282  0.0165  0.52 CONCLUIMOS QUE EL 10% MAS ALTO DE LAS DETERMINACIONES EXCEDE 0.52 ppm

QUE VALOR ES EXCEDIDO POR EL 10% DE LAS DETERMINACIONES? 45

46

EJERCICIO DE TALLER EL OCTANAJE DE LA GASOLINA SE PUEDE INCREMENTAR MEDIANTE LA ADICION DE TETRAETILO DE PLOMO (TEL, TETRAETHYLLEAD), PERO EL LIMITE MAXIMO DE TEL PERMITIDO ES 0.50 g/gal. SI MAXIMO EL 0.5% DE LAS MUESTRAS DE GASOLINA PUEDEN EXCEDER ESTE LIMITE Y LA DESVIACION ESTANDAR DEL CONTENIDO DE TEL EN LA COMPAÑIA A ES sA = 0.05 g/gal, CUAL ES LA CONCENTRACIO MEDIA QUE ESTA COMPAÑIA PUEDE USAR EN SU GASOLINA? LA COMPAÑIA B MANTIENE UN CONTROL MAS ESTRICTO EN SUS PROCEDIMIENTOS, DE TAL MANERA QUE sB = 0.01 g/gal. CUANTO TEL PUEDE AÑADIR EN PROMEDIO ESTA COMPAÑIA?

47

48

12

PRUEBAS DE SIGNIFICACION

PRUEBAS DE SIGNIFICACION

TAMBIEN LLAMADAS PRUEBAS DE HIPOTESIS (NULA)

EJEMPLO:

UN PROCEDIMIENTO SISTEMATICO QUE NOS PERMITE DECIDIR SI UN CONJUNTO DE MEDICIONES REPETIDAS

(Analyst 1983, 108, 64)

EN UN METODO PARA DETERMINAR PLOMO EN SANGRE POR ABSORCION ATOMICA SE OBTUVIERON LOS SIGUIENTES VALORES PARA UNA MUESTRA STANDARD QUE CONTIENE 38.9 ppb DE PLOMO: 38.9 37.4 37.1

MUESTRA EVIDENCIA DE ERROR SISTEMATICO EXISTE ALGUNA EVIDENCIA DE ERROR SISTEMATICO?

EL PROPOSITO DE UNA PRUEBA DE SIGNIFICACION ES SACAR UNA CONCLUSION ACERCA DE UNA POBLACION UTILIZANDO DATOS PROVENIENTES DE UNA MUESTRA

x  37.80 ppb

s  0.964 ppb

LA CUESTION ES SI LA DIFERENCIA ENTRE EL RESULTADO Y EL VALOR REAL ES ESTADISTICAMENTE SIGNIFICATIVA, O SI SE DEBE A MERAS VARIACIONES FORTUITAS (AL AZAR)

49

SE SIGUE UN PROCEDIMIENTO DE 6 PASOS

50

PROCEDIMIENTO DE SEIS PASOS

PASO 1: HIPOTESIS “NULA” ( H0) : EL RESULTADO NO ES INEXACTO

PASO 3: PRUEBA ESTADISTICA

OJO: UNO NO SABE SI ESTA DECLARACION ES CIERTA O ES FALSA, PERO SERA ASUMIDA CIERTA HASTA QUE SE PRUEBE QUE ES FALSA

tcalc 

x n s

OJO: ESTE PASO CONDENSA LA INFORMACION DE LA MUESTRA EN UN SIMPLE NUMERO

PASO 2: HIPOTESIS ALTERNA ( H1) : EL RESULTADO ES INEXACTO

tcalc  51

37.8  38.9 3 0.964

 1.98 52

13

PASO 4: VALORES CRITICOS : COMPARE EL RESULTADO DE LA

PASO 5:

PRUEBA ESTADISTICA (tcalc) CON VALORES TEORICOS TABULADOS

DECISION: RETENEMOS LA HIPOTESIS NULA

tcrit = 4.3

(P = 95%, f = 2)

PASO 6: CONCLUSION: HEMOS SIDO INCAPACES DE PROBAR QUE EL

SI tcalc EXCEDE EL VALOR CRITICO, LA HIPOTESIS NULA SE RECHAZA.

RESULTADO ES INEXACTO

LOS VALORES CRITICOS PUEDEN INTEPRETARSE COMO VALORES QUE SON IMPROBABLES* QUE SEAN EXCEDIDOS POR LA PRUEBA ESTADISTICA (tcalc) SI LA HIPOTESIS NULA ES CIERTA

NOTA IMPORTANTISIMA: LA DECISION DE RETENER LA HIPOTESIS NULA NO SIGNIFICA QUE SE HA DEMOSTRADO QUE ES CIERTA;

* A UN 95% DE CONFIANZA, LA PROBABILIDAD ES MENOR DE 5% (ES DECIR, MENOS QUE 1 EN 20)

SIMPLEMENTE, NO SE PUDO DEMOSTRAR QUE SEA FALSA 53

VALORES CRITICOS PARA LA PRUEBA

t

54

LA HIPOTESIS NULA SE USA (O SE DEBERIA USAR) EN LAS CORTES CRIMINALES: EL ACUSADO SE ASUME “NO CULPABLE” HASTA QUE SE DEMUESTRE QUE ES CULPABLE VEREDICTO “NO CULPABLE” EN CORTE CRIMINAL LA EVIDENCIA (PRUEBAS DE SIGNIFICACION) INDICA QUE LA HIPOTESIS NULA DEBE CONSERVARSE CONCLUSION: NO SE HA DEMOSTRADO QUE EL ACUSADO ES INOCENTE... (NO SE PUDO DEMOSTRAR QUE EL ACUSADO SEA CULPABLE) 55

56

14

PRUEBAS DE SIGNIFICACION

COMPARACION DE LAS MEDIAS DE DOS MUESTRAS

ENFASIS SOBRE LO IMPORTANTE



 

H0 ES UNA DECLARACION DE QUE “NO HAY DIFERENCIA”, ES DECIR, QUE CUALQUIER DIFERENCIA

SE QUIEREN COMPARAR LOS RESULTADOS DE UN

OBSERVADA ES DEBIDA SOLO AL AZAR

NUEVO METODO ANALITICO CON AQUELLOS

H0 ES LA HIPOTESIS QUE EL INVESTIGADOR ESPERA

OBTENIDOS POR UN SEGUNDO METODO

RETENER

(REFERENCIA)

EL UMBRAL DE ERROR,  (= 1-P), ES EL RIESGO (LA PROBABILIDAD) QUE EL INVESTIGADOR ESTA

x1 & x2

DISPUESTO A TOMAR SI RECHAZARA

s1 & s2

CONOCIDOS:

INCORRECTAMENTE LA H0 VERDADERA

n1 & n2 57

58

Y QUE ES UN PROMEDIO “PONDERADO”?

COMPARACION DE DOS MEDIAS CASO I:

s1

Y

s2

A CADA NUMERO

NO SON SIGNIFICATIVAMENTE DIFERENTES

xi

EN EL CONJUNTO (x1, x2, x3,

…., xn)

SE LE ASIGNA UN FACTOR DE PONDERACION wi

H0: LOS DOS METODOS NO PRODUCEN RESULTADOS DIFERENTES

 x1 NO  x2 

EL PROMEDIO PONDERADO SE DEFINE COMO n

PRUEBA ESTADISTICA:

x1  x2

tcalc  s

1 1  n1 n2

tcalc TIENE

fs  f s s  f1  f 2 2

CON

2 1 1

2 2 2

xw 

*

i 1 n

i

i

w i 1

i

NOTESE QUE SI TODOS LOS FACTORES DE PONDERACION FUERAN

f1 + f2 (O SEA, n1+n2-2) GRADOS DE LIBERTAD

*

w x

IGUALES EL PROMEDIO PONDERADO SE REDUCE AL PROMEDIO COMUN

UN PROMEDIO PONDERADO 59

60

15

CUANDO SE USE LA PRUEBA t...

COMPARACION DE DOS MEDIAS

x1 x2 s1 vs s2 n1 n2

CASO II:

s1

Y

H0 :

s2

USE LA PRUEBA F PARA RESOLVER ESTE CONDICIONAL

SON SIGNIFICATIVAMENTE DIFERENTES

s1 = s2

LOS DOS METODOS NO PRODUCEN RESULTADOS DIFERENTES

 x1 NO  x2 

CASO I

SI

?

2

tcalc 

x1  x2

CON

s12 s22  n1 n2

s

NO

 s12 s22   n n   2   1 f  2 2 2  s12   s22      n     1    n2  n1  1 n2  1

CASO II

t calc 

x1  x2 2 1

2 2

s s  n1 n2 f 

REDONDEADO AL ENTERO MAS CERCANO 61

PRUEBAS DE SIGNIFICACION EJEMPLO (CASO I) COMPARACION DE DOS METODOS PARA LA DETERMINACION DE BORO EN MATERIAL VEGETAL

media

desv std

n

MET. ESPECTROFOTOMETRICO

28.00

0.30

10

MET. FLUORIMETRICO

26.25

0.23

8

 s12 s22   n  n  2   1

2

2

2

 s12   s22   n   n   1  2 n1  1 n2  1

62

F: Fluorimétrico

xE  28.00 ppm

xF  26.65 ppm sF  0.23 ppm

nE  10

nF  8

sE

NO



xE  xF

tcalc  s

f F  nF  1  8  1  7

 sF

 H 0 : xE NO  xF

63

f  f1  f 2

sE  0.30 ppm

CASO I :

f1s12  f 2 s22 f1  f 2

2

f E  nE  1  10  1  9

SON LOS RESULTADOS DE ESTOS DOS METODOS SIGNIFICATIVAMENTE DIFERENTES? (Analyst 1983, 108, 368)

1 1  n1 n2

s2 

Subindices: E: Espectrofotométrico

Resultados obtenidos (ppm)

x1  x2

t calc 

PRUEBA ESTADISTICA:

1 1  nE nF



H 1 : xE  x F

s2 

f E sE2  f F sF2 fE  fF 64

16

s

9  0.30 2  7  0.23 2  0.271604  9 7 xE  xF

tcalc  s

1 1  nE nF

28.00  26.25



0.2716 

1 1  10 8

x

 Se retiene H1

 13.58

E

E

 xF

NO  xF





 CONCLUSION: SI, LOS RESULTADOS DE ESTOS DOS METODOS SON SIGNIFICATIVAMENTE DIFERENTES

f  f E  f F  9  7  16



x

 DECISION: Se rechaza H0

tcrit (16 GdL, 95%) = 2.12 tcrit (16 GdL, 99%) = 2.92

tcalc (13.58) > tcrit (2.12) ? SI (aun por encima del 99%) 65

66

PRUEBAS DE SIGNIFICACION Subindices: N: Normal

R: Reumatoide

EJEMPLO (CASO II)

xN  1.9214  mM

xR  3.465 mM

LA SIGUIENTE TABLA PROPORCIONA LA CONCENTRACION DE TIOL EN SANGRE DE DOS GRUPOS DE VOLUNTARIOS. EL PRIMER GRUPO ES “NORMAL” Y EL SEGUNDO SUFRE DE ARTRITIS REUMATOIDE. (Analyst,

s N  0.07559  mM

sR  0.4404  mM

nN  7

nR  6

1983, 107,195) CASO II :

Concentración de tiol (mM) Normal

Reumatoide

1.84

2.81

1.92

4.06

1.94

3.62

1.92

3.27

1.85

3.27

1.91

3.76

2.07

sN  sR

 H 0 : xN NO  xR

ES LA CONCENTRACION DE TIOL EN LA SANGRE DE LOS ENFERMOS DE ARTRITIS REUMATOIDE DIFERENTE DE AQUELLA DE LOS INDIVIDUOS “NORMALES”?



67

tcalc 

xN  xR s N2 s2  R nN nR





H 1 : x N  xR

1.921  3.645 0.0755 2 0.440 2  7 6

 8.47

68

17

2

2

 s N2  0.0755 2 0.440 2  s2      R   n n 7 6 R   f   N2 2   2 5 2 2 2 2 2 2  sN   0.0755    0.440 2   sR          n   n  7 6      N   R 7 1 6 1 n N  1 nR  1



tcrit (5 GdL, 95%) = 2.57

LA PRUEBA t POR PAREJAS CIRCUNSTANCIAS EN LAS CUALES ES NECESARIO O DESEABLE HACER UNA COMPARACION DE MEDIAS POR PAREJAS: CANTIDAD LIMITADA DE UNA O MAS MUESTRAS (SOLO HAY MUESTRA SUFICIENTE PARA UNA DETERMINACION POR CADA METODO)

tcrit (5 GdL, 99%) = 4.06

MUESTRAS DE ORIGENES DIFERENTES Y POSIBLEMENTE CON CONCENTRACIONES DIFERENTES*

tcalc (8.47) > tcrit (2.57) ? SI (aun por encima del 99%) 

DECISION: Se rechaza H0

 Se retiene H1



x

N

x

N

NO  xR

 xR



MUESTRAS QUE SE RECIBEN EN UN PERIODO DE TIEMPO LARGO (SE HACE NECESARIO ELIMINAR EFECTOS DE CONDICIONES AMBIENTALES VARIABLES COMO TEMPERATURA, PRESION, ETC.)



ASUNCION: CUALQUIER ERROR (SISTEMATICO O AL AZAR) ES INDEPENDIENTE DE LA CONCENTRACION

CONCLUSION: SI, LA CONCENTRACION DE TIOL EN LA SANGRE DE LOS ENFERMOS DE ARTRITIS REUMATOIDE ES DIFERENTE DE AQUELLA DE LOS INDIVIDUOS “NORMALES”

*

EN CASO DE DIFERENCIAS DE CONCENTRACION MUY AMPLIAS ES MEJOR USAR ANALISIS DE REGRESION (VER LUEGO)

69

70

xDIF  1.75

EJEMPLO DE PRUEBA t POR PAREJAS

 H 0 : xDIF NO  0

sDIF  4.991 nDIF  4

LA SIGUIENTE TABLA PROPORCIONA LA CONCENTRACION DE PLOMO (g/mL) POR DOS METODOS DIFERENTES PARA 4 MUESTRAS: EXTRACCION

EXTRACCION

MUESTRA

OXIDATIVA

DIRECTA

1

71

76

2

61

68

-7

3

50

48

+2

4

60

57

+3

 tcalc 

DIF

x DIF  0 nDIF sDIF

H 0 : xDIF  0



f E  nDIF  1  4  1  3 

x DIF

nDIF

sDIF



1.75  4  0.70 4.991

-5

LOS DOS METODOS PROPORCIONAN VALORES PARA LAS CONCENTRACIONES MEDIAS DE PLOMO QUE DIFIEREN SIGNIFICATIVAMENTE?



tcrit (3 GdL, 95%) = 3.18



DECISION: Se retiene H0

tcalc (0.70) > tcrit (3.18) ?

x

DIF

NO  0

NO



 No, los dos métodos no proporcionan valores para las concentraciones medias de plomo que difieren significativamente 71

72

18

PRUEBA F PARA LA COMPARACION DE DESVIACIONES STANDARD UTIL PARA COMPARAR LA PRECISION DE DIFERENTES METODOS

H0 : LAS DESVIACIONES ESTANDAR DE LAS

LA PRUEBA F CONSIDERA EL COCIENTE DE LAS DOS VARIANZAS MUESTRALES*

s12 s22

POBLACIONES NO SON DIFERENTES

(ES DECIR, EL COCIENTE

(SIEMPRE, VARIANZA MAYOR / VARIANZA MENOR):

Fcalc 

PRUEBA F PARA LA COMPARACION DE DESVIACIONES STANDARD

s1NO  s2 

DE VARIANZAS NO DIFIERE

SIGNIFICATIVAMENTE DE LA UNIDAD)

s1  s2

EVALUACION: RECHAZAR LA HIPOTESIS NULA SI Fcalc > Fcrit

*

SE ASUME QUE LAS POBLACIONES DE DONDE SE TOMAN LAS MUESTRAS SON NORMALES 73

74

PRUEBA F * 2 FORMAS 2 *  PRUEBA DE UNA COLA (UNILATERAL): PRUEBA SI UN METODO A ES MAS PRECISO QUE UN METODO B OJO: UNO ESTA INTERESADO EN DETECTAR LA DIFERENCIA EN UNA SOLA DIRECCION

 PRUEBA DE DOS COLAS (BILATERAL): PRUEBA SI LOS METODOS A Y B DIFIEREN EN SU PRECISION OJO: UNO ESTA INTERESADO EN DETECTAR CUALQUIER DIFERENCIA EN CUALQUIER DIRECCION 75

76

19

Subindices: S: Standard

PRUEBA F - EJEMPLOS UNA COLA: SE COMPARO UN METODO PROPUESTO PARA LA DETERMINACION DE DE LA DEMANDA DE OXIGENO EN AGUAS RESIDUALES CON UN METODO STANDARD. SE OBTUVIERON LOS SIGUIENTES RESULTADOS (ppm) EN UNA

sP  1.51 ppm

nS  9

nP  8

f S  nS  1  9  1  8

f P  nF  1  8  1  7

 H 0 : sP NO  sS

MUESTRA:

METODO

media

desv std

n

STANDARD

72

3.31

9

PROPUESTO

72

1.51

8



H 1 : s P  sS 8 GdL



ES EL METODO PROPUESTO MAS PRECISO QUE EL METODO ESTANDAR?

Fcalc 

s s

2 S 2 P



Fcrit (8/7, 95%) = 3.73

DECISION: Se rechaza H0



Se retiene H1

s

78

PRUEBA F - EJEMPLOS

Fcalc (4.81) > Fcrit (3.73) ?



3.312  4.81 1.512 7 GdL

77



P: Propuesto

sS  3.31 ppm

P

SI

s

 sS

P

NO  sS

DOS COLAS: DATOS ANTERIORES DE BORO EN MATERIAL VEGETAL





METODO

media

desv std

n

ESPECTROFOTOMETRICO

28.00

0.30

10

FLUORIMETRICO

26.25

0.23

8

CHEQUEAR LA ASUNCION DE QUE LAS DOS VARIANZAS NO DIFIEREN SIGNIFICATIVAMENTE



CONCLUSION: EL METODO PROPUESTO ES MAS PRECISO QUE EL METODO ESTANDAR

79

80

20

Subindices: E: Espectrofotométrico



F: Fluorimétrico

sE  0.30 ppm

sF  0.23 ppm

nE  10

nF  8

f E  nE  1  10  1  9

f F  nF  1  8  1  7

Fcalc (1.70) > Fcrit (4.82) ?

 CASO I :

sE

 sF

NO

Fcalc 

DECISION: Se retiene H0

s

NO

E

NO  sF



VERIFICAR QUE ESTO ES CIERTO

 H 0 : sE NO  sF 

Fcrit (9/7, 95%) = 4.82





H 1 : sE  sF

CONCLUSION: SE CONFIRMA LA ASUNCION DE QUE LAS DOS VARIANZAS NO DIFIEREN SIGNIFICATIVAMENTE

sE2 0.30 2   1.70 sF2 0.23 2 81

EJERCICIO DE TALLER

EXISTE UNA PEQUEÑA PROBABILIDAD DE QUE HAYAMOS TOMADO UNA MALA DECISION

Una de sus amigas se ha metido en el negocio de fabricar vinos. En una fiesta de catadores de vino ella le dijo a usted que estaba segura que un cierto restaurante estaba etiquetando el vino de ella como si fuera importado y que estaba cobrando precios exhorbitantes. Usted le respondió que estaba tomando el curso de Estadística en Univalle y que si ella le proporcionaba unas cuantas botellas, usted podría determinar si los dos vinos eran el mismo. (Durante una de esas fiestas, uno dice casi cualquier cosa). Cual es su conclusión, con base en los siguientes resultados de contenido (%v/v) de alcohol?

(DOS POSIBLES ERRORES EN PRUEBAS DE SIGNIFICACION) DECISION ______________________________

REALIDAD

RECHACE LA

NO RECHACE LA

HIPOTESIS NULA Y

HIPOTESIS NULA Y

CONCLUYA QUE

NO CONCLUYA QUE

EL RESULTADO ES

EL RESULTADO ES

INEXACTO

INEXACTO

______________________________________________ HIPOTESIS NULA

SE TOMO LA

ERROR DEL

ES FALSA; ES DECIR,

DECISION CORRECTA

TIPO II

EL RESULTADO ES INEXACTO

HIPOTESIS NULA ES CIERTA; ES DECIR, EL RESULTADO NO ES INEXACTO

 ERROR DEL TIPO I



SE TOMO LA DECISION CORRECTA





82

83

•Vino de su amiga:

12.50, 12.34, 12.38, 12.33, 12.28, 12.41

•Vino del restaurante:

12.49, 12.62, 12.69, 12.64 84

21

EJERCICIO DE TALLER Cuando se hacen mediciones por replicado, a veces un resultado parece diferir sustancialmente de los demás. Una prueba de significación llamada “prueba-Q” o “prueba de Dixon” puede utilizarse para chequear si el valor “sospechoso” puede descartarse antes de calcular la media y la desviación estándar. Para aplicar esta prueba, se calcula un cociente de rechazo Q, definido como

Q

resultado sospechoso - resultado más próximo  rango de resultados

y se ve si excede el valor crítico apropiado en la tabla estadística de cocientes, que aparece en la página siguiente. Si Qcalc. > Qcrit. , el resultado sospechoso puede descartarse. Aplicar la prueba-Q a los siguientes datos del contenido de estronsio (g/mL) en una muestra, para ver si el valor sospechoso puede o no descartarse: 1.15, 1.02. 1.10, y 1.88. 85

22

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF