Estadistica Aplicada al Analisis Quimico
March 28, 2017 | Author: Joan Hoyos | Category: N/A
Short Description
Download Estadistica Aplicada al Analisis Quimico...
Description
CUANDO SE APLICA LA ESTADISTICA A UN ANALISIS
DEPARTAMENTO DE QUIMICA
(QUIMIOMETRIA)
ESTADISTICA APLICADA AL ANALISIS QUIMICO ADQUISICION DE DATOS
Bases para la Validación de Métodos Analíticos Recopilado por J. Sandoval
DURANTE
ANALISIS
DISEÑO
MANIPULACION
EXPERIMENTAL ANTES
DESPUES
DE DATOS
“LA GENTE SOLO VE LO QUE ESTA PREPARADA PARA VER” Emerson
LA APLICACION DE LA ESTADISTICA EN TODOS LOS PASOS DE UNA MEDICION QUIMICA ASEGURA LA CALIDAD DE LA MEDICION 1
CONTROL ESTADISTICO DE CALIDAD EN LAS MEDICIONES QUIMICAS
2
DEFINICION PRACTICA DE
ESTADISTICA
CALIDAD CONFIABILIDAD
HERRAMIENTA UTILIZADA PARA DISCRIMINAR UN RESULTADO CONFIABLE ES AQUEL QUE DEMUESTRA SER VALIDO
ENTRE LAS PARTES SISTEMATICA (DETERMINADA) Y AL AZAR (INDETERMINADA) DE UNA SEÑAL O RESULTADO ANALITICO
VALIDEZ: GRADO AL CUAL UNA MEDICION (REALIZADA MEDIANTE UN INSTRUMENTO Y/O PROCEDIMIENTO ANALITICO ESPECIFICOS) PRODUCE EL RESULTADO ESPERADO
y = Total
3
D + d Sistemática
Al azar
4
1
OBJETIVO DE UNA MEDICION: CERCANIA AL VALOR “VERDADERO”
DETERMINAR LA MAGNITUD DE LA PARTE SISTEMATICA DE LA SEÑAL PARA SEPARAR LA PARTE SISTEMATICA DE UNA SEÑAL ESPECIFICA, EL ANALISTA DEBERA TENER UN CONOCIMIENTO PREVIO DE LAS POSIBLES FUENTES DE ESA PARTE SISTEMATICA LA ESTADISTICA ES UN COMPLEMENTO QUE LE AYUDA INDIRECTAMENTE EN DICHA SEPARACION
EXACTITUD Y PRECISION
REPRODUCIBILIDAD
5
ERROR SISTEMATICO •
•
SU PRESENCIA PUEDE SER DETECTADA MEDIANTE PRUEBAS ESTADISTICAS SENCILLAS. DICHAS PRUEBAS, SIN EMBARGO, NO PERMITEN IDENTIFICAR EL ORIGEN DEL ERROR SISTEMATICO LA MANERA MAS SIMPLE DE DETERMINAR LA PRESENCIA DE ERROR SISTEMATICO ES CUANTIFICAR EL ANALITO EN UN MATERIAL DE REFERENCIA (ESTANDAR)*
6
ERROR ALEATORIO (AL AZAR, INDETERMINADO) TIENE SU ORIGEN EN LOS EFECTOS DE VARIABLES FUERA DE CONTROL (TAL VEZ INCONTROLABLES) EN LAS MEDICIONES TIENE IGUAL PROBABILIDAD DE SER POSITIVO O NEGATIVO
* MATERIAL DE REFERENCIA:
CONTIENE UNO O MAS ANALITOS EN CONCENTRACION CONOCIDA CON
ESTA SIEMPRE PRESENTE Y NO PUEDE
ALTAS EXACTITUD Y PRECISION
CORREGIRSE
PUEDEN OBTENERSE EN National Institute of Standards and Technology (NIST) American Society for Testing and Materials (ASTM)
7
8
2
PUNTOS IMPORTANTES EN ESTADISTICA
DOS CONCEPTOS BASICOS:
POBLACION Y MUESTRA
•
POBLACION
ESTRICTAMENTE, LAS LEYES DE LA ESTADISTICA SE APLICAN SOLO A POBLACIONES. CUANDO ESTAS LEYES SE APLICAN A MUESTRAS DE DATOS DE LABORATORIO, SE ASUME QUE LA MUESTRA ES REPRESENTATIVA DE LA POBLACION
COLECCION COMPLETA DE OBJETOS QUE COMPARTEN UNA O MAS CARACTERISTICAS DESDE UN PUNTO DE VISTA ANALITICO:
LA ESTADISTICA TIENE SUS BASES EN LA TEORIA DE PROBABILIDADES (UNA TEORIA UTILIZADA PARA EXPLICAR EVENTOS AL AZAR)
EL NUMERO INFINITO DE RESULTADOS QUE, EN PRINCIPIO, SE PUEDE OBTENER CON UNA INFINITA CANTIDAD DE MUESTRA Y EN UNA INFINITA CANTIDAD DE TIEMPO
•
LA ESTADISTICA NO MANEJA “ABSOLUTOS”: SOLO PUEDE DECIR
MUESTRA
SI UN EVENTO ES ESTADISTICAMENTE SIGNIFICATIVO O
UN SUBCONJUNTO DE UNA POBLACION
ESTADISTICAMENTE INSIGNIFICANTE 9
10
DOS DEFINICIONES BASICAS EN ESTADISTICA: MEDIA Y DESVIACION ESTANDAR
DOS DEFINICIONES BASICAS EN ESTADISTICA:
MEDIA Y DESVIACION STANDARD
DESVIACION ESTANDAR
MEDIA
n
x
i
POBLACION:
n
lim i 1 n n
POBLACION:
s lim
x i 1
n
n
n
x
GRADOS DE LIBERTAD
i
MUESTRA:
n xi
x
2
i
n
i 1
MUESTRA:
n
s
x x i 1
2
i
n 1
UN GRADO DE LIBERTAD SE PIERDE CUANDO LA MEDIA SE USA EN EL CALCULO POSTERIOR DE CUALQUIER PARAMETRO
NÚMERO DE MEDICIONES
sn-1
i-ÉSIMA MEDICIÓN DE x 11
en su calculadora 12
3
DESVIACION ESTANDAR RELATIVA
DESVIACION ESTANDAR
(RSD)
LA DESVIACION ESTANDAR ES UNA MEDIDA CUANTITATIVA DE LA PRECISON (REPRODUCIBILIDAD o DISPERSION DE LAS MEDICIONES ALREDEDOR DE LA MEDIA)
RSD % RSD
s x
s 100 x
TAMBIEN CONOCIDA COMO COEFICIENTE DE VARIACION (CV) 13
14
GRADOS DE LIBERTAD
GRADOS DE LIBERTAD
(CONTINUACION)
NUMERO DE VALORES NO RESTRINGIDOS
•
Ejemplo:
•
•
10
11.275
PARA OBTENER UN PROMEDIO DE 8 Y UNA DESVIACION ESTANDAR DE 6 , SOLAMENTE LOS NUMEROS 3.725 Y 11.275 PUEDEN SER EL 4oY EL 5o VALORES, DESPUES DE ESCOJER LOS PRIMEROS 3 NUMEROS
ESCOJA UN TOTAL DE 5 VALORES CON UN PROMEDIO DE 8:
3 5 17 2 4 GRADOS DE LIBERTAD
ESCOJA UN TOTAL DE 5 VALORES CON UN PROMEDIO DE 8 Y UNA DESVIACION ESTANDAR DE 6:
3 5 17 3.725 3 GRADOS DE LIBERTAD
ESCOJA UN TOTAL DE 5 VALORES AL AZAR:
3 5 17 2 5 GRADOS DE LIBERTAD
Ejemplo:
13 EN GENERAL...
PARA OBTENER UN PROMEDIO DE 8 DESPUES DE ESCOJER LOS PRIMEROS 4 VALORES, EL 13 Y SOLAMENTE EL 13 PUEDE SER EL 5o VALOR 15
SI UNO TIENE n DATOS Y CALCULA m PARAMETROS ESTADISTICOS, LOS GRADOS DE LIBERTAD SON DE (n
- m) 16
4
DISTRIBUCIONES
HISTOGRAMA DE LOS DATOS DE CONCENTRACION DE ION NITRATO LA DISTRIBUCION DE LAS MEDICIONES ES CERCANAMENTE SIMETRICA CON RESPECTO A LA MEDIA
14
0.51 0.52 0.53 0.48 0.49 0.50 0.52 0.49 0.49 0.50 12
0.49 0.48 0.46 0.49 0.49 0.48 0.49 0.49 0.51 0.47
10
0.51 0.51 0.51 0.48 0.50 0.47 0.50 0.51 0.49 0.48
Frecuencia
50 determinaciones de la concentración (g/mL) del ión nitrato en una muestra de agua
0.51 0.51 0.51 0.50 0.51 0.49 0.52 0.53 0.50 0.47
0.51 0.50 0.50 0.53 0.52 0.52 0.50 0.50 0.51 0.51 TABLA DE FRECUENCIA
Concentracion
Frecuencia
0.46
1
0.47
3
0.48
5
0.49
10
0.50
10
0.51
13
0.52
5
0.53
3
8 6
media= 0.500 g/mL
4
desv. estd. = 0.0165 g/mL
2 0 0.46
0.47
0.48
0.49
0.50
0.51
0.52
0.53
Concentracion, g/mL
LA DISTRIBUCION SE PUEDE VISUALIZAR
LA SIMETRIA SE HACE MAS APARENTE A MEDIDA QUE
MEDIANTE UN HISTOGRAMA
x
n
SE INCREMENTA
ES UN ESTIMADO DE
S ES UN ESTIMADO DE s
17
LA DISTRIBUCION NORMAL O GAUSSIANA
18
LA DISTRIBUCION NORMAL O GAUSSIANA x 2 exp 2s 2 y s 2
x 2 exp 2s 2 y s 2
El área total encerrada bajo la curva es igual a 1:
ydx 1
Funcion de densidad de probabilidad La probabilidad de que la variable aleatoria x tome un valor dentro de un determinado rango es la integral de la función y sobre dicho rango
dN ydx N
b
P(a x b) ydx a
FRACCION DE LA POBLACION CUYOS VALORES SE ENCUENTRAN ENTRE
x Y x+dx 19
20
5
LA DISTRIBUCION NORMAL O GAUSSIANA RELACION MUY UTIL:
LA DISTRIBUCION NORMAL “ESTANDAR” Se llama distribución normal "estándar" a aquélla en la que sus parámetros toman los valores μ = 0 y σ = 1. En este caso la función de densidad tiene la siguiente expresión:
x z s
2
dN 1 x2 e dx N 2
DIFERENCIA EN UNIDADES DE DESVIACION ESTANDAR
x 2 exp 2s 2 y s 2
Que, naturalmente, coincide con: 2
x 2 exp 2s 2 y s 2
2
ECUACION MAS COMPACTA:
dN 1 z2 e dz N 2
dN 1 z2 e dz N 2 Puesto que...
z
x
s
x0 x 1
21
INTERPRETACION GEOMETRICA DE LA DESVIACION ESTANDAR s
22
OTRAS DISTRIBUCIONES COMUNES
A MAYOR s, MAS ANCHA LA CURVA
DISTRIBUCIONES APROXIMADAMENTE LOG-NORMAL: CONCENTRACION DEL ANTICUERPO INMUNOGLOBULINA M EN SUERO DE INDIVIDUOS MACHOS EL TAMAÑO DE LAS GOTITAS FORMADAS POR LOS NEBULIZADORES DE ABSORCION/ EMISION ATOMICA TAMBIEN EXHIBEN ESTA DISTRIBUCION
DISTRIBUCIONES NORMALES CON LA MISMA MEDIA PERO DIFERENTES VALORES DE LA DESVIACION ESTANDAR 23
24
6
OTRAS PROPIEDADES DE LA DISTRIBUCION NORMAL PREGUNTA: CUAL ES LA PROBABILIDAD DE QUE REPLICAS DE UNA MEDICION SE ENCUENTREN DENTRO DE UN RANGO PARTICULAR ALREDEDOR DE LA MEDIA?
z 1
x 1s En el intervalo [μ - 2σ, μ + 2σ] se encuentra comprendida, aproximadamente, el 95% de la distribución
z2
x 2s z3
x 3s 25
26
OTRAS PROPIEDADES DE LA DISTRIBUCION NORMAL OTRA PREGUNTA: CUAL ES RANGO ALREDEDOR DE LA MEDIA PARA EL CUAL HAY UNA PROBABILIDAD DADA DE QUE REPLICAS DE UNA MEDICION SE ENCUENTREN DENTRO DE EL? EN OTRAS PALABRAS: CUAL ES EL VALOR DE z PARA UN PORCENTAJE DADO DE VALORES OBSERVADOS?
%Valores Observados
Intervalo alrededor de
Desviaciones estandares, z
50
± 0.67s
0.67
68
± 1.00s
1.00
80
± 1.29s
1.29
90
± 1.64s
1.64
95
± 1.96s
1.96
98
± 2.33s
2.33
99
± 2.58s
2.58
99.7
± 3.00s
3.00
99.9
± 3.29s
3.29
LA DISTRIBUCION DE MEDIAS RESULTADOS DE 50 DETERMINACIONES DE LA CONCENTRACION DE ION NITRATO, EN g/mL
0.51
0.51
0.51
0.50
0.51
0.49
0.52
0.53
0.50
0.47
0.51
0.52
0.53
0.48
0.49
0.50
0.52
0.49
0.49
0.50
0.49
0.48
0.46
0.49
0.49
0.48
0.49
0.49
0.51
0.47
0.51
0.51
0.51
0.48
0.50
0.47
0.50
0.51
0.49
0.48
0.51
0.50
0.50
0.53
0.52
0.52
0.50
0.50
0.51
0.51
0.506
0.504
0.502
0.496
0.502
0.492
0.506
0.504
0.500
0.486
PARTE DE UNA POBLACION DE MEDIAS
NOTESE QUE ESTAS MEDIAS EXHIBEN UNA DISPERSION MENOR QUE LOS DATOS ORIGINALES 27
A SU DESVIACION ESTANDARD SE LE CONOCE COMO ERROR ESTANDARD DE LA MEDIA 28
7
TEOREMA DEL LIMITE CENTRAL
CONFIABILIDAD DE UN RESULTADO ANALITICO
INDEPENDIENTEMENTE DEL TIPO DE DISTRIBUCION DE LOS DATOS...
RESULTADO ANALÍTICO: ENTRE MAS MUESTRAS DE DATOS SE TOMAN, MAS NORMALMENTE DISTRIBUIDA SE HACE LA DISTRIBUCION DE LAS MEDIAS DE ESAS MUESTRAS
x int ervalo de confianza
INTERVALO DE CONFIANZA*_ RANGO DENTRO DEL CUAL UNO PUEDE RAZONABLEMENTE ASUMIR QUE SE ENCUENTRA EL VALOR REAL
EN OTRAS PALABRAS,
AUN SI LA POBLACION ORIGINAL NO ES NORMALMENTE DISTRIBUIDA, LA DISTRIBUCION DE LAS MEDIAS TIENDE A SER MAS NORMALMENTE DISTRIBUIDA A MEDIDA QUE
LIMITES DE CONFIANZA_
n AUMENTA
LOS VALORES EXTREMOS DE ESE RANGO
sx
sm
sx n
sm xi EN LA PRACTICA,
* “CONFIANZA” SIGNIFICA QUE UNO PUEDE AFIRMAR CON UN GRADO ESPECIFICO DE CERTEZA (i. e. , UNA CIERTA PROBABILIDAD) QUE EL INTERVALO INCLUYE EL VALOR REAL
xi
sm
sx n
29
30
LIMITES DE CONFIANZA
RANGO DE CONFIANZA Y DISTRIBUCION DE LAS MEDIAS
SI SE CONOCE s :
IC x zs
Z=
n
1.96
(95%)
2.58
(99%)
1 P
DISTRIBUCION DE MEDIAS MOSTRANDO EL RANGO DENTRO DEL CUAL SE ENCUENTRA EL 95% DE LAS MEDIAS 31
32
8
VALORES DE
t
LIMITES DE CONFIANZA
t t f , P
SI NO SE CONOCE s (MUESTRAS PEQUEÑAS):
IC x ts
n
P=0.95
t t f , P
14.00 12.00
t ES FUNCIÓN DE:
10.00 t-value
f n 1 LOS GRADOS DE LIBERTAD LA PROBABILIDAD, P, DE QUE SE
8.00 6.00 4.00
ENCUENTRE DENTRO DEL RANGO ESTABLECIDO
2.00 0.00
ALGUNAS VECES SE USA (LA PROBABILIDAD DE QUE SE ENCUENTRE FUERA DEL RANGO ESTABLECIDO)
0
20
40
60
80
100
120
Degrees of freedom
1 P 33
LIMITES DE CONFIANZA
34
Intervalo de confianza
EJEMPLO
x 10.1 ppb
SE DETERMINÓ LA CONCENTRACIÓN DE PLOMO EN LA SANGRE DE 50 NIÑOS DE UNA ESCUELA CERCA A UNA CARRETERA CON MUCHO TRÁFICO. LA MEDIA DE LAS MUESTRAS FUÉ DE 10.1 ng/mL Y LA DESVIACIÓN ESTÁNDAR FUÉ DE 0.6 ng/mL.
s 0.6 ppb
IC x t
n 50
(a) CALCULAR EL INTERVALO DE CONFIANZA DE LA CONCENTRACIÓN MEDIA DE PLOMO EN TODOS LOS NIÑOS DE LA ESCUELA. (b) CUAL DEBERÍA SER EL TAMAÑO DE LA MUESTRA PARA REDUCIR EL RANGO DE CONFIANZA A 0.2 ng/mL (ES DECIR, ±0.1 ng/mL)?
35
IC 10.1 2.01
s n
0.6 10.1 0.17 50
10.27 9.93
lim. superior
lim. inferior
10.1 0.17
0.17 0.34 Rango de confianza
36
9
Tamaño de la muestra
LIMITES DE CONFIANZA
x 10.1 ppb s 0.6 ppb
IC x t
n ?
ts n 0.1
2
s n
t
s 0.1 n
EN GENERAL_ EL TAMAÑO DE MUESTRA (n) NECESARIO PARA ESTIMAR LA PRECISION DENTRO DE ± C ES
2 0.6 2 n 144 1.4 10 0.1 2
ts n C
10.1 0.1
2
0.1 0.2
37
MAS SOBRE LA DISTRIBUCION NORMAL
38
USO DE LAS “COLAS“ DE UNA DISTRIBUCION NORMAL DE ERROR
EN GENERAL UNO ASUME QUE REPETIDAS DETERMINACIONES
HAY SITUACIONES EN LAS QUE ES IMPORTANTE DETERMINAR LA FRECUENCIA CON LA CUAL CIERTOS RESULTADOS EXTREMOS PODRIAN OCURRIR EN UNO DE LOS LADOS DE LA CURVA NORMAL DE ERROR:
DE UN ANALITO SIGUEN UNA DISTRIBUCION NORMAL LA ASUNCION NO ES DEL TODO GRATUITA:
ESTUDIOS MATEMATICOS DE LA DISTRIBUCION NORMAL (AL MENOS POR 300 AÑOS) HAN MOSTRADO QUE EN SITUACIONES EN LAS QUE MUCHOS PEQUEÑOS ERRORES AFECTAN CADA MEDICION, EL ERROR TOTAL EN EL
TIPICAMENTE, EL ANALISTA DEBE ASEGURARSE QUE NO MAS QUE UN PEQUEÑO PORCENTAJE DE LAS MUESTRAS SEA MAYOR O MENOR QUE ALGUN VALOR LIMITE PREDETERMINADO
RESULTADO SIGUE SIEMPRE UNA DISTRIBUCION NORMAL
MUCHOS CIENTIFICOS HAN ENCONTRADO UN GRAN NUMERO DE SITUACIONES EN LAS QUE MEDICIONES REPETIDAS SIGUEN UNA DISTRIBUCION NORMAL 39
40
10
USO DE LAS “COLAS“ DE UNA DISTRIBUCION NORMAL DE ERROR
“COLAS“ DE LA DISTRIBUCION NORMAL EL PORCENTAJE REQUERIDO PUEDE OBTENERSE DE LA
RETOMEMOS LAS DETERMINACIONES DE LA CONCENTRACIÓN (ppm) DE IÓN NITRATO EN UNA MUESTRA DE AGUA
TABLA DE DISTRIBUCION NORMAL “ESTANDAR” (VIDE INFRA), PERO PARA USAR ESTA TABLA DEBEMOS PRIMERO
MEDIA= 0.500 ppm
ESTANDARIZAR EL VALOR (0.53) EN EL QUE ESTAMOS
DESV. ESTD. = 0.0165 ppm
INTERESADOS.
SUPONGAMOS QUE DESEAMOS ESTIMAR EL PORCENTAJE DE DETERMINACIONES QUE EXCEDE 0.53 ppm
ESTO SE HACE EN TERMINOS DE z, LA DESVIACION DEL VALOR CON RESPECTO A LA MEDIA, EXPRESADA EN UNIDADES DE DESVIACION ESTANDAR, ES DECIR :
z QUE PORCENTAJE DE LAS DETERMINACIONES EXCEDE 0.53?
x xlim x 0.53 0.50 1.818 s s 0.0165
41
“COLAS“ DE DISTRIBUCION NORMAL
42
TABLA DE DISTRIBUCION NORMAL ESTANDAR
2.00 1.95 1.90 1.85 1.80 1.75 1.70 1.65 1.60 1.55 1.50 1.45 1.40 1.35 1.30 1.25 1.20 1.15 1.10 1.05 1.00 0.95 0.90 0.85 0.80 0.75 0.70 0.65 0.60 0.55
0.50 0.49 0.48 0.47 0.46 0.45 0.44 0.43 0.42 0.41 0.40 0.39 0.38 0.37 0.36 0.35 0.34 0.33 0.32 0.31 0.30 0.29 0.28 0.27 0.26 0.25 0.24 0.23 0.22 0.21
2.877 2.885 2.893 2.901 2.910 2.919 2.928 2.937 2.946 2.956 2.966 2.977 2.987 2.998 3.010 3.022 3.034 3.047 3.060 3.074 3.089 3.104 3.120 3.136 3.154 3.172 3.192 3.214 3.237 3.261
% exceeding the value
2.575 2.582 2.589 2.597 2.604 2.612 2.619 2.627 2.635 2.643 2.652 2.660 2.669 2.678 2.687 2.696 2.706 2.716 2.726 2.736 2.747 2.758 2.770 2.781 2.794 2.806 2.819 2.833 2.847 2.862
0.200 0.195 0.190 0.185 0.180 0.175 0.170 0.165 0.160 0.155 0.150 0.145 0.140 0.135 0.130 0.125 0.120 0.115 0.110 0.105 0.100 0.095 0.090 0.085 0.080 0.075 0.070 0.065 0.060 0.055
% exceeding the value
2.054 2.064 2.075 2.086 2.097 2.108 2.120 2.132 2.144 2.157 2.170 2.183 2.197 2.211 2.226 2.241 2.257 2.273 2.290 2.308 2.326 2.345 2.365 2.386 2.409 2.432 2.457 2.483 2.512 2.542
% exceeding the value
Standardized value
% exceeding the value 5.0 4.9 4.8 4.7 4.6 4.5 4.4 4.3 4.2 4.1 4.0 3.9 3.8 3.7 3.6 3.5 3.4 3.3 3.2 3.1 3.0 2.9 2.8 2.7 2.6 2.5 2.4 2.3 2.2 2.1
Standardized value
1.645 1.655 1.664 1.675 1.685 1.695 1.706 1.717 1.728 1.739 1.751 1.762 1.774 1.786 1.799 1.812 1.825 1.838 1.852 1.866 1.881 1.896 1.911 1.927 1.943 1.960 1.977 1.995 2.014 2.033
Standardized value
20.0 19.5 19.0 18.5 18.0 17.5 17.0 16.5 16.0 15.5 15.0 14.5 14.0 13.5 13.0 12.5 12.0 11.5 11.0 10.5 10.0 9.5 9.0 8.5 8.0 7.5 7.0 6.5 6.0 5.5
Standardized value
% exceeding the value
Standardized value 0.842 0.860 0.878 0.896 0.915 0.935 0.954 0.974 0.994 1.015 1.036 1.058 1.080 1.103 1.126 1.150 1.175 1.200 1.226 1.254 1.282 1.311 1.341 1.372 1.405 1.439 1.476 1.514 1.555 1.598
% exceeding the value
43
50.0 49.0 48.0 47.0 46.0 45.0 44.0 43.0 42.0 41.0 40.0 39.0 38.0 37.0 36.0 35.0 34.0 33.0 32.0 31.0 30.0 29.0 28.0 27.0 26.0 25.0 24.0 23.0 22.0 21.0
Standardized value
USANDO EL VALOR DE z Y LA TABLA DE DISTRIBUCION NORMAL ESTANDAR, VEMOS QUE APROXIMADAMENTE 3.45% DE LAS DETERMINACIONES EXCEDEN 0.53 ppm
0.000 0.025 0.050 0.075 0.101 0.126 0.151 0.176 0.202 0.228 0.253 0.279 0.305 0.332 0.358 0.385 0.412 0.440 0.468 0.496 0.524 0.553 0.583 0.613 0.643 0.674 0.706 0.739 0.772 0.806
% exceeding the value
RECUERDE QUE ESTE VALOR DE z NOS DICE QUE EL VALOR (0.53) ESTA 1.818 DESVIACIONES ESTANDAR POR ENCIMA DE LA MEDIA (0.50)
Standardized value
Standardized value = (value – mean)/SD
z 1.818
3.287 3.317 3.349 3.385 3.427 3.476 3.534 3.607 3.707 3.869
0.050 0.045 0.040 0.035 0.030 0.025 0.020 0.015 0.010 0.005
44
11
“COLAS“ DE DISTRIBUCION NORMAL
“COLAS“ DE DISTRIBUCION NORMAL
LA TABLA DE DISTRIBUCION NORMAL ESTANDAR TAMBIEN PUEDE USARSE “EN REVERSA”: QUE VALOR ES PROBABLE DE SER EXCEDIDO POR EL 10% DE LAS DETERMINACIONES MAS ALTAS?
LOCALIZANDO EL 10% EN LA COLUMNA DE LA DERECHA DE LA TABLA DE DISTRIBUCION NORMAL ESTANDAR, OBTENEMOS UN VALOR, z, DE 1.282, DEL CUAL SE PUEDE OBTENER EL VALOR DESCONOCIDO:
1.282
xlim 0.50 0.0165
xlim 0.50 1.282 0.0165 0.52 CONCLUIMOS QUE EL 10% MAS ALTO DE LAS DETERMINACIONES EXCEDE 0.52 ppm
QUE VALOR ES EXCEDIDO POR EL 10% DE LAS DETERMINACIONES? 45
46
EJERCICIO DE TALLER EL OCTANAJE DE LA GASOLINA SE PUEDE INCREMENTAR MEDIANTE LA ADICION DE TETRAETILO DE PLOMO (TEL, TETRAETHYLLEAD), PERO EL LIMITE MAXIMO DE TEL PERMITIDO ES 0.50 g/gal. SI MAXIMO EL 0.5% DE LAS MUESTRAS DE GASOLINA PUEDEN EXCEDER ESTE LIMITE Y LA DESVIACION ESTANDAR DEL CONTENIDO DE TEL EN LA COMPAÑIA A ES sA = 0.05 g/gal, CUAL ES LA CONCENTRACIO MEDIA QUE ESTA COMPAÑIA PUEDE USAR EN SU GASOLINA? LA COMPAÑIA B MANTIENE UN CONTROL MAS ESTRICTO EN SUS PROCEDIMIENTOS, DE TAL MANERA QUE sB = 0.01 g/gal. CUANTO TEL PUEDE AÑADIR EN PROMEDIO ESTA COMPAÑIA?
47
48
12
PRUEBAS DE SIGNIFICACION
PRUEBAS DE SIGNIFICACION
TAMBIEN LLAMADAS PRUEBAS DE HIPOTESIS (NULA)
EJEMPLO:
UN PROCEDIMIENTO SISTEMATICO QUE NOS PERMITE DECIDIR SI UN CONJUNTO DE MEDICIONES REPETIDAS
(Analyst 1983, 108, 64)
EN UN METODO PARA DETERMINAR PLOMO EN SANGRE POR ABSORCION ATOMICA SE OBTUVIERON LOS SIGUIENTES VALORES PARA UNA MUESTRA STANDARD QUE CONTIENE 38.9 ppb DE PLOMO: 38.9 37.4 37.1
MUESTRA EVIDENCIA DE ERROR SISTEMATICO EXISTE ALGUNA EVIDENCIA DE ERROR SISTEMATICO?
EL PROPOSITO DE UNA PRUEBA DE SIGNIFICACION ES SACAR UNA CONCLUSION ACERCA DE UNA POBLACION UTILIZANDO DATOS PROVENIENTES DE UNA MUESTRA
x 37.80 ppb
s 0.964 ppb
LA CUESTION ES SI LA DIFERENCIA ENTRE EL RESULTADO Y EL VALOR REAL ES ESTADISTICAMENTE SIGNIFICATIVA, O SI SE DEBE A MERAS VARIACIONES FORTUITAS (AL AZAR)
49
SE SIGUE UN PROCEDIMIENTO DE 6 PASOS
50
PROCEDIMIENTO DE SEIS PASOS
PASO 1: HIPOTESIS “NULA” ( H0) : EL RESULTADO NO ES INEXACTO
PASO 3: PRUEBA ESTADISTICA
OJO: UNO NO SABE SI ESTA DECLARACION ES CIERTA O ES FALSA, PERO SERA ASUMIDA CIERTA HASTA QUE SE PRUEBE QUE ES FALSA
tcalc
x n s
OJO: ESTE PASO CONDENSA LA INFORMACION DE LA MUESTRA EN UN SIMPLE NUMERO
PASO 2: HIPOTESIS ALTERNA ( H1) : EL RESULTADO ES INEXACTO
tcalc 51
37.8 38.9 3 0.964
1.98 52
13
PASO 4: VALORES CRITICOS : COMPARE EL RESULTADO DE LA
PASO 5:
PRUEBA ESTADISTICA (tcalc) CON VALORES TEORICOS TABULADOS
DECISION: RETENEMOS LA HIPOTESIS NULA
tcrit = 4.3
(P = 95%, f = 2)
PASO 6: CONCLUSION: HEMOS SIDO INCAPACES DE PROBAR QUE EL
SI tcalc EXCEDE EL VALOR CRITICO, LA HIPOTESIS NULA SE RECHAZA.
RESULTADO ES INEXACTO
LOS VALORES CRITICOS PUEDEN INTEPRETARSE COMO VALORES QUE SON IMPROBABLES* QUE SEAN EXCEDIDOS POR LA PRUEBA ESTADISTICA (tcalc) SI LA HIPOTESIS NULA ES CIERTA
NOTA IMPORTANTISIMA: LA DECISION DE RETENER LA HIPOTESIS NULA NO SIGNIFICA QUE SE HA DEMOSTRADO QUE ES CIERTA;
* A UN 95% DE CONFIANZA, LA PROBABILIDAD ES MENOR DE 5% (ES DECIR, MENOS QUE 1 EN 20)
SIMPLEMENTE, NO SE PUDO DEMOSTRAR QUE SEA FALSA 53
VALORES CRITICOS PARA LA PRUEBA
t
54
LA HIPOTESIS NULA SE USA (O SE DEBERIA USAR) EN LAS CORTES CRIMINALES: EL ACUSADO SE ASUME “NO CULPABLE” HASTA QUE SE DEMUESTRE QUE ES CULPABLE VEREDICTO “NO CULPABLE” EN CORTE CRIMINAL LA EVIDENCIA (PRUEBAS DE SIGNIFICACION) INDICA QUE LA HIPOTESIS NULA DEBE CONSERVARSE CONCLUSION: NO SE HA DEMOSTRADO QUE EL ACUSADO ES INOCENTE... (NO SE PUDO DEMOSTRAR QUE EL ACUSADO SEA CULPABLE) 55
56
14
PRUEBAS DE SIGNIFICACION
COMPARACION DE LAS MEDIAS DE DOS MUESTRAS
ENFASIS SOBRE LO IMPORTANTE
H0 ES UNA DECLARACION DE QUE “NO HAY DIFERENCIA”, ES DECIR, QUE CUALQUIER DIFERENCIA
SE QUIEREN COMPARAR LOS RESULTADOS DE UN
OBSERVADA ES DEBIDA SOLO AL AZAR
NUEVO METODO ANALITICO CON AQUELLOS
H0 ES LA HIPOTESIS QUE EL INVESTIGADOR ESPERA
OBTENIDOS POR UN SEGUNDO METODO
RETENER
(REFERENCIA)
EL UMBRAL DE ERROR, (= 1-P), ES EL RIESGO (LA PROBABILIDAD) QUE EL INVESTIGADOR ESTA
x1 & x2
DISPUESTO A TOMAR SI RECHAZARA
s1 & s2
CONOCIDOS:
INCORRECTAMENTE LA H0 VERDADERA
n1 & n2 57
58
Y QUE ES UN PROMEDIO “PONDERADO”?
COMPARACION DE DOS MEDIAS CASO I:
s1
Y
s2
A CADA NUMERO
NO SON SIGNIFICATIVAMENTE DIFERENTES
xi
EN EL CONJUNTO (x1, x2, x3,
…., xn)
SE LE ASIGNA UN FACTOR DE PONDERACION wi
H0: LOS DOS METODOS NO PRODUCEN RESULTADOS DIFERENTES
x1 NO x2
EL PROMEDIO PONDERADO SE DEFINE COMO n
PRUEBA ESTADISTICA:
x1 x2
tcalc s
1 1 n1 n2
tcalc TIENE
fs f s s f1 f 2 2
CON
2 1 1
2 2 2
xw
*
i 1 n
i
i
w i 1
i
NOTESE QUE SI TODOS LOS FACTORES DE PONDERACION FUERAN
f1 + f2 (O SEA, n1+n2-2) GRADOS DE LIBERTAD
*
w x
IGUALES EL PROMEDIO PONDERADO SE REDUCE AL PROMEDIO COMUN
UN PROMEDIO PONDERADO 59
60
15
CUANDO SE USE LA PRUEBA t...
COMPARACION DE DOS MEDIAS
x1 x2 s1 vs s2 n1 n2
CASO II:
s1
Y
H0 :
s2
USE LA PRUEBA F PARA RESOLVER ESTE CONDICIONAL
SON SIGNIFICATIVAMENTE DIFERENTES
s1 = s2
LOS DOS METODOS NO PRODUCEN RESULTADOS DIFERENTES
x1 NO x2
CASO I
SI
?
2
tcalc
x1 x2
CON
s12 s22 n1 n2
s
NO
s12 s22 n n 2 1 f 2 2 2 s12 s22 n 1 n2 n1 1 n2 1
CASO II
t calc
x1 x2 2 1
2 2
s s n1 n2 f
REDONDEADO AL ENTERO MAS CERCANO 61
PRUEBAS DE SIGNIFICACION EJEMPLO (CASO I) COMPARACION DE DOS METODOS PARA LA DETERMINACION DE BORO EN MATERIAL VEGETAL
media
desv std
n
MET. ESPECTROFOTOMETRICO
28.00
0.30
10
MET. FLUORIMETRICO
26.25
0.23
8
s12 s22 n n 2 1
2
2
2
s12 s22 n n 1 2 n1 1 n2 1
62
F: Fluorimétrico
xE 28.00 ppm
xF 26.65 ppm sF 0.23 ppm
nE 10
nF 8
sE
NO
xE xF
tcalc s
f F nF 1 8 1 7
sF
H 0 : xE NO xF
63
f f1 f 2
sE 0.30 ppm
CASO I :
f1s12 f 2 s22 f1 f 2
2
f E nE 1 10 1 9
SON LOS RESULTADOS DE ESTOS DOS METODOS SIGNIFICATIVAMENTE DIFERENTES? (Analyst 1983, 108, 368)
1 1 n1 n2
s2
Subindices: E: Espectrofotométrico
Resultados obtenidos (ppm)
x1 x2
t calc
PRUEBA ESTADISTICA:
1 1 nE nF
H 1 : xE x F
s2
f E sE2 f F sF2 fE fF 64
16
s
9 0.30 2 7 0.23 2 0.271604 9 7 xE xF
tcalc s
1 1 nE nF
28.00 26.25
0.2716
1 1 10 8
x
Se retiene H1
13.58
E
E
xF
NO xF
CONCLUSION: SI, LOS RESULTADOS DE ESTOS DOS METODOS SON SIGNIFICATIVAMENTE DIFERENTES
f f E f F 9 7 16
x
DECISION: Se rechaza H0
tcrit (16 GdL, 95%) = 2.12 tcrit (16 GdL, 99%) = 2.92
tcalc (13.58) > tcrit (2.12) ? SI (aun por encima del 99%) 65
66
PRUEBAS DE SIGNIFICACION Subindices: N: Normal
R: Reumatoide
EJEMPLO (CASO II)
xN 1.9214 mM
xR 3.465 mM
LA SIGUIENTE TABLA PROPORCIONA LA CONCENTRACION DE TIOL EN SANGRE DE DOS GRUPOS DE VOLUNTARIOS. EL PRIMER GRUPO ES “NORMAL” Y EL SEGUNDO SUFRE DE ARTRITIS REUMATOIDE. (Analyst,
s N 0.07559 mM
sR 0.4404 mM
nN 7
nR 6
1983, 107,195) CASO II :
Concentración de tiol (mM) Normal
Reumatoide
1.84
2.81
1.92
4.06
1.94
3.62
1.92
3.27
1.85
3.27
1.91
3.76
2.07
sN sR
H 0 : xN NO xR
ES LA CONCENTRACION DE TIOL EN LA SANGRE DE LOS ENFERMOS DE ARTRITIS REUMATOIDE DIFERENTE DE AQUELLA DE LOS INDIVIDUOS “NORMALES”?
67
tcalc
xN xR s N2 s2 R nN nR
H 1 : x N xR
1.921 3.645 0.0755 2 0.440 2 7 6
8.47
68
17
2
2
s N2 0.0755 2 0.440 2 s2 R n n 7 6 R f N2 2 2 5 2 2 2 2 2 2 sN 0.0755 0.440 2 sR n n 7 6 N R 7 1 6 1 n N 1 nR 1
tcrit (5 GdL, 95%) = 2.57
LA PRUEBA t POR PAREJAS CIRCUNSTANCIAS EN LAS CUALES ES NECESARIO O DESEABLE HACER UNA COMPARACION DE MEDIAS POR PAREJAS: CANTIDAD LIMITADA DE UNA O MAS MUESTRAS (SOLO HAY MUESTRA SUFICIENTE PARA UNA DETERMINACION POR CADA METODO)
tcrit (5 GdL, 99%) = 4.06
MUESTRAS DE ORIGENES DIFERENTES Y POSIBLEMENTE CON CONCENTRACIONES DIFERENTES*
tcalc (8.47) > tcrit (2.57) ? SI (aun por encima del 99%)
DECISION: Se rechaza H0
Se retiene H1
x
N
x
N
NO xR
xR
MUESTRAS QUE SE RECIBEN EN UN PERIODO DE TIEMPO LARGO (SE HACE NECESARIO ELIMINAR EFECTOS DE CONDICIONES AMBIENTALES VARIABLES COMO TEMPERATURA, PRESION, ETC.)
ASUNCION: CUALQUIER ERROR (SISTEMATICO O AL AZAR) ES INDEPENDIENTE DE LA CONCENTRACION
CONCLUSION: SI, LA CONCENTRACION DE TIOL EN LA SANGRE DE LOS ENFERMOS DE ARTRITIS REUMATOIDE ES DIFERENTE DE AQUELLA DE LOS INDIVIDUOS “NORMALES”
*
EN CASO DE DIFERENCIAS DE CONCENTRACION MUY AMPLIAS ES MEJOR USAR ANALISIS DE REGRESION (VER LUEGO)
69
70
xDIF 1.75
EJEMPLO DE PRUEBA t POR PAREJAS
H 0 : xDIF NO 0
sDIF 4.991 nDIF 4
LA SIGUIENTE TABLA PROPORCIONA LA CONCENTRACION DE PLOMO (g/mL) POR DOS METODOS DIFERENTES PARA 4 MUESTRAS: EXTRACCION
EXTRACCION
MUESTRA
OXIDATIVA
DIRECTA
1
71
76
2
61
68
-7
3
50
48
+2
4
60
57
+3
tcalc
DIF
x DIF 0 nDIF sDIF
H 0 : xDIF 0
f E nDIF 1 4 1 3
x DIF
nDIF
sDIF
1.75 4 0.70 4.991
-5
LOS DOS METODOS PROPORCIONAN VALORES PARA LAS CONCENTRACIONES MEDIAS DE PLOMO QUE DIFIEREN SIGNIFICATIVAMENTE?
tcrit (3 GdL, 95%) = 3.18
DECISION: Se retiene H0
tcalc (0.70) > tcrit (3.18) ?
x
DIF
NO 0
NO
No, los dos métodos no proporcionan valores para las concentraciones medias de plomo que difieren significativamente 71
72
18
PRUEBA F PARA LA COMPARACION DE DESVIACIONES STANDARD UTIL PARA COMPARAR LA PRECISION DE DIFERENTES METODOS
H0 : LAS DESVIACIONES ESTANDAR DE LAS
LA PRUEBA F CONSIDERA EL COCIENTE DE LAS DOS VARIANZAS MUESTRALES*
s12 s22
POBLACIONES NO SON DIFERENTES
(ES DECIR, EL COCIENTE
(SIEMPRE, VARIANZA MAYOR / VARIANZA MENOR):
Fcalc
PRUEBA F PARA LA COMPARACION DE DESVIACIONES STANDARD
s1NO s2
DE VARIANZAS NO DIFIERE
SIGNIFICATIVAMENTE DE LA UNIDAD)
s1 s2
EVALUACION: RECHAZAR LA HIPOTESIS NULA SI Fcalc > Fcrit
*
SE ASUME QUE LAS POBLACIONES DE DONDE SE TOMAN LAS MUESTRAS SON NORMALES 73
74
PRUEBA F * 2 FORMAS 2 * PRUEBA DE UNA COLA (UNILATERAL): PRUEBA SI UN METODO A ES MAS PRECISO QUE UN METODO B OJO: UNO ESTA INTERESADO EN DETECTAR LA DIFERENCIA EN UNA SOLA DIRECCION
PRUEBA DE DOS COLAS (BILATERAL): PRUEBA SI LOS METODOS A Y B DIFIEREN EN SU PRECISION OJO: UNO ESTA INTERESADO EN DETECTAR CUALQUIER DIFERENCIA EN CUALQUIER DIRECCION 75
76
19
Subindices: S: Standard
PRUEBA F - EJEMPLOS UNA COLA: SE COMPARO UN METODO PROPUESTO PARA LA DETERMINACION DE DE LA DEMANDA DE OXIGENO EN AGUAS RESIDUALES CON UN METODO STANDARD. SE OBTUVIERON LOS SIGUIENTES RESULTADOS (ppm) EN UNA
sP 1.51 ppm
nS 9
nP 8
f S nS 1 9 1 8
f P nF 1 8 1 7
H 0 : sP NO sS
MUESTRA:
METODO
media
desv std
n
STANDARD
72
3.31
9
PROPUESTO
72
1.51
8
H 1 : s P sS 8 GdL
ES EL METODO PROPUESTO MAS PRECISO QUE EL METODO ESTANDAR?
Fcalc
s s
2 S 2 P
Fcrit (8/7, 95%) = 3.73
DECISION: Se rechaza H0
Se retiene H1
s
78
PRUEBA F - EJEMPLOS
Fcalc (4.81) > Fcrit (3.73) ?
3.312 4.81 1.512 7 GdL
77
P: Propuesto
sS 3.31 ppm
P
SI
s
sS
P
NO sS
DOS COLAS: DATOS ANTERIORES DE BORO EN MATERIAL VEGETAL
METODO
media
desv std
n
ESPECTROFOTOMETRICO
28.00
0.30
10
FLUORIMETRICO
26.25
0.23
8
CHEQUEAR LA ASUNCION DE QUE LAS DOS VARIANZAS NO DIFIEREN SIGNIFICATIVAMENTE
CONCLUSION: EL METODO PROPUESTO ES MAS PRECISO QUE EL METODO ESTANDAR
79
80
20
Subindices: E: Espectrofotométrico
F: Fluorimétrico
sE 0.30 ppm
sF 0.23 ppm
nE 10
nF 8
f E nE 1 10 1 9
f F nF 1 8 1 7
Fcalc (1.70) > Fcrit (4.82) ?
CASO I :
sE
sF
NO
Fcalc
DECISION: Se retiene H0
s
NO
E
NO sF
VERIFICAR QUE ESTO ES CIERTO
H 0 : sE NO sF
Fcrit (9/7, 95%) = 4.82
H 1 : sE sF
CONCLUSION: SE CONFIRMA LA ASUNCION DE QUE LAS DOS VARIANZAS NO DIFIEREN SIGNIFICATIVAMENTE
sE2 0.30 2 1.70 sF2 0.23 2 81
EJERCICIO DE TALLER
EXISTE UNA PEQUEÑA PROBABILIDAD DE QUE HAYAMOS TOMADO UNA MALA DECISION
Una de sus amigas se ha metido en el negocio de fabricar vinos. En una fiesta de catadores de vino ella le dijo a usted que estaba segura que un cierto restaurante estaba etiquetando el vino de ella como si fuera importado y que estaba cobrando precios exhorbitantes. Usted le respondió que estaba tomando el curso de Estadística en Univalle y que si ella le proporcionaba unas cuantas botellas, usted podría determinar si los dos vinos eran el mismo. (Durante una de esas fiestas, uno dice casi cualquier cosa). Cual es su conclusión, con base en los siguientes resultados de contenido (%v/v) de alcohol?
(DOS POSIBLES ERRORES EN PRUEBAS DE SIGNIFICACION) DECISION ______________________________
REALIDAD
RECHACE LA
NO RECHACE LA
HIPOTESIS NULA Y
HIPOTESIS NULA Y
CONCLUYA QUE
NO CONCLUYA QUE
EL RESULTADO ES
EL RESULTADO ES
INEXACTO
INEXACTO
______________________________________________ HIPOTESIS NULA
SE TOMO LA
ERROR DEL
ES FALSA; ES DECIR,
DECISION CORRECTA
TIPO II
EL RESULTADO ES INEXACTO
HIPOTESIS NULA ES CIERTA; ES DECIR, EL RESULTADO NO ES INEXACTO
ERROR DEL TIPO I
SE TOMO LA DECISION CORRECTA
82
83
•Vino de su amiga:
12.50, 12.34, 12.38, 12.33, 12.28, 12.41
•Vino del restaurante:
12.49, 12.62, 12.69, 12.64 84
21
EJERCICIO DE TALLER Cuando se hacen mediciones por replicado, a veces un resultado parece diferir sustancialmente de los demás. Una prueba de significación llamada “prueba-Q” o “prueba de Dixon” puede utilizarse para chequear si el valor “sospechoso” puede descartarse antes de calcular la media y la desviación estándar. Para aplicar esta prueba, se calcula un cociente de rechazo Q, definido como
Q
resultado sospechoso - resultado más próximo rango de resultados
y se ve si excede el valor crítico apropiado en la tabla estadística de cocientes, que aparece en la página siguiente. Si Qcalc. > Qcrit. , el resultado sospechoso puede descartarse. Aplicar la prueba-Q a los siguientes datos del contenido de estronsio (g/mL) en una muestra, para ver si el valor sospechoso puede o no descartarse: 1.15, 1.02. 1.10, y 1.88. 85
22
View more...
Comments