Kolmogorov Smirnov
Short Description
Download Kolmogorov Smirnov...
Description
INSTITUTO TECNOLÓGICO DE QUERÉTARO
CARRERA ING. LOGÍSTICA
MATERIA ESTADÍSTICA INFERENCIA I
TRABAJO DE UNIDAD PRUEBAS NO PARAMÉTRICAS “KOLMOGOROV-SMIRNOV” GRUPO 9V PRESENTA NOMBRE
NO.CONTROL
BACILIO SOFIA GRACIELA
11141041
SERRANO PEREZ MIGUEL ANGEL
11141067
ARGUELLO LARA BLANCA ENEDINA
11141038
DOMÍNGUEZ HERNÁNDEZ ANGÉLICA
11141047
PROFESOR TUTOR M.C. PATRICIA YSCAPA MORÁN
Miércoles 22 de mayo del 2013.
Kolmogorov-Smirnov Pruebas no paramétricas Introducción En este proyecto se dará a conocer la prueba no paramétrica llamada kolmogorov-Smirnov que tiene como propósito el probar si existe una diferencia significativa entre una distribución de frecuencias observadas y una distribución de frecuencias teóricas. La prueba de K-S de es uno de los métodos no paramétricos más útiles y generales para la comparación de dos muestras, ya que es sensible a las diferencias tanto de ubicación y la forma de las funciones de distribución acumulativa empírica. Una parte importante de esta prueba se encuentra en el estadístico de K-S, Dn es particularmente útil para juzgar que tan cerca está la distribución de Fo respecto a Fe.
Objetivo Se pretende utilizar las herramientas estadísticas implementadas en la prueba de kolmogorov-Smirnov, con la finalidad de analizar el comportamiento de una población normal. Así como como saber cuáles son sus aplicaciones en nuestra carrera como ingenieros logísticos.
Desarrollo En estadística, la prueba de Kolmogorov-Smirnov (también prueba K-S) es una prueba no paramétrica que se utiliza para determinar la bondad de ajuste de dos probabilidad entre sí. La prueba de kolmogorov-Smirnov para una muestra se considera un procedimiento de “bondad de ajuste”, es decir, permite medir el grado de concordancia existente entre la distribución de un conjunto de datos y una distribución teórica específica. Su objetivo es señalar si los datos provienen de una población que tiene la distribución teórica específica. Mediante la prueba se compara la distribución acumulada de las frecuencias teóricas con la distribución acumulada de las frecuencias observadas, se encuentra el punto de divergencia máxima y se determina que probabilidad existe que una diferencia de esa magnitud se da al azar.
La prueba de Kolmogorov-Smirnov puede ser modificado para servir como una bondad de ajuste de prueba. En el caso especial de las pruebas de normalidad de la distribución, las muestras están normalizados y en comparación con una distribución normal estándar. Esto es equivalente a establecer la media y la varianza de la distribución de referencia igual a las estimaciones de la muestra, y se sabe que el uso de estos para definir la distribución de referencia específica cambia la distribución nula de la estadística de prueba: ver a continuación . Varios estudios han encontrado que, incluso en esta forma se corrige, la prueba es menos potente para probar la normalidad de la prueba de Shapiro-Wilk o Anderson-Darling prueba . En resumen si la distancia entre las frecuencias esperadas y las frecuencias observadas no es significativa, entonces la distribución teórica describe bien la distribución observada.
Aplicaciones de la prueba. Para pronosticar la eficiencia de un proceso o técnicas en los diferentes departamentos administrativos.
Pasos a seguir para resolver los problemas de esta prueba: 1. 2. 3. 4. 5. 6.
Datos. Hipótesis. Grafica en caso de necesitarla. Obtener frecuencia acumulada observada. Obtener frecuencia acumulada observada relativa. Obtener la frecuencia acumulada observada esperada (según la distribución que se pida). 7. Obtener valor crítico. 8. Obtener el estadístico. 9. Conclusión. Hipótesis H0: Los datos analizados siguen una distribución M. H1: Los datos analizados no siguen una distribución M. Si el valor critico es mayor que el estadístico se acepta Ho.
Formulas Frecuencia acumulativa observada relativa: Cada valor de frecuencia acumulada / total de la muestra Frecuencia acumulada observada esperada: Se obtiene con la distribución que te pide el ejercicio. Poisson, distribución normal, binomial, etc. Estadístico: Dn= máx. │Fe-Fo│ Valor crítico: En las tablas del apéndice 8 donde necesitamos α (alfa) y tamaño de la muestra.
Conclusión. Haber resuelto ejercicios de esta prueba, nos dimos cuenta de que tipos de distribución (Poisson, distribución normal o binomial) nos pueden ayudar para poder resolverlos. Además como utilizar la formula Dn y la tabla de significancia. El conocer y saber manejar las pruebas no paramétricas, en este caso K-S, nos permite tener una amplia teoría para poder utilizarla en algún futuro cuando nos desarrollemos como Ingenieros en Logística especialmente usándola como herramienta de toma de decisiones para pronosticar resultados y nos permita hacer una análisis de que tan factible es tomar cierta decisión y hacia donde se inclinan nuestros datos, valores etc.
Ejercicios resueltos. 1. Al nivel de significancia de 0.05. ¿podemos concluir que los siguientes datos provienen de una distribución de Poisson con λ=3? Número de llegadas por día
0
Número 6 de días
1
2
3
4
5
6o+
18
30
24
11
2
9
1) Datos Nivel de significancia de .05 λ= 3 Distribución Poisson n = 100 2) Ho; los datos provienen de una distribución de Poisson con λ =3 H1; los datos no provienen de una distribución de Poisson con λ =3
4-6) Obtener las tablas No. Llegadas 0 1 2 3 4 5 6
7) Valor critico
fo acumula da
fo 6 18 30 24 11 2 9
6 24 54 78 89 91 100
frecuencia acumulativa observada relativa 0,06 0,24 0,54 0,78 0,89 0,91 1
frecuencia acumulativa observada esperada 0,049787068 0,149361205 0,224041808 0,224041808 0,168031356 0,100818813 0,050409407
│Fe-Fo│ 0,10978707 0,09063879 0,31595819 0,55595819 0,72196864 0,80918119 0,94959059
1.36/√100 = 0.1360 8) Estadístico Dn= 0.95 en X= 6 0.1360 < 0.95 Así que rechazamos Ho. 9) conclusión: los datos obtenidos no pertenecen a la distribución de Poisson con λ =3.
2. La siguiente es una distribución de frecuencias observadas. Utilice la distribución normal con M= 98.6 y σ= 3.78. a) Encuentre la probabilidad de caer en cada clase. b) Del inciso a), calcule la frecuencia esperada de cada categoría. c) Calcule Dn. d) Para un nivel de significancia de 0.10 ¿parece que esta distribución está bien descrita por la distribución normal sugerida? Valor de la < 92 variable Frecuencia 69 observada a)
92-95.99
96-99.99
408
842
100103.99 621
≥ 104 137
Gráfica de distribución
Normal, Media=98.6, Desv.Est.=3.78 0.12 0.10
Densidad
0.08 0.06 0.04 0.02 0.1330 0.0778 0.3557 0.3557 0.0778 92 96 104 98.6 90 95 100 105 X -1.11 0.37 1.42 -1.42 -0.37
0.00
110 Z
b) n
2077
área
Frecuencias esperadas
0.0778 0.3557 0.133 0.3557 0.0778
161.5906 738.7889 276.241 738.7889 161.5906
c) Valor de la variable
View more...
Comments