Kolmogorov Smirnov

May 22, 2019 | Author: Rafael Olguin Arreola | Category: Normal Distribution, Statistics, Probability Distribution, Poisson Distribution, Statistical Theory

Share Embed Donate

Report this link

Short Description

Download Kolmogorov Smirnov...

Description

INSTITUTO TECNOLÓGICO DE QUERÉTARO

CARRERA ING. LOGÍSTICA

MATERIA ESTADÍSTICA INFERENCIA I

TRABAJO DE UNIDAD PRUEBAS NO PARAMÉTRICAS “KOLMOGOROV-SMIRNOV” GRUPO 9V PRESENTA NOMBRE

NO.CONTROL

BACILIO SOFIA GRACIELA

11141041

SERRANO PEREZ MIGUEL ANGEL

11141067

ARGUELLO LARA BLANCA ENEDINA

11141038

DOMÍNGUEZ HERNÁNDEZ ANGÉLICA

11141047

PROFESOR TUTOR M.C. PATRICIA YSCAPA MORÁN

Miércoles 22 de mayo del 2013.

Kolmogorov-Smirnov Pruebas no paramétricas Introducción En este proyecto se dará a conocer la prueba no paramétrica llamada kolmogorov-Smirnov que tiene como propósito el probar si existe una diferencia significativa entre una distribución de frecuencias observadas y una distribución de frecuencias teóricas. La prueba de K-S de es uno de los métodos no paramétricos más útiles y generales para la comparación de dos muestras, ya que es sensible a las diferencias tanto de ubicación y la forma de las funciones de distribución acumulativa empírica. Una parte importante de esta prueba se encuentra en el estadístico de K-S, Dn es particularmente útil para juzgar que tan cerca está la distribución de Fo respecto a Fe.

Objetivo Se pretende utilizar las herramientas estadísticas implementadas en la prueba de kolmogorov-Smirnov, con la finalidad de analizar el comportamiento de una población normal. Así como como saber cuáles son sus aplicaciones en nuestra carrera como ingenieros logísticos.

Desarrollo En estadística, la prueba de Kolmogorov-Smirnov (también prueba K-S) es una prueba no paramétrica que se utiliza para determinar la bondad de ajuste de dos probabilidad entre sí. La prueba de kolmogorov-Smirnov para una muestra se considera un procedimiento de “bondad de ajuste”, es decir, permite medir el grado de concordancia existente entre la distribución de un conjunto de datos y una distribución teórica específica. Su objetivo es señalar si los datos provienen de una población que tiene la distribución teórica específica. Mediante la prueba se compara la distribución acumulada de las frecuencias teóricas con la distribución acumulada de las frecuencias observadas, se encuentra el punto de divergencia máxima y se determina que probabilidad existe que una diferencia de esa magnitud se da al azar.

La prueba de Kolmogorov-Smirnov puede ser modificado para servir como una bondad de ajuste de prueba. En el caso especial de las pruebas de normalidad de la distribución, las muestras están normalizados y en comparación con una distribución normal estándar. Esto es equivalente a establecer la media y la varianza de la distribución de referencia igual a las estimaciones de la muestra, y se sabe que el uso de estos para definir la distribución de referencia específica cambia la distribución nula de la estadística de prueba: ver a continuación . Varios estudios han encontrado que, incluso en esta forma se corrige, la prueba es menos potente para probar la normalidad de la prueba de Shapiro-Wilk o Anderson-Darling prueba . En resumen si la distancia entre las frecuencias esperadas y las frecuencias observadas no es significativa, entonces la distribución teórica describe bien la distribución observada.

Aplicaciones de la prueba. Para pronosticar la eficiencia de un proceso o técnicas en los diferentes departamentos administrativos.

Pasos a seguir para resolver los problemas de esta prueba: 1. 2. 3. 4. 5. 6.

Datos. Hipótesis. Grafica en caso de necesitarla. Obtener frecuencia acumulada observada. Obtener frecuencia acumulada observada relativa. Obtener la frecuencia acumulada observada esperada (según la distribución que se pida). 7. Obtener valor crítico. 8. Obtener el estadístico. 9. Conclusión. Hipótesis H0: Los datos analizados siguen una distribución M. H1: Los datos analizados no siguen una distribución M. Si el valor critico es mayor que el estadístico se acepta Ho.

Formulas Frecuencia acumulativa observada relativa: Cada valor de frecuencia acumulada / total de la muestra Frecuencia acumulada observada esperada: Se obtiene con la distribución que te pide el ejercicio. Poisson, distribución normal, binomial, etc. Estadístico: Dn= máx. │Fe-Fo│ Valor crítico: En las tablas del apéndice 8 donde necesitamos α (alfa) y tamaño de la muestra.

Conclusión. Haber resuelto ejercicios de esta prueba, nos dimos cuenta de que tipos de distribución (Poisson, distribución normal o binomial) nos pueden ayudar para poder resolverlos. Además como utilizar la formula Dn y la tabla de significancia. El conocer y saber manejar las pruebas no paramétricas, en este caso K-S, nos permite tener una amplia teoría para poder utilizarla en algún futuro cuando nos desarrollemos como Ingenieros en Logística especialmente usándola como herramienta de toma de decisiones para pronosticar resultados y nos permita hacer una análisis de que tan factible es tomar cierta decisión y hacia donde se inclinan nuestros datos, valores etc.

Ejercicios resueltos. 1. Al nivel de significancia de 0.05. ¿podemos concluir que los siguientes datos provienen de una distribución de Poisson con λ=3? Número de llegadas por día

0

Número 6 de días

1

2

3

4

5

6o+

18

30

24

11

2

9

1) Datos Nivel de significancia de .05 λ= 3 Distribución Poisson n = 100 2) Ho; los datos provienen de una distribución de Poisson con λ =3 H1; los datos no provienen de una distribución de Poisson con λ =3

4-6) Obtener las tablas No. Llegadas 0 1 2 3 4 5 6

7) Valor critico

fo acumula da

fo 6 18 30 24 11 2 9

6 24 54 78 89 91 100

frecuencia acumulativa observada relativa 0,06 0,24 0,54 0,78 0,89 0,91 1

frecuencia acumulativa observada esperada 0,049787068 0,149361205 0,224041808 0,224041808 0,168031356 0,100818813 0,050409407

│Fe-Fo│ 0,10978707 0,09063879 0,31595819 0,55595819 0,72196864 0,80918119 0,94959059

1.36/√100 = 0.1360 8) Estadístico Dn= 0.95 en X= 6 0.1360 < 0.95 Así que rechazamos Ho. 9) conclusión: los datos obtenidos no pertenecen a la distribución de Poisson con λ =3.

2. La siguiente es una distribución de frecuencias observadas. Utilice la distribución normal con M= 98.6 y σ= 3.78. a) Encuentre la probabilidad de caer en cada clase. b) Del inciso a), calcule la frecuencia esperada de cada categoría. c) Calcule Dn. d) Para un nivel de significancia de 0.10 ¿parece que esta distribución está bien descrita por la distribución normal sugerida? Valor de la < 92 variable Frecuencia 69 observada a)

92-95.99

96-99.99

408

842

100103.99 621

≥ 104 137

Gráfica de distribución

Normal, Media=98.6, Desv.Est.=3.78 0.12 0.10

Densidad

0.08 0.06 0.04 0.02 0.1330 0.0778 0.3557 0.3557 0.0778 92 96 104 98.6 90 95 100 105 X -1.11 0.37 1.42 -1.42 -0.37

0.00

110 Z

b) n

2077

área

Frecuencias esperadas

0.0778 0.3557 0.133 0.3557 0.0778

161.5906 738.7889 276.241 738.7889 161.5906

c) Valor de la variable

Kolmogorov Smirnov

Short Description

Description

Comments

We need your help!