Laboratorio #10

April 20, 2024 | Author: Anonymous | Category: N/A
Share Embed Donate


Short Description

Download Laboratorio #10...

Description

UNIVERSIDAD NACIONAL DE SAN AGUSTÍN FACULTAD DE INGENIERÍA DE PROCESOS ESCUELA PROFESIONAL DE INGENIERÍA QUÍMICA

«DISTRIBUCIÓN T DE STUDENT Y CHI-CUADRADO»

ASIGNATURA

:

ESTADÍSTICA Y DISEÑO EXPERIMENTAL

LABORATORIO

:

N° 11

PRESENTADO POR

:

NÚÑEZ CCASA ÁNGEL YOEL

Julio, Arequipa 2022

Diseño Experimental para Ingeniería

Dr. Alejandro Salas B.

GUÍA DE PRÁCTICAS DISTRIBUCIÓN t DE STUDENT y DISTRIBUCIÓN CHI-CUADRADO 1.

TEMA a. DISTRIBUCIÓN T STUDENT

Descrita por William S. Gosset en 1908. Publicaba bajo el pseudónimo de «Studente» mientras trabajaba para la cervecería Guinnes en Irlanda. Está diseñada para probar hipótesis en estudios con muestras pequeñas menores a 30. La fórmula general para la T de Student es la siguiente:

t=

X−μ σ √n

En donde el numerador representa la diferencia a probar y el denominador la desviación estándar de la diferencia llamado también Error Estándar. En esta fórmula t representa al valor estadístico que estamos buscando X es el promedio de la variable analizada de la muestra, y µ es el promedio poblacional de la variable a estudiar. En el denominador tenemos a σ como representativo de la desviación estándar de la muestra y n el tamaño de ésta. Grados libertad El número de grados de libertad es igual al tamaño de la muestra (número de observaciones independientes) menos 1.

gl=df =( n−1 ) Si pudiera expresar en un cierto número de pasos para resolver un problema de t de student tendría que declarar los siguientes: PASO 1 Plantear la hipótesis nula (H0) y la hipótesis alternativa (H1). La hipótesis alternativa plantea matemáticamente lo que queremos demostrar, en tanto que la hipótesis nula plantea exactamente lo contrario. PASO 2 Determinar el nivel de significancia (rango de aceptación de la hipótesis alternativa), a. Se considera un nivel alfa de: 0.05 para proyectos de investigación; 0.01 para aseguramiento de la calidad; y 0.10 para estudios o encuestas de mercadotecnia. PASO 3 Evidencia muestral, se calcula la media y la desviación estándar a partir de la muestra.

Diseño Experimental para Ingeniería

Dr. Alejandro Salas B.

PASO 4 Se aplica la distribución T de Student para calcular la probabilidad de error por medio la fórmula general presentada al principio y se contrasta con el valor de T obtenido de la tabla correspondiente. PASO 5 En base a la evidencia disponible se acepta o se rechaza la hipótesis alternativa. Si la probabilidad de error (p) es mayor que el nivel de significancia se rechaza la hipótesis alternativa. Si la probabilidad de error (p) es menor que el nivel de significancia se acepta la hipótesis alternativa. Por supuesto que al final lo que tenemos que contrastar es el valor de T que hayamos obtenido en el problema contra el valor de T crítico que obtenemos de la tabla de T de Student.

Diseño Experimental para Ingeniería

Dr. Alejandro Salas B.

Si el resultado del problema cae en la región de H 0 se acepta ésta, de lo contrario se rechaza. Por supuesto, si se rechaza H0 aceptarás H1.

En la gráfica precedente se aprecian las regiones de aceptación y de rechazo con respecto a H 0. b. DISTRIBUCIÓN CHI-CUADRADO La prueba Chi-cuadrado, también llamada ji cuadrado (X 2), se encuentra dentro de las pruebas pertenecientes a la estadística descriptiva, concretamente la estadística descriptica aplicada al estudio de dos variables. Por su parte, la estadística descriptiva se centra en extraer información sobre la muestra. En cambio, la estadística inferencial extrae información sobre la población. El nombre de la prueba es propio de la distribución Chi-cuadrado de la probabilidad en la que se basa. Esta prueba fue desarrollada en el año 1900 por Karl Pearson. La prueba Chi-cuadrado es una de las más conocidas y utilizadas para analizar variables nominales o cualitativas, es decir, para determinar la existencia o no de independencia entre dos variables. Que dos variables sean independientes significa que no tienen relación, y que por lo tanto una no depende de la otra, ni viceversa. Así, son el estudio de la independencia, se origina también un método para verificar si las frecuencias observadas en cada categoría son compatibles con la independencia entre ambas variables. Esta prueba puede utilizarse incluso con datos medibles en una escala nominal. La hipótesis nula de la prueba Chi-cuadrado postula una distribución de la probabilidad totalmente especificada como el modelo matemático de la población que ha generado la muestra. Par realizar este contraste se disponen los datos en una tabla de frecuencias. Para cada valor o intervalo de valores se indica la frecuencia absoluta observada o empírica (Oi). A continuación, y suponiendo que la hipótesis nula es cierta, se calculan para cada valor o intervalo de valores la frecuencia absoluta que cabría esperar o frecuencia esperada. El estadístico de prueba se basa en las diferencias entre Oi y Ei; se define como:

Diseño Experimental para Ingeniería

k

X =∑ 2

i=1

Dr. Alejandro Salas B.

( Oi−Ei )2 Ei

Este estadístico tiene una distribución Chi-cuadrado con k-1 grados de libertad si n es suficiente grande, es decir, si todas las frecuencias esperadas son mayores que 5. En la práctica se tolera un máximo de 20% de frecuencias inferiores a 5. Si existe concordancia perfecta entre las frecuencias observadas y las esperadas el estadístico tomará un valor igual a 0; por el contrario, si existe una gran discrepancia entre estas frecuencias el estadístico tomará un valor grande y, en consecuencia, se rechazará la hipótesis nula. Así, la región crítica estará situada en el extremo superior de la distribución Chi-cuadrado con k-1 grados de libertad.

Diseño Experimental para Ingeniería

2.

Dr. Alejandro Salas B.

CONTENIDO Las Distribuciones de t de Student y Chi-Cuadrado son de suma importancia para la verificación de experimentos y validar procesos a nivel piloto o de la industria. La distribución de probabilidad de la T de Student nos permitirá estimar el valor de la media poblacional de una variable aleatoria que sigue una distribución normal cuando el parámetro se extrae de una muestra pequeña y se desconoce la varianza poblacional. El estadístico Chi-Cuadrado (o Ji cuadrado), que tiene distribución de probabilidad del mismo nombre, nos servirá para someter a prueba las hipótesis referidas a distribuciones de frecuencias. En términos generales, esta prueba contrasta frecuencias observadas con las frecuencias esperadas de acuerdo con la hipótesis nula.

3.

OBJETIVO a) Representar los factores, que intervienen en la Elaboración de las Distribuciones t de Student y Chi-Cuadrado. b) Uso del software SPSS y EXCEL

4.

PROCEDIMIENTO Se ejecutarán varias funciones o procesos que se requieren para la elaboración de verificación de Chi -Cuadrado o t de Student. PROBLEMA PLANTEADO Se toma una muestra aleatoria de 2200 familias y se les clasifica en una tabla de doble entrada según su nivel de ingresos (alto, medio, bajo) y el tipo de colegio a la que envían sus hijos. La siguiente tabla muestra los resultados obtenidos: TIPO DE COLEGIO INGRESO S ALTO MEDIO BAJO TOTAL

PRIVADO

PÚBLICO

TOTAL

506 438 215 1159

494 162 385 1041

1000 600 600 2200

¿A un nivel de significancia del 5% hay una razón para creer que el ingreso y el tipo de colegio no son variables independientes? SOLUCIÓN Tenemos que hallar el valor crítico Chi-cuadrado.

Diseño Experimental para Ingeniería

Grados

Dr. Alejandro Salas B.

de

libertad TIPO DE COLEGIO INGRESOS PRIVADO PÚBLICO TOTAL v=(Cantidad de filas−1)∗(Cantidad de columnas−1) ALTO 506 494 1000 v=( 3−1 )∗( 2−1 ) MEDIO 438 162 600 v=2 BAJO 215 385 600 Nivel de significancia TOTAL 1159 1041 2200 En el problema nos indica trabajar con 5%, así que trabajaremos con 0.05. Valor del parámetro

p=1−nivel de significancia p=1−0.05 p=0.95 En la tabla de Chi-cuadrado, tenemos que buscar el valor con dos grados de libertad y con una probabilidad de 0.95. Entonces, nuestra gráfica:

obtenemos

Ahora, tenemos que VALOR Chi-cuadrado.

hallar el CALCULADO

Para hallar dichos usaremos la siguiente

valores, fórmula.

f esperada=

Total Columna∗Total Fila Suma total

Tendremos que usar la fórmula para cada uno de los valores de la frecuencia del valor observado.

1159∗1000 =526.818 2200 1159∗600 f 438= =316.091 2200 1159∗600 f 215= =316.091 2200

f 506=

1041∗1000 =473.182 2200 1041∗600 f 162= =283.909 2200 1041∗600 f 385= =283.909 2200

f 494=

Dr. Alejandro Salas B.

Diseño Experimental para Ingeniería

Ahora tenemos dos tablas con las que podemos calcular el chi-cuadrado Frecuencia del Valor Observado Frecuencia del Valor Calculado INGRESOS ALTO MEDIO BAJO

TIPO DE COLEGIO PRIVADO PÚBLICO 526.81818 316.09091 316.09091

TIPO DE COLEGIO INGRESOS PRIVADO PÚBLICO ALTO 506 494 MEDIO 438 162 BAJO 215 385 TOTAL 1159 1041

473.18182 283.90909 283.90909

TOTAL 1000 600 600 2200

Diseño Experimental para Ingeniería

Dr. Alejandro Salas B.

Luego se procede a realizar los requerimientos del problema, la fórmula de Chi-cuadrado.

( fo−fe )2 X =∑ fe i=1 2

fobservado 506 438 215 494 162 385

fesperado 526.81818 316.09091 316.09091 473.18182 283.90909 283.90909

k

fo-fe -20.81818 121.90909 -101.0909 20.818182 -121.9091 101.09091

(fo-fe)^2 433.39669 14861.826 10219.372 433.39669 14861.826 10219.372

(fo-fe)^2/fe 0.82266844 47.01757 32.3304834 0.91592001 52.3471313 35.995226

TOTAL

169.428999

Entonces el Valor calculado de Chi-cuadrado es 169.429, y lo interpretamos en la gráfica para poder hallar la respuesta.

RPTA: Según la gráfica, el valor calculado es mucho mayor al valor crítico, por lo que podemos concluir con el concluir y resolver el problema propuesto: La educación de los niños DEPENDE, de los ingresos de los padres; y estos pueden tener ingresos ALTOS, MEDIOS, y BAJOS. Y los tipos de educación son PÚBLICO y PRIVADO.

Diseño Experimental para Ingeniería

Dr. Alejandro Salas B.

CÁLCULOS REALIZADOS EN EL PROGRAMA DE SPSS DEL MISMO EJERCICIO, PARA COMPROBAR LAS SIMILITUDES, Y LAS VÍAS QUE UNO TIENE PARA PODER RESOLVER EJERCICIOS.

WEIGHT BY FRECUENCIA. CROSSTABS /TABLES=INGRESOS BY COLEGIO /FORMAT=AVALUE TABLES /STATISTICS=CHISQ /CELLS=COUNT EXPECTED ROW COLUMN TOTAL /COUNT ROUND CELL. Tablas de contingencia Notas Resultados creados Comentarios Entrada

10-JUL-2022 10:39:58 Conjunto de datos activo Filtro Peso Dividir archivo

Conjunto_de_datos0 FRECUENCIA

Dr. Alejandro Salas B.

Diseño Experimental para Ingeniería

Núm. de filas del archivo de trabajo Definición de los perdidos Tratamiento de los valores perdidos Casos utilizados

Sintaxis

Tiempo de procesador

6 Los valores perdidos definidos por el usuario serán tratados como perdidos. Los estadísticos de las tablas se basan en todos los casos con datos válidos en los rangos especificados para todas las variables de las tablas. CROSSTABS /TABLES=INGRESOS BY COLEGIO /FORMAT=AVALUE TABLES /STATISTICS=CHISQ /CELLS=COUNT EXPECTED ROW COLUMN TOTAL /COUNT ROUND CELL. 00:00:00.00

Tiempo transcurrido Recursos

00:00:00.02

Dimensiones solicitadas

2

Casillas disponibles

131029

[Conjunto_de_datos0] Resumen del procesamiento de los casos Casos Válidos N INGRESOS * COLEGIO

2200

Porcentaje 100,0%

Perdidos N

Total

Porcentaje 0

0,0%

N 2200

Tabla de contingencia INGRESOS * COLEGIO COLEGIO

Total

Porcentaje 100,0%

Dr. Alejandro Salas B.

Diseño Experimental para Ingeniería

PRIVAD PÚBLICO O Recuento

506

494

1000

526,8

473,2

1000,0

% dentro de INGRESOS

50,6%

49,4%

100,0%

% dentro de COLEGIO

43,7%

47,5%

45,5%

% del total

23,0%

22,5%

45,5%

438

162

600

316,1

283,9

600,0

% dentro de MEDIO INGRESOS

73,0%

27,0%

100,0%

% dentro de COLEGIO

37,8%

15,6%

27,3%

% del total

19,9%

7,4%

27,3%

215

385

600

316,1

283,9

600,0

% dentro de INGRESOS

35,8%

64,2%

100,0%

% dentro de COLEGIO

18,6%

37,0%

27,3%

9,8% 1159

17,5% 1041

27,3% 2200

Frecuencia esperada

1159,0

1041,0

2200,0

% dentro de INGRESOS

52,7%

47,3%

100,0%

% dentro de COLEGIO

100,0%

100,0%

100,0%

52,7%

47,3%

100,0%

Frecuencia esperada ALTO

Recuento Frecuencia esperada INGRESO S

Recuento Frecuencia esperada BAJO

% del total Recuento

Total

% del total Pruebas de chi-cuadrado Valor

gl

Sig. asintótica (bilateral)

Diseño Experimental para Ingeniería

Chi-cuadrado de Pearson Razón de verosimilitudes Asociación lineal por lineal N de casos válidos

169,429a

2

,000

174,511

2

,000

16,917

1

,000

Dr. Alejandro Salas B.

2200

a. 0 casillas (0,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima esperada es 283,91. Advertencia # 3211 En al menos un caso, el valor de la variable de ponderación era cero, negativa o faltaba. Estos casos no son visibles para procedimientos estadísticos y gráficos que necesiten casos ponderados positivamente, pero permanecen en el archivo y se procesan mediante unidades no stadísticas como LIST y SAVE.

5. CONCLUSIONES En esta sesión se hizo la representación de los factores que interviene en la resolución de T Student y Chi-cuadrado, se puede resolver ejercicios en los programas de SPSS y EXCEL, en los que se aprendió a aplicar las fórmulas y conceptos hechos en las clases de teoría. La aplicación de las distribuciones T Student y Chi-cuadrado, se puede dar en el día a día; podemos usarlo en cualquier problema en los que se pueda comparar variables y trabajar con hipótesis. 6. BIBLIOGRAFÍA     

https://estadisticaeninvestigacion.wordpress.com/distribucion-t-de-student/ H. GUTIÉRREZ, R, DE LA VARA, ESTADÍSTICA Y DISEÑO EXPERIMENTAL, SEGUNDA EDICIÓN, 2008. https://www.ucm.es/data/cont/media/www/pag-54183/APUNTES%20ESTAD %C3%8DSTICA%203.pdf http://labrad.fisica.edu.uy/docs/tabla_chi_cuadrado.pdf https://economipedia.com/definiciones/distribucion-t-de-student.html

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF