Laboratorio #10
April 20, 2024 | Author: Anonymous | Category: N/A
Short Description
Download Laboratorio #10...
Description
UNIVERSIDAD NACIONAL DE SAN AGUSTÍN FACULTAD DE INGENIERÍA DE PROCESOS ESCUELA PROFESIONAL DE INGENIERÍA QUÍMICA
«DISTRIBUCIÓN T DE STUDENT Y CHI-CUADRADO»
ASIGNATURA
:
ESTADÍSTICA Y DISEÑO EXPERIMENTAL
LABORATORIO
:
N° 11
PRESENTADO POR
:
NÚÑEZ CCASA ÁNGEL YOEL
Julio, Arequipa 2022
Diseño Experimental para Ingeniería
Dr. Alejandro Salas B.
GUÍA DE PRÁCTICAS DISTRIBUCIÓN t DE STUDENT y DISTRIBUCIÓN CHI-CUADRADO 1.
TEMA a. DISTRIBUCIÓN T STUDENT
Descrita por William S. Gosset en 1908. Publicaba bajo el pseudónimo de «Studente» mientras trabajaba para la cervecería Guinnes en Irlanda. Está diseñada para probar hipótesis en estudios con muestras pequeñas menores a 30. La fórmula general para la T de Student es la siguiente:
t=
X−μ σ √n
En donde el numerador representa la diferencia a probar y el denominador la desviación estándar de la diferencia llamado también Error Estándar. En esta fórmula t representa al valor estadístico que estamos buscando X es el promedio de la variable analizada de la muestra, y µ es el promedio poblacional de la variable a estudiar. En el denominador tenemos a σ como representativo de la desviación estándar de la muestra y n el tamaño de ésta. Grados libertad El número de grados de libertad es igual al tamaño de la muestra (número de observaciones independientes) menos 1.
gl=df =( n−1 ) Si pudiera expresar en un cierto número de pasos para resolver un problema de t de student tendría que declarar los siguientes: PASO 1 Plantear la hipótesis nula (H0) y la hipótesis alternativa (H1). La hipótesis alternativa plantea matemáticamente lo que queremos demostrar, en tanto que la hipótesis nula plantea exactamente lo contrario. PASO 2 Determinar el nivel de significancia (rango de aceptación de la hipótesis alternativa), a. Se considera un nivel alfa de: 0.05 para proyectos de investigación; 0.01 para aseguramiento de la calidad; y 0.10 para estudios o encuestas de mercadotecnia. PASO 3 Evidencia muestral, se calcula la media y la desviación estándar a partir de la muestra.
Diseño Experimental para Ingeniería
Dr. Alejandro Salas B.
PASO 4 Se aplica la distribución T de Student para calcular la probabilidad de error por medio la fórmula general presentada al principio y se contrasta con el valor de T obtenido de la tabla correspondiente. PASO 5 En base a la evidencia disponible se acepta o se rechaza la hipótesis alternativa. Si la probabilidad de error (p) es mayor que el nivel de significancia se rechaza la hipótesis alternativa. Si la probabilidad de error (p) es menor que el nivel de significancia se acepta la hipótesis alternativa. Por supuesto que al final lo que tenemos que contrastar es el valor de T que hayamos obtenido en el problema contra el valor de T crítico que obtenemos de la tabla de T de Student.
Diseño Experimental para Ingeniería
Dr. Alejandro Salas B.
Si el resultado del problema cae en la región de H 0 se acepta ésta, de lo contrario se rechaza. Por supuesto, si se rechaza H0 aceptarás H1.
En la gráfica precedente se aprecian las regiones de aceptación y de rechazo con respecto a H 0. b. DISTRIBUCIÓN CHI-CUADRADO La prueba Chi-cuadrado, también llamada ji cuadrado (X 2), se encuentra dentro de las pruebas pertenecientes a la estadística descriptiva, concretamente la estadística descriptica aplicada al estudio de dos variables. Por su parte, la estadística descriptiva se centra en extraer información sobre la muestra. En cambio, la estadística inferencial extrae información sobre la población. El nombre de la prueba es propio de la distribución Chi-cuadrado de la probabilidad en la que se basa. Esta prueba fue desarrollada en el año 1900 por Karl Pearson. La prueba Chi-cuadrado es una de las más conocidas y utilizadas para analizar variables nominales o cualitativas, es decir, para determinar la existencia o no de independencia entre dos variables. Que dos variables sean independientes significa que no tienen relación, y que por lo tanto una no depende de la otra, ni viceversa. Así, son el estudio de la independencia, se origina también un método para verificar si las frecuencias observadas en cada categoría son compatibles con la independencia entre ambas variables. Esta prueba puede utilizarse incluso con datos medibles en una escala nominal. La hipótesis nula de la prueba Chi-cuadrado postula una distribución de la probabilidad totalmente especificada como el modelo matemático de la población que ha generado la muestra. Par realizar este contraste se disponen los datos en una tabla de frecuencias. Para cada valor o intervalo de valores se indica la frecuencia absoluta observada o empírica (Oi). A continuación, y suponiendo que la hipótesis nula es cierta, se calculan para cada valor o intervalo de valores la frecuencia absoluta que cabría esperar o frecuencia esperada. El estadístico de prueba se basa en las diferencias entre Oi y Ei; se define como:
Diseño Experimental para Ingeniería
k
X =∑ 2
i=1
Dr. Alejandro Salas B.
( Oi−Ei )2 Ei
Este estadístico tiene una distribución Chi-cuadrado con k-1 grados de libertad si n es suficiente grande, es decir, si todas las frecuencias esperadas son mayores que 5. En la práctica se tolera un máximo de 20% de frecuencias inferiores a 5. Si existe concordancia perfecta entre las frecuencias observadas y las esperadas el estadístico tomará un valor igual a 0; por el contrario, si existe una gran discrepancia entre estas frecuencias el estadístico tomará un valor grande y, en consecuencia, se rechazará la hipótesis nula. Así, la región crítica estará situada en el extremo superior de la distribución Chi-cuadrado con k-1 grados de libertad.
Diseño Experimental para Ingeniería
2.
Dr. Alejandro Salas B.
CONTENIDO Las Distribuciones de t de Student y Chi-Cuadrado son de suma importancia para la verificación de experimentos y validar procesos a nivel piloto o de la industria. La distribución de probabilidad de la T de Student nos permitirá estimar el valor de la media poblacional de una variable aleatoria que sigue una distribución normal cuando el parámetro se extrae de una muestra pequeña y se desconoce la varianza poblacional. El estadístico Chi-Cuadrado (o Ji cuadrado), que tiene distribución de probabilidad del mismo nombre, nos servirá para someter a prueba las hipótesis referidas a distribuciones de frecuencias. En términos generales, esta prueba contrasta frecuencias observadas con las frecuencias esperadas de acuerdo con la hipótesis nula.
3.
OBJETIVO a) Representar los factores, que intervienen en la Elaboración de las Distribuciones t de Student y Chi-Cuadrado. b) Uso del software SPSS y EXCEL
4.
PROCEDIMIENTO Se ejecutarán varias funciones o procesos que se requieren para la elaboración de verificación de Chi -Cuadrado o t de Student. PROBLEMA PLANTEADO Se toma una muestra aleatoria de 2200 familias y se les clasifica en una tabla de doble entrada según su nivel de ingresos (alto, medio, bajo) y el tipo de colegio a la que envían sus hijos. La siguiente tabla muestra los resultados obtenidos: TIPO DE COLEGIO INGRESO S ALTO MEDIO BAJO TOTAL
PRIVADO
PÚBLICO
TOTAL
506 438 215 1159
494 162 385 1041
1000 600 600 2200
¿A un nivel de significancia del 5% hay una razón para creer que el ingreso y el tipo de colegio no son variables independientes? SOLUCIÓN Tenemos que hallar el valor crítico Chi-cuadrado.
Diseño Experimental para Ingeniería
Grados
Dr. Alejandro Salas B.
de
libertad TIPO DE COLEGIO INGRESOS PRIVADO PÚBLICO TOTAL v=(Cantidad de filas−1)∗(Cantidad de columnas−1) ALTO 506 494 1000 v=( 3−1 )∗( 2−1 ) MEDIO 438 162 600 v=2 BAJO 215 385 600 Nivel de significancia TOTAL 1159 1041 2200 En el problema nos indica trabajar con 5%, así que trabajaremos con 0.05. Valor del parámetro
p=1−nivel de significancia p=1−0.05 p=0.95 En la tabla de Chi-cuadrado, tenemos que buscar el valor con dos grados de libertad y con una probabilidad de 0.95. Entonces, nuestra gráfica:
obtenemos
Ahora, tenemos que VALOR Chi-cuadrado.
hallar el CALCULADO
Para hallar dichos usaremos la siguiente
valores, fórmula.
f esperada=
Total Columna∗Total Fila Suma total
Tendremos que usar la fórmula para cada uno de los valores de la frecuencia del valor observado.
1159∗1000 =526.818 2200 1159∗600 f 438= =316.091 2200 1159∗600 f 215= =316.091 2200
f 506=
1041∗1000 =473.182 2200 1041∗600 f 162= =283.909 2200 1041∗600 f 385= =283.909 2200
f 494=
Dr. Alejandro Salas B.
Diseño Experimental para Ingeniería
Ahora tenemos dos tablas con las que podemos calcular el chi-cuadrado Frecuencia del Valor Observado Frecuencia del Valor Calculado INGRESOS ALTO MEDIO BAJO
TIPO DE COLEGIO PRIVADO PÚBLICO 526.81818 316.09091 316.09091
TIPO DE COLEGIO INGRESOS PRIVADO PÚBLICO ALTO 506 494 MEDIO 438 162 BAJO 215 385 TOTAL 1159 1041
473.18182 283.90909 283.90909
TOTAL 1000 600 600 2200
Diseño Experimental para Ingeniería
Dr. Alejandro Salas B.
Luego se procede a realizar los requerimientos del problema, la fórmula de Chi-cuadrado.
( fo−fe )2 X =∑ fe i=1 2
fobservado 506 438 215 494 162 385
fesperado 526.81818 316.09091 316.09091 473.18182 283.90909 283.90909
k
fo-fe -20.81818 121.90909 -101.0909 20.818182 -121.9091 101.09091
(fo-fe)^2 433.39669 14861.826 10219.372 433.39669 14861.826 10219.372
(fo-fe)^2/fe 0.82266844 47.01757 32.3304834 0.91592001 52.3471313 35.995226
TOTAL
169.428999
Entonces el Valor calculado de Chi-cuadrado es 169.429, y lo interpretamos en la gráfica para poder hallar la respuesta.
RPTA: Según la gráfica, el valor calculado es mucho mayor al valor crítico, por lo que podemos concluir con el concluir y resolver el problema propuesto: La educación de los niños DEPENDE, de los ingresos de los padres; y estos pueden tener ingresos ALTOS, MEDIOS, y BAJOS. Y los tipos de educación son PÚBLICO y PRIVADO.
Diseño Experimental para Ingeniería
Dr. Alejandro Salas B.
CÁLCULOS REALIZADOS EN EL PROGRAMA DE SPSS DEL MISMO EJERCICIO, PARA COMPROBAR LAS SIMILITUDES, Y LAS VÍAS QUE UNO TIENE PARA PODER RESOLVER EJERCICIOS.
WEIGHT BY FRECUENCIA. CROSSTABS /TABLES=INGRESOS BY COLEGIO /FORMAT=AVALUE TABLES /STATISTICS=CHISQ /CELLS=COUNT EXPECTED ROW COLUMN TOTAL /COUNT ROUND CELL. Tablas de contingencia Notas Resultados creados Comentarios Entrada
10-JUL-2022 10:39:58 Conjunto de datos activo Filtro Peso Dividir archivo
Conjunto_de_datos0 FRECUENCIA
Dr. Alejandro Salas B.
Diseño Experimental para Ingeniería
Núm. de filas del archivo de trabajo Definición de los perdidos Tratamiento de los valores perdidos Casos utilizados
Sintaxis
Tiempo de procesador
6 Los valores perdidos definidos por el usuario serán tratados como perdidos. Los estadísticos de las tablas se basan en todos los casos con datos válidos en los rangos especificados para todas las variables de las tablas. CROSSTABS /TABLES=INGRESOS BY COLEGIO /FORMAT=AVALUE TABLES /STATISTICS=CHISQ /CELLS=COUNT EXPECTED ROW COLUMN TOTAL /COUNT ROUND CELL. 00:00:00.00
Tiempo transcurrido Recursos
00:00:00.02
Dimensiones solicitadas
2
Casillas disponibles
131029
[Conjunto_de_datos0] Resumen del procesamiento de los casos Casos Válidos N INGRESOS * COLEGIO
2200
Porcentaje 100,0%
Perdidos N
Total
Porcentaje 0
0,0%
N 2200
Tabla de contingencia INGRESOS * COLEGIO COLEGIO
Total
Porcentaje 100,0%
Dr. Alejandro Salas B.
Diseño Experimental para Ingeniería
PRIVAD PÚBLICO O Recuento
506
494
1000
526,8
473,2
1000,0
% dentro de INGRESOS
50,6%
49,4%
100,0%
% dentro de COLEGIO
43,7%
47,5%
45,5%
% del total
23,0%
22,5%
45,5%
438
162
600
316,1
283,9
600,0
% dentro de MEDIO INGRESOS
73,0%
27,0%
100,0%
% dentro de COLEGIO
37,8%
15,6%
27,3%
% del total
19,9%
7,4%
27,3%
215
385
600
316,1
283,9
600,0
% dentro de INGRESOS
35,8%
64,2%
100,0%
% dentro de COLEGIO
18,6%
37,0%
27,3%
9,8% 1159
17,5% 1041
27,3% 2200
Frecuencia esperada
1159,0
1041,0
2200,0
% dentro de INGRESOS
52,7%
47,3%
100,0%
% dentro de COLEGIO
100,0%
100,0%
100,0%
52,7%
47,3%
100,0%
Frecuencia esperada ALTO
Recuento Frecuencia esperada INGRESO S
Recuento Frecuencia esperada BAJO
% del total Recuento
Total
% del total Pruebas de chi-cuadrado Valor
gl
Sig. asintótica (bilateral)
Diseño Experimental para Ingeniería
Chi-cuadrado de Pearson Razón de verosimilitudes Asociación lineal por lineal N de casos válidos
169,429a
2
,000
174,511
2
,000
16,917
1
,000
Dr. Alejandro Salas B.
2200
a. 0 casillas (0,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima esperada es 283,91. Advertencia # 3211 En al menos un caso, el valor de la variable de ponderación era cero, negativa o faltaba. Estos casos no son visibles para procedimientos estadísticos y gráficos que necesiten casos ponderados positivamente, pero permanecen en el archivo y se procesan mediante unidades no stadísticas como LIST y SAVE.
5. CONCLUSIONES En esta sesión se hizo la representación de los factores que interviene en la resolución de T Student y Chi-cuadrado, se puede resolver ejercicios en los programas de SPSS y EXCEL, en los que se aprendió a aplicar las fórmulas y conceptos hechos en las clases de teoría. La aplicación de las distribuciones T Student y Chi-cuadrado, se puede dar en el día a día; podemos usarlo en cualquier problema en los que se pueda comparar variables y trabajar con hipótesis. 6. BIBLIOGRAFÍA
https://estadisticaeninvestigacion.wordpress.com/distribucion-t-de-student/ H. GUTIÉRREZ, R, DE LA VARA, ESTADÍSTICA Y DISEÑO EXPERIMENTAL, SEGUNDA EDICIÓN, 2008. https://www.ucm.es/data/cont/media/www/pag-54183/APUNTES%20ESTAD %C3%8DSTICA%203.pdf http://labrad.fisica.edu.uy/docs/tabla_chi_cuadrado.pdf https://economipedia.com/definiciones/distribucion-t-de-student.html
View more...
Comments