Reactivos ESTADISTICA11.pdf
Short Description
Download Reactivos ESTADISTICA11.pdf...
Description
Grupo # 1 1.- Supóngase que en un corral existen 400 pollos y de allí se toma una muestra aleatoria de 80 pollos. Determine la probabilidad de que el promedio de la muestra supere las 7.7 libras de peso si tiene una desviación estándar de 1.25 Distribución normal Muestreo (población infinita) Muestreo (población finita)
= 7.5 libras = 1.25 = 400 pollos = 80 pollos
tabla 0,445
Interpretación: Si se toma una muestra de 80 pollos de un total de 400, existe la probabilidad del 5.48% de que los pollos pesen en promedio por los menos 7,7 libras.
2.- Del mismo corral se escogieron una muestra de 100 pollos. Calcule la probabilidad de que el promedio supere las 7.4 libras
= 7.5 libras = 1.25 = 400 pollos = 100 pollos tabla 0,3212
Existe el 82.12% de probabilidad de que el promedio de una muestra tamaño de 100 tomada de una población de 400 pollos, tenga un peso promedio de mínimo 7.4 libras.
3.-En una institución financiera se reconoce que el salario promedio es igual a $13.80 con una desviación estándar de $2.25 por hora. Si se analiza 1 muestra de 18 empleados bancarios. Determine la probabilidad de que la muestra analizada tenga un salario promedio de por lo menos $14 por hora.
= $ 13,80 = $2,55 * hora = 18 emp. Tabla 0,1293
Interpretación: Existe el 37,07% de probabilidad de que el promedio de una muestra tamaño 18, promedio de que por lo menos ganen $14 por hora.
4.-Supongase que en la empresa bancaria hay un total de 56 trabajadores. Calcule las probabilidades de que el promedio de la muestra gane más de $14 la hora si la muestra es de 21 empleados
= 13,80 = 2,55 = 96 = 21
Tabla 0,1554
Interpretación: Existe el 34.46% de probabilidad de que el promedio de una muestra tamaño 21, tomada de una población de 96 gane mas de $14,oo
5.- Si dicha agencia detallada en el ejercicio anterior se toma una muestra de 26 trabajadores. Determine la probabilidad de que el salario promedio este entre $13.5 y $14.5 = 13,80 = 2,55 = 96 = 26
+
= 0.7064
Interpretación: Existe el 70.64% de probabilidad de que el promedio de una muestra tamaño 26, tomada de una población de 96 gane entre $13.5 y $14.5
Grupo N°2 1. El jefe de comercialización de una compañía envasadora de gas sospecha que los cilindro de uso domestico no se están despachando de manera correcta. Estos deben tener 15 kilos. El ejecutivo toma 35 cilindros de gas de manera aleatoria, los pesa individualmente y obtiene los siguientes resultados. Se requiere el 97% de confianza. 15 14.9 14.95 15.01 15
15 14.98 14.96 15 14.93
15.02 14.99 15 14.97 15
14.98 14.98 15.03 15.01 14.99
14.90 15.01 14.96 15 14.97
15 14.99 15 14.99 15
14.93 15.01 14.95 14.94 14.99
Datos n = 35 cilindros =14.9797 kilos S = 0.0325 kilos 0.015
97%
0.015
nc= 97% Σ x= 524.29 kilos Formula: û=
± ƻ.(s/
n)
Resolución û= 14.9797±2.17(0.0325/
35)
û=14.9797±2.17(0.005494) û=14.9797±0.0119 û=14.9797+0.0119= 14.99 kilos Lsc û=14.9797-0.0119= 14.97 kilos Lic Después de revisar el contenido de 35 cilindros de gas se estimo que el promedio de los cilindros de gas de uso domestico está entre 14.97 a 14.99 kilos, por lo que se evidencia que los cilindros no están siendo llenados de manera correcta bajo el 97% de confianza.
2. Un representante de la Universidad desea estimar el promedio de gastos semanales en estudios que tienen los estudiantes de Gestión Empresarial. Para esto se toma una muestra de estudiantes del cuarto semestre .Los datos son los siguientes: 10 5 8 10 15 5
10 9 10 10 10 25
10 15 15 10 10 5
15 9 10 10 10 10
7 10 10 15 10 20
10 8 25 15 10 10
8 15 10 15 6 5
10 10 15 20 20 25
25 12 5 10 10 15
15 5 20 20 8
Utilice un nivel de confianza de 94.5% n.c= 0.945/2=0.4725-----1.92 n=59 ×=12.03389 S=5.29790
0.0275
0.945
0.0275
10.71≤µ≤13.36 Interpretación: Realizan el debido estudio, se estima que los gastos promedio de los estudiantes están entre $10.71 y $13.36
3. El tiempo que tardan las cajeras de un supermercado en cobrar a los clientes sigue una ley normal con media desconocida y desviación típica 0,5 minutos. Para una muestra aleatoria de 25 clientes se obtuvo un tiempo medio de 5,2 minutos. 1. Calcula el intervalo de confianza al nivel del 95% para el tiempo medio que se tarda en cobrar a los clientes.
Interpretación: Después de preguntarle a 25 clientes se estima que la cajera tarda en cobrar un tiempo medio entre 5,004 a 5,396 minutos, bajo un nivel de confianza de 95%.
4. EJERCICIO Un representante de la Universidad desea estimar el promedio de gastos semanales en estudios que tienen los estudiantes de Gestión Empresarial. Para esto se toma una muestra de estudiantes del cuarto semestre .Los datos son los siguientes: 10 10 10 15 7 5 9 15 9 10 8 10 15 10 10 10 10 10 10 15 15 10 10 10 10 5 25 5 10 20 Utilice un nivel de confianza de 94.5%
10 8 25 15 10 10
8 15 10 15 6 5
10 10 15 20 20 25
25 12 5 10 10 15
15 5 20 20 8
n.c= 0.945/2=0.4725-----1.92 n=59 ×=12.03389 S=5.29790 0.0275
0.945
0.0275
10.71≤µ≤13.36
Interpretación: Realizan el debido estudio, se estima que los gastos promedio de los estudiantes están entre $10.71 y $13.36 5. El administrador de una empresa distribuidora de artículos de ferretería desea estirar el promedio de ventas diarias. Requiere para la información un nivel de confianza del 95%. Toma una muestra de 42 días y el promedio de la muestra es igual a 6800 con una desviación estándar igual a 2850. Calcule un intervalo de confianza. N = 42 días X = 6800 S = 2850 n. c = 95%
U = 7.661.94 L.S. U = 5.938.06 L. I. Interpretación: Después de revisar la facturación de 42 días se estima que el promedio de ventas está entre 5938.06 a 7661.94 bajo un nivel de confianza de 95%
Grupo# 3 Ejercicio: 1 Un organismo int. Desea estimar proporción/mujeres jóvenes que tienen un hábito de fumar de manera cotidiana. La información requiere un nivel de confianza del 95 % se consultó a una muestra de 3450 mujeres de las cuales 383 dijeron que fumaban de manera normal. Π= p = proporción muestral n=tamaño muestral p = 0.110 p= x/n a) Determine las variables n= 3450 mujeres Xi=383 π=Valor estimado b) Halle el valor de Zc en la tabla de distribución normal Zc=0.95/2=0.47501.96 c) Halle el valor estimado del ejercicio Π=0.110±1.96 Π=0.110±1.96(0.005348) Π=0.110± 0.0105Error de estimación Π=0.110 + 0.0105=0.121512.15% Π=0.110 - 0.0105=0.105510.05% d) Realice la interpretación de sus resultados Interpretación: Tomando como muestra un total de 3450 mujeres se estima que la proporción de jóvenes que fuman de manera cotidiana esta entre el 10,05% y el 12,15% con un nivel de Confianza del 95%.
e) Dibuje el correspondiente gráfico
0.95 10.15% ≤π ≤ 12.15%
Ejercicio: 2 Determine con valor estimado la proporción de la población que toma leche “la lechera” la muestra se la tomo con los estudiantes del 4 semestre de Ing. comercial y los datos son los sgtes: Existe un nivel de confianza del 98% Lechera Toni Lechera Lechera Lechera Toni Nutrileche Lechera Lechera Nutrileche Lechera Nutrileche Toni Lechera Ninguna
Rey leche Toni Parmalat ninguna Parmalat lechera Toni lechera Parmalat lechera Toni Toni vitaleche lechera lechera
Toni Toni Lechera Toni Parmalat Nutrileche Indulac Toni Lechera Ninguna Ninguna Ninguna Rey leche Rey leche
Rey leche Lechera Toni Lechera Parmalat Indulac Ninguna Lechera Lechera Nutrileche Lechera Toni Indulac
Π= p = proporción muestral n=tamaño muestral π=Valor estimado p= x/n a) Determine las variables n= 57 mujeres Xi=20 p = 0.350877 b) Halle el valor de Zc en la tabla de distribución normal Zc=0.98/2=0.492.33 c) Halle el valor estimado del ejercicio Π=0.3509 ± 2.33 Π=0.3509 ± 2.33(0.00399595) Π=0.3509 ± 2.33Error de estimación Π=0.3509 + 2.33=0.498175349.82% Π=0.3509 - 2.33=0.2036124720.36% d) Realice la interpretación de sus resultados Interpretación: Considerando una muestra aleatoria de 57 estudiantes se estima que la proporción que prefiere Leche La lechera está entre el 20,36% al 49,82% con un nivel de confianza del 98%
e) Dibuje el correspondiente gráfico
0.98 20.36% ≤π ≤ 49.82% Ejercicio: 3 Con los datos del ejercicio anterior estime la proporción de personas que no toman leche y el nivel de confianza es de 90% Π= p = proporción muestral n=tamaño muestral π=Valor estimado p= x/n a) Determine las variables n= 57 mujeres Xi=6 p = 0.105263 b) Halle el valor de Zc en la tabla de distribución normal Zc=0.90/2=0.451.645
c) Halle el valor estimado del ejercicio Π=0.105263 ± 1.645 Π=0.105263 ± 1.645 (0.040648838) Π=0.105263 ± 0.066867339Error de estimación Π=0.105263 ± 0.066867339= 0.17213017.21% Π=0.105263 ± 0.066867339=0.0383956613.83% d) Realice la interpretación de sus resultados Interpretación: Considerando una muestra aleatoria de 57 estudiantes se estima que la proporción que prefiere no tomar leche esta entre el 3.83% al 17.21% con un nivel de confianza del 90% e) Dibuje el correspondiente gráfico
0.90 3.83% ≤π ≤ 17.21%
Ejercicio 4 Tomada, al azar, una muestra de 120 estudiantes de una Universidad, se encontró que 54 de ellos hablaban inglés. Halle, con un nivel de confianza del 90%, un intervalo de confianza para estimar la proporción de estudiantes que hablan el idioma inglés entre los estudiantes de esa Universidad. Π= p = proporción muestral n=tamaño muestral π=Valor estimado p= x/n a) Determine las variables n= 120 mujeres Xi=54 p = 0.45
b) Halle el valor de Zc en la tabla de distribución normal Zc=0.90/2=0.451.645
c) Halle el valor estimado del ejercicio Π=0.45 ± 1.645 Π=0.45 ± 1.645 (0.0020625) Π=0.45 ± 0.0033928125Error de estimación Π=0.45 + 0.0033928125= 0.44644.66% Π=0.45 – 0.0033928125=0.453345.34% d) Realice la interpretación de sus resultados Interpretación: Considerando una muestra aleatoria de 54 estudiantes se estima que la proporción que habla inglés esta 44.66% al 45.34% con un nivel de confianza del 90% e) Dibuje el correspondiente gráfico
0.90 44.66% ≤π ≤ 45.34%
Ejercicio 5 La Pilsener desea estimar la proporción de hombres adultos que tienen como habito beber cerveza de manera cotidiana. Se consulta a una muestra de 2400 hombres de los cuales 300 dijeron q si tomaban de manera normal. Existe un nivel de confianza del 90%. Π= p = proporción muestral n=tamaño muestral π=Valor estimado p= x/n a) Determine las variables n= 2400 hombres Xi=300 p = 0.125 b) Halle el valor de Zc en la tabla de distribución normal Zc=0.90/2=0.451.645 c) Halle el valor estimado del ejercicio Π=0.125 ± 1.645 Π=0.125 ± 1.645 (0.006750770326) Π=0.125 ± 0.011105017Error de estimación Π=0.125 + 0.011105017= 0.136113.61% Π=0.125 – 0.011105017=0.113911.39% d) Realice la interpretación de sus resultados Interpretación: Considerando una muestra aleatoria de 300 estudiantes se estima que la proporción que bebe cerveza de manera cotidiana esta entre el 11.39% al 13.61% con un nivel de confianza del 90% e) Dibuje el correspondiente gráfico
0.90 11.39% ≤π ≤ 13.61%
Grupo#4 Ejercicio # 1 Se desea estimar el promedio de consumo de arroz que tienen las familias de la ciudad de Guayaquil el consumo debe de estar dado por la cantidad mensual y no por la marca de arroz. Se requiere que el informe tenga el 95% de confianza los datos son los siguientes: MARCA Gustadina Súper extra Conejo Imperial Súper extra Conejo Gustadina Imperial Súper extra Gustadina
CANTIDAD 2 1 1 3 1 2 2 1 3 1
GRAMOS 500 250 500 500 250 500 250 250 500 500
1. Encuentre el consumo promedio de las familias de la ciudad de Gye.
2. Hallar la desviación estándar de los datos. S = 492.3018496 3. Encontrar el valor en la tabla t student. n -1 = 10 -1 = 9 Nivel de confianza = 0.95 Valor tabla student = 2.262 4. Halle el valor de estimación aplicando la fórmula de error estándar
5. Demuestre gráficamente el resultado del error estándar de los datos.
6. Interpretar el resultado del ejercicio. Después de analizar la muestra aleatoria de 10 personas, se estima que el promedio de consumo de arroz de las familias de la ciudad de Guayaquil está entre 372.85 a 1,077.15 gr con un nivel de confianza del 95% Ejercicio # 2 Se desea estimar el promedio de megas de internet mensuales que se utilizan en los diversos departamentos de una compañía. La información requiere de una confianza del 95%. Se tomó una muestra aleatoria cuyos datos son los siguientes: 854
1090
954
836
911
1429
1285
819 986 1486
1443 1169 1271
1349 897 1330
1356 1337 1348
1033 824 758
964 1407 1376
1432 630 581
1. Halle la media de los datos. Ẋ
1,112.68
2. Halle la desviación estándar de los datos. S
275.16
3. Determine el grado de libertad de la muestra de datos y el valor de ts. tc n
2.052 n-28= 27
4. Calcule el error de estimación
5. Realice el análisis del caso respectivo. El promedio de megas de internet mensuales que se utilizan en los diversos departamentos de una compañía se dará entre los 1,005.97 a 1,219.38 megas bajo un nivel de confianza del 95%
Ejercicio 3 En un ganado de gallinas se está utilizando un alimento especial para las gallinas. Antes que se le dé el alimento, las gallinas tenían un peso promedio de 6.5 libras a determinada edad. Después de darles el alimento especial se ha considerado una muestra de gallinas a los que se les pesa individualmente. Nivel de confianza 90% ¿Consideraría usted que ha habido una variación en el peso promedio de pollos? n ∑x Ẋ S N.C tc
20 131.5 6.575 0,656846533 90% 1.729
N-1= 19
6.4 7.5 6.5 7 6.5 6 7 6.5 7 6
8 5.9 6.5 7.3 6.5 6.6 5 6.3 6 7
PREGUNTAS 1. Hallar la media de los datos Ẋ =6.575 2. Después de haber resuelto el ejercicio haga su respectivo análisis Después de haber tomado una muestra de gallinas y pesarlos individualmente nos hemos dado cuenta que el peso promedio esta entre 6.83 libras a 6.32 libras con un porcentaje de confianza del 90% 3. Cuál sería el error estándar si el nivel de confianza fuera del 80%
4. Cuál sería el tc si el nivel de confianza es del 70% Tc= 1.066 5. Grafique el resultado del ejercicio
EJERCICIO 4 El administrador de una granja avícola desea estimar el peso promedio de los pollos cuando estos tienen 9 semanas de vida. Escoge de manera aleatoria una muestra de 10 pollos, los pesa de manera individual y el detalle es el siguiente: 6.400
5.980
6.500
5.460
6.520
6.000
6.100
6.250
4.950
6.100
Utilice un nivel de confianza del 95% 1) Halle la media y desviación estándar de los datos. Ẋ S
6.026 0.48883535
2) Determine el grado de libertad de la muestra de datos y el valor de ts. tc n
2.262 n-1= 9
3) Halle el valor de estimación aplicando la fórmula de error estándar.
4) Represente gráficamente el resultado de error estándar para la muestra de 10 de pollos.
1.85
2
1.70
1.87
1.86
1.96
1.95
1.77
1.95
1.82
1.91
1.92
1.97
1.99
1.80
1.79
1.96
1.79
1.88
1.89
1.94
5) ¿Cuál será el peso promedio de los 10 pollos cuando estos tienen 9 semanas de vida? El peso promedio de los 10 pollos cuando estos tienen 9 semanas de vida se dará entre los 5.85 a 6.38 kg bajo un nivel de confianza del 95% EJERCICIO # 5 Se necesita saber cuál es la altura promedio que tienen los futbolistas de la Selección Ecuatoriana. Se tomó la siguiente muestra, con un nivel de confianza del 90% 1. Halle el promedio de la estatura de los futbolistas de la Selección Ecuatoriana.
2. Halle el valor de estimación utilizando la formula.
Alt. Alt. 3. Determine el grado de libertad de la muestra de datos y el valor de ts. n -1 = 21 -1 = 20 nivel de confianza = 0.90 Valor tabla student = 1.725 4. Represente gráficamente el resultado de error estándar.
5. Realice el análisis del caso respectivo. Después de analizar la muestra aleatoria de los 21 jugadores de la selección Ecuatoriana, se determinó que el valor promedio de la altura de los jugadores es 1.88 con un nivel de confianza del 90%.
Grupo #5 hipótesis EJERCICIO 1 Un grupo empresarial se proyecta incrementar la producción de sus productos a más de 50 productos por hora, que es la producción para alcanzar la meta. Se toma para muestra 16 productos elaborados en 20 minutos de las diferentes productoras de la industria. Productos por Hora: 45 40 41 47 26 57 38 45 37 38 51 46 39 43 48 52 ¿Cree usted que la proyección de aumentar la producción se cumple, teniendo una significancia de 2%? RESOLUCIÓN PASO 1 (ESTABLECER LAS HIPÓTESIS, TANTO LA NULA ( ) COMO LA ASERTIVA ( ))
PASO 2 SIGNIFICANCIA
PASO 3 ESTADÍSTICO DE PRUEBA
PASO 4
VARIABLE DE COMPROBACIÓN
PASO: 5 TOMA DE DECISIÓN
Podemos determinar que nuestro valor sometido a prueba, nos indica como resultado que la hipótesis Nula es verdadera por entrar dentro de la región de aceptación. Interpretación: El crecimiento de la producción en la industria, no está cumpliendo con la meta de elevarla a una mayor a 50, por lo cual, una vez comprobado a través del método de hipótesis con una significancia del 2% podemos determinar que la Hipótesis Nula establecida resulta verdadera a lo que se deben tomar medidas para cumplir con la proyección emprendida. Ejercicio No. 2 Una marca de nueces afirma que, como máximo, el 6% de las nueces están vacías. Se eligieron 300 nueces al azar y se detectaron 21 vacías. Con un nivel de significación del 5%, DETERMINE:
a) ¿se puede aceptar la afirmación de la marca? b) Establezca seis pasos en la prueba de hipótesis. c) Realice el correspondiente gráfico. 1. Datos:
2. Establecemos la Hipótesis:
3. Nivel de significancia , 4. Regla de decisión: Si
no se rechaza Ho.
Si
se rechaza Ho.
5. Cálculos:
6. Decisión y justificación: Como no se rechaza Ho y se concluye con un nivel de significancia del 0.05 que como máximo el 6% de las nueces están vacías. Ejercicio No. 3 – HIPÓTESIS PARA MUESTRAS PEQUEÑAS El jefe de la zona escolar desea probar que el promedio de calificaciones de física de 9º, de planteles privados es igual o menor a 12 pts. Para 25 planteles la media muestral es de X = 11.92 y la desviación estándar es de S = 1.40. Nivel de significancia es de 0.05. Realizar Establezca cinco pasos en la prueba de hipótesis. Realice el correspondiente gráfico. Interprete los resultados.
Paso 1: Establezca la hipótesis nula y la hipótesis alternativa. H_0:μ= ≤12 H_1:μ>12 Paso 2: Seleccione el nivel de significancia. Es de 0.05 Paso 3: Encuentre un estadístico de prueba. Es la distribución t porque el tamaño de la muestra es menos de 30. Paso 4: Indique la regla de la decisión (n-1) Grados de libertad. Entones 25 – 1 = 24 Grado de libertad Decisión: se rechaza la hipótesis nula si t>1.711
Paso 5: Tome una decisión e intérprete los resultados. t= (x
-μ)/(s⁄√n)
t=(11.92-12)/(1.4⁄√25) t=-0.29 4)Ejercicio El dueño de un Café. Realizo un estudio estadístico por cuenta propia y otro con asesoría externa según los datos del muestreo del dueño para 30 personas su edad promedio fue de 21 años con una desviación estándar de 0.5 años. En cambio, el muestreo realizado de forma externa para 40 personas encontraron que la media es de 19 años con una desviación estándar de 0.3 años. Con un nivel de significancia del 5 % La pregunta del dueño del café es si se requiere invertir en un nuevo estudio dado que las medias de cada uno fueron diferentes. Paso 1: Determinar hipótesis Ho: u1 ≠ u2
Formula:
Ho: u1 = u2
Paso 2:Significancia 0.5 Paso 3: Paso 4: Valor Critico Zc: +- 1.96
Paso 5: Toma de decisión Se rechaza la Ho u1 ≠ u2 Interpretación: De acuerdo a los datos analizados se concluye que hay diferencias reales en el tiempo Promedio de edad de las personas. Se llega a esa conclusión después de analizar un total de 70 personas con un nivel de significancia de 5%. Interpretación: De acuerdo a los datos analizados se concluye que hay diferencias reales en el tiempo Promedio de edad de las personas. Se llega a esa conclusión después de analizar un total de 70 personas con un nivel de significancia de 5%.
GRUPO #6 ANALISIS DE VARIANZA Ejercicio No. 1 Se quiere averiguar si tres fertilizantes A, B, C presentan diferencias significativas en cuanto a sus efectos sobre el aumento de la cosecha. Con este propósito se eligieron al azar 15 parcelas a las que se fertilizo aleatoriamente con cada uno de los fertilizantes en cuestión. Los aumentos de cosecha obtenidos fueron los siguientes. Fertilizante
Aumento de cosecha
A
39
33
39
35
32
B
36
40
35
30
29
C
33
33
36
26
35
Se pide: 1.- A un nivel de significancia del 5% ¿puede resultar que no exista diferencias significativas entre los tres fertilizantes? 2.- Encontrar el resultado la suma de cuadrado debido al tratamiento 3.- Encontrar el resultado de la suma de cuadrados del error 4.- Realizar la tabla de Anova. 5.- En la tabla de Fisher encontrar el resultado referente a los grados de libertad. TABLA DE REALIZACION DE EJERCICIO A
B
C
TOTAL
Tc
178
170
163
511
Nc
5
5
5
15
Tc2/nc
6336.8
5780
5313.8
17430.6
X2
6380
5862
5375
17617
SST= 17430.60– (511)2 /15 SST= 17430.60 –17408.07 SST= 22.53 SSE= 17617-17430.6 SSE= 186.4 FUENTE DE VARIACION
SUMA DE CUADRADOS
GRADOS DE LIBERTAD
CUADRADO MEDIO
ENTRE LOS GRUPOS
22.53
3-1=2
11.27
EN GRUPO
186.4
15-3=12
15.53
TOTAL
0.73
Interpretación: El valor en la F teórica con 2 y 12 grados de libertad a un nivel de confianza del 5% es 3.8853. Por consiguiente al ser F=0.73 menor que dicho punto crítico se acepta la hipótesis nula y concluyendo con la no existencia de diferencias significativas entre los tres fertilizantes.
Ejercicio No. 2 Un profesor del curso de mercadotecnia pidió a los alumnos de un de sus grupos que evaluaran su desempeño como excelente, bueno, regular o deficiente. Un estudiante egresado recopilo las evaluaciones y aseguro a los estudiantes que el profesor las recibiría hasta que las calificaciones del curso se hubieran enviado a las oficinas de registro. La evaluación (es decir, el tratamiento) que cada alumno asigno al profesor se comparó con las calificaciones, que podrá ir de 0 a 100 que obtuvo el estudiante en el curso. A continuación se presenta la información de la muestra ¿existe diferente entre los promedios de las calificaciones de los alumnos en cada uno de las cuatro categoría de evaluación? Utilice el nivel de significancia 0.01 CALIFICACIONES DEL CURSO EXCELENTE
BUENO
REGULAR
DEFICIENTE
94
75
70
68
90
68
73
70
85
77
76
72
80
83
78
65
88
80
74
68
65
65
SE PIDE: 1. Plantear la hipótesis nula y la hipótesis alternativa
La hipótesis alternativa es que las calificaciones promedio no son las mismas en las cuatro categorías
2. Seleccionar el nivel de significancia Se elige el nivel 0.01 3. ¿Cuál es la regla de decisión Grados de libertad en el numerador = k-1= 4-1=3 Grados de libertad en el numerador= n-k=22-4=18
EXCELENTE X 94 90 85 80
BUENO X 75 68 77 83 88
8836 8100 7225 6400
349 4 30450.25
5625 4624 5929 6889 7744
391 5 30576. 2 30561
REGULAR X 70 73 76 78 80 68 65 510 7 37157.14
30811
4900 5329 5776 6084 6400 4624 4225
DEFICIENTE TOTAL X 68 4624 70 4900 72 5184 65 4225 74 5476 65 4225 414 6 28566
37338
1664 22 126749.59 28634
127344
4. Calcule SST, SSE Y SS total SUMA DE CUADRADOS; TOTAL
SS total = 127344 -
= 1485.09
SUMA DE CUADRADOS DEBIDOS AL TRATAMIENTO SST =
=
SUMA DE CUADRADOS DEL ERROR SSE = SS total – SST 1485.09-890.68 =594.41 5. Elabore una tabla de ANOVA TABLA ANOVA FUENTE DE VARIACION TRATAMIENTOS
SUMA DE CUADRADOS SST
GRADOS DE LIBERTAD k-1
ERROR
SSE
n-k
TOTAL
SS total
n-1
CUADRADO MEDIO SST/(K-1) = MST SSE/(N-K) =MSE
F MST/MSE
TABLA ANOVA
FUENTE DE VARIACION
SUMA DE GRADOS DE CUADRADOS LIBERTAD
CUADRADO MEDIO F
TRATAMIENTOS
890,68
3
296,89
ERROR
594,41
18
33,02
TOTAL
1485,09
21
8,99
El valor calculado para F es 8.99, que es mayor que el valor critico 5.09, por lo tanto se rechaza la hipótesis nula. Se concluye que las medias poblacionales no son iguales. Las calificaciones promedio no son iguales en los cuatro grupos de evaluación.
Ejercicio No, 3 La siguiente es información muestral. Pruebe la hipótesis de que las medias de tratamiento son iguales. Utilice el nivel de significancia 0.05 TRATAMIENTO 1 9 7 11 9 12 10
TRATAMIENTO 2 13 20 14 13
TRATAMIENTO 3 10 9 15 14 15
SE PIDE: 1. 2. 3. 4. 5.
Establezca la hipótesis nula y alternativa ¿Cuál es la regla de decisión? Seleccionar la muestra, realizar los cálculos necesario para determinar el valor de F Calcule SST,SSE Y SSTOTAL Elabore una tabla de Anova PROCEDIMIENTO Plantear la hipótesis nula y la hipótesis alternativa
La hipótesis alternativa es que las calificaciones promedio no son las mismas en las tres categorías Seleccionar el nivel de significancia Se elige el nivel 0.05 Cuál es la regla de decisión Grados de libertad en el numerador = k-1= 3-1=2 Grados de libertad en el numerador= n-k=15-3=12
Seleccionar la muestra, realizar los cálculos necesario para determinar el valor de F
TRATAMIENTO 1 81 49 121 81 144 100 58
TRATAMIENTO 2 169 400 196 169
TRATAMIENTO 3 100 81 225 196 225
60
63
TOTAL 350 530 542 446 369 100 181
6
4
5
15
561
900
794
2255
576
934
827
2337
Calcule SST, SSE Y SS total SUMA DE CUADRADOS; TOTAL SS total =
=2337 -
= 152.93
SUMA DE CUADRADOS DEBIDOS AL TRATAMIENTO SST =
= 2255-
2255-2184.07= 70.93
SUMA DE CUADRADOS DEL ERROR SSE = SS total – SST = 152.93-70.93= 82 Elabore una tabla de Anova TABLA ANOVA FUENTE DE VARIACION
SUMA DE CUADRADOS
GRADOS DE LIBERTAD
CUADRADO MEDIO
F
70.93
2
35.47
ERROR
82
12
6.83
TOTAL
152.93
14
TRATAMIENTOS
5.19
Interpretación: El valor calculado para F es 5.19, que es mayor que el valor critico 3.89, por lo tanto se rechaza la hipótesis nula.
Ejercicio No. 4 Una lista de palabras sin sentido se presenta en la pantalla del ordenador con cuatro procedimientos diferentes, asignados al azar a un grupo de sujetos. Posteriormente se les realiza una prueba de recuerdo de dichas palabras, obteniéndose los siguientes resultados: PROCEDIMIENTO 1 5 7 6 3 9 7 4 2
PROCEDIMIENTO 2 9 11 8 7 7
PROCEDIMIENTO 3 8 6 9 5 7 4 4
PROCEDIMIENTO 4 1 3 4 5 1 4
SE PIDE: 1. 2. 3. 4. 5.
A un nivel de significancia del 95% ¿puede resultar que los 4 procedimientos producen resultados equivalentes? Encontrar el resultado la suma de cuadrado debido al tratamiento Encontrar el resultado de la suma de cuadrados del error Realizar la tabla de Anova. En la tabla de Fisher encontrar el resultado referente a los grados de libertad.
TABLA DE REALIZACION DE EJERCICIO
Tc Nc Tc2/nc X2
PROCED. 1 43 8 231.10 269
PROCED. 2 42 5 352.8 364
PROCED. 3 43 7 264.10 287
PROCED.4 18 6 54 68
TOTAL 146 26 902 988
SST= 902 –(146)2 /26 SST= 902- 819.80 SST= 82.20 SSE= 988-902 SSE= 86 FUENTE DE VARIACION ENTRE LOS GRUPOS EN GRUPO TOTAL
SUMA CUADRADOS 82.20 86
DE
GRADOS LIBERTAD 4-1= 3 26-4= 22
DE
CUADRADO MEDIO 27.40 3.90 7.03
El valor en la F teórica con 3 y 22 grados de libertad a un nivel de confianza del 95% es 3.05. Por consiguiente se rechaza la hipótesis nula y se concluye que los cuatro procedimientos de presentación producen diferencias significativas.
Ejercicio No. 5 Un fabricante sospecha que los lotes de materia prima recibidos de un proveedor difieren significativamente de su contenido en calcio. Elige al azar 5 lotes diferentes y un químico hace cinco determinaciones del contenido en calcio de cada lote. Los resultados obtenidos han sido: LOTE1 23.46 23.48 23.56 23.39 23.40 TOTAL
LOTE 2 23.59 23.46 23.42 23.49 23.50
LOTE 3 23.51 23.64 23.46 23.52 23.49
LOTE 4 23.28 23.40 23.37 23.46 23.29
LOTE 5 23.29 23.46 23.37 23.32 23.38
SE PIDE: 1. A un nivel de significancia del 98% ¿puede resultar que los 5 lotes producen resultados equivalentes? 2. Encontrar el resultado la suma de cuadrado debido al tratamiento 3. Encontrar el resultado de la suma de cuadrados del error 4. Realizar la tabla de Anova. 5. En la tabla de Fisher encontrar el resultado referente a los grados de libertad. DESARROLLO LOTE 1
LOTE 2
LOTE. 3
LOTE 4
LOTE.5
TOTAL
Tc
117.29
117.46
117.62
116.80
116.82
585.99
Nc
5
5
5
5
5
25
Tc2/nc
2751.39
2759.37
2766.89
2728.45
2729.38
13735.48
X2
2751.41
2759.39
2766.91
2728.47
2729.40
13735.58
SST = SST= 13735.48–(585.99)2 /25 SST= 13735.48- 13735.37 SST= 0.11 SSE = SS total – SST SSE= 13735.58-13735.48 SSE=0.1 TABLA ANOVA FUENTE DE VARIACION
SUMA DE CUADRADOS
GRADOS DE LIBERTAD
CUADRADO MEDIO
F
0.11
5-1=4
0.0275
ERROR
0.1
25-5=20
0.005
TOTAL
0.21
24
TRATAMIENTOS
5.5
Interpretación: El valor calculado para F es 5.5, que es mayor que el valor critico 4.43, por lo tanto se rechaza la hipótesis nula.
GRUPO #7 REGRESIO LINEAL Formulas FORMULA GENERAL DE LA ECUACION DE REGRESION LINEAL Ŷ = a + bX
PENDIENTE DE LA LINEA DE REGRESION
b=
a=
INTERCEPCION CON EL EJE X
–b
EJERCICIO Nº 1 La empresa ReliableFurniture es un negocio familiar que ha vendido al menudeo en Guayaquil durante muchos años. Se anuncia ampliamente por radio y televisión, destacando sus bajos precios y accesibles condiciones de crédito. Al dueño le gustaría analizar la relación entre las ventas y lo que gasta en publicidad. A continuación se encuentra la información acerca de las ventas y los gastos de publicidad durante los últimos cuatro meses. GASTOS EN PUBLICIDAD (millones de dólares)
INGRESOS POR VENTAS (millones de dólares)
XY
X^2
Julio
2
7
14
4
Agosto
1
3
3
1
Septiembre
3
8
24
9
Octubre
4
10
40
16
10
28
81
30
MES
b=
1.
Resolver el ejercicio planteando la ecuación de la recta. -0,96+29,4x2= 57,84 -0,96+29,4x1= 28,44
-0,96+29,4x3= 87,24 -0,96+29,4x4= 116,64
2.
Analizar la Correlación de los datos propuestos, si están intensamente relacionados, dibuje un esquema. 140 120 100 80 60 40 20 0 0
3.
1
2
3
4
5
Demostrar por medio de la ecuación obtenida, cuánto ganaría si se invierten 10 millones en publicidad.
-0,96+29,4x10= 293,04
4.
Demostrar qué significa B para la ecuación planteada.
Es el valor en millones invertido Análisis: Se estima que por cada millón de dólares en publicidad que se gaste adicional, se obtengan ventas de 2.2 millones de dólares.
EJERCICIO Nº 2 La Empresa Eléctrica estudia las relaciones entre el consumo de energía (en miles de kilowatts-hora, kWh) y el número de habitaciones en una residencia privada unifamiliar. Una muestra aleatoria de 10 casas produjo lo siguiente. NUMERO DE HABITACIONES
CONSUMO (miles de kWh)
XY
X^2
12
9
108
144
9
7
63
81
14
10
140
196
6
5
30
36
10
8
80
100
8
6
48
64
10
8
80
100
10
10
100
100
5
4
20
25
7
7
49
49
91
74
718
895
b=
Análisis: Se estima que por cada habitación adicional en las residencias, se gaste 0.67 watts. 1.
Resolver el ejercicio planteando la ecuación de la recta. 1.3+0.67x12= 9,34 1.3+0.67x9= 7,33 1.3+0.67x14= 10,68 1.3+0.67x6= 5,32 1.3+0.67x10= 8
1.3+0.67x8= 6,66 1.3+0.67x10= 8 1.3+0.67x10= 8 1.3+0.67x5= 4,65 1.3+0.67x7= 5,99
2.
Analizar la Correlación de los datos propuestos, si están intensamente relacionados, dibuje un esquema. 12 10 8 6 4 2 0 0
3.
2
4
6
8
12
Demostrar por medio de la ecuación obtenida, cuánto se consumiría en 91 habitaciones.
1.3x0.67x91= 62,27
4.
10
Demostrar qué significa B para la ecuación planteada.
Es el valor en número de habitaciones
EJERCICIO Nº 3 El señor James Brown, presidente de la empresa Servicios Financieros James, considera que existe relación entre el número de entrevistas con clientes y el importe en dólares de las ventas. NUMERO DE CONTACTOS
VENTAS (miles de dólares)
XY
X^2
14
24
336
196
12
14
168
144
20
28
560
400
16
30
480
256
46
80
3680
2116
23
30
690
529
48
90
4320
2304
50
85
4250
2500
55
120
6600
3025
50
110
5500
2500
334
611
26584
13970
b=
1.
Resolver el ejercicio planteando la ecuación de la recta. -12.05 + 2.19x 14
18,61
-12.05 + 2.19x 12
14,23
-12.05 + 2.19x 20
31,75
-12.05 + 2.19x 16
22,99
-12.05 + 2.19x 46
88,69
-12.05 + 2.19x 23
38,32
-12.05 + 2.19x 48
93,07
2.
-12.05 + 2.19x 50
97,45
-12.05 + 2.19x 55
108,4
-12.05 + 2.19x 50
97,45
Analizar la Correlación de los datos propuestos, si están intensamente relacionados, dibuje un esquema. 120 100 80 60 40 20 0 0
3.
2
4
6
8
10
12
Demostrar por medio de la ecuación obtenida, cuánto se venderia con 334 entrevistas
-12.05 + 2.19x 334 719,41
4.
Demostrar qué significa B para la ecuación planteada.
Es el valor en número de entrevistas. Análisis: Se estima que por cada entrevista con los clientes, se obtengan ventas de 2.2 millones de dólares en ventas adicional.
EJERCICIO Nº 4 Un reciente artículo en Business Week presento una lista de las “Mejores Compañías Pequeñas”. Hay interés en los resultados actuales de las ventas y las ganancias de las empresas. Se seleccionó una muestra aleatoria de 12 compañías.
COMPAÑÍA
VENTAS (millones de dólares)
GANANCIAS (millones de dólares)
XY
X^2
Papa John’s
89,20
4,90
437,08
7.956,64
AppliedInnovation
18,60
4,40
81,84
345,96
Integracare
18,20
1,30
23,66
331,24
Wall Data
71,00
8,00
568,00
5.041,00
Davidson
70,00
6,60
462,00
4.900,00
Chico’s Fas
58,60
4,10
240,26
3.433,96
CheckmateElectronics
46,80
2,60
121,68
2.190,24
Royal Grip
17,50
1,70
29,75
306,25
M-Wave
11,90
3,50
41,65
141,61
Serving-n-Slide
19,60
8,20
160,72
384,16
Daig
51,20
6,00
307,20
2.621,44
Cobra Golf
28,60
12,80
366,08
817,96
501,2
64,10
2.839,92
4.788,64
b=
1.
Resolver el ejercicio planteando la ecuación de la recta. 2.11+ 0.56x89.20
52,062
.11+0.56x18.60
12,526
2.11+0.56x18.20
12,302
2.11+0.56x71.00
41,87
2.
2.11+0.56x70.00
41,31
2.11+0.56x58.60
34,926
2.11+0.56x46.80
28,318
2.11+0.56x17.50
11,91
2.11+0.56x11.90
8,774
2.11+0.56x19.60
13,086
2.11+0.56x51.20
30,782
2.11+0.56x28.60
18,126
Analizar la Correlación de los datos propuestos, si están intensamente relacionados, dibuje un esquema. 60 50 40 30 20 10 0 0
3.
2
4
6
8
10
12
14
Demostrar por medio de la ecuación obtenida, cuánto se ganaría vendiendo 501.2 (millones)
2.11+0.56x501.2 282.782
4.
Demostrar qué significa B para la ecuación planteada.
Es el valor de venta en millones de dólares Análisis: Se estima que por millón de dólares en ventas, se obtengan utilidades de 501.2 millones de dólares.
EJERCICIO Nº 5 El Consejo Municipal de la ciudad de Guayaquil está considerando aumentar el número de agentes de policía, en un esfuerzo por reducir los delitos. Antes de tomar una decisión final, el organismo pide al jefe de policía que haga una encuesta en otras ciudades de tamaño similar, a fin de determinar la relación entre el número de vigilantes y el de los delitos reportados. El funcionario recopilo la siguiente información: CIUDAD
AGENTES DE POLICIA 15
NUMERO DE DELITOS 17
XY
X^2
255
225
Danville
17 25
13 5
221 125
289 625
Woodville
27
7
189
729
Athens Carey Miami
17 12 11
7 21 19
119 252 209
289 144 121
Orlando
22
6
132
484
146
95
1502
2906
Dallas Oxford
b=
1.
2.
Resolver el ejercicio planteando la ecuación de la recta. -0,96+29,4x15
440,04
-0,96+29,4x17
498,84
-0,96+29,4x25
734,04
-0,96+29,4x27
792,84
-0,96+29,4x17
498,84
-0,96+29,4x12
351,84
-0,96+29,4x11
322,44
-0,96+29,4x22
645,84
Analizar la Correlación de los datos propuestos, si están intensamente relacionados, dibuje un esquema.
900 800 700 600 500 400 300 200 100 0 0
3.
2
4
6
8
10
Demostrar por medio de la ecuación obtenida, cuanto numero de delitos resolverán 146 agentes de policías =-0,96+29,4x146 4291,44
4.
Demostrar qué significa B para la ecuación planteada.
Es el valor en cantidad de agente de policías
Interpretación: Se estima que por cada agente de policía que se aumente en la ciudad, se produzcan 29,4 delitos.
GRUPO #8 EJERCICIO # 1 El dueño de Maumee Motors desea estudia la relación entre la antigüedad de un automóvil y su precio de venta. A continuación aparece la lista una muestra aleatoria de 12 autos usados vendidos en ese establecimiento durante el último año. a) Establezca el coeficiente de correlación b) Calcule el coeficiente de determinación c) Interprete estas medidas estadísticas Auto
1 2 3 4 5 6 7 8 9 10 11 12
Coeficiente de Correlación
r = - 0.55 Coeficiente de Determinación
Antigüedad (años)
9 7 11 12 8 7 8 11 10 12 6 6
Precio de venta (miles de dólares) 8.1 6.0 3.6 4.0 5.0 10.0 7.6 8.0 8.0 6.0 8.6 8.0
Interpretación: Debido a que la correlación es negativa por demos demostrar que no existe una relación directa entre la antigüedad de un automóvil y su precio de venta por tanto si el 45% por cierto de carros es un poco mas antiguos no garantiza que su valor sea un poco mas elevado y de acuerdo a la determinación podemos observar que el 30% es la cantidad de carros que podrían tener un valor elevado de acuerdo a su antigüedad. EJERCICIO # 2 El consejo municipal de la ciudad de Pine Bluffs está considerando aumentar el número de agentes de policía, en un esfuerzo por reducir los delitos. Antes de tomar una decisión final, el organismo pide al jefe de policía que haga una encuesta en otras ciudades de tamaño similar, a fin de determinar la relación entre el número de vigilantes y el de delitos reportados. El funcionario recopilo la siguiente información: Ciudad
Agentes de Policía
Números de delitos
Oxford
15
17
Starksville
17
13
Danville
25
5
Athens
27
7
Holgate
17
7
Carey
12
21
Whistler
11
19
Woodville
22
6
Total
146
95
a) Si desea evaluar los delitos con base en la cantidad de guardianes, ¿Cuál es la Variable dependiente y cuál es la independiente? b) Determine el coeficiente de correlación. c) Calcule el coeficiente de determinación. d) Trace un diagrama de Dispersión. Repuesta: a) La Variable dependiente (Y) son los números de delitos, y la independiente (X) son los agentes de Policía. b) Datos:
Primera Forma para calcular Coeficiente de Correlación: Formula:
Segunda Forma para calcular Coeficiente de Correlación: Datos:
Formula:
Desarrollo:
c) Formula:
Desarrollo:
r = -0.7646 x 100 r = 76.46%
d) y 26 23 20 17 14 11 9 6 3 3
6
9
11
14
17
20
23
26
29
X
Análisis: Se ha determinado que si se aumenta un 87.46% la tensidad de policías, bajaría un $76.46% de delitos en la ciudad Pine Bluffs según estudio en otras ciudades.
EJERCICIO # 3 La empresa Nutecom es un negocio familiar que ha venido al menudeo en Chicago durante muchos años. Se anuncia ampliamente por radio y televisión, destacando sus bajos precios y accesibles condiciones de crédito. Al dueño le gustaría analizar la relación entre las ventas y lo que gasta en publicidad. A continuación se encuentra la información acerca de las ventas y los gastos de publicidad durante los últimos cuatro meses. MES
GASTOS EN PUBLICIDAD (millones de dólares) 2 1 3 4 10
Julio Agosto Septiembre Octubre Total
INGRESO POR VENTAS (millones de dólares) 7 3 8 10 28
a) Si desea evaluar los ingresos por ventas con base a los gastos de publicidad, ¿Cuál es la Variable dependiente y cuál es la independiente? b) Determine el coeficiente de correlación. c) Calcule el coeficiente de determinación d) Trace un diagrama de Dispersión. Desarrollo a) La Variable dependiente (X) son los gastos de publicidad, y la independiente (y) son los ingresos por ventas. Primera manera: Datos Oxy Ox Oy Zxy n x y
2.75 1.12 2.55 81 4 2.5 7
Covarianza Desviación Estándar de x Desviación Estándar de y Sumatoria de XY Número de la Población Media de x Media de y
Fórmula de Covarianza
Fórmula de Coeficiente de Variación
Fórmula de Coeficiente de Determinación
y 10 9 8 7 6 5 4 3 2 1 1
2
3
4
5
Análisis: ¿Cómo se interpreta una correlación de
6
7
8
9
10
X
?
Primero: es positiva, así que se ve que existe una relación directa entre los gastos de publicidad y los ingresos por ventas. Esto confirma el razonamiento basado en el gráfico de dispersión. El valor de esta muy cerca de 1.00, así que se concluye que la asociación es fuerte. Para expresarlo de otro modo, un 3.85% de incremento en los gastos de producción probablemente conducirá a un 3.858% de aumento de los ingresos por ventas. ¿Cómo se interpreta una determinación? Esta es una relación proporcional o porcentaje; puede decirse que 93% de la variación en el número de los gastos de publicidad se explica por la variación en el número de ingresos por ventas.
EJERCICIO # 4 Una empresa comercial tiene establecimientos en varias grandes áreas metropolitanas. La gerente general de ventas planea lanzar al aire una un anuncio por televisión en algunas estaciones locales, al menos dos veces antes de una venta gigante que ha de empezar el sábado y termina el domingo. Planea tener las cifras de las ventas de videocámaras del sábado y el domingo en las diversas tiendas y parearlas con el número de veces que apareció el comercial en la televisión. El objetivo fundamental de la investigación es determinar si existe alguna relación entre el número de veces que se trasmitió el anuncio y las ventas de cámaras de video. Los pares de datos son: LOCALIZACIÓN DE LA TELEVISORA
NUMERO DE TRASNMISIONES DE ANUNCIOS
VENTAS EN SÁBADO Y DOMINGO (MILES DE DÓLARES)
Búfalo Albany Erie Syracuse Rochester
4 2 5 6 3
15 8 21 24 17
¿Cuál es la variable dependiente? Trace el diagrama de dispersión Calcule el coeficiente de correlación Evalué el coeficiente de determinación Interprete estas medidas estadísticas
¿CUÁL ES LA VARIABLE DEPENDIENTE? VENTAS EN SÁBADO Y DOMINGO (MILES DE DÓLARES) TRACE EL DIAGRAMA DE DISPERSIÓN 30 25 20 VENTAS EN SÁBADO Y DOMINGO (MILES DE DÓLARES)
15
Lineal (VENTAS EN SÁBADO Y DOMINGO (MILES DE DÓLARES))
10 5 0 0
2
4
6
8
CALCULE EL COEFICIENTE DE CORRELACIÓN FORMULA DE CORRELACIÓN
DATOS Sxy = 7.2 Sx = 1.4142 Sy = 5.4772 ∑xy = 376 n =5 Х =4 ỹ = 17
Estos datos los da la calculadora, ya una vez ingresados los datos anteriores…
PROCEDIMIENTO 1.- vamos a proceder a encontrar la covarianza: Formula de la Covarianza
2.- una vez encontrada la covarianza procederemos hallar el coeficiente de correlación:
EVALUÉ EL COEFICIENTE DE DETERMINACIÓN Formula del Coeficiente de Determinación
1.- A continuación pasaremos hallar el coeficiente de determinación:
Interprete estas Medidas Estadísticas ¿Cómo se interpreta una correlación de
?
Primero: es positiva, así que se ve que existe una relación directa entre el número de transmisiones de anuncios y las ventas en sábado y domingo. Esto confirma el razonamiento basado en el grafico de dispersión. El valor de esta muy cerca de 1.00, así que se concluye que la asociación es fuerte. Para expresarlo de otro modo, un 7.05% de incremento en el numero de transmisiones de anuncios probablemente conducirá a un 7.05% de aumento en las ventas. ¿Cómo se interpreta una determinación? Esta es una relación proporcional o porcentaje; puede decirse que 86.40% de la variación en el número de ventas en sábado y domingo se explica por la variación en el número de transmisiones de anuncios.
EJERCICIO # 5 En un departamento de producción (de NDB Electrónicos) se desea examinar la relación entre el número de trabajadores que arman un subensamble, y el número de subensambles producidos. Como experimento se asignaron dos empleados para armar el dispositivo electrónico. Produjeron 15 durante un lapso de una hora. Después se asignaron cuatro obreros al mismo trabajo, y produjeron 25 durante dicho periodo. A continuación se presenta el conjunto completo de pares de observaciones. Cantidad de empleados 2
Producción en una hora (unidades) 15
4
25
1
10
5
40
3
30
La variable dependiente es la producción; es decir, se considera que el nivel productivo depende del número de trabajadores asignados. a) Si desea evaluar la cantidad de empleados con base a la producción en una hora. ¿Cuál es la Variable dependiente y cuál es la independiente b) Determine el coeficiente de correlación c) Calcule el coeficiente de determinación d) Trace un diagrama de Dispersión.
Desarrollo a) La Variable dependiente (X) es la Cantidad de empleados, y la independiente (y) es la Producción en una hora (unidades). PRIMERA MANERA: DATOS Xi
Yi
Xi^2
Yi^2
Xi .Yi
1
10
1
100
10
2
15
4
225
30
3
30
9
900
90
4
25
16
625
100
5
40
25
1600
200
∑ 55
∑ 3450
∑ 430
∑ 15
Oxy Ox Oy Zxy n x y
∑
120
14 1.41 10.68 430 4 3 24
Fórmula de Desviación Estándar
Covarianza Desviación Estándar de x Desviación Estándar de y Sumatoria de XY Número de la Población Media de x Media de y
Fórmula de Covarianza
Oxy = 14
Fórmula de Coeficiente de Variación
R= R= R= 0.9272 R= 0.9272*100 R= 92.72%
SEGUNDA MANERA: Fórmula de Coeficiente de Variación
R= 0.93
R= 0.93*100
R= 93% Fórmula de Coeficiente de Determinación
d) y 70 60 50 40 30 20 10 1
2
3
4
5
6
7
8
9
10
X
Análisis ¿Cómo se interpreta una correlación de
?
Primero: es positiva, así que se ve que existe una relación directa entre el número de cantidad de personas y la producción por hora. Esto confirma el razonamiento basado en el gráfico de dispersión. El valor de esta muy cerca de 1.00, así que se concluye que la asociación es fuerte. Para expresarlo de otro modo, un 7.28% de incremento en el número de personas probablemente conducirá a un 7.28% de aumento a la producción por hora. ¿Cómo se interpreta una determinación? Esta es una relación proporcional o porcentaje; puede decirse que 86% de la variación en el número de personas se explica por la variación en el número de producción por hora.
GRUPO #9 INTERVARLO DE CONFIANZA Y PREDICCION. REACTIVO 1 La gerencia de Hop Scoth Airlines, la aerolínea más pequeña del mundo, considera que existe una relación directa entre los gastos publicitarios y el número de pasajeros que escogen viajar por Hop Scoth. Se calcula que la ecuación de regresión es Y’ = 4,26 + 1,10 X, y el error estándar es 1,15 y con un coeficiente de confianza del 95%. GASTOS DE MILES DE PUBLICIDAD PASAJEROS 10 12 8 17 10
15 17 13 23 16
15
21
Con los datos anteriores:
GASTOS DE MILES DE PUBLICIDAD PASAJEROS
XY
X2
Y2
10
15
150
100
225
12 8 17 10 15
17 13 23 16 21
204 104 391 160 315
144 64 289 100 225
289 169 529 256 441
72
105
1324
922
1909
a) Complete la tabla de datos b) Encuentre el valor de Y’ cuando X = 10 Y’ = 4,26 + 1,10 X Y’ = 4,26 + 1,10 (10) Y’ = 15,26 c) Encuentre el valor de T n–2 6–2=4
1 – 0,95 0,05
Buscamos en la tabla y el valor T es 2,776 d) Encuentre el intervalo de confianza
+ 16,81 - 13,71
e) Encuentre el intervalo de predicción
-
+ 19,208 11,311
REACTIVO 2 La siguiente es una ecuación de regresión: Y’ = 17.08 + 0.16X La siguiente información también está disponible: : = 5.
;yn
Estime el valor de Y’ cuando X = 50 a) Desarrolle un intervalo de predicción de 95% para un valor individual de Y, para X = 50. DESARROLLO: - Primero resolvemos el literal a, por lo que reemplazaremos X = 50 en la ecuación de Y’. Y’ = 17.08 + 0.16X Y’ = 17.08 + 0.16 (50) Y’ = 25.08 -
Después de haber conseguido el valor de Y’ cuando X = 50; procederemos a resolver el literal b.
Debemos conocer el valor t y para ello primero encontraremos el número de grados de libertad: n–2 5–2=3 Tenemos un nivel de confianza de 95%. Para obtener el nivel de significancia se resta el 95% menos 1 1 – 0.95 = 0,05 Buscamos en la tabla y nos resulta que el valor de T es igual 3.182. Para terminar, reemplazamos los valores en la fórmula de los intervalos de predicción:
Intervalo de predicción =
3.182 (4.05) = = 25.08
Positivo: 39.56
12.8871 (1.123448229) 14.47798967
Negativo: 10.60
REACTIVO 3 Un Banco cuenta con 4 ejecutivos de cuenta para banca empresarial, estos realizan visitas a sus clientes para ofrecerles la apertura de cuentas en el banco, de acuerdo al número de clientes que visiten se dan las aperturas de cuenta. Nos piden hallar el intervalo de confianza y predicción teniendo un nivel de confianza del 95%.
Ejecutivo
# de realizadas
visitas
Leonardo
10
8
María
9
6
Anabel
8
7
Cecilia
15
12
# de cuentas abiertas
Con los datos anteriores: a) b) c) d)
Terminar de completar la tabla. Hallar la ecuación de regresión. Hallar el error estándar. Hallar el intervalo de confianza cuando se realicen 7 visitas. e) Hallar el intervalo de predicción cuando un ejecutivo especifico realice 7 visitas.
a) Ejecutivo Leonardo María Anabel Cecilia
# de visitas realizadas 10 9 8 15
# de cuentas abiertas 8 6 7 12
42
33
b) Y´ =-0.2586+0.8103(x) c)
Se= Se= 13.45
x2
y2
xy
100 81 64 225 470
64 36 49 144 293
80 54 56 180 370
d) 4.303(13.45)
5.41+-4.303(13.45) 5.41+-4.303(13.45) (0.82) 5.41+-47.46 +53.17 -42.05 e)
4.303(13.45)
5.41+-4.303(13.45) 5.41+-4.303(13.45) (1.6724) +102.20 2.306(9.901)
-91.38 Interpretación:
Como podemos ver tenemos un intervalo de entre 42.05 a 53.17 cuentas abiertas si se realizan 7 visitas, y si un determinado ejecutivo realiza 7 visitas tenemos un intervalo de 91.38 a 102.20 cuentas abiertas.
REACTIVO 4 Los administradores de risoflins.a, la empresa de venta de programas, considera que existe una relación directa entre los gastos publicitarios y el número de ventas por empresa a quienes les distribuyen sus programas. Se calcula que la ecuación de regresión es Y’ = 2.83 + 1,20 X, y el error estándar es 2.03 y con un coeficiente de confianza del 95%. GASTOS DE PUBLICIDAD
Empresas
8
12
11
15
10
11
16
25
12
14
8
18
Con los datos anteriores: a) b) c) d) e)
Complete la tabla de datos Encuentre el valor de Y’ cuando X = 5 Encuentre el valor de T Encuentre el intervalo de confianza Encuentre el intervalo de predicción
LITERAL A) GASTOS DE Empresas PUBLICIDAD 8 12 11 15 10 11 16 25 12 14 8 18 LITERAL B) Y’ = 2.83 + 1,20 X Y’ = 2.83 + 1,20 (5) Y’=15.76 LITERAL C) N-2 7-2=5 1-0.95=0.05 T=2.0150 LITERAL D) 2.0150 (2.03)
2.0150 (2.03)
2.0150 (2.03) 2.0150 (2.03) (2.09) 8.55 +24.31
-7.21
x2
y2
xy
64 121 100 256 144 64
144 225 121 625 196 324
96 165 110 480 168 144
LITERAL E)
(2.03)
(2.03)
1.71
(2.03)(1.69)
+22.67
-8.8847
Interpretación: Como podemos ver tenemos un intervalo de entre 24.31 a 7.21 DE GASTOS si se realizan 7 visitas, y si un determinado ejecutivo realiza 8 visitas tenemos un intervalo de 22.67 a 8.89 DE GASTOS.
REACTIVO 5 La empresa Reliable Forniture es un negocio familiar que realiza ventas al menudeo, en Guayaquil, durante muchos años. Se anuncia ampliamente por radio y televisión, destacando sus bajos precios y accesibles condiciones de crédito. Al dueño le gustaría analizar la relación entre las ventas y lo que gasta en publicidad. A continuación se encuentra la información acerca de una muestra de las ventas y los gastos de publicidad durante los últimos cuatro meses:
Gastos en publicidad (millones de dólares)
Ingresos por ventas (millones de dólares)
Julio
2
7
Agosto
1
3
Septiembre
3
8
Octubre
4
10
Mes
Se calcula que la ecuación de regresión es Y’ = 1.5 + 2.2X, y el error estándar es 0.9487. Ambas variables se presentaron en millones de dólares. Determine el intervalo de confianza de 90% para el mes típico en el que se gastaron 3 millones de dólares en publicidad.
DESARROLLO:
Gastos de publicidad
Ingresos por ventas
X
Y
x2
y2
xy
Julio
2
7
4
49
14
Agosto
1
3
1
9
3
Septiembre
3
8
9
64
24
Octubre
4
10
16
100
40
10
28
30
222
Mes
1) Como deseamos saber la relación entre las ventas y lo que gasta en publicidad en el mes que los gastos fueron de 3 millones de dólares, reemplazamos x en la ecuación. Y’ = 1,5 + 2,2 (x) Y’ = 1,5 + 2,2 (3) Y’ = 8,1
2) Ahora debemos conocer el valor de T, primero se necesita conocer el número de grados de libertad: n – 2 4–2=2 Tenemos un nivel de confianza del 90%, para obtener el nivel de significancia se resta el 90% menos 1. 1 – 0,90 = 0,1 Buscamos en la tabla y nos damos cuenta que el valor de t es igual a 2,920. 3) Reemplazamos los valores en la fórmula:
2,920 (0,9487)
8,1 +- 2,770204 (0,5477225575) 8,1 +- 1,51730322 = + 9,61730322 -6,58269678
Interpretación: Si la empresa gastó 3 millones de dólares en publicidad, es probable que sus ventas hubiesen variado de 9,6 a 6,6 millones de dólares.
Grupo No. 10 INTERVALO DE PREDICCION
2,920 (0,9487)
8,1 +- 2,770204 (1,1401758425) 8,1 +- 3,158518523 = + 11,25851852 -
4,941481477
Interpretación: Las ventas pronosticadas en base a un gasto publicitario de 3 millones de dólares estarán entre 11,2 y 4,9 millones de dólares. EJERCICIO 1 Para este ejercicio tomaremos datos del Instituto Nacional de Estadísticas (INE) de Chile, extraídos de Series de Indicadores del Banco Central de Chile. Donde hemos buscamos un tramo de datos de 34 meses consecutivos, desde marzo del 2009 hasta diciembre del 2011, para la Tasa de Desocupación (% miles de personas), Total Exportaciones Mineras (millones de dólares) y el Total de Importación de Bienes (millones de dólares) en Chile. Lo que deseamos establecer es una interpretación económica de las variables ya antes mencionadas. Analizaremos la variación de la Tasa de Desocupación, explicada por las variables de los Totales de Exportaciones Mineras y los Totales de Importación de Bienes durante ese rango de tiempo. Sea Y una función general explicada por 2 variables agregadas, expresada en el siguiente modelo:
Y = ß0 + ß1 X1 + ß2 X2 + m DONDE: Y: Tasa de Desocupación (%), X1: Total de Importación de Bienes (fob) X2: Exportaciones Mineras
m : Error o Residuo
PROCEDIMIENTO 1. Presentar el problema diferenciando las variables
Año
Mes
Tasa de Desocupación
2009
Marzo Abril Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre
10,6 10,9 11,4 11,5 11,6 11,6 11,2 10,7 10,4 10 9,7 9,1 9 8,6 8,8 8,5 8,3 8,3 8 7,6 7,1 7,1 7,3 7,3 7,3 7 7,2 7,2 7,5 7,4 7,4 7,2 7,1 6,6
2010
2011
2. Ir a Datos 3. Análisis de datos 4. Elegir regresión y aceptar
Total de Importaciones de bienes 2,91 3,19 2,77 3 3,74 3,25 3,25 3,89 4 4,17 3,88 3,65 4,21 4,26 4,8 4,29 5,03 5,05 4,85 5,18 5,13 5,26 4,82 4,98 6,18 5,6 5,99 5,86 6,13 6,49 6,37 5,75 6,42 6,04
Total de Exportaciones Mineras 2,07 2,21 2,46 2,57 2,84 2,83 2,52 3,79 3,41 4,02 2,76 3,04 3,51 3,13 3,35 3,19 3,7 3,96 4,06 4,08 4,26 5,32 3,78 3,63 4,73 4,26 4,36 4,25 3,74 3,51 3,95 4,13 4,05 4,48
5. Llenar los campos solicitados
RESULTADO
ANÁLISIS DE RESULTADOS
= 15,5129 (0,5979)
- 1,0582 X1 (0,1807)
- 0,5019 X2 (0,2700)
R2 = 0,8212
Donde los valores entre paréntesis son los errores estándar de los coeficientes estimados. La interpretación de la resultante de la regresión es la siguiente: Para el periodo de la muestra, cuando ambas variables explicativas son cero (al momento inicial), entonces la Tasa de Desocupación (Y) es de alrededor de 15,51%. No necesariamente el intercepto tiene significado económico. El coeficiente parcial -1,0582 que acompaña a la variable Importación de Bienes (X1), significa que su efecto es negativo sobre la variación de la Tasa de Desocupación (Y). Es decir, si crece en una unidad la importación de bienes, la tasa de desocupación decrece en aproximadamente 1,1%. A la inversa, si disminuye en una unidad la Tasa de Desocupación aumenta en alrededor de 1.1% en el periodo.
El coeficiente parcial -0,5019 que acompaña a la variable Exportaciones Mineras (X2) sobre el periodo marzo 2009 – marzo 2011, tiene un efecto negativo sobre la Tasa de Desocupación (Y) en un 0.5%. El Coeficiente de Determinación R2, significa que ambas variables X1 y X2 explican la variación de la Tasa de Desocupación (Y) en 82%. Podemos decir que hay correlación fuerte
Del diagrama observamos que existe una pendiente positiva y que tendremos una correlación relativamente alta entre estas variables
EJERCICIO 2 1. Se ha reunido la siguiente información de una muestra aleatoria de arrendadores de departamentos en una ciudad. Se intenta predecir la renta (en dólares por mes) con base en el tamaño del departamento (número de habitaciones) y la distancia al centro de la ciudad (en millas).
RENTA (DÓLARES) 360 1000 450 525 350 300
NÚMERO DE HABITACIONES 2 6 3 4 2 1
Donde:
PROCEDIMIENTO 1. Nos vamos a Datos, Análisis de datos y Regresión
DISTANCIA AL CENTRO 1 1 2 3 10 4
2. Escogemos el rango de entrada que en este caso será la Renta
3. Luego el rango de salida, que serán el número de habitaciones y la distancia al centro
4. Seleccionamos si queremos mostrar rótulos, y en donde aparecerán los resultados, ya sea en un rango de salida o en una hoja nueva.
5. Hacemos clic en aceptar y obtendremos los siguientes resultados
Interpretación: El coeficiente de determinación r2 se encuentra lejos de cero, lo cual nos indica que existe una fuerte relación entre las variable s, en decir en este caso la rentabilidad depende mucho del número de habitaciones que rente y de la distancia que tengan al centro Dado que el coeficiente de correlación es lejano a cero, se considera que el modelo es confiable para realizar pronósticos (valores de y) con las variables independientes (valores de las xs) El intercepto, es la pendiente en la ecuación, la cual nos da 96.45805593 El coeficiente que le corresponde a X1 es 136.4846871 El coeficiente que le corresponde a X2 es -2.403462051 El valor de r-cuadrado, dice qué porcentaje de variabilidad en la variable dependiente. Una estadística-t de 2 o más indica relevancia estadística, lo que significa que la relación entre la variable independiente y la dependiente seguramente no es por una probabilidad aleatoria.
EJERCICIO 3 Sam Spade, dueño y gerente de Stationary Store, está preocupado por el comportamiento de las ventas de un modelo de reproductor de CD y casetes que se venden en la tienda. Se da cuenta de que existen muchos factores que podrían ayudar a explicarlo, pero cree que la publicidad y el precio son los principales determinantes. Se intenta predecir las ventas a partir de la publicidad y el precio.Sam reunió los siguientes datos: VENTAS (UNIDADES VEND.) 33 61 70 82 17 24
PUBLICIDAD (NÚM. DE ANUNCIOS) 3 6 10 13 9 6
PRECIO (DÓLARES) 125 115 140 130 145 140
PROCEDIMIENTO 1. Nos vamos a Datos, Análisis de datos y Regresión
2. Escogemos el rango de entrada que en este caso será las ventas (unidades vender)
3. Luego el rango de salida, que serán la publicidad y el precio
4. Seleccionamos si queremos mostrar rótulos, y en donde aparecerán los resultados, ya sea en un rango de salida o en una hoja nueva.
5. Hacemos clic en aceptar y obtendremos los siguientes resultados
ANALISIS El coeficiente de determinación r2 se encuentra lejos de cero, lo cual nos indica que existe una fuerte relación entre las variables, es decir en este caso las ventas depende tanto del número de anuncios que se hagan por unidades vendidas y del precio de las unidades. Dado que el coeficiente de correlación es lejano a cero, se consideraría que el modelo es confiable para realizar predicciones (valores de y) con las variables independientes (valores de las xs) El intercepto, es la pendiente en la ecuación, la cual nos da 219.2306034 El coeficiente que le corresponde a X1 es 6.381465517 El coeficiente que le corresponde a X2 es -1.670833333
Ejercicio #4
PASOS 1. Hacemos clic en datos
2. Escogemos la opción análisis de datos
3. Damos clic en Regresión
4. Llenamos los datos en la cuadro que nos aparece
5. Obtenemos el Resultado
ANÁLISIS DE RESULTADOS
Interpretación:
*El coeficiente de determinación r2 se encuentra cera de cero, lo cual nos indica que no existe una fuerte relación entre las variables, en este caso podemos observar que el número de empleos no depende de las embarcaciones ni de las reparaciones q se efectúen *El intercepto, es la pendiente en la ecuación, la cual nos da 71,0318466048071 *El coeficiente que le corresponde a X1 es0,461991397250752
Reparaciones o Conversiones (millones de $)
*El coeficiente que le corresponde a X2 es 0,020815323569879
1800 1600
y = 10,68x R² = 0,13
1400 1200 1000 800 600 400 200 0 0
20
40
60
80
Embarcaciones (millones de $)
100
120
View more...
Comments