A01682283 10.1TareaFcaptulo1213y14(Semana10) TareaF Capitulo12al14 CarlosMontealvo A01682283
Short Description
Descripción: Estadística en las organizaciones...
Description
Instituto Tecnológico y de Estudios Super Monterrey
Maestría en Administración Empresarial (M Estadística en las Organizaciones Tarea F Capítulo 12 - 14 Carlos Alberto Montealvo Villanueva A01682283 14/11/2016
studios Superiores de ey Empresarial (MGN)
ganizaciones
o 12 - 14
lvo Villanueva
83
16
Capítulo 12 Problema 1 Cierta empresa piensa que el tipo de campaña influye en la zona del país, ya que la empresa indica que unas son más agresivas que otras. Para probar lo anterior se obtuvo la preferencia según la zona, lo anterior se muestra a continuación: Usando un nivel de significancia del 2.5%, se le pide que sustente sus respuestas en forma estadística para lo cual deberá de contener lo siguiente: a. Las hipótesis b. El valor del estadístico de prueba c. El valor crítico d. Decisión que se tomó e. Conclusión a la cual llegó Tabla de frecuencias observadas Tipos de campañas Zona del País Tipo A Tipo B Norte 158 156 Sur 147 167 Este 149 165 Oeste 160 146 Centro 167 148 TOTAL 781 782
Tipo C TOTAL 146 166 146 154 165 777
A) 460 480 460 460 480 2340 B)
Tabla de frecuencias esperadas Tipos de campañas Zona del País Tipo A Tipo B Tipo C TOTAL Norte 153.53 153.73 152.74 Sur 160.21 160.41 159.38 Este 153.53 153.73 152.74 Oeste 153.53 153.73 152.74 Centro 160.21 160.41 159.38 TOTAL 781 782 777
C) 460.00 480.00 460.00 460.00 480.00 2340
po de campaña influye son más agresivas que egún la zona, lo
e sustente sus contener lo siguiente:
En primer momento debemos especificar que en la hipotesis nula las variables deberan ser independientes y en la hipotesis alterna que las variables son dependientes viendose de la siguientes forma: H0: La zona del país es independiente del tipo de campaña Ha: La zona del país es dependiente del tipo de campaña X2=
5.471
g.l.= (R-1)(C-1) = (5-1)(3-1) = p - valor = 0.70627
8
Para rechazar la hipótesis nula es necesario que: valor - p ≤ α D) 0.70627 > 0.025 Por lo cual no se rechaza la hipótesis nula
E) Concluyendo con un 97.5% de confianza, se tiene evidencia estadística para no rechazar la hipótesis nula, afirmando que la opinión de la zona del país es independiente del tipo de campaña
Using the Test Statistic Chi Square Enter Chi Square --> df -->
p-value (Lower Tail) p-value (Upper Tail) p-value (Two Tail)
5.471 8
0.2937 0.70627 0.5875
evidencia estadística la opinión de la zona
La siguiente tabla muestra el puntaje que alumnos de diferentes ramas de las carreras que estudian obtuvieron según las horas que dedicaron; se desea saber si el puntaje promedio es el mismo en las diferentes ramas de la carrera: D e d i c a d a s
GMAT Study 3-hour review 1-day program 10-week course
Rama de la Carrera que Estudian Business Engineering Arts and Sciences 500 540 480 580 460 400 460 560 420 540 620 480 560 600 480 600 580 410
Usando un nivel de significancia del 1% (α = 0.01), se le pide lo siguiente: a. Las hipótesis b. El valor del estadístico de prueba c. Muestre el p-valor d. Decisión que se tomó e. La conclusión a la cual llegó α = 0.01
as de se as de la
A)
La Hipótesis nula indicaria lo siguiente ya que tenemos tres ramas de la carrera que estu ser iguales: H0: µ1 = µ2 = µ3 La Hipótesis alterna indicaria diferencia en al menos una media: Ha: al menos una µ ≠ es diferente a las demás B) Análisis de varianza de un factor RESUMEN Grupos
Cuenta
Columna 1 Columna 2 Columna 3 nT= Media total= ANÁLISIS DE VARIANZA Origen de las variaciones Entre grupos Dentro de los grupos
6 6 6 18 515 Suma de cuadrados 45300 37150
Total
82450
Variación entre tratamientos
SCTR= 45300 g.l. = K -1 = 3 -1 = 2 CMTR= 22650
SCE = 37150
g.l. = nT - K = 18 - 3 = 15 CME= 2476.67 STC= 82450
g.l. = nT - 1 = 18 -1 = 17 Estadistico de prueba F = 9.145 Nivel de significancia = α 0.01 Nivel de confianza = 1 -α = 0.99
nemos tres ramas de la carrera que estudian tendria deberan
erencia en al menos una media: a las demás
Suma
Promedio
Varianza 2720 3200 1510
Desv Std 52.15 56.57 38.86
Promedio de los cuadrados F 22650 9.14535666 2476.6666666667
Probabilidad 0.0025308196
3240 3360 2670 α = 0.01
Grados de libertad 2 15 17
540 560 445
C) (F - Fisher)
g.l. = K -1 = 3 -1 = g.l. = nT - K = 18 - 3 = 6.359 0.0025308196 9.145
V.c = p - valor = Estadistico de prueba F =
9.145 ≥ 6.359
0.00253082 ≤ 0.01
Ya que F es mayor que el valor crítico y el p -valor es menor al nivel de significancia se rechaza H0 D)
Valor crítico para F 6.359
Con un 99% de confianza, se tiene evidencia estadí concluir que rechazamos la hipótesis nula y afirmar en al menos una de las tres ramas de las carreras q diferente a las demas.
2 15
Using the Test Statistic F Enter F --> Numerator df --> Denominator df --> p-value (Lower Tail) p-value (Upper Tail) p-value (Two Tail)
9.15 2 15
0.9975 0.00253 0.0051
e confianza, se tiene evidencia estadística para chazamos la hipótesis nula y afirmar que el puntaje na de las tres ramas de las carreras que estudian es demas.
Sports & GT Car Acura Integra Type R Acura NSX-T BMW Z3 2.8 Chevrolet Camaro Z28 Chevrolet Corvette Convertible Dodge Viper RT/10 Ford Mustang GT Honda Prelude Type SH Mercedes-Benz CLK320 Mercedes-Benz SLK230 Mitsubishi 3000GT VR-4 Nissan 240SX SE Pontiac Firebird Trans Am Porsche Boxster Toyota Supra Turbo Volvo C70
Price ($1000s) 25.035 93.758 40.900 24.865 50.144 69.742 23.200 26.382 44.988 42.762 47.518 25.066 27.770 45.560 40.989 41.120
Curb Weight (lb.) 2577 3066 2844 3439 3246 3319 3227 3042 3240 3025 3737 2862 3455 2822 3505 3285
La tabla anterior indica que se tienen los diferentes tipos de automóviles deportivos con sus dólares), caballos de fuerza, velocidad (en millas por hora) y el peso del frenado (en libras). Se piensa que el precio del automóvil se ve afectado por la velocidad de este. Si necesita un Note que en la redacción no dice cuál es la variable X y cuál es la variable Y, pero lo anterio se ve afectado por la velocidad de este”, lo que lo anterior dice es que Y es el precio y X es lo siguiente: a. Presente un diagrama de dispersión e indique el tipo de relación que se tiene. b. Realice una regresión simple por medio del Excel y muestre sus resultados. c. De los resultados que se obtuvieron del inciso pasado en el Excel, muestre en que lugar e estimada para predecir el precio del automóvil. d. Realice la prueba de hipótesis para mostrar que a mayor velocidad, mayor sería el precio e. Indique la calidad de ajuste (muestre R cuadrada y el error estándar del estimado) e indiq saber si es cierto lo que indican sobre el precio y la velocidad, para poder determinar si la va hace que se incremente el precio. f. ¿El supuesto de normalidad en los errores se cumple? g. Ahora realice una regresión con la variable Peso del frenado (X) y la variable Precio del au h. Midiendo la calidad de ajuste de esta nueva regresión, ¿explica de mejor manera el precio explica de mejor manera a la variable precio del automóvil? Para responder esta pregunta u regresiones.
Horsepower
Speed at 1/4 mile (mph) 195 290 189 305 345 450 225 195 215 185 320 155 305 201 320 236
90.7 108 93.2 103.2 102.1 116.2 91.7 89.7 93 92.3 99 84.6 103.2 93.2 105 97
X Y α 1 - 0.05
viles deportivos con sus respectivos precios (en miles de del frenado (en libras). d de este. Si necesita un nivel de confianza utilice el 95%. riable Y, pero lo anterior indica que “el precio del automóvil ue Y es el precio y X es la velocidad. Se le pide que conteste
ue se tiene. sultados. muestre en que lugar encuentra la ecuación de regresión
d, mayor sería el precio del automóvil. ar del estimado) e indique si usaría esta ecuación para poder determinar si la variable X (velocidad del automóvil),
la variable Precio del automóvil (Y). e mejor manera el precio del automóvil o bien la velocidad ponder esta pregunta use la calidad de ajuste de ambas
= Velocidad = Precio = 0.05 = 0.95
A) 100.000 90.000 80.000 70.000 60.000 50.000 40.000 30.000 20.000 10.000 0.000 80
B)
85
C)
D)
E)
F)
G)
H)
P 100.000 80.000 60.000 40.000 20.000 0.000 80
85
90
Price ($1000s) 100.000 90.000 80.000 70.000 60.000 50.000 40.000 30.000 20.000 10.000 0.000 80
85
90
95
100
105
110
115
120
Resumen Estadísticas de la regresión Coeficiente de correlación múltiple Coeficiente de determinación R^2 R^2 ajustado Error típico Observaciones
0.6387804812 0.4080405031 0.3657576819 14.882405681 16
ANÁLISIS DE VARIANZA Grados de libertad Regresión Residuos Total
Intercepción Variable X 1
1 14 15
Suma de cuadrados 2137.3989679769 3100.8039839606 5238.2029519375
Coeficientes -101.1625523333 1.4649509233
Error típico 46.1908252327 0.4715778705
Pronóstico para Y 31.7084964127 57.0521473863 35.370873721 50.0203829543 48.4089369386
Residuos -6.6734964127 36.7058526137 5.529126279 -25.1553829543 1.7350630614
Análisis de los residuales Observación 1 2 3 4 5
6 7 8 9 10 11 12 13 14 15 16
Intercepción Variable X 1
69.0647449576 33.173447336 30.2435454893 35.0778835363 34.05241789 43.8675890763 22.7722957804 50.0203829543 35.370873721 52.6572946163 40.9376872296
0.6772550424 -9.973447336 -3.8615454893 9.9101164637 8.70958211 3.6504109237 2.2937042196 -22.2503829543 10.189126279 -11.6682946163 0.1823127704
Coeficientes -101.1625523333 1.4649509233
Error típico 46.1908252327 0.4715778705
La Hipótesis nula seria la siguientes: H0: β1 = 0 La Hipótesis alterna seria la siguiente: Ha: β1 Tenemos que: ≠0 V. c. = 4.6001099367 p - valor = 0.007732101
Estadísticas de la regresión Coeficiente de correlación múltiple Coeficiente de determinación R^2 R^2 ajustado Error típico Observaciones R2 = Error estándar del estimado = S =
9.650 ≥ 4.6001
0.6387804812 0.4080405031 0.3657576819 14.882405681 16 0.4080405031 14.882405681
Ya que se rechazo la Hipótesis nula y esta indicaba que se seguía una distribución normal 0.007732101 ≤ 0.05 Podemos decir que: Se puede apreciar en el grafico que e Ha : No sigue una distribución normal distribución normal e inclusive apreci Resultados de datos de probabilidad Percentil
Y 100 90 80
3.125 9.375 15.625 21.875 28.125 34.375 40.625 46.875 53.125 59.375 65.625 71.875 78.125 84.375 90.625 96.875
23.2 24.865 25.035 25.066 26.382 27.77 40.9 40.989 41.12 42.762 44.988 45.56 47.518 50.144 69.742 93.758
100 90 80 70 60 50 40 30 20 10 0
0
20
Resumen Estadísticas de la regresión Coeficiente de correlación múltiple Coeficiente de determinación R^2 R^2 ajustado Error típico Observaciones
0.1044459711 0.0109089609 -0.0597403991 19.2373513192 16
ANÁLISIS DE VARIANZA Grados de libertad Regresión Residuos Total
Intercepción Variable X 1
1 14 15
Suma de cuadrados 57.1433510383 5181.0596008992 5238.2029519375
Coeficientes 21.3163414567 0.0064851263
Error típico 52.5074764567 0.0165036826
Pronóstico para Y 38.0285119023 41.1997386574 39.7600406213 43.618690763
Residuos -12.9935119023 52.5582613426 1.1399593787 -18.753690763
Análisis de los residuales Observación 1 2 3 4
4
5 6 7 8 9 10 11 12 13 14 15 16
42.3670613893 42.8404756084 42.2438439898 41.0440956265 42.3281506316 40.9338484796 45.551258397 39.8767728945 43.7224527836 39.617367843 44.0467090981 42.6199813146
7.7769386107 26.9015243916 -19.0438439898 -14.6620956265 2.6598493684 1.8281515204 1.966741603 -14.8107728945 -15.9524527836 5.942632157 -3.0577090981 -1.4999813146
X = Velocidad Y = Precio Estadísticas de la regresión Coeficiente de correlación múltiple 0.6387804812 Coeficiente de determinación R^2 0.4080405031 R^2 ajustado 0.3657576819 Error típico 14.882405681 Observaciones 16 R2 = Error estándar del estimado = S =
0.4080405031 14.882405681
La R2 nos indica lo que se logro captar del comportamiento de la variable dependiente del cual se cap El error estandar (S) nos indica cuanta dispersión o variabilidad de los datos ahí a tr se puede detectar un valor atípico. Por ende no recomiendo usar esta ecuación para saber si es cierto lo que indic incremente el precio, ya que la calidad de ajuste o captación es baja y la dispersión o error estándar e usar la calidad de ajuste anterior donde la R2 era mayor a 1% y el error tipico S era menor a 19, ya qu
Price ($1000s)
100.000
100.000
80.000
80.000
60.000
60.000
40.000
40.000
20.000
20.000
0.000 80
85
90
95
100
105
110
115
120
0.000 2500
2700
2
En el grafico podemos observar que cuando la velocidad aumenta el precio también y viceversa, mostrando así una relación directa entre la variable X (velocidad) y Y (precio). Ademas al trazar una linea de tendencia podemos detectar que atraviesa solo algunos de los puntos mostrando bastante dispersión.
Promedio de los cuadrados 2137.3989679769 221.4859988543
F 9.6502667394
Valor crítico de F 0.007732101
Estadístico t -2.1901005627 3.1064878463
Probabilidad 0.0459444531 0.007732101
Inferior 95% -200.2320193963 0.4535169843 Resultados de datos de probabilidad
Residuos estándares -0.4641537934 2.5529587008 0.3845607727 -1.7496025623 0.1206767865
Percentil 3.125 9.375 15.625 21.875 28.125
0.047104318 -0.6936713723 -0.2685775007 0.6892665951 0.6057672509 0.2538927083 0.1595312934 -1.5475545374 0.7086722344 -0.8115510782 0.0126801842
Estadístico t -2.1901005627 3.1064878463
0.007732101 ≤ 0.05
34.375 40.625 46.875 53.125 59.375 65.625 71.875 78.125 84.375 90.625 96.875
Probabilidad 0.0459444531 0.007732101
Inferior 95% -200.2320193963 0.4535169843
Se concluye que se rechaza la Hipótesis nula y se acepta la alterna. Con un 95% de confianza, se tiene evidencia estadística para afirmar que β1 ≠ 0, dandonos a entender que la variable velocidad afecta a la variable precio, provocando que a mayor velocidad mayor precio.
La R2 nos indica lo que se logro captar del comportamiento de la variable dependiente del cua
40.8% de un 100%, esto da pie a usar otras variables para acercarnos a 100%. El error estandar (S) nos indica cuanta dispersión o variabilidad de los datos ahí a tra regresión y donde el valor optimo seria 0 pero nos muestra una dispersion de 14.88, e inclusi valor atípico. recomiendo usar esta ecuación para saber si es cierto lo que indican sobre el precio y la veloc determinar si la variable X (velocidad del automóvil), hace que se incremente el precio, ya qu captación es baja y la dispersión o error estándar es alto.
ón normal
iar en el grafico que existen valores que no siguen la linea de tendencia, mostrando que no se tiene una mal e inclusive apreciamos un valor atipico.
Y
Y
20
40
60
80
100
120
Promedio de los cuadrados 57.1433510383 370.0756857785
F 0.1544099038
Valor crítico de F 0.7002745554
Estadístico t 0.4059677382 0.3929502561
Probabilidad 0.6909032287 0.7002745554
Inferior 95% -91.3009950637 -0.0289117524
Resultados de datos de probabilidad Residuos estándares -0.6991379616 2.8279864579 0.0613374492 -1.0090741619
Percentil 3.125 9.375 15.625 21.875
0.4184513816 1.4474821795 -1.0246863487 -0.7889189409 0.1431177098 0.0983667955 0.1058238701 -0.7969187737 -0.8583487979 0.3197534096 -0.1645252278 -0.0807090405
28.125 34.375 40.625 46.875 53.125 59.375 65.625 71.875 78.125 84.375 90.625 96.875
X = Peso del Frenado Y = Precio Estadísticas de la regresión Coeficiente de correlación múltiple 0.1044459711 Coeficiente de determinación R^2 0.0109089609 R^2 ajustado -0.0597403991 Error típico 19.2373513192 Observaciones 16 R2 = Error estándar del estimado = S =
0.0109089609 19.2373513192
ndiente del cual se capto solo un 1% de un 100%, esto da pie a usar otras variables para acercarnos a 100%. ad de los datos ahí a traves de la linea de regresión y donde el valor optimo seria 0 pero nos muestra una disper
i es cierto lo que indican sobre el precio y el peso del frenado, para poder determinar si la variable X (peso del f sión o error estándar es alto. Si se tuviera que elegir entre esta calidad de ajuste o la determinada en incisos an era menor a 19, ya que presenta mayor capatación y una menor dispersión de datos.
Price
000
000
000
000
000
000 2500
2700
2900
3100
3300
3500
3700
3900
Superior 95% -2.09308527 2.47638486
de datos de probabilidad Y 23.2 24.865 25.035 25.066 26.382
27.77 40.9 40.989 41.12 42.762 44.988 45.56 47.518 50.144 69.742 93.758
Superior 95% -2.09308527 2.47638486
ipótesis nula y se
ene evidencia ≠ 0, dandonos a ad afecta a la variable velocidad mayor
ariable dependiente del cual se capto solo un nos a 100%. lidad de los datos ahí a traves de la linea de spersion de 14.88, e inclusive se puede detectar un Por ende no an sobre el precio y la velocidad, para poder ncremente el precio, ya que la calidad de ajuste o
do que no se tiene una
Superior 95% Inferior 95.0% Superior 95.0% 133.933678 -91.300995064 133.933677977 0.041882 -0.0289117524 0.0418820049
de datos de probabilidad Y 23.2 24.865 25.035 25.066
Gráfico de probabilidad normal 100 Y
50 0 0
20
40
60
80
100
120
Gráfico de probabilidad normal 100
26.382 27.77 40.9 40.989 41.12 42.762 44.988 45.56 47.518 50.144 69.742 93.758
Y
50 0 0
20
s para acercarnos a 100%. 0 pero nos muestra una dispersion de 19.23 e inclusive
nar si la variable X (peso del frenado), hace que se la determinada en incisos anteriores, se recomienda tos.
40
60 Muestra percentil
80
100
120
normal
100
120
normal
100
120
Ejercicio Portada y redacción Ejercicio 1 Ejercicio 2 Ejercicio 3 Calificación
.
Puntos posibles 10 30 30 30 100
Puntos obtenidos 10 30 30 30 100
View more...
Comments