A01682283 10.1TareaFcaptulo1213y14(Semana10) TareaF Capitulo12al14 CarlosMontealvo A01682283

Share Embed Donate


Short Description

Descripción: Estadística en las organizaciones...

Description

 

Instituto Tecnológico y de Estudios Super Monterrey

Maestría en Administración Empresarial (M  Estadística en las Organizaciones Tarea F Capítulo 12 - 14 Carlos Alberto Montealvo Villanueva A01682283 14/11/2016

studios Superiores de ey Empresarial (MGN)

ganizaciones

o 12 - 14

lvo Villanueva

83

16

Capítulo 12 Problema 1 Cierta empresa piensa que el tipo de campaña influye en la zona del país, ya que la empresa indica que unas son más agresivas que otras. Para probar lo anterior se obtuvo la preferencia según la zona, lo anterior se muestra a continuación: Usando un nivel de significancia del 2.5%, se le pide que sustente sus respuestas en forma estadística para lo cual deberá de contener lo siguiente: a. Las hipótesis b. El valor del estadístico de prueba c. El valor crítico d. Decisión que se tomó e. Conclusión a la cual llegó Tabla de frecuencias observadas Tipos de campañas Zona del País Tipo A Tipo B Norte 158 156 Sur 147 167 Este 149 165 Oeste 160 146 Centro 167 148 TOTAL 781 782

Tipo C TOTAL 146 166 146 154 165 777

A) 460 480 460 460 480 2340 B)

Tabla de frecuencias esperadas Tipos de campañas Zona del País Tipo A Tipo B Tipo C TOTAL Norte 153.53 153.73 152.74 Sur 160.21 160.41 159.38 Este 153.53 153.73 152.74 Oeste 153.53 153.73 152.74 Centro 160.21 160.41 159.38 TOTAL 781 782 777

C) 460.00 480.00 460.00 460.00 480.00 2340

po de campaña influye son más agresivas que egún la zona, lo

e sustente sus contener lo siguiente:

En primer momento debemos especificar que en la hipotesis nula las variables deberan ser independientes y en la hipotesis alterna que las variables son dependientes viendose de la siguientes forma: H0: La zona del país es independiente del tipo de campaña Ha: La zona del país es dependiente del tipo de campaña X2=

5.471

g.l.= (R-1)(C-1) = (5-1)(3-1) = p - valor = 0.70627

8

Para rechazar la hipótesis nula es necesario que: valor - p ≤ α D) 0.70627 > 0.025 Por lo cual no se rechaza la hipótesis nula

E) Concluyendo con un 97.5% de confianza, se tiene evidencia estadística para no rechazar la hipótesis nula, afirmando que la opinión de la zona del país es independiente del tipo de campaña

Using the Test Statistic Chi Square Enter Chi Square --> df -->

p-value (Lower Tail) p-value (Upper Tail) p-value (Two Tail)

5.471 8

0.2937 0.70627 0.5875

evidencia estadística la opinión de la zona

La siguiente tabla muestra el puntaje que alumnos de diferentes ramas de las carreras que estudian obtuvieron según las horas que dedicaron; se desea saber si el puntaje promedio es el mismo en las diferentes ramas de la carrera: D e d i c a d a s

GMAT Study 3-hour review 1-day program 10-week course

Rama de la Carrera que Estudian Business Engineering Arts and Sciences 500 540 480 580 460 400 460 560 420 540 620 480 560 600 480 600 580 410

Usando un nivel de significancia del 1% (α = 0.01), se le pide lo siguiente: a. Las hipótesis b. El valor del estadístico de prueba c. Muestre el p-valor d. Decisión que se tomó e. La conclusión a la cual llegó α = 0.01

as de se as de la

A)

La Hipótesis nula indicaria lo siguiente ya que tenemos tres ramas de la carrera que estu ser iguales: H0: µ1 = µ2 = µ3 La Hipótesis alterna indicaria diferencia en al menos una media: Ha: al menos una µ ≠ es diferente a las demás B) Análisis de varianza de un factor RESUMEN Grupos

Cuenta

Columna 1 Columna 2 Columna 3 nT= Media total= ANÁLISIS DE VARIANZA Origen de las variaciones Entre grupos Dentro de los grupos

6 6 6 18 515 Suma de cuadrados 45300 37150

Total

82450

Variación entre tratamientos

SCTR= 45300 g.l. = K -1 = 3 -1 = 2 CMTR= 22650

SCE = 37150

g.l. = nT - K = 18 - 3 = 15 CME= 2476.67 STC= 82450

g.l. = nT - 1 = 18 -1 = 17 Estadistico de prueba F = 9.145 Nivel de significancia = α 0.01 Nivel de confianza = 1 -α = 0.99

nemos tres ramas de la carrera que estudian tendria deberan

erencia en al menos una media: a las demás

Suma

Promedio

Varianza 2720 3200 1510

Desv Std 52.15 56.57 38.86

Promedio de los cuadrados F 22650 9.14535666 2476.6666666667

Probabilidad 0.0025308196

3240 3360 2670 α = 0.01

Grados de libertad 2 15 17

540 560 445

C) (F - Fisher)

g.l. = K -1 = 3 -1 = g.l. = nT - K = 18 - 3 = 6.359 0.0025308196 9.145

V.c = p - valor = Estadistico de prueba F =

9.145 ≥ 6.359

0.00253082 ≤ 0.01

Ya que F es mayor que el valor crítico y el p -valor es menor al nivel de significancia se rechaza H0 D)

Valor crítico para F 6.359

Con un 99% de confianza, se tiene evidencia estadí concluir que rechazamos la hipótesis nula y afirmar en al menos una de las tres ramas de las carreras q diferente a las demas.

2 15

Using the Test Statistic F Enter F --> Numerator df --> Denominator df --> p-value (Lower Tail) p-value (Upper Tail) p-value (Two Tail)

9.15 2 15

0.9975 0.00253 0.0051

e confianza, se tiene evidencia estadística para chazamos la hipótesis nula y afirmar que el puntaje na de las tres ramas de las carreras que estudian es demas.

Sports & GT Car Acura Integra Type R Acura NSX-T BMW Z3 2.8 Chevrolet Camaro Z28 Chevrolet Corvette Convertible Dodge Viper RT/10 Ford Mustang GT Honda Prelude Type SH Mercedes-Benz CLK320 Mercedes-Benz SLK230 Mitsubishi 3000GT VR-4 Nissan 240SX SE Pontiac Firebird Trans Am Porsche Boxster Toyota Supra Turbo Volvo C70

Price ($1000s) 25.035 93.758 40.900 24.865 50.144 69.742 23.200 26.382 44.988 42.762 47.518 25.066 27.770 45.560 40.989 41.120

Curb Weight (lb.) 2577 3066 2844 3439 3246 3319 3227 3042 3240 3025 3737 2862 3455 2822 3505 3285

La tabla anterior indica que se tienen los diferentes tipos de automóviles deportivos con sus dólares), caballos de fuerza, velocidad (en millas por hora) y el peso del frenado (en libras). Se piensa que el precio del automóvil se ve afectado por la velocidad de este. Si necesita un Note que en la redacción no dice cuál es la variable X y cuál es la variable Y, pero lo anterio se ve afectado por la velocidad de este”, lo que lo anterior dice es que Y es el precio y X es lo siguiente: a. Presente un diagrama de dispersión e indique el tipo de relación que se tiene. b. Realice una regresión simple por medio del Excel y muestre sus resultados. c. De los resultados que se obtuvieron del inciso pasado en el Excel, muestre en que lugar e estimada para predecir el precio del automóvil. d. Realice la prueba de hipótesis para mostrar que a mayor velocidad, mayor sería el precio e. Indique la calidad de ajuste (muestre R cuadrada y el error estándar del estimado) e indiq saber si es cierto lo que indican sobre el precio y la velocidad, para poder determinar si la va hace que se incremente el precio. f. ¿El supuesto de normalidad en los errores se cumple? g. Ahora realice una regresión con la variable Peso del frenado (X) y la variable Precio del au h. Midiendo la calidad de ajuste de esta nueva regresión, ¿explica de mejor manera el precio explica de mejor manera a la variable precio del automóvil? Para responder esta pregunta u regresiones.

Horsepower

Speed at 1/4 mile (mph) 195 290 189 305 345 450 225 195 215 185 320 155 305 201 320 236

90.7 108 93.2 103.2 102.1 116.2 91.7 89.7 93 92.3 99 84.6 103.2 93.2 105 97

X Y α 1 - 0.05

viles deportivos con sus respectivos precios (en miles de del frenado (en libras). d de este. Si necesita un nivel de confianza utilice el 95%. riable Y, pero lo anterior indica que “el precio del automóvil ue Y es el precio y X es la velocidad. Se le pide que conteste

ue se tiene. sultados. muestre en que lugar encuentra la ecuación de regresión

d, mayor sería el precio del automóvil. ar del estimado) e indique si usaría esta ecuación para poder determinar si la variable X (velocidad del automóvil),

la variable Precio del automóvil (Y). e mejor manera el precio del automóvil o bien la velocidad ponder esta pregunta use la calidad de ajuste de ambas

= Velocidad = Precio = 0.05 = 0.95

A) 100.000 90.000 80.000 70.000 60.000 50.000 40.000 30.000 20.000 10.000 0.000 80

B)

85

C)

D)

E)

F)

G)

H)

P 100.000 80.000 60.000 40.000 20.000 0.000 80

85

90

Price ($1000s) 100.000 90.000 80.000 70.000 60.000 50.000 40.000 30.000 20.000 10.000 0.000 80

85

90

95

100

105

110

115

120

Resumen Estadísticas de la regresión Coeficiente de correlación múltiple Coeficiente de determinación R^2 R^2 ajustado Error típico Observaciones

0.6387804812 0.4080405031 0.3657576819 14.882405681 16

ANÁLISIS DE VARIANZA Grados de libertad Regresión Residuos Total

Intercepción Variable X 1

1 14 15

Suma de cuadrados 2137.3989679769 3100.8039839606 5238.2029519375

Coeficientes -101.1625523333 1.4649509233

Error típico 46.1908252327 0.4715778705

Pronóstico para Y 31.7084964127 57.0521473863 35.370873721 50.0203829543 48.4089369386

Residuos -6.6734964127 36.7058526137 5.529126279 -25.1553829543 1.7350630614

Análisis de los residuales Observación 1 2 3 4 5

6 7 8 9 10 11 12 13 14 15 16

Intercepción Variable X 1

69.0647449576 33.173447336 30.2435454893 35.0778835363 34.05241789 43.8675890763 22.7722957804 50.0203829543 35.370873721 52.6572946163 40.9376872296

0.6772550424 -9.973447336 -3.8615454893 9.9101164637 8.70958211 3.6504109237 2.2937042196 -22.2503829543 10.189126279 -11.6682946163 0.1823127704

Coeficientes -101.1625523333 1.4649509233

Error típico 46.1908252327 0.4715778705

La Hipótesis nula seria la siguientes: H0: β1 = 0 La Hipótesis alterna seria la siguiente: Ha: β1 Tenemos que: ≠0 V. c. = 4.6001099367 p - valor = 0.007732101

Estadísticas de la regresión Coeficiente de correlación múltiple Coeficiente de determinación R^2 R^2 ajustado Error típico Observaciones R2 = Error estándar del estimado = S =

9.650 ≥ 4.6001

0.6387804812 0.4080405031 0.3657576819 14.882405681 16 0.4080405031 14.882405681

Ya que se rechazo la Hipótesis nula y esta indicaba que se seguía una distribución normal 0.007732101 ≤ 0.05 Podemos decir que: Se puede apreciar en el grafico que e Ha : No sigue una distribución normal distribución normal e inclusive apreci Resultados de datos de probabilidad Percentil

Y 100 90 80

3.125 9.375 15.625 21.875 28.125 34.375 40.625 46.875 53.125 59.375 65.625 71.875 78.125 84.375 90.625 96.875

23.2 24.865 25.035 25.066 26.382 27.77 40.9 40.989 41.12 42.762 44.988 45.56 47.518 50.144 69.742 93.758

100 90 80 70 60 50 40 30 20 10 0

0

20

Resumen Estadísticas de la regresión Coeficiente de correlación múltiple Coeficiente de determinación R^2 R^2 ajustado Error típico Observaciones

0.1044459711 0.0109089609 -0.0597403991 19.2373513192 16

ANÁLISIS DE VARIANZA Grados de libertad Regresión Residuos Total

Intercepción Variable X 1

1 14 15

Suma de cuadrados 57.1433510383 5181.0596008992 5238.2029519375

Coeficientes 21.3163414567 0.0064851263

Error típico 52.5074764567 0.0165036826

Pronóstico para Y 38.0285119023 41.1997386574 39.7600406213 43.618690763

Residuos -12.9935119023 52.5582613426 1.1399593787 -18.753690763

Análisis de los residuales Observación 1 2 3 4

4

5 6 7 8 9 10 11 12 13 14 15 16

42.3670613893 42.8404756084 42.2438439898 41.0440956265 42.3281506316 40.9338484796 45.551258397 39.8767728945 43.7224527836 39.617367843 44.0467090981 42.6199813146

7.7769386107 26.9015243916 -19.0438439898 -14.6620956265 2.6598493684 1.8281515204 1.966741603 -14.8107728945 -15.9524527836 5.942632157 -3.0577090981 -1.4999813146

X = Velocidad Y = Precio Estadísticas de la regresión Coeficiente de correlación múltiple 0.6387804812 Coeficiente de determinación R^2 0.4080405031 R^2 ajustado 0.3657576819 Error típico 14.882405681 Observaciones 16 R2 = Error estándar del estimado = S =

0.4080405031 14.882405681

La R2 nos indica lo que se logro captar del comportamiento de la variable dependiente del cual se cap El error estandar (S) nos indica cuanta dispersión o variabilidad de los datos ahí a tr se puede detectar un valor atípico. Por ende no recomiendo usar esta ecuación para saber si es cierto lo que indic incremente el precio, ya que la calidad de ajuste o captación es baja y la dispersión o error estándar e usar la calidad de ajuste anterior donde la R2 era mayor a 1% y el error tipico S era menor a 19, ya qu

Price ($1000s)

100.000

100.000

80.000

80.000

60.000

60.000

40.000

40.000

20.000

20.000

0.000 80

85

90

95

100

105

110

115

120

0.000 2500

2700

2

En el grafico podemos observar que cuando la velocidad aumenta el precio también y viceversa, mostrando así una relación directa entre la variable X (velocidad) y Y (precio). Ademas al trazar una linea de tendencia podemos detectar que atraviesa solo algunos de los puntos mostrando bastante dispersión.

Promedio de los cuadrados 2137.3989679769 221.4859988543

F 9.6502667394

Valor crítico de F 0.007732101

Estadístico t -2.1901005627 3.1064878463

Probabilidad 0.0459444531 0.007732101

Inferior 95% -200.2320193963 0.4535169843 Resultados de datos de probabilidad

Residuos estándares -0.4641537934 2.5529587008 0.3845607727 -1.7496025623 0.1206767865

Percentil 3.125 9.375 15.625 21.875 28.125

0.047104318 -0.6936713723 -0.2685775007 0.6892665951 0.6057672509 0.2538927083 0.1595312934 -1.5475545374 0.7086722344 -0.8115510782 0.0126801842

Estadístico t -2.1901005627 3.1064878463

0.007732101 ≤ 0.05

34.375 40.625 46.875 53.125 59.375 65.625 71.875 78.125 84.375 90.625 96.875

Probabilidad 0.0459444531 0.007732101

Inferior 95% -200.2320193963 0.4535169843

Se concluye que se rechaza la Hipótesis nula y se acepta la alterna. Con un 95% de confianza, se tiene evidencia estadística para afirmar que β1 ≠ 0, dandonos a entender que la variable velocidad afecta a la variable precio, provocando que a mayor velocidad mayor precio.

La R2 nos indica lo que se logro captar del comportamiento de la variable dependiente del cua

40.8% de un 100%, esto da pie a usar otras variables para acercarnos a 100%. El error estandar (S) nos indica cuanta dispersión o variabilidad de los datos ahí a tra regresión y donde el valor optimo seria 0 pero nos muestra una dispersion de 14.88, e inclusi valor atípico. recomiendo usar esta ecuación para saber si es cierto lo que indican sobre el precio y la veloc determinar si la variable X (velocidad del automóvil), hace que se incremente el precio, ya qu captación es baja y la dispersión o error estándar es alto.

ón normal

iar en el grafico que existen valores que no siguen la linea de tendencia, mostrando que no se tiene una mal e inclusive apreciamos un valor atipico.

Y

Y

20

40

60

80

100

120

Promedio de los cuadrados 57.1433510383 370.0756857785

F 0.1544099038

Valor crítico de F 0.7002745554

Estadístico t 0.4059677382 0.3929502561

Probabilidad 0.6909032287 0.7002745554

Inferior 95% -91.3009950637 -0.0289117524

Resultados de datos de probabilidad Residuos estándares -0.6991379616 2.8279864579 0.0613374492 -1.0090741619

Percentil 3.125 9.375 15.625 21.875

0.4184513816 1.4474821795 -1.0246863487 -0.7889189409 0.1431177098 0.0983667955 0.1058238701 -0.7969187737 -0.8583487979 0.3197534096 -0.1645252278 -0.0807090405

28.125 34.375 40.625 46.875 53.125 59.375 65.625 71.875 78.125 84.375 90.625 96.875

X = Peso del Frenado Y = Precio Estadísticas de la regresión Coeficiente de correlación múltiple 0.1044459711 Coeficiente de determinación R^2 0.0109089609 R^2 ajustado -0.0597403991 Error típico 19.2373513192 Observaciones 16 R2 = Error estándar del estimado = S =

0.0109089609 19.2373513192

ndiente del cual se capto solo un 1% de un 100%, esto da pie a usar otras variables para acercarnos a 100%. ad de los datos ahí a traves de la linea de regresión y donde el valor optimo seria 0 pero nos muestra una disper

i es cierto lo que indican sobre el precio y el peso del frenado, para poder determinar si la variable X (peso del f sión o error estándar es alto. Si se tuviera que elegir entre esta calidad de ajuste o la determinada en incisos an era menor a 19, ya que presenta mayor capatación y una menor dispersión de datos.

Price

000

000

000

000

000

000 2500

2700

2900

3100

3300

3500

3700

3900

Superior 95% -2.09308527 2.47638486

de datos de probabilidad Y 23.2 24.865 25.035 25.066 26.382

27.77 40.9 40.989 41.12 42.762 44.988 45.56 47.518 50.144 69.742 93.758

Superior 95% -2.09308527 2.47638486

ipótesis nula y se

ene evidencia ≠ 0, dandonos a ad afecta a la variable velocidad mayor

ariable dependiente del cual se capto solo un nos a 100%. lidad de los datos ahí a traves de la linea de spersion de 14.88, e inclusive se puede detectar un Por ende no an sobre el precio y la velocidad, para poder ncremente el precio, ya que la calidad de ajuste o

do que no se tiene una

Superior 95% Inferior 95.0% Superior 95.0% 133.933678 -91.300995064 133.933677977 0.041882 -0.0289117524 0.0418820049

de datos de probabilidad Y 23.2 24.865 25.035 25.066

Gráfico de probabilidad normal 100 Y

50 0 0

20

40

60

80

100

120

Gráfico de probabilidad normal 100

26.382 27.77 40.9 40.989 41.12 42.762 44.988 45.56 47.518 50.144 69.742 93.758

Y

50 0 0

20

s para acercarnos a 100%. 0 pero nos muestra una dispersion de 19.23 e inclusive

nar si la variable X (peso del frenado), hace que se la determinada en incisos anteriores, se recomienda tos.

40

60 Muestra percentil

80

100

120

normal

100

120

normal

100

120

Ejercicio Portada y redacción Ejercicio 1 Ejercicio 2 Ejercicio 3 Calificación

.

Puntos posibles 10 30 30 30 100

Puntos obtenidos 10 30 30 30 100

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF