Estadistica I GaonaZambranoReimundo

February 11, 2017 | Author: Paulo Cesar Ocampo | Category: N/A
Share Embed Donate


Short Description

Download Estadistica I GaonaZambranoReimundo...

Description

DEPARTAMENTO DE CIENCIAS DE LA COMPUTACIÓN

CARRERA INGENIERÍA EN SISTEMAS E INFORMÁTICA

CUADERNO VIRTUAL ESTADÍSTICA I “Estadística I conceptos, definiciones, ejercicios resueltos”

2DO NIVEL Equipo de trabajo: Andrea Reimundo Elizabeth Zambrano Christian Gaona DOCENTE: Ing. Oswaldo Latorre G. Sangolquí MAYO/ 2013

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

TABLA DE CONTENIDOS CONCEPTOS BÁSICOS........................................................................................................... 5 Estadística: ...............................................................................................................................5 Población: ................................................................................................................................5 Muestra:...................................................................................................................................5 Rango: ......................................................................................................................................5 Parámetro: ...............................................................................................................................5 Estadístico: ...............................................................................................................................5 Variable: ...................................................................................................................................5

ESTADÍSTICA DESCRIPTIVA .................................................................................................. 5 Medidas de tendencia central:.................................................................................................5 Medidas de dispersión: ............................................................................................................6 Medidas de forma: ...................................................................................................................6 Medidas de Posición: ...............................................................................................................6 Ejercicios: ............................................................................................................................7

COMBINACIONES Y PERMUTACIONES............................................................................... 10 Permutaciones con repetición ...............................................................................................10 Ejercicios: ..........................................................................................................................10 Permutaciones sin repetición.................................................................................................12 Ejercicios: ..........................................................................................................................12 Combinación sin repetición ....................................................................................................13 Ejercicios: ..........................................................................................................................13 Combinación con repetición ..................................................................................................14 Ejercicios: ..........................................................................................................................14 Ejercicios: ..........................................................................................................................14

PROBABILIDAD ................................................................................................................... 15 Espacio muestral (𝑠): .............................................................................................................15 Evento: ...................................................................................................................................15

Reimundo, Gaona, Zambrano

2

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

Probabilidad Marginal: ...........................................................................................................16 Ejercicios: ..........................................................................................................................16 Probabilidad Conjunta: ..........................................................................................................17 Ejercicios: ..........................................................................................................................17 Regla de adición: ....................................................................................................................19 Ejercicios ...........................................................................................................................19 Probabilidad Condicional: ......................................................................................................21 Ejercicios: ..........................................................................................................................21

VARIABLES ALEATORIAS..................................................................................................... 23 Distribución de probabilidad de una variable aleatoria .........................................................23 Ejercicios: ..........................................................................................................................25

DISTRIBUCIONES DE PROBABILIDAD DISCRETA................................................................. 32 Distribución Binomial .............................................................................................................32 Ejercicios: ..........................................................................................................................33 Distribución Hipergeométrica ................................................................................................35 Ejercicios: ..........................................................................................................................36 Distribución de Poisson ..........................................................................................................37 Ejercicios: ..........................................................................................................................38 Distribución multinomial........................................................................................................40 Ejercicios: ..........................................................................................................................40

VARIABLE ALEATORIA CONTINUA ..................................................................................... 42 Ejercicios: ..........................................................................................................................43

DISTRIBUCIONES DE PROBABILIDAD CONTINUA............................................................... 45 Distribución Normal ...............................................................................................................45 Ejercicios: ..........................................................................................................................46 Aproximación de distribución normal a distribución binomial...............................................49 Ejercicios: ..........................................................................................................................49 Intervalos de confianza ..........................................................................................................51 Ejercicios: ..........................................................................................................................51

Reimundo, Gaona, Zambrano

3

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

Distribución uniforme ............................................................................................................53 Ejercicios: ..........................................................................................................................54 Distribución Exponencial ........................................................................................................57 Ejercicios: ..........................................................................................................................58

Regresiones........................................................................................................................ 61 Regresión Lineal .....................................................................................................................61 Mínimos Cuadrados ...............................................................................................................61 Ejercicios: ..........................................................................................................................64 Regresión polinomial .............................................................................................................71 Ejercicios: ..........................................................................................................................74 Regresión lineal múltiple........................................................................................................79 Ejercicios: ..........................................................................................................................79 Aplicaciones de la regresión lineal (función exponencial) ......................................................82 Ejercicios: ..........................................................................................................................82 Aplicaciones de la regresión lineal (función potencia) ...........................................................83 Ejercicios: ..........................................................................................................................84

Reimundo, Gaona, Zambrano

4

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

Estadística I CONCEPTOS BÁSICOS Estadística: La estadística es una disciplina que utiliza recursos matemáticos para organizar y resumir una gran cantidad de datos obtenidos de la realidad y poder inferir ciertas características sobre ellos.

Población: Se denomina población estadística a todo el conjunto de elementos sobre los cuales se va a realizar las observaciones.

Muestra: Es un subconjunto de los elementos de la población. Se toma o se adquiere una muestra cuando es difícil la observación de todos los elementos de la población.

Rango: Es la diferencia entre el mayor y menor valor del conjunto de datos. Parámetro: Son los datos descriptores de la población. Estadístico: Son los datos descriptores de la muestra. Variable: Es un conjunto de valores numéricos que adoptan un carácter cuantitativo y pueden ser:  

Variable Discreta: Es aquella que está relacionada con los números enteros, es decir que no hay un número intermedio entre dos consecutivos. Ejemplo: Número de hijos Variable Continua: Es aquella que toma un infinito número de valores y está relacionada con la recta real. Ejemplo: calificaciones.

ESTADÍSTICA DESCRIPTIVA Es aquella que utiliza los datos numéricos, obtenidos de la muestra por medio de las medidas descriptivas, resumen la información contenida en la muestra. Las medidas descriptivas se clasifican en:

Medidas de tendencia central: Son los valores numéricos que se consideran como los más representativos dentro de un conjunto ordenado de datos y son: 

̅): Es el cociente entre la suma de los datos con el número Media Aritmética (𝒙 de datos. 𝑥̅ =



∑ 𝑥𝑖 𝑛

si 𝑛: número de datos.

Moda (𝑴𝒐): Es el valor de la variable que más veces se repite dentro de un conjunto de datos.

Reimundo, Gaona, Zambrano

5

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos



Mediana (𝑴𝒆): Es el valor numérico que divide a los observados ordenados de menor a mayor en la mitad. Si el número de observados ordenados es impar, la mediana es el valor central, caso contrario si el número es par la mediana es la media aritmética entre los dos valores centrales.

Medidas de dispersión: Sirven para indicar que tan representativas son las medidas de tendencia central y se clasifican en absolutas y relativas. 



Absolutas  Varianza (𝝈𝟐 ): Es el cociente entre la suma de los cuadrados de la diferencia de la media aritmética con cada uno de os datos y el número de datos. ∑ii=0(𝑥̅ − 𝑥𝑖 )2 𝜎2 = 𝑛  Desviación estándar (𝝈): Es el valor positivo de la raíz de la varianza 𝜎 = √𝜎 2 Relativas: Es el coeficiente de variación de Pearson, es el cociente de la desviación y el valor absoluto 𝜎 𝐶𝑉𝑃 = |𝑥 |

Medidas de forma: Se consideran que una distribución es simétrica si su media aritmética y su moda coinciden, se dice que es asimétrica por la derecha si sus frecuencias descienden lentamente por dicho lado, caso contrario se consideran asimétrica por la izquierda. Para determinar a forma de distribución se hace uso del coeficiente de asimetría de Pearson.       

𝑥̅ −𝑀𝑜

𝐴𝑆 = 𝜎 𝐴𝑆 = 0 𝑆𝑖𝑚é𝑡𝑟𝑖𝑐𝑜 𝐴𝑆 > 0 𝐷𝑒𝑟𝑒𝑐ℎ𝑎 𝐴𝑆 < 0 𝐼𝑧𝑞𝑢𝑖𝑒𝑟𝑑𝑎

Frecuencia (𝒇): Es el número de veces que se repite una variable Frecuencia Absoluta (𝒇𝒂): Es el número de veces que se repite una variable dentro de un intervalo. Frecuencia Relativa (𝒇𝒓): Es el cociente entre la frecuencia absoluta y la suma de frecuencias se expresa también en porcentaje.

Medidas de Posición: Son aquellos que dividen al conjunto ordenado de datos en grupos con la misma cantidad de individuos y se clasifican en cuartiles, deciles y percentiles.  

Cuartiles: Son 3 valores numéricos que dividen al conjunto de datos en 4 partes iguales. Deciles: Son 9 valores numéricos que dividen al conjunto de datos en 10 partes

Reimundo, Gaona, Zambrano

6

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos



iguales. Percentiles: Son 99 valores numéricos que dividen al conjunto de datos en 100 partes iguales.

Ejercicios: Hallar las medidas de tendencia central, medidas de dispersión, medidas de forma y medidas de posición para la variable pesos de mujeres Valores: 50, 60, 50, 50, 50, 57. Pesos de mujeres

Frecuencia Frecuencia absoluta

Frecuencia relativa

50

4

4

0.6667  67%

57

1

5

0.1667  16%

60

1

6

0.1667  16%

TOTAL

6

𝑥̅ = 52.8333 𝑀𝑜 = 50 𝑀𝑒 = 50 ∑ii=0(𝑥̅ − 𝑥𝑖 )2 𝜎2 = 𝑛 4(52.833 − 50)2 + (52.833 − 57)2 + (52.833 − 60)2 = = 20.1664 6 𝜎 = √𝜎 2 = √20.1664 = 4.4907 𝜎 4.4907 𝐶𝑉𝑃 = |𝑥| = 52.8333 = 0.08499 > 0 → 𝐴𝑠𝑖𝑚𝑒𝑡𝑟í𝑎 𝑝𝑜𝑟 𝑙𝑎 𝑑𝑒𝑟𝑒𝑐ℎ𝑎 Hallar las medidas de tendencia central, medidas de dispersión, medidas de forma y medidas de posición para la variable pesos de hombres Valores: 70, 59, 60, 61, 59, 70, 60 Pesos de hombres Frecuencia Frecuencia absoluta Frecuencia relativa 59

2

2

0.2857  28.5%

60

2

4

0.2857  28.5%

61

1

5

0.1428  14.2%

70

2

7

0.2857  28.5%

TOTAL

7

Reimundo, Gaona, Zambrano

7

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

𝑥̅ = 62.714 𝑀𝑜 = 60, 59, 70 𝑀𝑒 = 60 i ( ∑ 𝑥̅ − 𝑥𝑖 )2 i=0 2 𝜎 = 𝑛 2(62.714 − 59)2 + 2(62.714 − 60)2 + (62.714 − 61)2 + (62.714 − 70)2 = 7 = 25.2376 𝜎 = √𝜎 2 = √25.2376 = 5.0237 𝜎 5.0237 𝐶𝑉𝑃 = |𝑥| = 62.714 = 0.08011 > 0 → 𝐴𝑠𝑖𝑚𝑒𝑡𝑟í𝑎 𝑝𝑜𝑟 𝑙𝑎 𝑑𝑒𝑟𝑒𝑐ℎ𝑎 Según la asociación de lucha contra la Bulimia y la Anorexia, las pautas culturales han determinado que la delgadez sea sinónimo de éxito social. Muchos jóvenes luchan para conseguir el “físico ideal” motivados por modelos artistas o por publicidad comercial. Durante el mes de marzo del 2006, en el colegio “UEMES” de la ciudad de Quito, después de las vacaciones de verano, se observó con precaución a 27 alumnos con síntomas de anorexia, registrándose los siguientes signos visibles: Dieta Severa Uso de Ropa Holgada Miedo a Engordar Dieta Severa Dieta Severa Hiperactividad Uso de Laxantes Uso de Laxantes Uso de Ropa Holgada

Miedo a Engordar Hiperactividad Dieta Severa Uso de Laxantes Dieta Severa Uso de Ropa Holgada Uso de Ropa Holgada Dieta Severa Dieta Severa Uso de Ropa Holgada Uso de Laxantes Miedo a Engordar Dieta Severa Uso de Ropa Holgada Hiperactividad Uso de Laxantes Hiperactividad Dieta Severa

Signos visibles

Frecuencia Frecuencia absoluta

Frecuencia relativa

Dieta severa

9

9

0.3333  33.00%

Miedo a engordar

3

12

0.1111  1.00%

Hiperactividad

4

16

0.1481  14.81%

Uso de laxantes

5

21

0.1851  18.51%

Uso de ropa holgada

6

27

0.2222  22.22%

TOTAL

27

Reimundo, Gaona, Zambrano

8

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

𝑀𝑜 = 𝐷𝑖𝑒𝑡𝑎 𝑆𝑒𝑣𝑒𝑟𝑎 Interpretación: ya que las variables usadas para este ejercicio no son cuantificables la medida descriptiva que se puede obtener del mismo es únicamente la moda arrojando el dato que la dieta severas es el signo más identificable en los jóvenes del colegio “UEMES” para el desorden alimenticio. El tratamiento de los niños con desórdenes de la conducta puede ser complejo. El tratamiento se puede proveer en una variedad de escenarios dependiendo de la severidad de los comportamientos. Además del reto que ofrece el tratamiento, se encuentran la falta de cooperación del niño/niña y el miedo y la falta de confianza de los adultos. Para poder diseñar un plan integral de tratamiento, el siquiatra de niños y adolescentes puede utilizar la información del niño, la familia, los profesores y de otros especialistas médicos para entender las causas del desorden. Para ello, un siquiatra local ha considerado una muestra aleatoria de 20 niños, anotando el tiempo necesario que requiere en cada niño para lograr un plan integral del tratamiento, obteniéndose lo siguiente (en horas): 6, 7, 7, 8, 8, 8, 8, 9, 9, 9 9, 9, 9, 9, 10, 10, 10, 10, 10, 11 Horas

Frecuencia Frecuencia absoluta

Frecuencia relativa

6

1

1

0.0500  5.00%

7

2

3

0.1000  10.00%

8

4

7

0.2000  20.00%

9

7

14

0.3500  35.00%

10

5

19

0.2500  25.00%

11

1

20

0.0500  5.00%

TOTAL

20

𝑥̅ = 8.8 𝑀𝑜 = 60, 59, 70 𝑀𝑒 = 60 ∑ii=0(𝑥̅ − 𝑥𝑖 )2 𝜎2 = = 1.5366 𝑛 𝜎 = √𝜎 2 = √1.5366 = 1.2396 𝜎 1.2396 𝐶𝑉𝑃 = |𝑥| = 8.8 = 0.1408 > 0 → 𝐴𝑠𝑖𝑚𝑒𝑡𝑟í𝑎 𝑝𝑜𝑟 𝑙𝑎 𝑑𝑒𝑟𝑒𝑐ℎ𝑎 Reimundo, Gaona, Zambrano

9

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

COMBINACIONES Y PERMUTACIONES Con frecuencia se utiliza la palabra combinación sin considerar o no si es importante el orden de las cosas, así por ejemplo si tenemos como clave de seguridad el número “2357”, es claro suponer que los siguientes números {3527, 7325, 3237}, no representan la clave anterior, a pesar de que están formados por los mismos dígitos. De aquí la importancia del orden que deben tener las cifras de dichas claves. Pero si decimos tengo monedas de 5, 10 y 25 ctvs., el valor total no va a cambiar si decimos decir, tengo monedas de 25, 10 y 5 ctvs., he aquí un ejemplo de que no importa el orden. Por lo tanto si el orden tiene una importancia definida es una permutación y si el orden no tiene importancia es una combinación. Una permutación es una combinación ordenada. Existen combinaciones y permutaciones con repetición y sin repetición.

Permutaciones con repetición 𝑃(𝑛, 𝑟) = 𝑛𝑃𝑟 = 𝑃𝑟𝑛 = 𝑛𝑟 Ejercicios: En la misión Apolo que llevo a hombres hasta la luna, se recurrió a un sistema cuya estructura básica se muestra en la figura. Los cinco componentes tenían que funcionar adecuadamente para que el sistema se hiciera con éxito. Sea que se identifica cada componente como funcional (𝐹) o no funcional (𝑁). Motor Principal Sistema Propulsión Servicio Módulo de Servicio Módulo de Excursión Motor de Módulo Lunar a) ¿Cuantos estados son posibles? 𝑃 (𝑛, 𝑟) = 𝑃(2,5) = 2𝑃5 = 25 = 32

Reimundo, Gaona, Zambrano

10

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

b) ¿Cuántos estados son posibles en los que no funcione el motor del módulo lunar? 𝑃 (𝑛, 𝑟) = 𝑃(2,4) = 2𝑃4 = 24 = 16 c) Se considera que la misión tiene éxito al menos parcialmente si funciona los 3 primeros componentes ¿Cuántos estados representa una misión por lo menos parcialmente exitosa? 𝑃 (𝑛, 𝑟) = 𝑃(2,3) = 2𝑃3 = 23 = 8 d) La misión es un éxito total si y solo si funciona los cinco componentes ¿Cuantos estados representa una misión totalmente exitosa? 𝑃 (𝑛, 𝑟) = 𝑃(1,5) = 1𝑃5 = 15 = 5 En un grupo de 10 amigos, ¿Cuántas distribuciones de sus fechas de cumpleaños pueden darse al año? 𝑃 (𝑛, 𝑟) = 𝑃(365,10) = 365𝑃10 = 36510 En un hospital se utiliza cinco símbolos para clasificar las historias clínicas de sus pacientes, de manera que las dos primeras son letras y los tres últimos son dígitos. Suponiendo que hay 25 letras. ¿Cuántas historias clínicas podrían hacerse si?: a) No hay restricciones sobre letras y números. 𝑃 (25,2) × 𝑃 (10,3) = 252 × 103 = 600 × 1000 = 600.000 Suponiendo que hay 27 letras distintas, ¿Cuántos conjuntos diferentes de iniciales pueden formarse si cada persona tiene un apellido y…: a) Exactamente dos nombres? 𝑃 (27,3) = 273 = 19683 b) No más de dos nombres. 272 × (1 + 27) = 729 × 28 = 20412 c) No más de tres nombres. 272 × (1 + 27 + 272 ) = 729 × (28 + 729) = 551853

Reimundo, Gaona, Zambrano

11

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

Permutaciones sin repetición 𝑃(𝑛, 𝑟) = 𝑛𝑃𝑟 =

𝑛! (𝑛 − 𝑟 )!

Ejercicios: En una actividad hay 3 niños y 2 niñas. ¿De cuantas maneras?: a) Los niños y las niñas pueden sentarse en una fila. 𝑃5 = 5! = 120 b) Pueden sentarse en fila si las niñas deben estar juntas y los niños también 𝑃2 × 𝑃3 × 𝑃2 = 2! × 3! × 2! = 24 c) Pueden sentarse en fila si solo las niñas se sientan juntas. 𝑃3 × 𝑃3 = 3! × 3! = 36 d) Pueden sentarse en fila alternados. 𝑃3 × 𝑃2 = 3! × 2! = 12 En una clase de 10 alumnos van a distribuirse 3 premios. Averiguar de cuantos modos se puede hacer si los premios son diferentes. 10! 10! 𝑃 (10,3) = = = 720 (10 − 3)! 7! Cuantos números de 6 cifras diferentes se puede formar con los dígitos: 1,2,3,4,5,6 𝑃6 = 6! = 720 Se realizan pruebas con 7 recubrimientos usados en la protección de cables de fibra óptica contra el frio extremo. Las pruebas se efectuaran en orden aleatorio. a) ¿En cuántas ordenes puede llevarse a cabo las pruebas? 𝑃7 = 7! = 5040

Reimundo, Gaona, Zambrano

12

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

Combinación sin repetición 𝐶 (𝑛, 𝑟) = 𝑛𝐶𝑟 =

𝑛! 𝑟! (𝑛 − 𝑟)!

Ejercicios: A partir de un grupo de 5 estadísticos y 6 economistas se vas a formar un comité de 3 estadísticos y 2 economistas ¿Cuántos diferentes se pueden formar si? a) No se imponen restricciones. 5! 6! 𝐶 (5,3) × 𝐶 (6,2) = × = 10 × 15 = 150 3! (5 − 3)! 2! (6 − 2)! b) 2 estadísticos en particular deben estar en el comité. 5! 6! 𝐶 (5,1) × 𝐶 (6,2) = × = 5 × 15 = 75 1! (5 − 1)! 2! (6 − 2)! c) 1 economista en particular no puede estar en el comité. 5! 5! 𝐶 (5,3) × 𝐶 (5,2) = × = 10 × 10 = 100 3! (5 − 3)! 2! (5 − 2)! ¿Cuántos comités de 1 presidente y 3 vocales se pueden formar a partir de un grupo de 8 personas, las cuales pueden ocupar todas cualquier puesto? 8! 7! 𝐶 (8,1) × 𝐶 (7,3) = × = 8 × 35 = 280 1! (8 − 1)! 3! (7 − 3)! Un grupo escolar consta de 16 alumnos. Es necesario formar simultáneamente 3 equipos con ellos, uno de 5 alumnos para ir a la Cruz Roja, otro de 3 alumnos para visitar el Hospital y el tercero de 2 alumnos para ir al Banco. ¿De cuantas maneras se pueden distribuir? 𝐶 (16,5) × 𝐶 (11,3) × 𝐶 (8,2) = 16! 11! 8! = × × 5! (16 − 5)! 3! (11 − 3)! 2! (8 − 2)! = 4368 × 165 × 28 = 20180160 Se tiene siete números positivos y cinco negativos. ¿De cuantas maneras se pueden multiplicar tres de ellos para que el resultado sea positivo? 7! 5! 7! 𝐶 (7,3) + 𝐶 (5,2) × 𝐶 (7,1) = + × 3! (7 − 3)! 2! (5 − 2)! 1! (7 − 1)! = 35 + 10 × 7 = 105

Reimundo, Gaona, Zambrano

13

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

Combinación con repetición 𝐶 (𝑛, 𝑟) = 𝑛𝐶𝑟 = 𝐶𝑟𝑛 =

(𝑛 + 𝑟 − 1)! 𝑟! (𝑛 − 1)!

Ejercicios: ¿Cuántas fichas tiene el juego de domino? (7 + 2 − 1)! (8)! 40320 𝐶 (7,2) = = = = 28 2! (7 − 1)! 2! (6)! 1440 En una pastelería hay 6 tipos distintos de pasteles. ¿De cuantas formas se pueden elegir 4 pasteles? (6 + 4 − 1)! (9)! 362880 𝐶 (6,4) = = = = 126 4! (6 − 1)! 4! (5)! 2880 En una bodega hay cinco tipos diferentes de botellas. ¿De cuantas formas se pueden elegir cuatro botellas? (5 + 4 − 1)! (8)! 40320 𝐶 (5,4) = = = = 14 4! (5 − 1)! 4! (5)! 2880 Calcular las combinaciones con repetición de los elementos (a, b, c, d) tomados de dos en dos. (4 + 2 − 1)! (5)! 120 𝐶 (4,2) = = = = 10 2! (4 − 1)! 2! (3)! 12 NOTA: SI dentro del conjunto de n elementos que se tiene para escoger existen grupos de elementos que se repitan, entonces las posibilidades de ocurrencia de cierto evento 𝑛! está dado por Número de posibilidades (𝑛, 𝑝, 𝑞, 𝑟, 𝑠, … ) = 𝑝! 𝑞! 𝑟! 𝑠! Si 𝑛 = 𝑛ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠 𝑝, 𝑞, 𝑟, 𝑠, … 𝑔𝑟𝑢𝑝𝑜 𝑑𝑒 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠 𝑞𝑢𝑒 𝑠𝑒 𝑟𝑒𝑝𝑖𝑡𝑒𝑛 Ejercicios: De cuantas maneras puede dividirse un grupo de 10 personas en: a) Dos grupos de 7 y 3 personas. 10! 3628800 = = 120 7! × 3! 30240

Reimundo, Gaona, Zambrano

14

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

b) Tres grupos de 5, 3 ,2 personas. 10! 3628800 = = 2520 5! × 3! × 2! 1440 Si un equipo de futbol participa en 12 juegos en una temporada. a) ¿Cuántas maneras hay de que entre esos doce juegos en que participa, obtenga 7 victorias, 3 empates y 2 juegos perdidos? 12! 479001600 = = 7920 7! × 3! × 2! 60480 b) ¿Cuántas maneras hay de que además de lo anterior se inicie y termine con derrota? 10! 3628800 = = 120 7! × 3! 30240 Con las cifras 2, 2, 2, 3, 3, 3, 3, 4, 4. ¿Cuántos números de nuevo cifras se pueden formar? 9! 362880 = = 1260 3! × 4! × 2! 288 En el palo de señales de un barco se pueden izar cuatro banderas rojas, dos azules y cinco verdes. ¿Cuántas señales distintas pueden indicarse con la colocación de las once banderas? 11! 39916800 = = 6930 4! × 2! × 5! 5760

PROBABILIDAD Es la evaluación de la medida que ocurra en dicho evento o experimento

Espacio muestral (𝑠): Es aquel que contiene a todas los posibles resultados que se dan cuando ocurre un evento o fenómeno, el espacio muestral puede ser continuo o discreto.  

Continuo: Es aquel que contiene un infinito número de posibles resultados ya que está relacionado con la recta de los números reales. Discreto: Es aquel que contienen un número finito de posibilidades o resultados.

Evento: Es un conjunto que abarca resultados, que posee ciertas características en común, los eventos son: 

Seguro: Aquel que contiene todos los posibles resultados de un experimento.

Reimundo, Gaona, Zambrano

15

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

  

Improbable o imposible: Es aquel que no contiene ningún resultado posible de un experimento. Eventos mutuamente excluyentes: Dos eventos son mutuamente excluyentes si la ocurrencia de uno anula la ocurrencia del otro. Evento complementario: Es aquel que contiene todos los posibles resultados que no constan en él.

Si consideramos el evento A un subconjunto del espacio muestral podemos distinguir las siguientes propiedades.   

Si 𝐴 ⊆ 𝑆 0 ≤ 𝑃 (𝐴 ) ≤ 1 ∼ 𝑃(𝐴) = 1 − 𝑃(𝐴) propiedad inversa

Probabilidad Marginal: Ocurre cuando tiene o sucede un solo evento, es decir se dice de una probabilidad individual, y la probabilidad marginal viene dada 𝑃 (𝐴 ) =

#𝑅𝑒𝑠𝑢𝑙𝑡𝑎𝑑𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠 𝑎𝑙 𝑒𝑣𝑒𝑛𝑡𝑜 𝐴 #𝑅𝑒𝑠𝑢𝑙𝑡𝑎𝑑𝑜𝑠 𝑡𝑜𝑡𝑎𝑙𝑒𝑠 𝑑𝑒𝑙 𝑓𝑒𝑛ó𝑚𝑒𝑛𝑜

Ejercicios: Se lanza un dado cargado, además suponemos que las caras con el número tres y cuatro tienen el doble de probabilidades de ocurrir que cualquiera de las demás caras. Encontrar la probabilidad de los siguientes sucesos: 1 p

2 p

3 2p

4 2p

𝟏 1 2 2 𝟖 8 8 8 𝑝 + 𝑝 + 2𝑝 + 2𝑝 + 𝑝 + 𝑝 = 1 1 𝑝= 8

5 p 1 8

6 p 1 8

a) Aparezca el número 4 2 𝑃 (𝑠𝑎𝑙𝑔𝑎 4) = 8 b) Aparezca el número 2 1 𝑃 (𝑠𝑎𝑙𝑔𝑎 2) = 8

Reimundo, Gaona, Zambrano

16

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

De acuerdo con las estadísticas del departamento de tránsito, durante el año de 2012 hubo 12005 accidentes viales, de los cuales 686 se debieron a exceso de velocidad. Si durante el primer mes de este año se reportaron 100 accidentes, ¿Cuántos se deben a exceso de velocidad? 686 2 𝑃 (𝑎𝑐𝑐𝑖𝑑𝑒𝑛𝑡𝑒𝑠 2012) = = 12005 35 2 𝑥 𝑃 (𝑎𝑐𝑐𝑖𝑑𝑒𝑛𝑡𝑒𝑠 2012) = = 35 100 2 × 100 ∴𝑥= =6 35 Se extrae una carta de una baraja común calcular: a) Espacio muestral Ω = {52 𝑐𝑎𝑟𝑡𝑎𝑠} b) Probabilidad de que sea una carta de corazón rojo 13 𝑃 (𝑐𝑜𝑟𝑎𝑧ó𝑛 𝑟𝑜𝑗𝑜) = 𝑦𝑎 𝑞𝑢𝑒 𝑒𝑥𝑖𝑠𝑡𝑒𝑛 13 𝑐𝑎𝑟𝑡𝑎𝑠 𝑑𝑒 𝑐𝑜𝑟𝑎𝑧ó𝑛 𝑟𝑜𝑗𝑜. 52 c) Probabilidad de que sea un 7 4 𝑃 (7) = 52 Se extrae una segunda carta de una baraja común, (tomando en consideración el ejercicio 3) llene la siguiente tabla: Probabilidad Condición No hace reposición Hace reposición 𝑷(𝒄𝒐𝒓𝒂𝒛ó𝒏 𝒓𝒐𝒋𝒐⁄𝟕 𝒕𝒓𝒆𝒃𝒐𝒍) 13/52 13/51 𝑷(𝒄𝒐𝒓𝒂𝒛ó𝒏 𝒓𝒐𝒋𝒐⁄𝟕 𝒄𝒐𝒓𝒛𝒐𝒏 𝒓𝒐𝒋𝒐 ) 13/52 12/51 𝑷(𝟕 𝒄𝒐𝒓𝒂𝒛ó𝒏 𝒓𝒐𝒋𝒐⁄𝟓 𝒕𝒓𝒆𝒃𝒐𝒍) 1/52 1/51

Probabilidad Conjunta: Surge cuando 2 o más eventos se desarrollan juntos o en sucesión y equivalen al producto de sus probabilidades marginales. Ejercicios: La propietaria de una computadora nueva, crea una contraseña que consta de dos caracteres. Ella selecciona al azar una letra del alfabeto para el primer carácter y digito (0, 1, 2, 3, 4, 5, 6, 7, 8, 9) para el segundo. ¿Cuál es la probabilidad de que su contraseña sea “K9”? 1 𝑃 (𝑙𝑒𝑡𝑟𝑎𝑠) = 27 1 𝑃 (𝑛𝑢𝑚𝑒𝑟𝑜) = 10 Reimundo, Gaona, Zambrano

17

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

𝑃 (𝑐𝑜𝑛𝑡𝑟𝑎𝑠𝑒ñ𝑎 𝐾9) =

1 1 1 × = 27 10 270

Una profesora de psicología hace un examen sorpresa que consta de 10 reactivos verdadero/falso; establece que para aprobar se requieren a las menos siete respuestas correctas. Suponga que un estudiante que no se preparó adoptó la cuestionable estrategia de adivinar cada respuesta. Preguntas

1

Probabilidad

1 2

2 1 2

3 1 2

4 1 2

5 1 2

6 1 2

7 1 2

8 1 2

9

10

1 2

a) Calcule la probabilidad de que las primeras 4 respuestas sean correctas y las últimas 3 sean incorrectas. 1 4 1 𝑃 (4 𝑝𝑟𝑖𝑚𝑒𝑟𝑎𝑠 𝑐𝑜𝑟𝑟𝑒𝑐𝑡𝑎𝑠) = ( ) = 2 16 1 3 1 𝑃 (3 𝑢𝑙𝑡𝑖𝑚𝑎𝑠 𝑖𝑛𝑐𝑜𝑟𝑟𝑒𝑐𝑡𝑎𝑠) = ( ) = 2 8 1 1 𝑃(4𝑐𝑜𝑟𝑟𝑒𝑐𝑡𝑎𝑠 𝑦 3 𝑖𝑛𝑐𝑜𝑟𝑟𝑒𝑐𝑡𝑎𝑠) = × 16 8 Con cierto método de un procedimiento que se llama muestreo de aceptación, se selecciona aleatoriamente y sin reemplazo una muestra de artículos, el lote completo se acepta si cada artículo en la muestra es aprobado. La Niko Electronics Company acaba de fabricar 5000 CD, de los cuales el 3% están defectuosos. Si se seleccionan al azar 12 de estos CD para probarlos, ¿Cuál es la probabilidad de que se acepte el lote completo? 97 𝑃 (𝑛𝑜 𝑑𝑒𝑓𝑒𝑐𝑡𝑢𝑜𝑠𝑜) = 100 97 12 ) = 0.694 𝑃 (𝑎𝑐𝑒𝑝𝑡𝑎𝑟 𝑒𝑙 𝑙𝑜𝑡𝑒 𝑐𝑜𝑚𝑝𝑙𝑒𝑡𝑜) = ( 100

Reimundo, Gaona, Zambrano

18

1 2

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

Una gerente de producción de “Telekttonics” afirma que su nuevo proceso de fabricación de reproductores de CD, es mejor porque su tasa de defectos es más baja que el 2%, que la tasa de defectos pasado. Para fundamentar su afirmación ella fabrica un lote de 5000 reproductores de CD, luego selecciona aleatoriamente 15 de ellos para probarlos, con el resultado de que no hay defecto en los 15 reproductores de CD seleccionados. Con base en el resultado, ¿Hay suficiente evidencia para fundamentar la afirmación de la gerente de que su nuevo proceso es el mejor? 98 𝑃 (𝑛𝑜 𝑑𝑒𝑓𝑒𝑐𝑡𝑢𝑜𝑠𝑜) = 100 98 15 ) = 0.739 𝑃(𝑛𝑖𝑛𝑔𝑢𝑛𝑜 𝑑𝑒𝑓𝑒𝑐𝑡𝑢𝑜𝑠𝑜) ( 100 SOLUCIÓN: Existe la suficiente evidencia, debido a que la probabilidad sobrepasa el 50% de aceptación.

Regla de adición: Surge cuando se quiere obtener la probabilidad de uno u otro evento 𝑃(𝐴𝑜𝐵) = 𝑃 (𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∧ 𝐵) 

Evento mutuamente excluyente  𝑃 (𝐴 ∧ 𝐵 ) = 0  𝑃 (𝐴 ∨ 𝐵 ) = 𝑃 (𝐴 ) + 𝑃 (𝐵 )



No son mutuamente excluyentes  𝑃 (𝐴𝑜𝐵) = 𝑃(𝐴) + 𝑃 (𝐵) − 𝑃 (𝐴 ∧ 𝐵)

Ejercicios En los ejercicios del 1 al 4 utilice los datos de la siguiente tabla, que resume resultados del hundimiento del “Titanic”.

Sobrevivientes Muertos Total

Hombres 332 1360 1692

Mujeres 318 104 422

Niños 29 35 64

Niñas 27 18 45

Total 706 1517 2223

Pasajeros del “Titanic”: Si se selecciona al azar a uno de los pasajeros del “Titanic”, calcule la probabilidad de que sea una mujer o una niña. 422 𝑃 (𝑚𝑢𝑗𝑒𝑟) = 2223 45 𝑃 (𝑛𝑖ñ𝑎) = 2223

Reimundo, Gaona, Zambrano

19

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

𝑃 (𝑚𝑢𝑗𝑒𝑟 𝑜 𝑛𝑖ñ𝑎) =

422 45 + = 0.210 2223 2223

Pasajeros del “Titanic”: Si se selecciona al azar a uno de los pasajeros del Titanic, calcule la probabilidad de que sea un hombre o una persona que sobrevivió al hundimiento. 322 706 𝑃 (ℎ𝑜𝑚𝑏𝑟𝑒) = 𝑃(𝑠𝑜𝑏𝑟𝑒𝑣𝑖𝑣𝑖𝑒𝑛𝑡𝑒) = 2223 2223 322 706 𝑃(ℎ𝑜𝑚𝑏𝑟𝑒 𝑜 𝑠𝑜𝑏𝑟𝑒𝑣𝑖𝑣𝑖𝑒𝑛𝑡𝑒) + = 0.462 2223 2223 Pasajeros del “Titanic”: Si se selecciona al azar a uno de los pasajeros del Titanic, calcule la probabilidad de que sea un niño o un sobreviviente. 64 𝑃 (𝑛𝑖ñ𝑜) = 2223 706 𝑃 (𝑠𝑜𝑏𝑟𝑒𝑣𝑖𝑣𝑖𝑒𝑛𝑡𝑒) = 2223 64 706 𝑃 (𝑛𝑖ñ𝑜 𝑜 𝑠𝑜𝑏𝑟𝑒𝑣𝑖𝑣𝑖𝑒𝑛𝑡𝑒) = + = 0.346 2223 2223 Pasajeros del “Titanic”: Si se selecciona al azar a uno de los pasajeros del Titanic, calcule la probabilidad de que sea una mujer o alguna persona que no sobrevivió al hundimiento. 422 𝑃 (𝑚𝑢𝑗𝑒𝑟) = 2223 1517 𝑃 (𝑚𝑢𝑟𝑖𝑜) = 2223 422 1517 + = 0.872 2223 2223 Las empresas que realizan encuestas se interesan en los niveles decrecientes de cooperación de las personas que se contactan para que las encuesten. Un encuestador contacta a 84 individuos de entre 18 y 21 años, y descubre que 73 responden y 11 se rehúsan a hacerlo. Cuando se contacta a 275 personas de entre 22 y 29 años, 255 responden y 20 se. Suponga que se selecciona al azar a 1 de las 359 personas. Calcule la probabilidad de que sea una persona en el rango de edad de 18 a 21 años o alguien que rechaza responder. 84 𝑃 (18 − 21) = 359 31 𝑃 (𝑟𝑒ℎ𝑢𝑠𝑎𝑛) = 359 84 31 𝑃 (18 − 21 ó 𝑟𝑒ℎ𝑢𝑠𝑎𝑛) = + = 0.320 359 359 Reimundo, Gaona, Zambrano

20

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

Sean los dígitos del 0 al 9, calcular la probabilidad de los siguientes sucesos: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 a) Seleccionar al azar un dígito, que resulte 0 o múltiplo de 3 1 3 4 𝑃 (𝑠𝑒𝑎 0 ó 𝑠𝑒𝑎 𝑚𝑢𝑙𝑡𝑖𝑝𝑙𝑜 3) = + = 10 10 10 b) Seleccionar al azar un dígito, que resulte par o número primo. 5 3 8 𝑃 (𝑠𝑒𝑎 𝑝𝑎𝑟 ó 𝑠𝑒𝑎 𝑛ú𝑚𝑒𝑟𝑜 𝑝𝑟𝑖𝑚𝑜 ) = + = 10 10 10

Probabilidad Condicional: Surge cuando se desea obtener la probabilidad de un evento A y se conoce la ocurrencia de un evento B que tiene relación con el primero La probabilidad condicional en independencia estadística (eventos independientes) está dada de la manera. 𝑃(𝐴⁄𝐵) = 𝑃(𝐴) /: 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑞𝑢𝑒 𝑜𝑐𝑢𝑟𝑟𝑎 𝐴 𝑠𝑎𝑏𝑖𝑒𝑛𝑑𝑜 𝑞𝑢𝑒 𝑜𝑐𝑢𝑟𝑟𝑎 𝐵 Ejercicios: En un centro escolar los alumnos pueden optar por cursar como lengua extranjera inglés o francés. En un determinado curso, el 90% de los alumnos estudia inglés y el resto francés. EL 30% de los que estudian inglés son chicos y de los que estudian francés son chicos el 40%. EL elegido es un alumno al azar, ¿Cuál es la probabilidad de que se chica? Suponiendo que el centro escolar tiene 100 alumnos: 𝐼𝑛𝑔𝑙é𝑠 = 90 𝑐ℎ𝑖𝑐𝑜𝑠 = 27 𝑐ℎ𝑖𝑐𝑎𝑠 = 63 𝐹𝑟𝑎𝑛𝑐𝑒𝑠 = 10 𝑐ℎ𝑖𝑐𝑜𝑠 =4 𝑐ℎ𝑖𝑐𝑎𝑠 = 6 63 𝑃 (𝑐ℎ𝑖𝑐𝑎⁄𝑖𝑛𝑔𝑙é𝑠) = 90 6 𝑃 (𝑐ℎ𝑖𝑐𝑎⁄𝑓𝑟𝑎𝑛𝑐𝑒𝑠) = 10 𝑃 (𝑐ℎ𝑖𝑐𝑎) = 0.9 × 0.7 + 0.1 × 0.6 = 0.69

Reimundo, Gaona, Zambrano

21

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

En un aula hay 100 alumnos, de los cuales: 40 son hombres, 30 usan gafas, y 15 son varones y usan gafas. Si seleccionamos al azar un alumno de dicho curso: a) ¿Cuál es la probabilidad de que sea mujer y no use gafas? Gafas Sin Gafas TOTAL Hombre 15 25 40 Mujer 15 45 60 TOTAL 30 70 100 45 𝑃 (𝑚𝑢𝑗𝑒𝑟 𝑦 sin 𝑔𝑎𝑓𝑎𝑠 ) = 100 b) Si sabemos que el alumno seleccionado no usa gafas, ¿Qué probabilidad hay de que sea hombre? 25 5 𝑃 (ℎ𝑜𝑚𝑏𝑟𝑒 ⁄sin 𝑔𝑎𝑓𝑎𝑠 ) = = 70 14 Se supone que 25 de cada 100 hombres y 600 de cada 1000 mujeres usan gafas. Si el número de mujeres es cuatro veces superior al de hombres, se pide la probabilidad de encontrarnos: 1 4 𝐷𝑒𝑙 𝑛ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑝𝑒𝑟𝑠𝑜𝑛𝑎𝑠 𝑠𝑜𝑛 ℎ𝑜𝑚𝑏𝑟𝑒𝑠 𝑦 𝑠𝑜𝑛 𝑚𝑢𝑗𝑒𝑟𝑒𝑠 5 5 a) Con una persona sin gafas 1 75 4 400 𝑃 (sin 𝑔𝑎𝑓𝑎𝑠) = × + × = 0.47 5 100 5 1000 b) Con una mujer con gafas 𝑃 (𝑚𝑢𝑗𝑒𝑟 𝑐𝑜𝑛 𝑔𝑎𝑓𝑎𝑠) =

4 600 × = 0.48 5 1000

En una estantería hay 60 novelas y 20 libros de poesía. Una persona A elige un libro al azar de la estantería y se lo lleva. A continuación otra persona B elige otro libro al azar. Ω = 80 𝑙𝑖𝑏𝑟𝑜𝑠 𝑒𝑛 𝑙𝑎 𝑒𝑠𝑡𝑎𝑛𝑡𝑒𝑟í𝑎 a) ¿Cuál es la probabilidad de que el libro seleccionado por B sea una novela? 60 59 𝑃 (𝐵 𝑛𝑜𝑣𝑒𝑙𝑎 ⁄𝐴 𝑛𝑜𝑣𝑒𝑙𝑎 ) = × 80 79 20 60 𝑃 (𝐵 𝑛𝑜𝑣𝑒𝑙𝑎 ⁄𝐴 𝑝𝑜𝑒𝑠í𝑎) = × 80 79 60 59 20 60 237 𝑃 (𝐵 𝑒𝑠𝑐𝑜𝑗𝑎 𝑛𝑜𝑣𝑒𝑙𝑎) = × + × = 80 79 80 79 316

Reimundo, Gaona, Zambrano

22

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

b) Si se sabe que B eligió una novela, ¿Cuál es la probabilidad de que el libro seleccionado por A sea de poesía? 20 60 × 79 60 80 𝑃 (𝐴 𝑝𝑜𝑒𝑠í𝑎⁄𝐵 𝑛𝑜𝑣𝑒𝑙𝑎 ) = 60 59 20 60 = × 79 + 80 × 79 237 80

VARIABLES ALEATORIAS Una variable aleatoria es aquella que obtiene diferentes valores numéricos mediante un proceso de conteo o medición como consecuencia de un fenómeno aleatorio. Esta variable es un valor o magnitud que ocurre con una secuencia indeterminada, por lo que al no conocerse el valor que puede adquirir se lo denomina aleatoria En otras palabras una variable es aquella regla (función) que asigna un valor numérico a cada resultado del espacio muestral. Una variable puede ser discreta o continua  

Discreta: es aquella que toma valores limitados y enteros. Continua: es aquella que toma valores ilimitados y puede ser entero o fraccionario.

Distribución de probabilidad de una variable aleatoria Se define a la distribución de probabilidad de una variable aleatoria como el conjunto de todos los posibles resultados numéricos de un experimento a los cuales podemos asignar una ocurrencia o una probabilidad, lo que permite obtener sus gráficos que entre los más importantes tenemos.  

Ley de densidad o probabilidad Función de distribución

Función de densidad o ley de probabilidad 𝒇(𝒙): Es el conjunto de valores de la variable x y su respectiva probabilidad. 𝑿 𝒇(𝒙)

𝒙𝟏 p(𝑥1 )

Reimundo, Gaona, Zambrano

𝒙𝟐 p(𝑥2 )

𝒙𝟑 p(𝑥3 )

𝒙𝟒 p(𝑥4 )

𝒙𝟓 𝑝(𝑥5 )

23

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

Función distribución 𝑭(𝒙): Es la sumatoria de las probabilidades. 𝑛

𝐹 (𝑥 ) = ∑ 𝑝(𝑖) 𝑖=1

𝑿 𝑭(𝒙)

𝒙𝟏 p(𝑥1 )

𝒙𝟐 p(𝑥1 ) + p(𝑥2 )

𝒙𝟑 … p(𝑥3 )

𝒙𝟒 …p(𝑥4 )

𝒙𝟓 …p(𝑥5 )

Momento ordenado de orden k 𝑛

𝛼𝑘 = ∑ 𝑝𝑖 𝑥𝑖𝑘 𝑖=1

Momento central de orden k 𝑛

µ𝑘 = ∑ 𝑝𝑖 (𝑥𝑖 − 𝐸(𝑥))2 𝑖=1

Valor esperado o esperanza matemática: Es el valor medio ponderado de todos los resultados que toma la variable aleatoria y se define. 𝐸 (𝑥 ) = ∑𝑛𝑖=1 𝑝𝑖 𝑥𝑖 𝑥𝑖 = 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎 𝑝𝑖 = 𝑝𝑟𝑎𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑑𝑒 𝑥𝑖 Varianza: 𝑛

𝑉 (𝑥 ) = ∑ 𝑖=1

[𝑥𝑖 − 𝐸(𝑥)]2 . 𝑝𝑖

Desviación Estándar: 𝜎 = √𝑉(𝑥)

Reimundo, Gaona, Zambrano

24

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

Asimetría: 𝐴(𝑥 ) = 𝑛

𝑈3 = ∑

𝑖=1

𝑈3 [𝐷(𝑥)]3

[𝑥𝑖 − 𝐸(𝑥)]3 . 𝑝𝑖

Moda: Esta dado por el valor de la variable aleatoria que tiene la mayor probabilidad. Dicho valor se obtiene de la ley de densidad o probabilidad. Mediana: Este valor está dado por aquella probabilidad que es la primera en igualar o sobrepasar al 0.5 y se obtiene del grafico de la función de distribución. Ejercicios: Complete la ley de probabilidad siguiente sabiendo que su esperanza matemática es igual a 1.8. Realizar el grafico de la función de distribución, obtener la varianza, desviación estándar, moda y mediana. 𝒙 𝑷(𝒙)

0 0,2

1 A

2 b

3 0,3

2 0,4 0,7

3 0,3 1

𝐸 (𝑥 ) = 1.8 2 3 1.8 = 0(10) + 1(𝑎) + 2(𝑏) + 3(10) 9 = 𝑎 + 2𝑏 10 0.2 + 𝑎 + 𝑏 + 0.9 = 1 ∴ 𝑎 = 0.1 𝑦 𝑏 = 0.4 Función de distribución 𝑿 0 𝒑(𝒙) 0,2 𝑭(𝒙) 0,2

Reimundo, Gaona, Zambrano

1 0,1 0,3

25

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

Gráfico de distribución

P(x) 1,5 1 P(x)

0,5 0 0

1

2

0 0.2 0.3 0.7 1

3

𝑥 1) = 1 − 𝑃(𝑟 ≤ 1) = 0.912836 La última novela de un autor he tenido un gran éxito, hasta el punto de que el 80% de los lectores ya la han leído. Un grupo de 4 amigos son aficionados a la lectura: a) ¿Cuál es la probabilidad de que en el grupo hayan leído la novela 2 personas? 𝑟: # 𝑑𝑒 𝑝𝑒𝑟𝑠𝑜𝑛𝑎𝑠 𝑞𝑢𝑒 𝑙𝑒𝑒𝑟á𝑛 𝑒𝑙 𝑙𝑖𝑏𝑟𝑜 𝑟 = 0, 1, 2, 3, 4 𝑛=4 𝑝 = 0.8 𝑃 (𝑟 = 2) = 4𝐶2 × 0.82 × 0.22 = 0.8179 = 0.1536 Reimundo, Gaona, Zambrano

34

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

b) ¿Y como máximo 2? 𝑟: # 𝑑𝑒 𝑝𝑒𝑟𝑠𝑜𝑛𝑎𝑠 𝑞𝑢𝑒 𝑙𝑒𝑒𝑟á𝑛 𝑒𝑙 𝑙𝑖𝑏𝑟𝑜 𝑟 = 0, 1, 2, 3, 4 𝑛=4 𝑝 = 0.8 𝑃 (𝑟 ≤ 2) = 𝑃 (𝑟 > 2) = 1 − 𝑃(𝑟 = 3) − 𝑃(𝑟 = 4) 𝑃 (𝑟 = 3) = 4𝐶3 × 0.83 × 0.21 = 0.4096 𝑃 (𝑟 = 4) = 4𝐶4 × 0.84 × 0.20 = 0.4096 𝑃 (𝑟 ≤ 2) = 1 − 0.4096 − 0.4096 = 0.1808

Distribución Hipergeométrica Surge al seleccionar una muestra sin reposición de una población finita conocida y sin reemplazo. Dicha muestra es una porción relativamente considerable con relación al tamaño de la población, la distribución hipergeométrica determina la probabilidad de ocurrencia de un cierto número de éxitos de una muestra que se obtiene de una población que también cuenta con un cierto número de éxitos. Características: La muestra se obtiene de una población finita si sin reemplazo El tamaño de la muestra n es mayor al 5% del tamaño de N población 𝑛 >= 5%𝑁 La distribución hipergeométrica está definida por: 𝑃 (𝑥 ) =

𝐶 (𝑦, 𝑥 ) × 𝐶(𝑁 − 𝑦, 𝑛 − 𝑥) 𝐶 (𝑁, 𝑛)

Dónde: 𝑵 = 𝑡𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 𝒏 = 𝑡𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝒚 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 é𝑥𝑖𝑡𝑜𝑠 𝑒𝑛 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 𝒙 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 é𝑥𝑖𝑡𝑜𝑠 𝑒𝑛 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎. 𝑵 − 𝒚 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑓𝑟𝑎𝑐𝑎𝑠𝑜𝑠 𝑒𝑛 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 𝒏 − 𝒙 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑓𝑟𝑎𝑐𝑎𝑠𝑜𝑠 𝑒𝑛 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎. Medidas descriptivas Media, Esperanza: 𝜇 = 𝑛 × 𝑝 𝑁−𝑛 Varianza: 𝑉(𝑥 ) = 𝑛 × 𝑝 × 𝑞 × (𝑁−1 ) Probabilidad: 𝑝 = 𝑦⁄𝑁 𝑞 = 1 − 𝑝 Desviación típica: 𝐷(𝑥 ) = √𝑉(𝑥)

Reimundo, Gaona, Zambrano

35

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

Ejercicios: Suponga que x tiene una distribución hipergeométrica N=100, n=4, y=20, determinar: 𝐶(𝑦,𝑥)×𝐶(𝑁−𝑦,𝑛−𝑥) 20𝐶1×(100−20)𝐶(4−1) a) 𝑃 (𝑥 = 1) = = = 0.41905 b) 𝑃 (𝑥 = 6) = c) 𝑃 (𝑥 = 4) =

𝐶(𝑁,𝑛) 𝐶(𝑦,𝑥)×𝐶(𝑁−𝑦,𝑛−𝑥) 𝐶(𝑁,𝑛) 𝐶(𝑦,𝑥)×𝐶(𝑁−𝑦,𝑛−𝑥) 𝐶(𝑁,𝑛)

= =

100𝐶4 20𝐶6×(100−20)𝐶(4−6) 100𝐶4 20𝐶4×(100−20)𝐶(4−4) 100𝐶4

= 0.0 = 0.00124

Del ejercicio anterior encontrar sus medidas descriptivas 𝑝 = 𝑦⁄𝑁 = 20⁄100 = 1⁄5 1 4 𝐸 (𝑥 ) = 𝑛𝑝 = 4 × = 5 5 𝑁−𝑛 4 1 96 ) = 4 × × × ( ) = 0.62061 𝑉 (𝑥 ) = 𝑛𝑝𝑞 ( 𝑁−1 5 5 99 Un lote de 75 arandelas contienen 5 en las cuales la variabilidad en el espesor alrededor de la circunferencia es inaceptable. Una muestra de 10 arandelas se selecciona al azar y sin remplazo. 𝑥: # 𝑑𝑒 𝑎𝑟𝑎𝑛𝑑𝑒𝑙𝑎𝑠 𝑖𝑛𝑎𝑐𝑒𝑝𝑡𝑎𝑏𝑙𝑒𝑠 𝑁 = 75 𝑛 = 10 𝑦=5 a) ¿Cuál es la probabilidad de que ninguna arandela sea inaceptable en la muestra? 𝐶 (𝑦, 𝑥 ) × 𝐶 (𝑁 − 𝑦, 𝑛 − 𝑥 ) 5𝐶0 × (75 − 5)𝐶 (10 − 0) 𝑃 (𝑥 = 0) = = 𝐶 (𝑁, 𝑛) 75𝐶10 = 0.47857 b) ¿Cuál es la probabilidad de que al menos una arandela sea inaceptable? 𝑃 (𝑥 ≥ 1) = 𝑃(𝑥 < 1) = 1 − 𝑃 (𝑥 = 0) = 1 − 0.47857 = 0.39227 c) ¿Cuál es la probabilidad de que exactamente 2 arandelas sea aceptable? 𝑥: # 𝑑𝑒 𝑎𝑟𝑎𝑛𝑑𝑒𝑙𝑎𝑠 𝑎𝑐𝑒𝑝𝑡𝑎𝑏𝑙𝑒𝑠 𝑁 = 75 𝑛 = 10 𝑦 = 70 𝐶 (𝑦, 𝑥 ) × 𝐶 (𝑁 − 𝑦, 𝑛 − 𝑥 ) 70𝐶2 × (75 − 70)𝐶 (10 − 8) 𝑃 (𝑥 = 2) = = 𝐶 (𝑁, 𝑛) 75𝐶10 = 0.0291 × 10−6

Reimundo, Gaona, Zambrano

36

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

Un estado efectuá una lotería, seleccionando de forma aleatoria 6 números de un grupo de 40, sin remplazo. Un jugador escoge 6 números antes del sorteo. 𝑥: # posibles sorteados 𝑁 = 40 𝑛=6 𝑦=6 a) ¿Cuál es la probabilidad de que los 6 números escogidos por el jugador coincidan con los 6 números premiados? 𝐶 (𝑦, 𝑥 ) × 𝐶 (𝑁 − 𝑦, 𝑛 − 𝑥 ) 6𝐶6 × (40 − 36)𝐶 (6 − 6) 𝑃 (𝑥 = 6) = = 𝐶 (𝑁, 𝑛) 40𝐶6 −7 = 2.60527 × 10 b) ¿Cuál es la probabilidad de que los números escogidos por el jugador coincidan con los 5 números premiados? 𝐶 (𝑦, 𝑥 ) × 𝐶 (𝑁 − 𝑦, 𝑛 − 𝑥 ) 6𝐶5 × (40 − 36)𝐶 (6 − 5) 𝑃 (𝑥 = 5) = = 𝐶 (𝑁, 𝑛) 40𝐶6 −5 = 5,31474 × 10 c) ¿Cuál es el número promedio de aciertos? 𝑝 = 𝑦⁄𝑁 = 6⁄40 6 9 𝐸 (𝑥 ) = 𝑛𝑝 = 6 × = 40 10

Distribución de Poisson Es una distribución de probabilidad que se aplica a las variables aleatorias discretas. Divide la frecuencia relativa de la ocurrencia de un evento, que está dado en función de la unidad de tiempo, espacio o volumen. Esta distribución permite describir el comportamiento de las probabilidades en fenómenos tales como: Número de accidentes por semana en una carretera, escuela o empresa Número de clientes que ingresan por hora a una tienda, banco, etc. Número de fallos o imperfecciones por cm 2 en las carpas de carrocerías de los automóviles nuevos. Número de bacterias por cada ml. de agua en un estanque o reservatorio de un distrito. Características: Esta distribución es el producto o resultado de las siguientes hipótesis: Los eventos ocurren uno a la vez, es decir, que la probabilidad que dos o más eventos ocurran juntos en nula. Reimundo, Gaona, Zambrano

37

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

La probabilidad de ocurrencia de un evento de interés es constante para intervalos diferentes en algún lugar de tiempo, espacio o volumen. El numero promedio o esperado de eventos es constante en cualquier lapso de tiempo, espacio o volumen. La ocurrencia de un evento de interés es independiente de cualquier ocurrencia en cualquier lapso de tiempo, espacio o volumen. Con estas características este tipo de distribución se define de la siguiente manera: 𝑃 (𝑥 ) =

ℯ −𝜆 × 𝜆𝑥 𝑥!

Dónde: 𝒑(𝒙) = 𝑙𝑎 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑑𝑒 𝑜𝑐𝑢𝑟𝑟𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑢𝑛 𝑒𝑣𝑒𝑛𝑡𝑜 𝑞𝑢𝑒 𝑑𝑒𝑝𝑒𝑛𝑑𝑒 𝑑𝑒𝑙 𝑡𝑖𝑒𝑚𝑝𝑜, 𝑒𝑠𝑝𝑎𝑐𝑖𝑜 𝑜 𝑣𝑜𝑙𝑢𝑚𝑒𝑛 𝝀 = 𝑛ú𝑚𝑒𝑟𝑜 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑜 𝑒𝑠𝑝𝑒𝑟𝑎𝑑𝑜 𝑑𝑒 𝑜𝑐𝑢𝑟𝑟𝑒𝑐𝑖𝑎 𝑑𝑒 𝑢𝑛 𝑒𝑣𝑒𝑛𝑡𝑜 𝑞𝑢𝑒 𝑑𝑒𝑝𝑒𝑛𝑑𝑒 𝑑𝑒𝑙 𝑡𝑖𝑒𝑚𝑝𝑜, 𝑒𝑠𝑝𝑎𝑐𝑖𝑜 𝑜 𝑣𝑜𝑙𝑢𝑚𝑒𝑛 𝓮 ∶ 𝑏𝑎𝑠𝑒 𝑑𝑒𝑙 𝑙𝑜𝑔𝑎𝑟𝑖𝑡𝑚𝑜 𝑛𝑎𝑡𝑢𝑟𝑎𝑙 𝒙: 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑒𝑣𝑒𝑛𝑡𝑜𝑠 𝑑𝑒𝑠𝑒𝑎𝑑𝑜𝑠 𝑞𝑢𝑒 𝑜𝑐𝑢𝑟𝑟𝑒𝑛 𝑒𝑛 𝑙𝑎 𝑢𝑛𝑖𝑑𝑎𝑑 𝑑𝑒 𝑡𝑖𝑒𝑚𝑝𝑜 𝑒𝑠𝑝𝑎𝑐𝑖𝑜 𝑜 𝑣𝑜𝑙𝑢𝑚𝑒𝑛. Ejercicios: La concentración de partículas en una suspensión es 2 por ml. Se agita por completo la concentración, y posteriormente se extraen 3 ml. Sea X el número de partículas que son retiradas. Determine a) 𝑝(𝑥 = 5) ℯ −𝜆 × 𝜆𝑥 ℯ −2 × 25 𝑃 (𝑥 ) = = = 0.0360 𝑥! 5! b) 𝑝(𝑥 ≤ 2) ℯ −𝜆 × 𝜆𝑥 ℯ −2 × 20 𝑃 (0) = = = 0.1353 𝑥! 0! ℯ −𝜆 × 𝜆𝑥 ℯ −2 × 21 𝑃 (1) = = = 0.2706 𝑥! 1! ℯ −𝜆 × 𝜆𝑥 ℯ −2 × 22 𝑃 (2) = = = 0.2706 𝑥! 2! 𝑃 (𝑥 ≥ 2) = 𝑝(0) + 𝑝(1) + 𝑝(2) = 0.6765 c) 𝑝(𝑥 > 1) ℯ −𝜆 × 𝜆𝑥 ℯ −2 × 20 𝑃 (0) = = = 0.1353 𝑥! 0! ℯ −𝜆 × 𝜆𝑥 ℯ −2 × 21 𝑃 (1) = = = 0.2706 𝑥! 1! Reimundo, Gaona, Zambrano

38

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

𝑃 (𝑥 > 1) = 1 − 𝑝(0) − 𝑝(1) = 0.4059 Suponga que 0.03% de los contenedores plásticos producidos en cierto proceso tiene pequeños agujeros que los dejan inservibles. X representa el número de contenedores en una muestra aleatoria de 10 000 que tienen este defecto. Determine a) 𝑃 (𝑥 = 3) 𝑃 (𝑥 ) =

ℯ −𝜆 ×𝜆𝑥 𝑥!

=

ℯ −3 ×33 3!

= 0.224

b) 𝑃 (𝑥 ≤ 2) ℯ −𝜆 × 𝜆𝑥 ℯ −3 × 30 𝑃 (0) = = = 0.0498 𝑥! 0! ℯ −𝜆 ×𝜆𝑥 ℯ −3 ×31 𝑃 (1) = 𝑥! = 1! = 0.1493

ℯ −𝜆 × 𝜆𝑥 ℯ −3 × 32 = = 0.2240 𝑥! 2! 𝑃 (𝑥 ≤ 2) = 𝑝(0) + 𝑝(1) + 𝑝(2) = 0.4231 𝑃 (2) =

c) 𝑃 (1 < 𝑥 < 4) ℯ −𝜆 × 𝜆𝑥 ℯ −3 × 32 𝑃 (2) = = = 0.224 𝑥! 2! ℯ −𝜆 × 𝜆𝑥 ℯ −3 × 33 𝑃 (3) = = = 0.224 𝑥! 3! 𝑃 (1 < 𝑥 < 4) = 𝑝(2) + 𝑝(3) = 0.448 d) 𝐸 (𝑥 ) = 𝜆 = 3 𝑉 (𝑥 ) = 𝜆 = 3 La producción de televisores en SAMSUNG trae asociada una probabilidad de defecto del 2%, si se toma un lote o muestra de 85 televisores, obtener la probabilidad de que existan 4 televisores con defectos n = 85 𝑝 = 0.02 𝑥=4 𝜆 = 1.7 ℯ −𝜆 × 𝜆𝑥 ℯ −1.7 × 1.74 𝑃 (4) = = = 0.0636 𝑥! 4! Si un banco recibe en promedio 6 cheques sin fondo por día, ¿cuáles son las probabilidades de que reciba 𝜆=6 𝑥 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐ℎ𝑒𝑞𝑢𝑒𝑠 sin 𝑓𝑜𝑛𝑑𝑜 Reimundo, Gaona, Zambrano

39

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

a) cuatro cheques sin fondo en un día dado, ℯ −𝜆 × 𝜆𝑥 ℯ −6 × 64 𝑃 (𝑥 = 4) = = = 0.1339 𝑥! 4! b) 10 cheques sin fondos en cualquiera de dos días consecutivos ℯ −𝜆 × 𝜆𝑥 ℯ −6 × 610 𝑃 (10) = = = 0.1049 𝑥! 10!

Distribución multinomial Si los sucesos A1 , A2 , A3 , … , Ak ocurren con una probabilidad p1 , p2 , p3 , … , pk entonces la probabilidad de que uno de ellos ocurra un número determinado de veces [ni ] está definido por: 𝑃 (A1 , m1 ; A2 , m2 ; A3 , m3 ; … ; Ak , mk) n! = × p1 m1 × p2 m2 × p3 m3 × … × pk mk n1 ! n2 ! n3 ! … nk ! 𝑛1 + 𝑛2 + 𝑛3 + ⋯ +𝑛𝑘 = 𝒏 𝑝1 + 𝑝2 + 𝑝3 + ⋯ +𝑝𝑘 = 𝒑𝒓𝒐𝒃𝒂𝒃𝒊𝒍𝒊𝒅𝒂𝒅𝒆𝒔 𝒑𝒂𝒓𝒄𝒊𝒂𝒍𝒆𝒔 = 𝟏 Ejercicios: Supóngase que el 23% de las personas que asisten a cierto partido de “baseball” viven a menos de 10 millas del estadio, el 59% de ellas viven a entre 10 y 50 millas del estadio, y el 18% vive a más de 50 millas. Se seleccionan al azar 20 personas entre los asistentes al partido (que son miles). Calcular la probabilidad de que siete de los seleccionados vivan a menos de 10 millas, ocho vivan entre 10 y 50 millas, y cinco vivan a más de 50 millas del estadio. n = 20 Número de personas seleccionadas k = 3 Cantidad de grupos de clasificación de las personas y1 Personas que viven a menos de 10 millas del estadio y2 Personas que viven a entre 10 y 50 millas del estadio y3 Personas que viven a más de 50 millas del estadio p1 = 0.23 p2 = 0.59 p3 = 0.18 Definiendo N1 , N2 , N3 el vector correspondiente a las frecuencias, se pide calcular: 20! ) × 0.237 × 0.598 × 0.185 P(N1 = 7, N2 = 8, N3 = 5) = ( 7! × 8! × 5! Reimundo, Gaona, Zambrano

40

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

P(N1 = 7, N2 = 8, N3 = 5) = 0.0094 En una fiesta, el 20% de los asistentes son españoles, el 30% franceses, el 40% italiano y el 10% portugueses. En un pequeño grupo se han reunido 4 invitados: ¿cuál es la probabilidad de que 2 sean españoles y 2 italianos? 𝑥1 = 2 𝑥2 = 0 𝑥3 = 2 𝑥4 = 0 𝑝1 = 0.2 𝑝2 = 0.3 𝑝3 = 0.4 𝑝4 = 0.1 𝑃(𝑥1 = 2, 𝑥2 = 0, 𝑥3 = 2, 𝑥4 = 0) 4! ) × 0.22 × 0.30 × 0.42 × 0.10 =( 2! × 0! × 2! × 0! 𝑃(𝑥1 = 2, 𝑥2 = 0, 𝑥3 = 2, 𝑥4 = 0) = 0.0384 Si se extrae una muestra aleatoria de 20 sujetos. ¿Cuál es la probabilidad de que 5 estén en contra, 10 sean indiferentes y 5 a favor de la donación de órganos? 𝑥: Actitud hacia la donación de órganos 𝑥1 = 5 En contra 𝑥2 = 10 Indiferente 𝑥3 = 5 A favor 𝑝1 = 0.15 𝑝2 = 0.40 𝑝3 = 0.45 20! ) ∗ 0.155 ∗ 0.4010 ∗ 0.455 𝑃 (𝑥1 = 5, 𝑥2 = 10, 𝑥3 = 5) = ( 5! ∗ 10! ∗ 5! 𝑃 (𝑥1 = 5, 𝑥2 = 10, 𝑥3 = 5) = 0.041 De acuerdo con la teoría de la genética, un cierto cruce de conejillo de indias resultará en una descendencia roja, negra y blanca en la relación 8: 4: 4. Encuentre la probabilidad de que entre 8 descendientes. 𝑛=8 a) 5 sean rojos, 2 negros y un blanco 𝑥1 = 5 Rojos 𝑥2 = 2 Negros 𝑥3 = 1 Blanco 𝑝1 = 0.50 𝑝2 = 0.25 Reimundo, Gaona, Zambrano

41

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

𝑝3 = 0.25

8! ) × 0.505 × 0.252 × 0.251 5! × 2! × 1! 𝑃 (𝑥1 = 5, 𝑥2 = 2, 𝑥3 = 1) = 0.082 𝑃 (𝑥1 = 5, 𝑥2 = 2, 𝑥3 = 1) = (

b) 3 sean rojos y 2 sean negros 𝑥1 = 3 Rojos 𝑥2 = 2 Negros 𝑥3 = 3 Blanco 𝑝1 = 0.50 𝑝2 = 0.25 𝑝3 = 0.25

8! ) × 0.503 × 0.252 × 0.253 3! × 2! × 3! 𝑃 (𝑥1 = 3, 𝑥2 = 2, 𝑥3 = 3) = 0.06836 𝑃 (𝑥1 = 3, 𝑥2 = 2, 𝑥3 = 3) = (

VARIABLE ALEATORIA CONTINUA Una variable aleatoria continua, es una función porque asigna a cada posible resultado de un experimento un valor real por lo tanto, x∈[a,b]⊂R. Ejemplo: 

Peso: estatura de un grupo de personas 𝑃∈[6; 2001]⊂ℝ 𝐸𝑠∈[40; 190]⊂ℝ Ca∈ [0; 20]⊂ℝ

Una variable aleatoria 𝑥 es continua si existe una función ℝ en ℝ 𝑓: R→R Llamada función de densidad o ley de probabilidad 𝐴 = [𝑎, 𝑏] 𝑏

𝑃(𝑥 ⊆ 𝐴) = ∫ 𝑓 (𝑥 )𝛿𝑥 = ∫ 𝑓 (𝑥 )𝛿𝑥 = 𝑃 < 𝑎 ≤ 𝑥 ≤ 𝑏 𝐴

𝑎

Propiedades de la función de densidad Propiedad de 𝑓 (𝑥 )  

𝑓 (𝑥 ) > 0 ∀𝑥 ∈ ℝ ∞ ∫−∞ 𝑓 (𝑥 )𝛿𝑥 = 1

Se tiene las siguientes equivalencias: 𝑃(𝑎 ≤ 𝑥 ≤ 𝑏) ≈ 𝑃(𝑎 < 𝑥 < 𝑏) ≈ 𝑃(𝑎 ≤ 𝑥 < 𝑏) ≈ 𝑃(𝑎 < 𝑥 ≤ 𝑏) 𝑃 ( 𝑥 = 𝑎 ) ≈ 𝑃 (𝑎 ≤ 𝑥 ≤ 𝑎 ) ≈ 𝑃 (𝑎 < 𝑥 < 𝑏 ) = 0 Reimundo, Gaona, Zambrano

42

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

Función Distribución 𝒇(𝒙) La función de distribución para una variable aleatoria continua, que tiene una función de densidad o ley de probabilidad 𝑓 (𝑥 ) esta dada por: 𝑥

𝐹(𝑥 ) = ∫ 𝑓(𝑡) 𝛿𝑡 −∞

Medidas descriptivas ∞

𝐸(𝑥 ) = ∫ 𝑥𝑓(𝑥)𝛿𝑥 −∞ ∞



𝑉(𝑥 ) = ∫ 𝑥 2 𝑓 (𝑥 )𝛿𝑥 − ∫ 𝑥𝑓 (𝑥 )𝛿𝑥 −∞

−∞

𝐷(𝑥 ) = √𝑉(𝑥) Ejercicios: Supongamos que el tiempo de funcionamiento de un dispositivo electrónico (en horas) puede modelarse por una variable aleatoria X continua con función densidad. 𝑥 − 𝑠𝑖 𝑥 > 0 𝑓 (𝑥 ) = {𝑘𝑒 2 𝑟𝑒𝑠𝑡𝑜 0 Hallar: a) K +∞



𝑓(𝑥 )𝑑𝑥 = 1

−∞ +∞



+∞

𝑓(𝑥 )𝑑𝑥 = ∫

−∞ +∞



𝑥

𝑥

𝑥

𝑘𝑒 −2 𝑑𝑥 = 𝑘 [−2𝑒 −2 ] = 𝑘 (−2 lim 𝑒 −2 + 2) 𝑥→∞

−∞

𝑓(𝑥 )𝑑𝑥 = 𝑘𝑥2 = 1

−∞

∴𝑘=

1 2

b) F(x) 0 𝑥 𝐹 (𝑥 ) = { 1 − 𝑒 −2

𝑠𝑖 𝑥 ≤ 0 𝑠𝑖 𝑥 > 0

c) La probabilidad de que el dispositivo dure más de dos horas 𝑃 [𝑥 > 2] = 1 − 𝐹 (2) = 1 − {1 − 𝑒 −2/2} = 0.368

Reimundo, Gaona, Zambrano

43

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

Sea X una variable aleatoria con F(x) 𝑥 2) + 𝑝(𝑧1 < −3) = 0.0241 c) Determinar las especificaciones de volumen que son simétricos alrededor de la media e incluyen al 99% de los envases.

Reimundo, Gaona, Zambrano

47

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

𝑝(𝑍 < 𝑧1 ) = 0.005 0.99 ÷ 2 = 0.4952.575 𝑧1 = 2.575 𝑥1 = (2.575 × 0.1) + 12.4 = 12.6575  𝑥2 = −12.6575 ∴ 𝐿𝑎𝑠 𝑒𝑠𝑝𝑒𝑐𝑖𝑓𝑖𝑐𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑑𝑒 𝑣𝑜𝑙𝑢𝑚𝑒𝑛 𝑠𝑜𝑛 12.6575 𝑦 − 12.6575 𝑟𝑒𝑠𝑝𝑒𝑐𝑡𝑖𝑣𝑎𝑚𝑒𝑛𝑡𝑒 𝑦 𝑐𝑎𝑑𝑎 𝑢𝑛𝑎 𝑐𝑜𝑛 𝑠𝑢𝑠 𝑒𝑟𝑟𝑜𝑟𝑒𝑠 𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜𝑠 𝑎𝑙 0.5 El tiempo de vida de un láser semiconductor a potencia constante tiene una distribución normal con una media de 7000 horas y una desviación de 600 horas. a) ¿Cuál es la probabilidad de que el láser falle antes de 5000 horas? 𝑥 < 5000 5000.25 − 7000 𝑧1 = = −3.33 600

𝑝(𝑧 < −3.33) = 0.5 − 𝑝(0 < 𝑧 < 3.33) = 0.5 − 0.49957 = 0.00043 b) ¿Cuál es el tiempo de vida en horas, del 95% del láser lo excede? 𝑝(𝑋 > 𝑥 ) = 0.95  0.45 𝑝(𝑍 < 𝑧) = 1.645

𝑥1 = (1.645 × 600) + 7000 = 7987 En 2004 y 2005, el costo medio anual para asistir a una universidad privada en Estados Unidos era de $20082. Suponga que la distribución de los costos anuales se rigen por una distribución normal y la desviación estándar era de $4500. El 95% de los estudiantes de la universidad privada paga menos de ¿Qué cantidad? Reimundo, Gaona, Zambrano

48

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

𝑝(𝑋 < 𝑥 ) = 0.95  0.45

𝑝(𝑍 < 𝑧) = 0.45 𝑧1 =1.645 𝑥1 = (1.645 × 4500) + 20082 = 27484.5

Aproximación de distribución normal a distribución binomial Se usa para una n demasiado grande ya que es conveniente realizar una aproximación de la distribución binomial. Distribución Normal 𝑥−𝑢 𝑍= 𝜎 Distribución Binomial 𝑛

𝑝(𝑋 = 𝑥 ) = ∑ 𝐶𝑥𝑛 × 𝑝 𝑥 × 𝑞𝑛−𝑥 𝑥=0

Aproximación 𝐵𝑖𝑛𝑜𝑚𝑖𝑎𝑙:

𝑢 =𝑛×𝑝

𝐵𝑖𝑛𝑜𝑚𝑖𝑎𝑙:

𝑑 = √𝑛 × 𝑝 × 𝑞

𝐴𝑝𝑟𝑥. 𝑁𝑜𝑟𝑚𝑎𝑙 ∴ 𝑧 =

𝑥 − (𝑛 × 𝑝) √𝑛 × 𝑝 × 𝑞

Ejercicios: El 2% de los tornillos fabricados por una máquina presentan defectos. Si tenemos un lote de 2000 tornillos, ¿Cuál es la probabilidad de que haya menos de 50 defectuosos? 𝑝 = 0.02 𝑞 = 1 − 𝑝 = 1 − 0.02 = 0.98 𝑛 = 2000 𝐸 = 𝑛𝑝 = 2000 × 0.02 = 40 = 𝑢 𝜎 = √𝑛𝑝𝑞 = √2000 × 0.02 × 0.98 = 6.26 ∴ 𝑁(𝑢; 𝜎) = 𝑁(40; 6.26) 𝑝(𝑋 < 50) (50 + 0.25) − 40 𝑧1 = = 1.64 6.26

Reimundo, Gaona, Zambrano

49

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

𝑝(𝑍 < 1.64) = 0.5 + 𝑝(0 < 𝑧 < 1.64) = 0.9495 La probabilidad de que un paciente se recupere de una rara enfermedad de la sangre es 0.4. Si se sabe que 100 personas contraen esta enfermedad, ¿Cuál es la probabilidad de que menos de 30 sobrevivan? 𝑝 = 0.4 𝑞 = 1 − 𝑝 = 1 − 0.4 = 0.6 𝑛 = 100 𝐸 = 𝑛𝑝 = 100 × 0.4 = 40 = 𝑢 𝜎 = √𝑛𝑝𝑞 = √100 × 0.4 × 0.6 = 4.899 ∴ 𝑁(𝑢; 𝜎) = 𝑁(40; 4.899) 𝑝(𝑋 < 30) (30 + 0.25) − 40 𝑧1 = = −1.99 4.899

𝑝(𝑍 < −1.99) = 0.5 − 𝑝(0 < 𝑧 < 1.99) = 0.0233 Una prueba de opción múltiple tiene 200 preguntas, cada una con 4 posibles respuestas, de las cuáles solo una es la correcta ¿Cuál es la probabilidad de que al azar se den de 25 a 30 respuestas correctas para 80 de las 200 preguntas acerca de los cuales el estudiante no tienen conocimiento? 𝑝 = 0.25 𝑞 = 1 − 𝑝 = 1 − 0.25 = 0.75 𝑛 = 80 𝐸 = 𝑛𝑝 = 80 × 0.25 = 20 = 𝑢 𝜎 = √𝑛𝑝𝑞 = √80 × 0.25 × 0.75 = 3.8729 ∴ 𝑁(𝑢; 𝜎) = 𝑁(20; 3.8729) 𝑝(25 < 𝑋 < 30) (25 − 0.25) − 20 𝑧1 = = 1.23 3.8729 (30 + 0.25) − 20 𝑧1 = = 2.65 3.8729

Reimundo, Gaona, Zambrano

50

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

𝑝(1.23 < 𝑍 < 2.65) = 𝑝(0 < 𝑧 < 2.65) − 𝑝(0 < 𝑧 < 1.23) 0.4960 − 0.3907 = 0.1053 Si 35% de los productos manufacturados en cierta línea de producción son defectuosos, ¿Cuál es la probabilidad de que entre los siguientes 1000 productos manufacturados en esa línea menos de 354 productos sean defectuosos? 𝑝 = 0.35 𝑞 = 1 − 𝑝 = 1 − 0.35 = 0.65 𝑛 = 1000 𝐸 = 𝑛𝑝 = 1000 × 0.35 = 350 = 𝑢 𝜎 = √𝑛𝑝𝑞 = √1000 × 0.35 × 0.65 = 15.0831 ∴ 𝑁(𝑢; 𝜎) = 𝑁(350; 15.0831) 𝑝(𝑋 < 354) (354 + 0.25) − 350 𝑧1 = = 0.28 15.0831

𝑝(𝑍 < 0.28) = 0.5 + 𝑝(𝑍 < 0.28) = 0.6103

Intervalos de confianza Un intervalo de confianza es donde se encuentra la media (𝑢) y se halla definido por un nivel de confianza. 𝜎 𝐼 = [𝑢 − 𝐸; 𝑢 + 𝐸]; 𝐸 = 𝑧𝛼 × √𝑛 𝜶: 𝑁𝑖𝑣𝑒𝑙 𝑑𝑒 𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎 𝑞𝑢𝑒 𝑣𝑖𝑒𝑛𝑒 𝑑𝑎𝑑𝑜 𝑒𝑛 𝑝𝑜𝑟𝑐𝑒𝑛𝑡𝑎𝑗𝑒 1+𝛼 𝑷𝒓𝒐𝒃𝒂𝒃𝒊𝒍𝒊𝒅𝒂𝒅: 𝑝(𝑍 ≥ 𝑧𝛼 ) = 2 Ejercicios: En una muestra de 65 sujetos las puntuaciones en una escale de extroversión tiene una media de 32.7 puntos y una desviación de 12.64. a) Calcule a partir de estos datos el correspondiente intervalo de confianza, a un nivel del 90%, para la media de la población. 𝐼 = [𝑢 − 𝐸; 𝑢 + 𝐸] Reimundo, Gaona, Zambrano

51

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

𝑝(𝑍 ≥ 𝑧𝛼 ) = 𝑧𝛼 = 1.96 𝐸 = 1.96 ×

1 + 0.95 = 0.975 − 0.5 = 0.475 2

12.64

= 3.07 √65 𝐼 = [32.7 − 3.07; 32.7 + 3.07] = [29.63; 35.77] La desviación típica de la altura de los habitantes de un país es de 8 cm. Calcular el tamaño mínimo que ha de tener una muestra de habitantes de dicho país para que el error cometido al estimar la altura media sea inferior a 1 cm con un nivel de confianza del 90% 𝐼 = [𝑢 − 𝐸; 𝑢 + 𝐸] 1 + 0.90 𝑝(𝑍 ≥ 𝑧𝛼 ) = = 0.95 − 0.5 = 0.45 2 8 𝐸 = 1.645 × =1 √𝑛 𝑛 = (1.645 × 8)2 = 173.19 Se lanza una moneda 100 veces y se obtiene 62 cruces. ¿Cuál es el intervalo de confianza para la proporción de cruces con un 99% de nivel de confianza? 𝐼 = [𝑢 − 𝐸; 𝑢 + 𝐸] 1 + 0.99 𝑝(𝑍 ≥ 𝑧𝛼 ) = = 0.995 − 0.5 = 0.495 2 √100 × 0.62 × 0.38 𝐸 = 2.575 × = 1.25 √100 𝑛 = (1.645 × 8)2 = 173.19 𝐼 = [62 − 1.25; 62 + 1.25] = [60.75; 63.25] Se desea realizar una investigación para estimar el peso medio de los recién nacidos de madres fumadoras. Se admite un error máximo de 50 gramos, con una confianza del 95%. Si por estudios anteriores se sabe que la desviación típica del peso medio de tales recién nacidos es de 400 gramos. ¿Qué tamaño de muestra se necesita en la investigación? 𝐼 = [𝑢 − 𝐸; 𝑢 + 𝐸] 1 + 0.95 𝑝(𝑍 ≥ 𝑧𝛼 ) = = 0.975 − 0.5 = 0.475 2 400 𝐸 = 1.96 × = 50 √𝑛 1.96 × 400 2 ) = 245.86 𝑛=( 50

Reimundo, Gaona, Zambrano

52

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

Distribución uniforme Se dice que una variable es aleatoria continua con distribución uniforme en a y b, si el conjunto de todas sus posibles variables están en el intervalo 𝑋 ∈ [𝑎, 𝑏] y los valores de sus probabilidades son iguales. Ejemplo: 

El lanzamiento de un dado Variables {1, 2, 3, 4, 5, 6} 1 𝑝(𝑋 = 𝑥 ) 𝑝𝑎𝑟𝑎 𝑡𝑜𝑑𝑎𝑠 𝑙𝑎𝑠 𝑐𝑎𝑟𝑎𝑠 𝑡𝑖𝑒𝑛𝑒 𝑙𝑎 𝑚𝑖𝑠𝑚𝑎 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 6 Función de densidad 1 𝑎≤𝑥≤𝑏 𝑓(𝑥) {𝑏 − 𝑎 𝑟𝑒𝑠𝑡𝑜 0 Gráfica función de densidad

Función de distribución 0 𝑥 100) = 1 − 𝐹 (100) = 1 − [1 − 𝑒 −1.25] = 𝑒 −1.25 = 0.2865 Se sabe que el gasto mensual de agua, en metros cúbicos, que tienen las familias en cierta localidad tiene una distribución exponencial con 𝜇 = 10. 1 −𝑥 𝑓 (𝑥 ) = 𝑒 10 10 𝑥 𝐹 (𝑥 ) = 1 − 𝑒 −10 a) ¿Cuál es la probabilidad que una familia consuma menos de 3 metros cúbicos al mes? 𝑃 (𝑥 < 3) = 𝐹 (3) = 1 − 𝑒 −0.30 = 0.2592 b) ¿Cuál es la probabilidad de que el consumo mensual de agua de una familia rebase los 40 metros cúbicos? 𝑃 (𝑥 > 40) = 1 − 𝐹 (40) = 1 − [1 − 𝑒 −4 ] = 𝑒 −4 = 0.0183 La vida media de un televisor “s” es de 7 años. SI esta vida puede considerarse como una variable aleatoria distribuida en forma exponencial, a) ¿Cuál es la probabilidad de que un televisor de este tipo falle después del 7mo año de uso? 1

𝑝(𝑥 > 7) = 1 − 𝐹 (7) = 𝑒 −7×7 = 0.3679

Reimundo, Gaona, Zambrano

59

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

b) Encontrar la función de densidad y gráfica, función de distribución y gráfica, media, varianza y desviación típica Función de densidad 1 −1𝑥 𝑠𝑖 𝑥 ≥ 0 7 𝑓 (𝑥 ) { 7 𝑒 𝑠𝑖 𝑥 < 0 0 Gráfica función de densidad

Función de distribución 1 𝑠𝑖 𝑥 ≥ 0 − 𝑥 𝐹 (𝑥 ) = { 1 − 𝑒 7 𝑠𝑖 𝑥 < 0 0 Gráfica función de distribución

𝑀𝑒𝑑𝑖𝑎: 𝐸(𝑥 ) = 𝑢 = 7 𝐷 (𝑥 ) = 7

Reimundo, Gaona, Zambrano

𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎: 𝑉(𝑥 ) =

1 12

= 49

7

60

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

REGRESIONES El objetivo de la regresión (que utiliza mínimos cuadrados) es el de obtener una función aproximada que ajuste adecuadamente el comportamiento de cierto conjunto de datos, sin que necesariamente coincida con cada punto en particular Existe la regresión lineal, polinomial, lineal múltiple, exponencial logarítmica y de potencias

Regresión Lineal 𝑦 = 𝑎0 + 𝑎1 𝑥 + 𝐸 𝐸 = 𝑦 − 𝑎0 − 𝑎1 𝑥 𝑛

𝑛

∑ 𝐸𝑖 = ∑(𝑦 − 𝑎0 − 𝑎1 𝑥𝑖 ) 𝑖=1 𝑛

𝑖=1 𝑛

∑|𝐸𝑖 | = ∑(𝑦 − 𝑎0 − 𝑎1 𝑥𝑖 ) 𝑖=1

𝑖=1

Mínimos Cuadrados 𝑛

𝑛 2

∑ 𝐸𝑖 = ∑(𝑦 − 𝑎0 − 𝑎1 𝑥𝑖 )2 𝑖=1 𝑛

𝑖=1

∑ 𝐸𝑖 2 = 𝑆𝑟 𝑖=1

Reimundo, Gaona, Zambrano

61

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos 𝑛

𝑆𝑟 = ∑(𝑦 − 𝑎0 − 𝑎1 𝑥𝑖 )2 𝑖=1 𝑛

𝑛

𝑛

𝑛

𝑖=1

𝑖=1

𝑖=1

𝑑𝑆𝑟 = ∑(𝑦 − 𝑎0 − 𝑎1 𝑥𝑖 )2 → 0 = ∑ 𝑦𝑖 − ∑ 𝑎0 − 𝑎1 ∑ 𝑥𝑖 2 𝑑𝑎0 𝑖=1

𝑬𝒄𝒖𝒂𝒄𝒊ó𝒏 𝟏 𝑛

𝑛

∑ 𝑦𝑖 = 𝑛 × 𝑎0 + 𝑎1 ∑ 𝑥𝑖 2 𝑖=1

𝑖=1 𝑛

𝑛

𝑛

𝑛

𝑖=1

𝑖=1

𝑖=1

𝑖=1

𝑑𝑆𝑟 = ∑(𝑦 − 𝑎0 − 𝑎1 𝑥𝑖 )2 → 0 = ∑ 𝑦𝑖 𝑥𝑖 − ∑ 𝑎0 𝑥𝑖 − 𝑎1 ∑ 𝑥𝑖 2 𝑑𝑎1 𝑬𝒄𝒖𝒂𝒄𝒊ó𝒏 𝟐 𝑛

𝑛

𝑛

∑ 𝑦𝑖 𝑥𝑖 = 𝑎0 ∑ 𝑥𝑖 + 𝑎1 ∑ 𝑥𝑖 2 𝑖=1

𝑖=1

𝑖=1

Parámetros 

Desviación estándar 𝑆𝑡

 𝑆𝑣 = √𝑛−1





𝐷𝑜𝑛𝑑𝑒:  𝑛 = 𝑛ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙  𝑆𝑡 = (𝑦𝑖 − 𝑦̅)2 Coeficiente de determinación 𝑆𝑡−𝑆𝑟  𝑟 2 = 𝑆𝑡  𝑟 2 → 1 𝑒𝑠 ó𝑝𝑡𝑖𝑚𝑜 Coeficiente de correlación 𝑆𝑡−𝑆𝑟

 𝑟 = √𝑟 2 → 𝑟 = √

𝑆𝑡

 𝑟 → 1 𝑐𝑜𝑛𝑓𝑖𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑒𝑛𝑡𝑟𝑒 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒𝑠 ‘

Reimundo, Gaona, Zambrano

62

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

Ejemplo: Ajustar la siguiente tabla a una línea recta y determine los parámetros para analizar la confiabilidad de dicha recta y dichos datos. 𝒙

𝒚

(𝒚 𝒊 − 𝒚 ̅ )𝟐

𝒙𝟐

𝒚𝒙

1

0.50

8.526

1

0.50

2

2.50

0.846

4

5.00

3

2.00

2.015

9

6.00

4

4.00

0.336

16

16.00

5

3.50

0.006

25

17.50

6

6.00

6.656

36

36.00

7

5.50

4.326

49

38.50

28

24.0

22.712

140

119.50

24 = 7𝑎0 + 28𝑎1 119.5 = 28𝑎0 + 140𝑎1 𝑑𝑒𝑠𝑝𝑒𝑗𝑜 𝑎0 𝑑𝑒 1 𝑎0 =

24−28𝑎1 7

24 − 28𝑎1 ) + 140𝑎1 7 119.5 = 96 + 28𝑎1 𝑎1 = 0.834 𝑟𝑒𝑒𝑚𝑝𝑙𝑎𝑧𝑜 𝑎1 𝑒𝑛 3 24 − 28 × 0.834 𝑎0 = 7 𝑎0 = 0.071 119.5 = 28 × (

Reimundo, Gaona, Zambrano

63

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

𝒙

𝒚

(𝒚 − 𝒂𝟎 − 𝒂𝟏 𝒙𝒊 )𝟐

1

0.50

0,168

2

2.50

0,564

3

2.00

0,346

4

4.00

0,328

5

3.50

0,587

6

6.00

0,801

7

5.50

0,197

28

24.0

2.991

22.712 − 2.991 = 0.868 22.712 𝑟 = √0.868 = 0.931 𝑟2 =

Ejercicios: De una muestra de ocho observaciones conjuntas de valores de dos variables X e Y, se obtiene la siguiente información: 𝑛

𝑛

𝑛

∑ 𝑥𝑖 = 24

∑ 𝑦𝑖 𝑥𝑖 = 64

∑ 𝑦𝑖 = 40

𝑖=1

𝑖=1

𝑖=1

𝑆𝑦 2 = 12

𝑆𝑥 2 = 6

Calcule: a) La recta de regresión de Y sobre X. Explique el significado de los parámetros. b) El coeficiente de determinación. Comente el resultado e indique el tanto por ciento de la variación de Y que no está explicada por el modelo lineal de regresión. c) Si el modelo es adecuado, ¿cuál es la predicción 𝑦̅ para x=4.

Reimundo, Gaona, Zambrano

64

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

a) En primer lugar calculamos las medias y las covarianza entre ambas variables: 𝑛 𝑥𝑖 24 𝑥̅ = ∑ = =3 𝑛 8 𝑖=1 𝑛

𝑦𝑖 40 = =5 𝑛 8 𝑖=1 ∑𝑛𝑖=1 𝑥𝑖 𝑦𝑖 64 𝑆𝑥𝑦 = − 𝑥𝑦 ̅̅̅ = − 3 × 5 = −7 𝑛 8 Con estas cantidades podemos determinar los parámetros a y b de la recta. La pendiente de la misma es𝑎1 , y mide la variación de Y cuando X aumenta en una unidad: 𝑆𝑥𝑦 7 𝑎1 = 2 = − = −1.667 𝑆𝑥 6 Al ser esta cantidad negativa, tenemos que la pendiente de la recta es negativa, es decir, a medida que X aumenta, la tendencia es a la disminución de Y. En cuanto al valor de la ordenada en el origen, 𝑎0 , tenemos: 7 𝑎0 = 𝑦̅ − 𝑎1 𝑥̅ = 5 − × 3 = 8.5 6 Así, la recta de regresión de Y como función de X es: 𝑦̂ = 8.5 − 1,667𝑥 b) El grado de bondad del ajuste lo obtenemos a partir del coeficiente de determinación: 𝑆𝑥𝑦 2 (−7)2 2 ) = r =( = 0.6805 = 68.05% 𝑆𝑥 × 𝑆𝑦 6 × 12 𝑦̅ = ∑

Es decir, el modelo de regresión lineal explica el 68% de la variabilidad de Y en función de la de X. Por tanto queda un 32% de variabilidad no explicada. c) La predicción que realiza el modelo lineal de regresión para x=4 es: 𝑦̂ = 8.5 − 1,667 × 4 = 3.833

Reimundo, Gaona, Zambrano

65

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

En la tabla se presentan las puntuaciones en Literatura 𝑥 y las puntuaciones en Lenguaje 𝑦 de un grupo de alumnos de un centro educativo. Ajustar la tabla a una línea recta. 𝒏

𝒙

𝒚

(𝒚𝒊 − 𝒚 ̅ )𝟐

𝒙𝟐

𝒚𝒙

1

5

12

44944

25

60

2

8

20

41616

64

160

3

12

30

37636

144

360

4

16

30

37636

256

480

5

16

42

33124

256

672

6

24

40

33856

576

960

7

28

50

30276

784

1400

109

224

259088

2105

4092

1. 224 = 7𝑎0 + 109𝑎1 2. 1400 = 109𝑎0 + 2105𝑎1 𝑑𝑒𝑠𝑝𝑒𝑗𝑜 𝑎0 𝑑𝑒 1 224−109𝑎1 3. 𝑎0 = 7 224 − 109𝑎1 ) + 140𝑎1 1400 = 28 × ( 7 1400 = 896 − 296𝑎1 𝑎1 = −1.70 𝑟𝑒𝑒𝑚𝑝𝑙𝑎𝑧𝑜 𝑎1 𝑒𝑛 3 224 − 109 × (−1.70) 𝑎0 = 7 𝑎0 = 58.47

Reimundo, Gaona, Zambrano

66

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

𝒏

𝒙

(𝒚 − 𝒂𝟎 − 𝒂𝟏 𝒙𝒊 )𝟐

𝒚

1

5

12

1441,72

2

8

20

618,52

3

12

30

65,12

4

16

30

1,61

5

16

42

115,13

6

24

40

498,63

7

28

50

1531,16

109

224

4271,89

259088 − 4271,89 = 0.9835 259088 𝑟 = √0.9835 = 0.9917 𝑟2 =

Se desea saber el grado de relación entre los años de escolaridad de la madre 𝑥 y las calificaciones de sus hijos en una prueba de Matemática 𝒚. Los datos se presentan en la siguiente tabla. 𝒏

𝒙

𝒚

(𝒚𝒊 − 𝒚 ̅ )𝟐

𝒙𝟐

𝒚𝒙

1

8

12

1296

64

96

2

5

8

1600

25

40

3

3

8

1600

9

24

4

6

10

1444

36

60

5

7

10

1444

49

70

Reimundo, Gaona, Zambrano

67

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

29

48

7384

183

260

1. 48 = 5𝑎0 + 29𝑎1 2. 260 = 29𝑎0 + 183𝑎1 𝑑𝑒𝑠𝑝𝑒𝑗𝑜 𝑎0 𝑑𝑒 1 48−29𝑎1 3. 𝑎0 = 5 48 − 29𝑎1 ) + 183𝑎1 260 = 29 × ( 5 260 = 278.4 − 14.8𝑎1 𝑎1 = 1.24 𝑟𝑒𝑒𝑚𝑝𝑙𝑎𝑧𝑜 𝑎1 𝑒𝑛 3 48 − 29 × 1.24 𝑎0 = 5 𝑎0 = 2.41 𝒏

𝒙

𝒚

(𝒚 − 𝒂𝟎 − 𝒂𝟏 𝒙𝒊 )𝟐

1

5

12

0.11

2

8

20

0.37

3

12

30

3.50

4

16

30

0.02

5

16

42

1.19

109

224

5.19

7384 − 5.19 = 0.999 7384 𝑟 = √0.999 = 0.999 𝑟2 =

En la segunda y tercera columna de la Tabla se tiene la información sobre coeficientes de inteligencia y puntajes en Matemáticas para una muestra aleatoria de 12 estudiantes que estudiaron el primer año de secundaria en el colegio Cabrera Tapia en el año 2000. Encontraremos el coeficiente de correlación de Pearson. Reimundo, Gaona, Zambrano

68

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

El primer día de clases, a todos ellos se les aplicó una prueba para obtener sus coeficientes de inteligencia 𝑥 en la escala Stanford-Binet y al término del año se les aplicó una prueba de 35 ítems para evaluar su rendimiento en Matemática. (𝒚 𝒊 − 𝒚 ̅ )𝟐

𝒙𝟐

𝒙

𝒚

𝒚𝒙

120

17

30276

14400

2040

112

15

30976

12544

1680

110

15

30976

12100

1650

120

19

29584

14400

2280

103

12

32041

10609

1236

126

20

29241

15876

2520

113

15

30976

12769

1695

114

17

30276

12996

1938

106

14

31329

11236

1484

108

14

31329

11664

1512

128

19

29584

16384

2432

109

14

31329

11881

1526

1369

191

367917

156859

21993

1. 191 = 12𝑎0 + 1369𝑎1 2. 21993 = 1369𝑎0 + 156859𝑎1 𝑑𝑒𝑠𝑝𝑒𝑗𝑜 𝑎0 𝑑𝑒 1 191−1369𝑎1 3. 𝑎0 = 12 191 − 1369𝑎1 ) + 156859𝑎1 21993 = 1369 × ( 12 Reimundo, Gaona, Zambrano

69

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

21993 = 21789.92 − 678.92𝑎1 𝑎1 =-0.30 𝑟𝑒𝑒𝑚𝑝𝑙𝑎𝑧𝑜 𝑎1 𝑒𝑛 3 191 − 1369 × (−0.3) 𝑎0 = 12 𝑎0 = 50.14 (𝒚 − 𝒂𝟎 − 𝒂𝟏 𝒙𝒊 )𝟐

𝒙

𝒚

120

17

8,18

112

15

2,37

110

15

4,58

120

19

23,62

103

12

52,42

126

20

58,68

113

15

1,54

114

17

1,12

106

14

18,84

108

14

13,99

128

19

52,71

109

14

11,83

1369

191

249,87

367917 − 249.87 = 0.999 367917 𝑟 = √0.999 = 0.999 𝑟2 =

Reimundo, Gaona, Zambrano

70

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

Regresión polinomial 𝐸 = 𝑦 − 𝑎0 − 𝑎1 𝑥1 − 𝑎2 𝑥2 + ⋯ + 𝑎𝑛 𝑥𝑛 𝐸𝑐𝑢𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑛

𝑛

𝑛

𝑛 2

∑ 𝑦𝑖 = 𝑛 × 𝑎0 + 𝑎1 ∑ 𝑥𝑖 + 𝑎2 ∑ 𝑥𝑖 + ⋯ + 𝑎𝑛 ∑ 𝑥𝑖 𝑛 𝑖=1 𝑛

𝑖=1

𝑖=1

𝑛

𝑛

𝑖=1 𝑛

2

𝑛

∑ 𝑦𝑖 𝑥𝑖 = 𝑎0 ∑ 𝑥𝑖 + 𝑎1 ∑ 𝑥𝑖 + 𝑎2 ∑ 𝑥𝑖 + ⋯ + 𝑎𝑛 ∑ 𝑥𝑖 𝑛+1 𝑖=1 𝑛

𝑖=1 𝑛 𝑛

𝑖=1

𝑖=1 𝑛

𝑛

𝑖=1

𝑖=1 𝑛

∑ 𝑦𝑖 𝑥𝑖 = 𝑎0 ∑ 𝑥𝑖 + 𝑎1 ∑ 𝑥𝑖 𝑖=1

3

𝑛+1

𝑛

+ 𝑎2 ∑ 𝑥𝑖

𝑖=1

𝑛+2

+ ⋯ + 𝑎𝑛 ∑ 𝑥𝑖 2𝑛

𝑖=1

𝑖=1

Parámetros Desviación estándar 𝑆𝑣 = √

𝑆𝑡 𝑛−1

𝐷𝑜𝑛𝑑𝑒: 𝑛 = 𝑛ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑆𝑡 = (𝑦𝑖 − 𝑦̅)2 Coeficiente de determinación 𝑆𝑡 − 𝑆𝑟 𝑆𝑡 𝑟 2 → 1 𝑒𝑠 ó𝑝𝑡𝑖𝑚𝑜 𝑟2 =

Coeficiente de correlación 𝑟 = √𝑟 2 → 𝑟 = √

𝑆𝑡 − 𝑆𝑟 𝑆𝑡

𝑟 → 1 𝑐𝑜𝑛𝑓𝑖𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑒𝑛𝑡𝑟𝑒 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒𝑠

Reimundo, Gaona, Zambrano

71

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

Ejemplo: Ajustar la siguiente tabla a una línea recta y determine los parámetros para analizar la confiabilidad de dicha recta y dichos datos. 𝒙

(𝒚𝒊 − 𝒚 ̅ )𝟐

𝒚

𝒙𝟐

𝒙𝟑

𝒙𝟒

𝒚𝒙

𝒚𝒙𝟐

1

0.50

8.526

1

1

1

0.50

0.50

2

2.50

0.846

4

8

16

5.00

10

3

2.00

2.015

9

27

81

6.00

18

4

4.00

0.336

16

64

256

16.00

64

5

3.50

0.006

25

125

625

17.50

87.50

6

6.00

6.656

36

216

1296

36.00

216

7

5.50

4.326

49

343

2401

38.50

269.50

28

24.0

22.712

140

784

4676

119.5

665.50

24 = 7𝑎0 + 28𝑎1 + 140𝑎2 119.5 = 28𝑎0 + 140𝑎1 + 784𝑎2 665.5 = 140𝑎0 + 784𝑎1 + 4676𝑎2 Despejo 𝑎0 𝑑𝑒 1 24 − 28𝑎1 − 140𝑎2 𝑎0 = 7 reemplazo en 2 y 3 24 − 28𝑎1 − 140𝑎2 ) + 140𝑎1 + 784𝑎2 119.5 = 28 × ( 7 23.5 = 28𝑎1 + 224𝑎2 24 − 28𝑎1 − 140𝑎2 ) + 784𝑎1 + 4676𝑎2 665.5 = 140 × ( 7 185.5 = 224𝑎1 + 1876𝑎2 Despejo 𝑎1 𝑑𝑒 4 23.5 − 224𝑎2 𝑎1 = 28 reemplazo en 5 23.5 − 224𝑎2 ) + 1876𝑎2 185.5 = 224 × ( 28 Reimundo, Gaona, Zambrano

72

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

−2.5 = 84𝑎2 𝑎2 = −0.030 reemplazo en 𝑎1 23.5 − 224 × (−0.030) 𝑎1 = 28 𝑎1 = 1.08 reemplazo en 𝑎0 24 − 28 × (1.08) − 140 × (−0.030) 𝑎0 = 7 𝑎0 = −2.04 𝒙

𝒚

(𝒚 − 𝒂𝟎 − 𝒂𝟏 𝒙𝒊 − 𝒂𝟐 𝒙𝒊 )𝟐

1

0.50

2,220

2

2.50

5,954

3

2.00

0,792

4

4.00

3,386

5

3.50

0,084

6

6.00

3,028

7

5.50

0,036

28

24.0

15.499

22.712 − 15.499 = 0.317 22.712 𝑟 = √0.317 = 0.563 𝑟2 =

Reimundo, Gaona, Zambrano

73

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

Ejercicios: En la tabla se tiene información de una muestra aleatoria de 15 alumnos del centro educativo Teresa Gonzales de Fanning. Se desea obtener el coeficiente de correlación entre los puntajes obtenidos en Aritmética y Lenguaje para medir su grado de relación. 𝒙

𝒚

𝒙𝟐

15 14 13 12 11 13 15 15 16 12 11 8 10 15 13 193

16 15 12 12 10 15 15 16 17 15 12 9 11 14 15 204

225 196 169 144 121 169 225 225 256 144 121 64 100 225 169 2553

𝒙𝟑 3375 2744 2197 1728 1331 2197 3375 3375 4096 1728 1331 512 1000 3375 2197 34561

𝒙𝟒 50625 38416 28561 20736 14641 28561 50625 50625 65536 20736 14641 4096 10000 50625 28561 476985

(𝒚 𝒊 − 𝒚 ̅ )𝟐 35344 35721 36864 36864 37636 35721 35721 35344 34969 35721 36864 38025 37249 36100 35721 543864

𝒚𝒙

𝒚𝒙𝟐

240 210 156 144 110 195 225 240 272 180 132 72 110 210 195 2691

3600 2940 2028 1728 1210 2535 3375 3600 4352 2160 1452 576 1100 3150 2535 36341

1. 204 = 15𝑎0 + 193𝑎1 + 2553𝑎2 2. 2691 = 193𝑎0 + 2553𝑎1 + 34561𝑎2 3. 36341 = 2553𝑎0 + 34561𝑎1 + 476985𝑎2 Despejo 𝑎0 𝑑𝑒 1 204 − 193𝑎1 − 2553𝑎2 𝑎0 = 15 reemplazo en 2 y 3 204 − 193𝑎1 − 2553𝑎2 ) + 2553𝑎1 + 34561𝑎2 2691 = 193 × ( 15 4. 66.2 = 69.73𝑎1 + 1712.4𝑎2 204 − 193𝑎1 − 2553𝑎2 ) + 3456𝑎1 + 476985𝑎2 36341 = 2553 × ( 15 5. 1620.2 = −29392.6𝑎1 + 42464.4𝑎2 Despejo 𝑎1 𝑑𝑒 4 66.2 − 1712.4𝑎2 𝑎1 = 69.73 Reimundo, Gaona, Zambrano

74

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

reemplazo en 5 1620.2 = −29392.6 × (

66.2 − 1712.4𝑎2 ) + 42464.4𝑎2 69.73

29524.83 = 764275.5𝑎2 𝑎2 = 0.03 reemplazo en 𝑎1 66.2 − 1712.4 × (0.03) 𝑎1 = 69.73 𝑎1 = 0.21 reemplazo en 𝑎0 204 − 193 × 0.21 − 2553 × 0.03 𝑎0 = 15 𝑎0 = 5.79 𝒙

𝒚

15 14 13 12 11 13 15 15 16 12 11 8 10 15 13 193

16 15 12 12 10 15 15 16 17 15 12 9 11 14 15 204

(𝒚 − 𝒂𝟎 − 𝒂𝟏 𝒙𝒊 − 𝒂𝟐 𝒙𝒊 )𝟐 43,67 34,20 9,54 11,08 2,46 37,06 31,45 43,67 54,29 40,04 12,73 1,66 7,88 21,23 37,06 388.02

Luego, el coeficiente de correlación entre las notas de Aritmética y Lenguaje es: 543864 − 388.02 𝑟2 = = 0.99 543864 𝑟 = √0.99 = 0.99

Reimundo, Gaona, Zambrano

75

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

𝒙

Partiendo de las siguientes observaciones de dos variables: (𝒚 𝒊 − 𝒚 𝒚 ̅ )𝟐 𝒙𝟐 𝒙𝟑 𝒙𝟒

23 23 25 25 26 26 29 30 30 32 33 31 333

60 62 61 55 53 60 63 53 52 48 49 53 669

𝒚𝒙𝟐

𝒚𝒙

529 12167 279841 370881 1380 529 12167 279841 368449 1426 625 15625 390625 369664 1525 625 15625 390625 376996 1375 676 17576 456976 379456 1378 676 17576 456976 370881 1560 841 24389 707281 367236 1827 900 27000 810000 379456 1590 900 27000 810000 380689 1560 1024 32768 1048576 385641 1536 1089 35937 1185921 384400 1617 961 29791 923521 379456 1643 9375 267621 7740183 4513205 18417 a) Hallar la función de regresión 𝑦 = 𝑎0 + 𝑎1 𝑥 + 𝑎2 𝑥 2 b) Determine la confiabilidad de las variables a) Solución 1. 669 = 12𝑎0 + 333𝑎1 + 9375𝑎2 2. 18417 = 333𝑎0 + 9375𝑎1 + 267621𝑎2 3. 514355 = 9375𝑎0 + 267621𝑎1 + 7740183𝑎2 Despejo 𝑎0 𝑑𝑒 1 669 − 333𝑎1 − 9375𝑎2 𝑎0 = 12 reemplazo en 2 y 3 669 − 333𝑎1 − 9375𝑎2 ) + 9375𝑎1 + 267621𝑎2 18417 = 333 × ( 12 4. −147.75 = 134.25𝑎1 − 2854.25𝑎2 669 − 333𝑎1 − 9375𝑎2 ) + 267621𝑎1 514355 = 9375 × ( 12 + 7740183𝑎2 5. −8301.25 = 7464.75𝑎1 − 415964.25𝑎2 Despejo 𝑎1 𝑑𝑒 4 −147.75 − 2854.25𝑎2 𝑎1 = 134.25 reemplazo en 5 −147.75 − 2854.25𝑎2 ) − 415964.25𝑎2 −8301.25 = 7464.75 × ( 134.25 −85.85 = −574670.11𝑎2 𝑎2 = 0.0001 reemplazo en 𝑎1

Reimundo, Gaona, Zambrano

76

31740 32798 38125 34375 35828 40560 52983 47700 46800 49152 53361 50933 514355

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

−147.75 − 2854.25 × 0.001 134.25 𝑎1 = 1.1025 reemplazo en 𝑎0 669 − 333 × 1.1025 − 9375 × 0.0001 𝑎0 = 12 𝑎0 = 25.0775 𝑦 = 25.0775 + 1.1025 + 0.0001𝑥 2 b) Solución (𝒚 − 𝒂𝟎 − 𝒂𝟏 𝒙𝒊 − 𝒂𝟐 𝒙𝒊 )𝟐 𝒙 𝒚 𝑎1 =

23 23 25 25 26 26 29 30 30 32 33 31 333

91,45 133,70 69,85 5,56 0,56 39,12 35,37 26,58 37,89 152,79 155,33 39,16 787,35

60 62 61 55 53 60 63 53 52 48 49 53 669

4513205 − 787,35 = 0.999 4513205 𝑟 = √0.999 = 0.999 𝑟2 =

Ajustar a un polinomio de segundo grado los datos dados en las dos primeras columnas de la siguiente tabla. 𝒙 0 1 2 3 4 5 15

𝒚 2.1 7.7 13.6 27.2 40.9 61.1 152.6

𝒙𝟐 0 1 4 9 16 25 55

Reimundo, Gaona, Zambrano

𝒙𝟑

𝒙𝟒

0 1 8 27 64 125 225

0 1 16 81 256 625 979

( 𝒚𝒊 − 𝒚 ̅ )𝟐 544,44 314,47 140,03 3,12 239,22 1272,11 2513,39

𝒚𝒙𝟐

𝒚𝒙 0,00 7,70 27,20 81,60 163,60 305,50 585,6

0,00 7,70 54,40 244,80 654,40 1527,50 2488,8

77

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

1. 152.6 = 6𝑎0 + 15𝑎1 + 55𝑎2 2. 585.6 = 15𝑎0 + 55𝑎1 + 225𝑎2 3. 2488.8 = 55𝑎0 + 225𝑎1 + 979𝑎2 Despejo 𝑎0 𝑑𝑒 1 152.6 − 15𝑎1 − 55𝑎2 𝑎0 = 6 reemplazo en 2 y 3 152.6 − 15𝑎1 − 55𝑎2 ) + 55𝑎1 + 225𝑎2 585.6 = 15 × ( 6 6. 204.1 = 17.5𝑎1 + 87.5𝑎2 152.6 − 15𝑎1 − 55𝑎2 ) + 225𝑎1 + 979𝑎2 2488.8 = 55 × ( 6 7. 1089.97 = 87.5𝑎1 + 414.83𝑎2 Despejo 𝑎1 𝑑𝑒 4 204.1 − 87.52 𝑎1 = 17.5 reemplazo en 5 204.1 − 87.5𝑎2 ) + 414.83𝑎2 1089.97 = 87.5 × ( 17.5 69.47 = 22.67𝑎2 𝑎2 = 1.86 reemplazo en 𝑎1 204.1 − 87.5 × (3.064) 𝑎1 = 17.5 𝑎1 = 2.36 reemplazo en 𝑎0 152.6 − 15 × 2.36 − 55 × (1.86) 𝑎0 = 6 𝑎0 = 2.48 𝑦 = 2.48 + 2.36𝑥 + 1.86𝑥 2 𝒙

𝒚

0 1 2 3 4 5 15

2.1 7.7 13.6 27.2 40.9 61.1 156.6

Reimundo, Gaona, Zambrano

(𝒚 − 𝒂𝟎 − 𝒂𝟏 𝒙𝒊 − 𝒂𝟐 𝒙𝒊 𝟐 ) 0.14 1 1.08 0.80 0,61 0.09 3.74

78

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

2513.39 − 3.74 = 0.998 2513.39 𝑟 = √0.998 = 0.999 𝑟2 =

Regresión lineal múltiple Relaciona 𝑦 → 𝑥1 , 𝑥2 , 𝑥3 , 𝑥4 , 𝑥5 , … , 𝑥𝑛 con varias variables 𝑦 = 𝑎0 + 𝑎1 𝑥1 + 𝑎2 𝑥2 + 𝑎3 𝑥3 + ⋯ + 𝑎𝑛 𝑥𝑛 + 𝐸 𝐸 = 𝑦 − 𝑎0 − 𝑎1 𝑥1 − 𝑎2 𝑥2 − 𝑎3 𝑥3 − ⋯ − 𝑎𝑛 𝑥𝑛 𝑛

𝑛 2

∑ 𝐸𝑖 = ∑(𝑦 − 𝑎0 − 𝑎1 𝑥1 − 𝑎2 𝑥2 − 𝑎3 𝑥3 − ⋯ − 𝑎𝑛 𝑥𝑛 )2 𝑖=1

𝑖=1

Ecuaciones 𝑛

𝑛

𝑛

𝑛

∑ 𝑦𝑖 = 𝑛𝑎0 + 𝑎1 ∑ 𝑥1𝑖 + 𝑎2 ∑ 𝑥2𝑖 + ⋯ + 𝑎𝑛 ∑ 𝑥𝑛𝑖 𝑖=1 𝑛

𝑛

𝑖=1

𝑛

𝑖=1

𝑖=1

𝑛

𝑛

2

∑ 𝑥1𝑖 𝑦𝑖 = 𝑎0 ∑ 𝑥1𝑖 + 𝑎1 ∑ 𝑥1𝑖 + 𝑎2 ∑ 𝑥1𝑖 𝑥2𝑖 + ⋯ + 𝑎𝑛 ∑ 𝑥𝑛𝑖 𝑥1𝑖 𝑖=1 𝑛

𝑖=1 𝑛

𝑖=1 𝑛

𝑖=1

𝑛

𝑖=1 𝑛

∑ 𝑥2𝑖 𝑦𝑖 = 𝑎0 ∑ 𝑥2𝑖 + 𝑎1 ∑ 𝑥1𝑖 𝑥2𝑖 + 𝑎2 ∑ 𝑥2𝑖 2 + ⋯ + 𝑎𝑛 ∑ 𝑥𝑛𝑖 𝑥2𝑖 𝑖=1 𝑛

𝑖=1 𝑛

𝑖=1 𝑛

𝑖=1 𝑛

𝑖=1

𝑛

∑ 𝑥𝑛𝑖 𝑦𝑖 = 𝑎0 ∑ 𝑥𝑛𝑖 + 𝑎1 ∑ 𝑥𝑛𝑖 𝑥1𝑖 + 𝑎2 ∑ 𝑥2𝑖 𝑥𝑛𝑖 + ⋯ + 𝑎𝑛 ∑ 𝑥𝑛𝑖 2 𝑖=1

𝑖=1

𝑖=1

𝑖=1

𝑖=1

Ejercicios: Utilizar la regresión lineal múltiple para ajustar la siguiente tabla de datos 𝒚 𝒙𝟏 𝒙𝟐 5 0 0 10 2 1 9 2.5 2 0 1 3 3 4 6 27 7 2 𝑦 = 𝑎0 + 𝑎1 𝑥1 + 𝑎2 𝑥2 ∙ 54 = 6𝑎0 + 16.5𝑎1 + 14𝑎2 ∙ 243.5 = 16.5𝑎0 + 76.25𝑎1 + 48𝑎2 ∙ 100 = 14𝑎0 + 48𝑎1 + 54𝑎2 ∴ 𝑦 = 5 + 4𝑥1 − 3𝑥2 Reimundo, Gaona, Zambrano

79

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

Supongamos que un promotor inmobiliario podría utilizar un análisis de regresión lineal múltiple, para estima el valor de un edificio de oficinas en un área determinada, basándose en las variables siguientes: 𝑦 = 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑡𝑎𝑠𝑎𝑐𝑖ó𝑛 𝑑𝑒𝑙 𝑒𝑑𝑖𝑓𝑖𝑐𝑖𝑜𝑛 𝑑𝑒 𝑜𝑓𝑖𝑐𝑖𝑛𝑎𝑠 𝑥1 = 𝑠𝑢𝑝𝑒𝑟𝑓𝑖𝑐𝑖𝑒 𝑒𝑛 𝑚𝑒𝑡𝑟𝑜𝑠 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜𝑠 𝑥2 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑜𝑓𝑖𝑐𝑖𝑛𝑎𝑠 𝒚 142.000 144.000 151.000 360.000 139.000 169.000 126.000 142.000 163.000 189.000 149.000 1.874.000

𝒙𝟏 2,31 2,333 2,356 2,273 2,402 2,425 2,448 2,471 2,494 2,517 2,54 27

𝒙𝟐 2 2 3 3 2 4 2 2 3 4 2 29

𝒙𝟏 𝟐 5,336 5,443 5,551 5,167 5,770 5,881 5,993 6,106 6,220 6,335 6,452 64,252

𝒙𝟐 𝟐 4 4 9 9 4 16 4 4 9 16 4 83

𝒙𝟏 𝒙𝟐 4,62 4,67 7,07 6,82 4,80 9,70 4,90 4,94 7,48 10,07 5,08 70

𝒚𝒙𝟏 328.020 335.952 355.756 818.280 333.878 409.825 308.448 350.882 406.522 475.713 378.460 4.501.736

𝒚𝒙𝟐 284.000 288.000 453.000 1.080.000 278.000 676.000 252.000 284.000 489.000 756.000 298.000 5.138.000

1. 1874 = 11𝑎0 + 27𝑎1 + 29𝑎2 2. 4501.736 = 27𝑎0 + 64.25𝑎1 + 70𝑎2 3. 5138 = 29𝑎0 + 70𝑎1 + 83𝑎2 Despejo 𝑎0 𝑑𝑒 1 1874 − 27𝑎1 − 29𝑎2 𝑎0 = 11 reemplazo en 2 y 3 1874 − 27𝑎1 − 29𝑎2 ) + 64.25𝑎1 + 70𝑎2 4501.736 = 27 × ( 11 4. −98.08 = 23.75𝑎1 + 26.5𝑎2 1874 − 27𝑎1 − 29𝑎2 ) + 70𝑎1 + 83𝑎2 5138 = 29 × ( 11 5. 197.45 = 71.181𝑎1 + 6.545𝑎2 Despejo 𝑎1 𝑑𝑒 4 −98.08 − 26.5𝑎2 𝑎1 = 23.75 reemplazo en 5 −98.08 − 26.5𝑎2 ) + 6.545𝑎2 197.45 = 71.181 × ( 23.75 −96.51 = −72.88𝑎2 Reimundo, Gaona, Zambrano

80

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

𝑎2 = 1.33 reemplazo en 𝑎1 −98.08 − 26.5 × (1.33) 𝑎1 = 23.75 𝑎1 = −5.61 reemplazo en 𝑎0 1874 − 27 × (−5.61) − 29 × 1.33 𝑎0 = 11 𝑎0 = 187.64 𝑦 = 187.64 − 5.61𝑥1 + 1.33𝑥2 Supongamos que estamos interesados en explicar los gastos (en miles de pesos) de las computadoras personales de un departamento comercial a partir de su edad (en años) y del número de horas diarias que trabajan (horas/día). Se ha tomado una muestra de cinco computadoras personales y de las cuales se han obtenido los resultados siguientes: 𝒚 24.6 33.0 36.6 39.8 28.6 169

𝒙𝟏 1 3 4 4 2 14

𝒙𝟐 11 13 13 14 12 63

𝒙𝟏 𝟐 1 9 16 16 4 46

𝒙𝟐 𝟐 121 169 169 196 144 799

𝒙 𝟏 𝒙𝟐 11 39 52 56 24 182

𝒚𝒙𝟏 24,6 99 146,4 159,2 57,2 486.4

𝒚𝒙𝟐 270,6 429 475,8 557,2 343,2 2075.8

1. 169 = 5𝑎0 + 14𝑎1 + 63𝑎2 2. 486.4 = 14𝑎0 + 46𝑎1 + 182𝑎2 3. 2075.8 = 63𝑎0 + 182𝑎1 + 799𝑎2 Despejo 𝑎0 𝑑𝑒 1 169 − 14𝑎1 − 63𝑎2 𝑎0 = 5 reemplazo en 2 y 3 169 − 14𝑎1 − 63𝑎2 ) + 46𝑎1 + 182𝑎2 486.4 = 14 × ( 5 4. 13.2 = 6.8𝑎1 + 5.6𝑎2 169 − 14𝑎1 − 63𝑎2 ) + 182𝑎1 + 799𝑎2 2075.8 = 63 × ( 5 5. −53.6 = 5.6𝑎1 + 5.2𝑎2 Despejo 𝑎1 𝑑𝑒 4 13.2 − 5.6𝑎2 𝑎1 = 6.8 Reimundo, Gaona, Zambrano

81

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

reemplazo en 5 13.2 − 5.6𝑎2 ) + 5.6𝑎2 6.8 −64.47 = +0.988𝑎2 𝑎2 =-65.25 reemplazo en 𝑎1 13.2 − 5.6 × (−65.25) 𝑎1 = 6.8 𝑎1 = 55.68 reemplazo en 𝑎0 169 − 14 × 55.68 − 29 × (−65.25) 𝑎0 = 5 𝑎0 = 396.35 −53.6 = 5.6 × (

𝑦 = 396.35 + 55.68𝑥1 − 65.25𝑥2

Aplicaciones de la regresión lineal (función exponencial) 𝑦 = 𝑎𝑒 𝑏𝑥 ln 𝑦 = ln 𝑎 + ln 𝑒 𝑏𝑥 ln 𝑦 = ln 𝑎 + 𝑏𝑥 (𝑥; ln 𝑦) 𝑛

𝑛

∙ ∑ 𝑦𝑖 = 𝑛𝑎0 + 𝑎1 ∑ 𝑥𝑖 𝑖=1

𝑖=1

Ecuaciones 𝑛

𝑛

∙ ∑ ln 𝑦𝑖 = n × ln 𝑎 + 𝑏 ∑ 𝑥𝑖 𝑖=1 𝑛

𝑖=1 𝑛

𝑛

∙ ∑ (ln 𝑦𝑖 ) × 𝑥𝑖 = ln 𝑎 ∑ 𝑥𝑖 + 𝑏 ∑ 𝑥𝑖 2 𝑖=1

𝑖=1

𝑖=1

Ejercicios: Ajustar a una función exponencial la siguiente tabla de datos: 𝒙 𝒚 1 0.5 2 1.7 3 3.4 4 5.7

Reimundo, Gaona, Zambrano

82

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

5

8.4

∙ 4.92 = 5 ln 𝑎 + 15𝑏 ∙ 21.64 = 15 ln 𝑎 + 55𝑏 ∴ ln 𝑎 = −1.07 𝑎 = 0.34 0.69𝑥 𝑦 = 0.34

𝑏 = 0.69

2. Resuelva utilizando regresión lineal la siguiente expresión 𝑦 = 2𝑎𝑒 𝑏𝑥 y los datos : 𝒙

𝒚

𝒙𝟐

𝐥𝐧 𝒚

𝐱𝐥𝐧 𝒚

3 4 5 6 7 25

2,5 3 4,1 0,3 2 11.9

9 16 25 36 49 135

0,916 1,099 1,411 -1,204 0,693 2.915

2,749 4,394 7,055 -7,224 4,852 11.826

1. 2.915 = 2 × ln 𝑎 + 25b 2. 11.826 = 25 × ln 𝑎 + 135b Despejo b 𝑑𝑒 1 2.915 − 2 × ln 𝑎 b= 25 reemplazo en 2 2.915 − 2 × ln 𝑎 11.826 = 25 × ln 𝑎 + 135 × 25 −3.916 ln 𝑎 = = −0.276 14.2 𝑎 = 0.758 reemplazo en b 2.915 − 2 × (−0.276) b= = 0.139 25 𝑦 = 0.758𝑒 0.139𝑥

Aplicaciones de la regresión lineal (función potencia) 𝑦 = 𝑎𝑥 𝑏 Reimundo, Gaona, Zambrano

83

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

log 𝑦 = log 𝑎𝑥 𝑏 log 𝑦 = log 𝑎 + b × log 𝑥 (log 𝑥 ; log 𝑦) 𝑛

𝑛

𝑛

∙ ∑ 𝑥𝑖 𝑦𝑖 = 𝑎0 ∑ 𝑥𝑖 + 𝑎1 ∑ 𝑥𝑖 2 𝑖=1 𝑛

𝑖=1

𝑖=1 𝑛

∙ ∑ log 𝑦𝑖 = n × log 𝑎 + 𝑏 ∑ log 𝑥𝑖 𝑖=1 𝑛

𝑖=1 𝑛

𝑛

∙ ∑ log 𝑦𝑖 log 𝑥𝑖 = log 𝑎 ∑ log 𝑥𝑖 + 𝑏 ∑ (log 𝑥𝑖 )2 𝑖=1

𝑖=1

𝑖=1

Ejercicios: Ajustar a una función exponencial la siguiente tabla de datos: 𝒙 𝒚 1 0.5 2 1.7 3 3.4 4 5.7 5 8.4 ∙ 2.14 = 5 log 𝑎 + 15𝑏 ∙ 1.42 = 2.08 log 𝑎 + 1.17𝑏 ∴ log 𝑎 = −0.3 𝑎 = 0.5 𝑦 = 0.5𝑥 1.74

𝑏 = 0.74

2. Resuelva utilizando regresión lineal la siguiente expresión 𝑦 = 2𝑎𝑥 𝑏 y los datos 𝒙

𝒚

3 4 5 6 7 25

2,50 3,00 4,10 0,30 2,00 11.9

𝐥𝐨𝐠 𝒙 0,477 0,602 0,699 0,778 0,845 3.401

𝐥𝐨𝐠 𝒚 0,398 0,477 0,613 -0,523 0,301 1.266

𝐥𝐨𝐠 𝒙𝟐 0,954 1,204 1,398 1,556 1,690 6.803

𝐥𝐨𝐠 𝒙 𝐥𝐨𝐠 𝒚 0,190 0,287 0,428 -0,407 0,254 0.753

1. 1.266 = 2 × log 𝑎 + 3.401b Reimundo, Gaona, Zambrano

84

UNIVERSIDAD DE LAS FUERZAS ARMAS ESPE ESTADÍSTICA I Estadística I conceptos, definiciones, ejercicios resueltos

2. 0.753 = 3.401 × log 𝑎 + 6.803b Despejo b 𝑑𝑒 1 1.266 − 2 × log 𝑎 b= 3.401 reemplazo en 2 0.753 = 3.401 × log 𝑎 + 6.803 ×

1.266 − 2 × log 𝑎 3.401

−1.779 = 2.967 −0.5996 𝑎 = 926.83 reemplazo en b 2.915 − 2 × (926.83) b= = −74.03 25 𝑦 = 1853.66𝑥 −74.03 log 𝑎 =

Reimundo, Gaona, Zambrano

85

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF