MD Estadistica y Probabilidades (INGENIERIA--UTP)

March 21, 2017 | Author: SebastianD.L.T.Castañeda | Category: N/A
Share Embed Donate


Short Description

Download MD Estadistica y Probabilidades (INGENIERIA--UTP)...

Description

1

ESTADÍSTICA La estadística es una ciencia, con su propio campo de estudio, y también un instrumento (conjunto de técnicas) que utilizan ampliamente otras ciencias. La estadística como ciencia es una rama de la matemática aplicada, cuyo objeto de estudio es el comportamiento de las variables que pueden asociarse a una o más poblaciones. La estadística es una ciencia que estudia la recolección, análisis e interpretación de datos, ya sea para ayudar en la toma de decisiones o para explicar condiciones regulares o irregulares de algún fenómeno o estudio aplicado, de ocurrencia en forma aleatoria o condicional. Sin embargo estadística es más que eso, en otras palabras es el vehículo que permite llevar a cabo el proceso relacionado con la investigación científica. Estadística descriptiva Se dedica a la descripción, visualización y resumen de datos originados a partir de los fenómenos de estudio. Los datos pueden ser resumidos numérica o gráficamente Estadística inferencial Se dedica a la generación de los modelos, inferencias y predicciones asociadas a los fenómenos en cuestión teniendo en cuenta la aleatoriedad de las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca de la población bajo estudio. VARIABLES Una variable es una característica observable que varía entre los diferentes individuos de la población, dicha característica debe ser susceptible de ser medido. La información que disponemos de cada individuo es resumida en variables. Ejemplos:      

Peso corporal Condición económica Tiempo de espera Utilidades de una empresa ………………………………………………………….. …………………………………………………………..

TIPOS DE VARIABLE  Variable cualitativa o categórica. Cuando la variable está asociada a una característica cualitativa o atributo. Es decir, son variables cuyos valores son cualidades. Dependiendo del número de categorías pueden ser dicotómicas o politómicas. Ejemplos:  Condición económica  Marca de auto  …………………………………………

2  ………………………………………… Dicotómica: Es aquella variable que solo puede adoptar dos atributos o características. Ejemplos:  Resultado de un encuentro de vóley  ………………………………………………………. Politómica: Es aquella variable que solo puede adopta más de dos atributos o características. Ejemplos:  Estado civil  ………………………………………………………..  Variable cuantitativa o numérica Cuando la variable está asociada a una característica cuantitativa. Es decir, estas surgen cuando se puede establecer cuánto o qué cantidad posee una determinada característica. Pueden ser discretas o continuas. Ejemplo:    

Peso corporal. Gasto por consumo de energía eléctrica. ……………………………………………………………. …………………………………………………………….

Discreta: En este caso la variable solo adopta valores enteros. Ejemplos:  Número de televisores en casa  …………………………………………………………….  ……………………………………………………………. Continua: En este caso la variable toma cualquier valor real, no necesariamente entero. Ejemplos:  Estaturas  …………………………………………………………...  …………………………………………………………….

MEDICIÓN Es asignar un número o símbolo a objetos o sucesos de acuerdo a reglas predeterminadas. ESCALA DE MEDICIÓN Es el grado de precisión como se expresa la medida de la variable.

3 Nominal Son aquellas que establecen la distinción de los elementos en las categorías sin implicar orden entre ellas. Ejemplo:  Sexo: Mujer – Hombre.  Servicios Hospitalarios: Medicina - Pediatría – Neurología.  ………………………………………………………………………………………….. Ordinal Son aquellas que agrupan a los objetos, individuos, en categorías ordenadas, para establecer relaciones comparativas. Es decir, son susceptibles de ordenación pero no de medición cuantitativa. Ejemplo:  Nivel educativo: Primaria – Secundaria – Técnico - Universitario  Estado de salud: Muy saludable – Saludable - No saludable  ……………………………………………………………………………………………. Intervalar Se tiene una escala intervalar, cuando los valores asignados a las unidades estadísticas no solo permiten ordenarlas sino que además, las diferencias iguales entre estos indican diferencias iguales en las cuantías de las propiedades a medir. El inicio de la escala (0) es arbitraria, convencional. Ejemplo:  Temperatura

Razón Se tiene una escala razón, cuando los valores asignados a las unidades estadísticas no solo permiten que estas puedan ser ordenadas, sino que además, las diferencias iguales entre estos indican diferencias reales en las cuantías de las propiedades a medir. El valor cero representa ausencia de la característica que se mide. Ejemplo:  Edad

4

 Peso POBLACIÓN Es un conjunto de datos que consta de todas las observaciones concebibles (o hipotéticamente) posibles de un fenómeno determinado. MUESTRA Es un subconjunto de individuos extraídos de la población con el fin de inferir mediante su estudio, características de la población.

PARÁMETRO Son todas aquellas medidas que describen numéricamente las características de una población. También se les denomina valor verdadero, ya que una característica poblacional tendrá un solo valor del parámetro. Sin embargo una población puede tener varias características y, por tanto, varios parámetros. ESTADÍGRAFOS Es aquella descripción numérica de una característica correspondiente a los elementos de una muestra. De una población se pueden obtener M números de muestra posibles y en cada una de ellas se puede cuantificar la característica, obteniéndose por lo general, valores diferentes para cada muestra.

5 EJERCICIOS Clasifique las siguientes variables y señale su escala de medición: Variable Número de solicitantes que llega a diario a una agencia de empleos. Software estadístico. Bancos comerciales. Tiempo cronometrado en los 100 metros planos. Velocidad de un automóvil. Empresas según el número de trabajadores. Nivel socioeconómico. Partidos políticos. Producto bruto interno del Perú. Número de asistentes a clase. Países de la Unión Europea. Puntuación de un test de coeficiente intelectual.

Tipo de variable

Escala

6

ORGANIZACIÓN TABULAR DE DATOS Y GRÁFICOS Frente a un conjunto de datos, el primer paso a dar, debe ser expresarlo y clasificarlo de acuerdos a criterios convenientes, de una forma simple que permita ver rápidamente todas las características posibles para obtener conclusiones útiles, ya sea directamente o por medio de cálculos posteriores. Se consideran los siguientes pasos:  Revisión y recolección de los datos.  Construcción de tablas de frecuencias.  Representación tabular o cuadros estadísticos y gráfica. REVISIÓN Y RECOLECCIÓN DE LOS DATOS Ningún análisis estadístico, por acabado y seguro que sea, es capaz de suministrar respuestas adecuadas a un problema de estudio, si aquel se basa en información incorrecta. Por tanto antes de utilizar los datos muestrales conviene aplicar técnicas simples para probarlos, como dar respuesta a las siguientes preguntas:    

¿Los datos apoyan o contradicen la evidencia que se tenía? ¿Es lógica la conclusión? ¿Hemos obtenido conclusiones que no estén sustentadas por los datos? ¿Cuántas observaciones se tiene?

TABLA DE DISTRIBUCIÓN DE FRECUENCIAS Si los datos que se disponen son numerosos, es indispensable clasificarlos en un cuadro o tabla resumen de las observaciones originales, a las que en adelante llamaremos tabla de distribución de frecuencias.

yi

ni

Ni

hi

Hi

hi%

Hi%

Y1

n1

N1

h1

H1

h1%

H1%

y2

n2

N2

h2

H2

h2%

H2%

y3

n3

N3

h3

H3

h3%

H3%

y4

n4

N4

h4

H4

h4%

H4%

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

ym

nm

Nm

hm

Hm

hm%

Hm%

7 Donde: 

yi: representa los valores de la variable o el valor asignado a algún atributo de la variable (caso de variables cualitativas).



ni: frecuencia absoluta del valor yi, representa el número de veces que aparece este valor en el conjunto de observaciones.



Ni: Frecuencia absoluta acumulada, representa el número de observaciones menores o iguales a yi.



hi: frecuencia relativa del valor de yi, es el cociente de la frecuencia absoluta de yi y el número total de observaciones.



Hi: frecuencia relativa acumulada, es la frecuencia relativa total de las observaciones menores o iguales a yi.



hi%: frecuencia relativa porcentual, es decir hi multiplicado por 100%; nos permite observar la frecuencia absoluta en forma porcentual respecto del total.



Hi%: frecuencia relativa acumulada porcentual, es decir Hi multiplicado por 100%.

CUADROS ESTADÍSTICOS Y GRÁFICOS Cuadro estadístico.- Es un arreglo ordenado, de filas y columnas de los datos o series estadísticas, por tanto tienen dos entradas. En ellas pueden representarse características cualitativas, cuantitativas o una combinación de ambas. La finalidad es ofrecer información resumida de fácil lectura, comparación e interpretación.

Gráfico.- Es la representación de un fenómeno estadístico por medio de figuras geométricas cuyas dimensiones son proporcionales a la magnitud de los datos representados. Su objetivo es la representación de los datos de forma gráfica, que permite de un solo golpe de vista darse cuenta del conjunto de elementos presentados y de evidenciar sus variaciones y características.

8

ORGANIZACIÓN Y REPRESENTACIÓN DE DATOS ASOCIADAS A VARIABLES CUALITATIVAS En el caso de las variables cualitativas se pueden dar dos tipos de tratamiento según la complejidad de los datos.  En el caso que sólo se tenga el valor de la característica de la variables Ejemplo: Se tiene información acerca de la composición de cartera de créditos (en millones de soles) del Sistema Financiero Peruano para el año 2010. CONSUMO

25300

CORPORATIVOS

23364

MEDIANAS EMPRESAS

21428

GRANDES EMPRESAS

21170

HIPOTECARIOS

16006

PEQUEÑAS EMPRESAS

13941

MICROEMPRESAS

7874

Si se quiere obtener una información más detallada que la que se muestra en la tabla, podemos representar esos valores en forma porcentual. Primero, obtengamos el total CONSUMO

25300

CORPORATIVOS

23364

MEDIANAS EMPRESAS

21428

GRANDES EMPRESAS

21170

HIPOTECARIOS

16006

PEQUEÑAS EMPRESAS

13941

MICROEMPRESAS

7874

TOTAL

129083

9 Luego, obtenemos el valor del hi, este se obtiene dividiendo cada valor entre el total. Una vez calculado el hi multiplicamos por 100% (hi%), el resultado representará el porcentaje respecto al total.

Ahora la tabla se puede presentar de la siguiente manera

Interpretaciones:   

El 19,6% de los créditos otorgados van a los créditos por consumo. El 16,4% de los créditos otorgados van destinados a las grandes empresas. Solo el 6,1% de los créditos son asignadas a las microempresas.

NOTA: En el ejemplo se está trabajando con valores no con frecuencias.

Para una mejor ilustración de los datos se puede realizar un gráfico. GRÁFICO DE SECTORES O DE PASTEL Para construir el gráfico de sectores se utiliza una circunferencia, cuyo círculo se divide en sectores, tales que sus medidas de los ángulos centrales, y por tanto la superficie del sector circular, sean proporcionales a las magnitudes de los valores de la variable que representan. Al total le corresponde el círculo completo, es decir los 360º de la circunferencia.

10

Composición de la cartera de creditos: 2010 6% 20%

11%

CONSUMO CORPORATIVOS MEDIANAS EMPRESAS

12%

GRANDES EMPRESAS HIPOTECARIOS

18%

PEQUEÑAS EMPRESAS MICROEMPRESAS

16% 17%

Composición de la cartera de créditos: 2010 PEQUEÑAS EMPRESAS 11%

MICROEMPRESAS 6%

CONSUMO 20%

HIPOTECARIOS 12% GRANDES EMPRESAS 16%

CORPORATIVOS 18% MEDIANAS EMPRESAS 17%

11  Si los datos no están contabilizados Ejemplo: Se realizo una encuesta en un conjunto habitacional a 45 vecinos, la cual estaba orientada a saber si estos estaban satisfechos con el servicio de vigilancia y seguridad que brinda una empresa. Se obtuvieron los siguientes datos.

BBRMMRBRBBMRRMB BBBRBMBMRBMRMBB BRBBRMRMBRBBRBB B: buena

R: regular

M: mala

El primer paso es contabilizarlos mediante alguna marca o palotes

Luego anotamos las frecuencias absolutas de cada característica de la variable y los valores de las frecuencias relativas de la misma forma que en el ejemplo anterior.

Interpretaciones:  

Casi la mitad de los vecinos consideran que el servicio que se les brinda es bueno. Un 22% cree que el servicio que se les ofrece es malo.

12 GRÁFICO DE BARRAS Es aquel en el cual el fenómeno que se estudia queda representado por una serie de rectángulos, barras o paralelepípedos, los cuales pueden dibujarse horizontal o verticalmente.

Calidad del servicio de vigilancia 60,0

Porcentaje

50,0 40,0 30,0 20,0 10,0 0,0

Buena

Regular

Mala

Calidad del servicio de vigilancia

Mala

Regular

Buena

10

13

22

CUADROS ESTADISTICOS Se define como el conjunto de datos estadísticos ordenados en filas y columnas, que permiten leer, comparar e interpretar las características de una o más variables. Los datos son el resultado de la ejecución de una investigación estadística o el aprovechamiento de un registro administrativo con fines estadísticos.

13

14 EJERCICIOS 1.- Se tiene información (http://www.sbs.gob.pe)

Sistema

de

Privado

de

Pensiones

obtenida

de

la

SBS

a. Realizar un cuadro estadístico mostrando en valores porcentuales del número de afiliados por AFP para cada una de las cuatro semanas y realice el gráfico de sectores para la semana de 30 julio al 3 de agosto. Del 23 al 27 de julio

Del 30 de julio al 3 de agosto

Del 6 al 10 de agosto

Del 13 al 17 de agosto

Del 23 al 27 de julio

Del 30 de julio al 3 de agosto

Del 6 al 10 de agosto

Del 13 al 17 de agosto

Horizonte Integra Prima Profuturo

Total

Cuadro estadístico

Horizonte Integra Prima Profuturo

15 Gráfico de Sectores

b. Realizar un cuadro estadístico mostrando en valores porcentuales de los trabajadores independientes para cada AFP para cada semana y realice un gráfico de barras para la semana del 13 al 17 de agosto. Trabajadores Independientes

Del 23 al 27 de julio

Del 30 de julio al 3 de agosto

Del 23 al 27 de julio

Del 30 de julio al 3 de agosto

Del 6 al 10 de agosto

Del 13 al 17 de agosto

Horizonte Integra Prima Profuturo

Total Cuadro estadístico

Horizonte Integra Prima Profuturo

Del 6 al 10 de agosto

Del 13 al 17 de agosto

16 Gráfico de Barras

c. Muestre un gráfico (elija uno a su criterio) donde se puede observar el comportamiento de la afiliación al sistema de fondo de pensiones para las cuatro semanas.

17

ORGANIZACIÓN Y REPRESENTACIÓN DE DATOS ASOCIADAS A VARIABLES CUANTITATIVAS En esta parte del curso se trabajará con los datos que se obtengan de las variables cuantitativas, como sabemos estas pueden ser discretas o continuas. De la misma manera como se organizaron los datos de las variables cualitativas, también organizaremos estos datos mediante una tabla de distribución de frecuencias, para luego obtener cuadros estadísticos y las gráficas. ORGANIZACIÓN DE LOS DATOS DE VARIABLES CUANTITATIVA DISCRETAS Recordemos que una variable cuantitativa discreta es aquella que solo toma valores enteros, en función a ello se establecen algunas propiedades con los elementos de la tabla de distribución de frecuencias.

 Propiedad relacionada con la frecuencia absoluta

18  Propiedad relacionada con la frecuencia relativa

 Propiedad relacionada con la frecuencia relativa porcentual.

Ejemplo: A las familias de una comunidad alto andina se le preguntó por el número de hijos, obteniéndose los siguientes resultados 2 0 2 4 4 6 6 4 6 7 4 4 7 4 2 0 4 6 7 7 Construiremos la tabla de distribución de frecuencias para luego realizar algunas interpretaciones. El primer paso es realizar un conteo o registro de valores de la variable que se repiten, es decir obtener las frecuencias absolutas.

19

Una vez hecho registro procedemos a completar la tabla

En la cuarta columna lo completamos con las frecuencias relativas y a partir de ella todas las demás columnas.

Interpretaciones de las frecuencias relativas:     

n1=2; Hay dos familias que no tienen hijos. n2=3; Tres familias que tienen dos hijos. n3=7; Siete familias que tienen cuatro hijos n4=4; Cuatro de estas tienen seis hijos. n5=4; Y cuatro familias con siete hijos.

Interpretaciones de las frecuencias relativas:  N3= 12; significa que el número de familias que tienen a lo más 4 hijos es 12 ó existen 12 familias que a lo más tienen 4 hijos.

20  N4 = 16; significa que el número de familias que tienen a lo más 6 hijos es 16 ó existen 16 familias que a lo mas tienen 6 hijos. Interpretaciones de las frecuencias porcentuales:     

h1% = 10% significa que el 10% de las familias no tienen hijos. h2% = 15% significa que el 15% de las familias tienen 2 hijos. h3% = 35% significa que el 35% de las familias tienen 4 hijos. h4% = 20% significa que el 20% de las familias tienen 6 hijos. h5% = 20% significa que el 20% de las familias tienen 7 hijos.

Interpretaciones de las frecuencias absolutas porcentuales:  H2% = 25% significa que el 25% de las familias tienen a lo más 2 hijos.  H3% = 60% significa que el 60% de las familias tienen a lo más 4 hijos.  H4% = 80% significa que el 80% de las familias tienen a lo más 6 hijos.

DIAGRAMA DE FRECUENCIAS Se usa para representar los diferentes tipos de distribuciones de frecuencias de variables cuantitativas discretas. Representación gráfica de las distribuciones de frecuencias absolutas y relativas. Considerando la tabla de distribución de frecuencias del ejemplo anterior.

Observaciones:  Generalmente los valores de la variable se deben ubicar en el eje horizontal, indicando el nombre de la variable.  Gráficamente los valores están representados por líneas, esto es debido que se está trabajando con variables cuantitativas discretas (valores enteros).

21

Representación gráfica de las distribuciones de frecuencias absolutas acumuladas y relativas acumuladas.

22 EJERCICIOS 1.- La siguiente información muestra la inasistencia a la junta de accionistas de 20 accionistas principales de una empresa de construcción en el último semestre del 2014. 0

1 2 2 1 3 2 1 4 2 4 3 2 0 0 2 2 3 0 3

a. Construye la tabla de frecuencias a partir de estos datos. b. Construye el gráfico que consideres más adecuado con las frecuencias no acumuladas.

2.- El Ministerio de Desarrollo e Inclusión Social encarga a una consultora recabar información de una región selvática del país acerca del número de hijos en 50 familias con el fin de brindar apoyo asistencial por parte del ministerio. Obteniéndose los siguientes datos. 2

4

2

3

1

2

4

2

3

0

2

2

2

3

2

6

2

3

2

2

3

2

3

3

4

3

3

4

5

2

0

3

2

1

2

3

2

2

3

1

4

2

3

2

4

3

3

2

2

1

23

a. b. c. d. e. f.

Construye la tabla de frecuencias a partir de estos datos. ¿Cuántas familias tienen exactamente tres hijos? ¿Qué porcentaje de familias tienen exactamente cuatro hijos? ¿Qué porcentaje de las familias de la muestra tienen más de dos hijos? Construye el gráfico que consideres más adecuado con las frecuencias no acumuladas. Construye el gráfico que consideres más adecuado con las frecuencias acumuladas.

24 3.- En la tabla de frecuencias que se muestra faltan algunos datos. Completarla yi

ni

Ni

0

2

1

5

2

9

3

14

hi

Hi

0.7

4

0.2

5

4.- Para medir la variable “adaptación sensorial” en un trabajo de investigación se utilizó una prueba elaborada ad hoc para esta investigación, donde la puntuación máxima es 10 (máxima adaptación) y la puntuación mínima 0 (mínima adaptación). Dicho trabajo se aplicó a 36 ingenieros participantes de un curso de capacitación de las fuerzas armadas. 9

8

6

5

3

4

7

6

4

5

7

5

2

4

1

7

6

4

5

1

3

7

8

7

4

2

1

7

2

2

5

4

3

2

1

2

Construya la tabla de distribución de frecuencias y realice algunas interpretaciones.

25

ORGANIZACIÓN Y REPRESENTACIÓN DE DATOS ASOCIADAS A VARIABLES CUANTITATIVAS CONTINUAS En este caso debido a que la magnitud de la característica puede tomar, al menos teóricamente, infinitos valores, el proceso de reducción, agrupación o condensación de los datos originales que conducen a la construcción de tablas de frecuencia, no es tan simple como en el caso de los datos discretos; es más bien un problema de clasificación de los datos donde la subjetividad del investigador tiene una influencia que no debe de ignorarse. Mediante un ejemplo se explicará el procedimiento que se debe seguir para la organización de estos datos. Ejemplo: La información que se muestra a continuación es referida 50 observaciones referentes a los pesos de 50 lingotes de acero producidos por una empresa minera. La muestra fue obtenida de la producción semanal, las unidades están dadas en Kg.

El primer paso a seguir consiste en determinar el máximo y mínimo valor, esto nos llevará a obtener la amplitud del recorrido.  Amplitud del recorrido o rango (Ɩ)

Ɩ = Xmax – Xmin Ɩ = 96.4 – 91.6 = 4.8  Número de intervalos (m) Criterios  5 ≤ m ≤ 20 (Elección subjetiva)  m = 1 + 3,3 log n (método de Sturges) n: número de observaciones Para nuestro ejemplo elegimos m = 5, si en caso se hubiese elegido el método de Sturges m=6.6 la cual podríamos aproximar a 6 ó a 7  Amplitud del intervalo (C)

26

Al trabajar con este número se nos puede hacer complicado la construcción de los intervalos, debido a que es un número decimal, por ello es preferible trabajar con un número entero pero este número debe ser más próximo y superior a 0.96, en este caso el valor elegido es c = 1, al hacer este cambio de “c” hace que el rango se modifique. Rango = c x m = 1 x 5 = 5 ≠ 4.8 Para ello modificamos la amplitud del recorrido, como la diferencia es de 0.2 entonces corremos 0.1 a la izquierda y 0.1 a la derecha.

 Los límites de clase vienen a ser los extremos de cada intervalo (o clase) con amplitud c, y para construir los intervalos se comienza con el mínimo valor, que en nuestro ejemplo será con el nuevo mínimo 91.5.

 La marca de clase es un valor que representa al conjunto de valores que pertenecen a un intervalo, este valor se calcula con el propósito de obtener alguna característica de los datos como la media, mediana, varianza, etc. que más adelante se calcularan.

27

Se debe tener en cuenta que los intervalos que se construyan deben ser semi-abiertos, es decir en un extremo abierto y en otro cerrado (o viceversa). Una vez construido los intervalos se procede a hacer el conteo de cuántos de estos datos pertenecen a cada intervalo. De esta manera se obtendrán las frecuencias absolutas.

Ahora completamos la tabla:

HISTOGRAMA DE FRECUENCIAS Se usa para representar gráficamente las distribuciones de frecuencias absolutas o relativas de datos cuantitativos continuos agrupados en clases. Estos están representados mediantes rectángulos cuya base es la amplitud de la clase.

28 Histograma de frecuencias: Peso de cincuenta lingotes de acero

POLÍGONO DE FRECUENCIAS Los polígonos de frecuencias absolutas o relativas, se obtienen uniendo los puntos medios de las bases superiores de los rectángulos en el histograma de frecuencias absolutas o relativas, respectivamente. Polígono de frecuencias: Peso de cincuenta lingotes de acero

POLÍGONO DE FRECUENCIAS ACUMULADAS: OJIVAS. La ojiva es la representación gráfica de una distribución de frecuencias absolutas acumuladas o frecuencias relativas acumuladas “menor que”. En el eje horizontal se ubican los límites de los intervalos de clase.

29

Ojiva: Peso de cincuenta lingotes de acero

30 EJERCICIOS 1.- Los sueldos mensuales (en dólares) de 60 operarios de la empresa TELCOM S.A. fueron los siguientes: 440 560 335 587 613 400 424 466 565 393 453 650 407 376 470 560 321 500 528 526 570 430 618 537 409 600 550 432 591 428 440 340 558 460 560 607 382 667 512 492 450 530 501 471 660 470 364 634 580 450 574 500 462 380 518 480 625 507 645 382

Construya la tabla de frecuencia para estos datos y realice los gráficos respectivos.

31 2.- Dada la siguiente distribución de frecuencias que muestra las utilidades netas (en miles de nuevos soles) de 200 pequeñas empresas del rubro de telecomunicaciones.

Li  Ls 

ni

-

12

Ni

- 270 - 300

30

-

90 126

330 -

50

¿Cuántas empresas tienen utilidades comprendidas entre 260 y 320?

3.- La siguiente tabla muestra las puntuaciones obtenidas mediante una prueba a 36 ingenieros de una empresa minera luego de recibir una capacitación, las puntuaciones van de 0 a 80 puntos. 69 55

68 30

38 24

50 47

57 21

33 23

30 68

38 60

39 70

22 31

20 28

37 46

62 50

35 48

41 37

50 35

43 42

19 17

Organice los datos en una tabla de distribución de frecuencias y realizar el histograma de frecuencias.

32

4.- En el artículo “Determination of representative Subdivision” (J. of Energy Engr, 1993: 43-55) se muestran los datos de varias características de subdivisiones que se podrían usar para decidir si se suministra energía eléctrica por medio de líneas aéreas o subterráneas. A continuación se dan los valores de la variable x = longitud total de calles dentro de una subdivisión: 1280 5320 4390 2100 1240 3060 4770 1050 360 3330 3380 340 1000 960 1320 530 3350 540 3870 1250 2400 960 1120 2120 450 2250 2320 2400 3150 5700 5220 500 1850 2460 5850 2700 2730 1670 100 5770 3150 1890 510 240 396 1419 2109 Organice los datos en una tabla de distribución de frecuencias y realizar el histograma de frecuencias.

33

MEDIDAS DE TENDENCIA CENTRAL Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor representativo, es decir, resumir la información con un solo número. Este número que, para tal fin, suele situarse hacia el centro de la distribución de datos y se denomina medida o parámetro de tendencia central.  MEDIA Se define como la suma de todos los valores observados de la variable dividida entre el número total de observaciones n. También es conocido como media aritmética o promedio. En general

Ejemplo: El curso de estadística tiene 15 alumnos y se han registrado el número de días que llegaron tarde en todo el ciclo.

1 2 0 5 3 5 7 1 2 1 3 4 3 3 2

Interpretación: En todo el ciclo los alumnos llegaron en promedio 2,8 días tarde.  MEDIANA Se define como aquel valor de la variable que supera a no más de la mitad de las observaciones y al mismo tiempo es superado por no más de la mitad de las observaciones. La mediana es el valor central. Ejemplo: El curso de estadística tiene 15 alumnos y se han registrado el número de días que llegaron tarde en todo el ciclo. Primero: Ordenamos los valores de las observaciones de menor a mayor

Interpretación: El valor central del número de tardanzas de los alumnos es de 3 días.

34 En el ejemplo anterior el número de observaciones era 15, un número impar. Pero que sucede si el número de observaciones es un número par, como por ejemplo:

1 2 0 5 3 5 7 1 2 1 3 4 3 3 2 0 En este caso se tiene 16 observaciones. Ordenando los valores de las observaciones de menor a mayor

Interpretación: El valor central del número tardanzas de los alumnos es de 2,5 días.  MODA Es aquel valor de la variable que se presenta con mayor frecuencia; es decir es el valor que más se repite. Ejemplo: El curso de estadística tiene 15 alumnos y se han registrado el número de días que llegaron tarde en todo el ciclo.

1 2 0 5 3 5 7 1 2 1 3 4 3 3 2 Como se puede observar el valor que más se repite es de 3 días, entonces el valor modal (Mo) es 3. En este caso se conoce como unimodal. Presentamos otra situación Ejemplo: El curso de estadística tiene 15 alumnos y se han registrado el número de días que llegaron tarde en todo el ciclo.

1 2 0 5 3 5 7 2 2 1 3 4 3 3 2 En este caso se tiene dos modas: 2 y 3, se conoce como bimodal. En el caso que haya más de dos modas se conocen como multimodal. A continuación se presenta las ventajas y desventajas que cada medida de medida de tendencia central tiene una respecto a otra.

35 MEDIA VENTAJAS

DESVENTAJAS

 Es un concepto familiar a la mayoría  La media puede verse afectada por de las personas e intuitivamente factores extremos que no son claro. representativos del resto de las  Es una medida que puede ser observaciones. calculada y única.  Para su cálculo, es tomada en cuenta Ejemplo: cada una de las observaciones del 1 0 3 2 2 0 2 M(x) = 1,42 conjunto de datos. 1 0 3 2 2 0 24 M(x) = 4,57

MEDIANA VENTAJAS  La mediana es fácil de entender y puede ser calculada a partir de cualquier tipo de datos.  La mediana está afectada por el número de observaciones y no por la magnitud de cualquier valor extremo. Ejemplo: 0 0 1 2 2 2 3 Me(x) = 2 0 0 1 2 2 2 24 Me(x) = 2

DESVENTAJAS  Se debe organizar los datos antes de realizar algún cálculo para obtener la mediana, esto puede consumir mucho tiempo.  Ciertos procedimientos estadísticos que usan a la mediana son mucho más complejos que si se usara la media

MODA VENTAJAS  Se puede usar como una localización tanto para datos de variable cualitativas como cuantitativas.  No está afectada por valores extremos.

DESVENTAJAS  A menudo no hay un valor modal, porque el conjunto de datos no contiene valores que se repiten más de una vez.  Cuando el conjunto de observaciones contiene dos, tres o más modas, éstas son difíciles de interpretar y comparar.

Cálculo de la media para datos agrupados En este caso los datos se encuentran organizados en una tabla de distribución de frecuencias, el método de obtener la media aritmética es diferente. En general

36 Ejemplo: A las familias de una comunidad alto andina se le preguntó por el número de hijos, obteniéndose los siguientes resultados 2 0 2 4 4 6 6 4 6 7 4 4 7 4 2 0 4 6 7 7

Interpretación: El número promedio de hijos de las familias de una comunidad alto andina es 4,3 Ejemplo: La información que se muestra a continuación es referida 50 observaciones referentes a los pesos de 50 lingotes de acero producidos por una empresa minera. La muestra fue obtenida de la producción semanal, las unidades están dadas en Kg.

En este caso multiplicamos la marca de clase con la frecuencia absoluta

37 Interpretación: En promedio el peso de un lingote de acero es de 94,04 Kg. PROPIEDADES Propiedad 1 Si todos los valores observados

son iguales a b (donde b es una constante), entonces

Ejemplo:

Propiedad 2 Si a cada valor de las observaciones aritmética del nuevo conjunto transformado más (o menos) la constante.

se le suma (o resta) una constante, la media , es la media aritmética del conjunto original

Ejemplo:

Propiedad 3 Si a cada valor de las observaciones se le multiplica por una constante diferente de cero, la media aritmética del nuevo conjunto transformado , es la media aritmética del conjunto original multiplicado por la constante. Ejemplo:

38 Propiedad 4 De una población de n observaciones se obtiene dos muestras de tamaño n1 y n2 respectivamente. Sean las medias aritméticas de las muestras, entonces la media asociada a las n observaciones está dada por: Donde n = n1 y n2 Ejemplo:

En general Sean respectivamente.

Donde:

las medias aritméticas de m muestras cada una de tamaño

39 EJERCICIOS 1.- Calcular la media, mediana y moda para los siguientes datos: 11 8 6 7 7

5 9 11 10 3

2.- Determinar la media de la siguiente tabla de frecuencia:

4 8 3 2 8

40 3.- Calcule la media a partir del siguiente histograma:

4.- El precio medio de un centenar de artículos escolares es de S/. 8 570, los artículos se dividen en dos grupos, con medias S/. 7 580 y S/. 9 780 ¿Cuántos artículos hay en cada grupo?

41 5.- Un grupo de 100 atletas viaja en dos aviones. El primero lleva 40 atletas y el segundo los restantes. Se sabe que el peso promedio de los 100 atletas es de 186,3 libras y los del segundo grupo es de 10 libras menos que el de los atletas del primer avión. ¿Cuál es el peso medio de los atletas en cada avión?

6.- Las notas del examen parcial del curso de estadística de 20 alumnos son: 11 13 09 13 15 13 14 10 12 16 11 08 10 11 14 12 16 17 09 10 Siendo el promedio de 12,2. Debido a los trabajados presentados por los alumnos el profesor decide aumentarle 3 puntos a cada alumno. ¿Cuál será el nuevo promedio?

42

CUANTILES Como una consecuencia del estudio de la mediana, es fácil ampliar este concepto a otros estadígrafos que dividen a los datos en otras proporciones y no solo en el valor central como lo hace la mediana. CUARTILES Los cuartiles son valores que divide a un conjunto de datos ordenados en forma ascendente o descendente en cuatro partes iguales.

PRIMER CUARTIL: Q1 Es el valor que deja 25% de las observaciones menores o iguales a él y el 75% superiores a él. Ejemplo: Al examinar los registros de facturación mensual de una empresa que vende al crédito, el auditor toma una muestra de 11 de las facturas no pagadas. Las sumas (en miles de nuevos soles) que se adeudan a la empresa son: 4 18 11 7 7 10 21 5 33 9 12 Primero se ordenan los datos en forma ascendente

En este caso se tiene 11 observaciones (n=11) luego realizamos el siguiente cálculo para obtener la posición de primer cuartil.

es un número entero, entonces

43

Interpretación: La deuda que es superada por el 75% de todas las deudas es de 7 mil soles, que corresponde al primer cuartil. TERCER CUARTIL: Q3 Es el valor que deja 75% de las observaciones menores o iguales a él y el 25% superiores a él. En este caso se tiene 11 observaciones (n=11) luego realizamos el siguiente cálculo para obtener la posición de tercer cuartil. es un número entero, entonces

Interpretación: La deuda que supera al 75% de todas las deudas es de 18 mil soles, que corresponde al tercer cuartil. Nota:  El cuartil Q2 coincide con la mediana la cual ya conocemos el método para obtenerlo.  En el ejemplo anterior, para el cálculo de Q1 y Q3

se obtuvieron valores enteros, pero eso no siempre va ocurrir. Ejemplo: Los siguientes datos representan el número de asistencias al policlínico hechas por 12 jubilados en un año de una comunidad asistencial para personas de la tercera edad. 9 10 12 3 5 7 15 10 9 11 13 11 Primero se ordenan los datos en forma ascendente

En este caso se tiene 12 observaciones (n=12) luego realizamos el siguiente cálculo para obtener la posición de primer cuartil.

44 No es un número entero, entonces Q1 = 7 + (9-7)(0.25) = 7 + 0.5= 7.5 asistencias

Interpretación: El número de asistencias que es superado por el 75% de todas las asistencias es de 7.5 asistencias, que corresponde al primer cuartil. En este caso se tiene 12 observaciones (n=12) luego realizamos el siguiente cálculo para obtener la posición de tercer cuartil.

No es un número entero, entonces Q3 = 11 + (12-11)(0.75) = 11 + 0.75= 11.75 asistencias

Interpretación: El número de asistencias que supera al 75% de todas las asistencias es de 11.75 asistencias, que corresponde al tercer cuartil. Nota:  DECILES: Son valores que dividen a un conjunto de datos ordenados en forma ascendente (o descendente) en diez partes iguales.  PERCENTILES: Son valores que dividen a un conjunto de datos ordenados en forma ascendente (o descendente) en cien partes iguales.

MEDIDAS DE DISPERSIÓN Son cantidades que miden el grado en que los datos numéricos tienden a extenderse alrededor de un valor medio. La importancia que tienen es porque proporcionan más información que permite juzgar la confiabilidad de las medidas de tendencia central. Si los datos están muy dispersos, las medidas de tendencia central son menos representativas de los datos que cuando están más agrupadas alrededor de la media. Utilidad Para medir el grado de variación de los datos del conjunto; así por ejemplo, si existe poca dispersión en la productividad de los obreros de una compañía, esto quiere decir, que los obreros tienen un rendimiento muy homogéneo, es decir, que existe poca variabilidad en el rendimiento; pero si la dispersión es alta, esto quiere decir, que el rendimiento es heterogéneo o que existe gran variabilidad en el rendimiento.

45 Para complementar un promedio; es decir, entre más baja sea la dispersión de un conjunto de datos, más altamente representativo será el promedio de ese conjunto. Si se tiene el conjunto 10, 12, 68, 9, 40, 97, 33, 14, 15 y 8, la media aritmética de este será 30.6, que no es un promedio representativo, pues como vemos los datos son muy variables. En éste caso, el cálculo de la dispersión nos daría alto, significando con ello, que existe alta variabilidad entre los datos. Para comparar dos o más conjuntos referentes a un mismo fenómeno. Si por ejemplo, tanto el ingreso promedio mensual de un barrio A como el de un barrio B de una cierta ciudad es $370.000, pero se sabe además que existe más variabilidad de los ingresos en el barrio A que en el barrio B, entonces podemos afirmar que el promedio de los ingresos en el barrio A es menos representativo que en el barrio B., es decir que existe peor distribución del ingreso en el barrio A que en el B.

 Rango o recorrido de la variable (R) R = Xmax - Xmin  Recorrido intercuartílico (RI) RI = Q3 – Q1  Desviación del cuartil (QD)

Ejemplo: Al examinar los registros de facturación mensual de una empresa que vende al crédito, el auditor toma una muestra de 11 de las facturas no pagadas. Las sumas que se adeudan a la empresa son: 4 18 11 7 7 10 21 5 33 9 12

46  Desviación Media Es la media aritmética de los valores absolutos de las desviaciones de los valores observados respecto a la media aritmética de éstas.

Ejemplo: Al examinar los registros de facturación mensual de una empresa que vende al crédito, el auditor toma una muestra de 11 de las facturas no pagadas. Las sumas que se adeudan a la empresa son: 4 18 11 7 7 10 21 5 33 9 12 En este caso los datos están sin tabular, primero debemos calcular la media

DM = 6.04  Varianza Se define como la media aritmética del cuadrado de las desviaciones de las observaciones con respecto a su media.

Ejemplo: Al examinar los registros de facturación mensual de una empresa que vende al crédito, el auditor toma una muestra de 11 de las facturas no pagadas. Las sumas que se adeudan a la empresa son: 4 18 11 7 7 10 21 5 33 9 12

Nota: el valor de la varianza no es interpretable, porque su valor están dadas en unidades al cuadrado.

47 Ejemplo: A las familias de una comunidad alto andina se le pregunto por el número de hijos, obteniéndose los siguientes resultados 2 0 2 4 4 6 6 4 6 7 4 4 7 4 2 0 4 6 7 7 Se tiene la tabla de distribución de frecuencias, ya realizada anteriormente, de la cual sólo nos interesa las dos primeras columnas

No olvidemos que la media es 4.3

La varianza para éste conjunto de datos es:

 Desviación estándar Se define como la raíz cuadrada de la varianza.

Para el ejemplo anterior, la desviación estándar es:  Coeficiente de Variación Las medidas de dispersión que vimos anteriormente son “absolutas” y son útiles para describir la dispersión de un solo conjunto de datos, pero si se quiere comparar más de dos conjuntos de datos tendremos que usar una medida de dispersión relativa, como el coeficiente de variación; la cual está definida como el cociente entre la desviación estándar y la media.

48

Ejemplo: Se tomaron dos exámenes a estudiantes del primer ciclo en los cursos de matemática y economía, las notas están sobre 100 puntos. En el curso de matemática la media fue de 72 puntos y una desviación estándar de 9 puntos; en el curso de economía se obtuvo una media de 80 puntos y desviación estándar 6 ¿En cuál de los cursos hay mayor dispersión?

Como se puede observar, la mayor dispersión se dio en el curso de matemática. PROPIEDADES Propiedad 1 Si todos los valores observados

son iguales a b (donde b es una constante), entonces

Ejemplo:

Propiedad 2 Si a cada valor de las observaciones nuevo conjunto transformado Ejemplo:

se le suma (o resta) una constante, la varianza del , es la misma del conjunto original, o sea

49 Propiedad 3 Si a cada valor de las observaciones se le multiplica por una constante diferente de cero, la varianza del nuevo conjunto transformado , es la varianza del conjunto original multiplicado por la constante elevada al cuadrado, es decir Ejemplo:

50 EJERCICIOS 1.- De los siguientes datos calcule los cuartiles y el coeficiente de variación. 4 8 3

11 8 6

5 9 11

2 10 7

7 8 3

2.- Establezca, con base estadística, en cuál de las siguientes empresas el salario (en cientos de nuevos soles) está repartido de forma menos dispersa.

51

3.- Sean X e Y tales que a>0, determinar los valores de estas dos constantes a y b.

Sabiendo que yi = axi + b

y que

52 4.- Se cuenta con datos del peso y la estatura de un grupo de 20 niños entre 8 y 10 años, y se desea saber cuál de las dos variables tiene mayor variabilidad.

5.- Los salarios de los obreros en una empresa presentaban en el año 2013 una media de $412 y desviación estándar de $62 y para el año 2014 la empresa decretó para cada obrero un aumento de $41, entonces ¿Podríamos decir que la empresa propone una distribución más equitativa de los salarios de sus trabajadores para este año? Sustente su respuesta.

53

MEDIDAS DE FORMA COEFICIENTE DE ASIMETRÍA Nos indica la asimetría de una que presenta un conjunto de datos (o distribución). Este coeficiente caracteriza el grado de asimetría de una distribución con respecto a su media.

Para calcular el coeficiente de asimetría se usa la siguiente fórmula:

En función al valor que tome esta se presentarán las siguientes situaciones: •

CAs < 0: Distribución asimétrica hacia la izquierda (asimetría negativa)



CAs = 0: Distribución simétrica.



CAs > 0: Distribución asimétrica hacia la derecha (asimetría positiva)

Por ejemplo: El caso de las notas de un examen final.

MEDIDA DE APUNTAMIENTO O CURTOSIS Se entiende por curtosis, la medida de deformación vertical de una distribución de frecuencias, es decir la medida de apuntamiento o achatamiento de una distribución. La fórmula a usar es la siguiente:

54

A manera de aplicación de las medidas de forma tomaremos un ejemplo ya trabajado anteriormente. Ejemplo: A las familias de una comunidad alto andina se le pregunto por el número de hijos, obteniéndose los siguientes resultados 2 0 2 4 4 6 6 4 6 7 4 4 7 4 2 0 4 6 7 7 Donde:

= 4,3

S = 2,71

n = 20

55

TÉCNICAS DE CONTEO Las técnicas de conteo son usadas para enumerar eventos difíciles de cuantificar. Comprende un conjunto de procedimientos que permite determinar el número de resultados de un evento o experimento aleatorio sin necesidad de utilizar una enumeración e identificación directa de todos los posibles resultados de dicho evento o experimento.  PRINCIPIO DE ADICIÓN Si una acción puede realizarse de n1 maneras diferentes y una segunda acción puede realizarse de n2 maneras diferentes, pero no es posible realizar ambas acciones conjuntamente, entonces n1 o n2 pueden realizarse alternativamente de n1 + n2 maneras diferentes. Ejemplo: Claudio va a comprar el repuesto de su automóvil que se venden en 3 tiendas de La Victoria y 5 tiendas del Rímac. ¿De cuántas maneras diferentes puede adquirir el repuesto?

Por lo tanto Claudio podrá adquirir dicho repuesto de 8 maneras diferentes Este principio aditivo se generaliza para cualquier número de acciones alternativas a realizar, esto es, si una primera acción se puede realizar de n1 maneras diferentes, una segunda acción se puede realizar de n2 maneras diferentes,..., y una r-ésima acción se puede realizar de nr maneras diferentes, entonces las r acciones alternativas se pueden realizar de n1 + n2 +...+ nr maneras diferentes. Ejemplo: Para viajar de Lima al Cusco se puede optar por avión, autobús o tren; existen tres rutas para el avión, cuatro para el autobús y dos para el tren. ¿Cuántas rutas hay para viajar?

 PRINCIPIO DE MULTIPLICACIÓN El principio multiplicativo es aplicable cuando el experimento se puede descomponer en un conjunto de acciones secuenciales o independientes, de modo que cada resultado del experimento se conforma con una posibilidad de cada una de esas acciones. Si una acción puede realizarse de n1 maneras diferentes y una segunda acción puede realizarse de n2 maneras diferentes, entonces ambas acciones pueden realizarse secuencialmente de n1 x n2 maneras diferentes.

56 Ejemplo: Si Lorena tiene 2 blusas y 3 faldas diferentes, ¿De cuántas maneras se puede vestir de manera adecuada?

Este principio multiplicativo se generaliza para cualquier número de acciones a realizar, esto es, si una primera acción se puede realizar de n1 maneras diferentes, una segunda acción se puede realizar de n2 maneras diferentes,..., y una r-ésima acción se puede realizar de nr maneras diferentes, entonces las r acciones se pueden realizar de n1 x n2 x...x nr maneras diferentes. Ejemplos: 

¿De cuántas maneras pueden repartirse 3 premios a un conjunto de 10 personas, suponiendo que cada persona no puede obtener más de un premio?

Aplicando el principio de multiplicación, tenemos 10 personas que pueden recibir el primer premio. Una vez que éste ha sido entregado, restan 9 personas para recibir el segundo, y posteriormente quedarán 8 personas para el tercer premio. De ahí que el número de maneras distintas de repartir los tres premios.



¿Cuántas placas de automóvil se pueden hacer utilizando dos letras seguidas de tres cifras? No se admiten repeticiones. 26 x 25 x 10 x 9 x 8 = 468 000

Se tendrían 468 000 placas de automóvil. DIAGRAMA DE ARBOL Un diagrama de árbol es una herramienta gráfica que permite enumerar todas las posibles maneras de realizar un conjunto de acciones secuenciales o independientes. El árbol se construye a partir de un nodo, que representa la primera acción a efectuar; de éste se desprenden tantas ramas como maneras diferentes se pueda realizar esa acción; en las terminales de cada rama se dibujan otros nodos, que representan la segunda acción a efectuar y de los que se desprenden tantas ramas como maneras lógicas diferentes pueda realizarse esa segunda acción, considerando la manera en que se realiza la primera. Y así, sucesivamente.

57

Ejemplo: Se tienen en un estante de 3 libros; uno de Álgebra, uno de Contabilidad y otro de Biología. ¿De cuántas formas distintas se pueden ordenar los libros?

Ω = {ACB, ABC, BAC, BCA, CAB, CBA} Ejemplo: Considere el experimento consistente en lanzar una moneda tres veces consecutivas y observar, cada vez, la cara que queda hacia arriba.

58 Ejemplo: Un hombre tiene tiempo para jugar ruleta cinco veces a lo sumo. En cada juego gana o pierde un dólar. El hombre empieza con un dólar y dejará de jugar si antes de la quinta vez pierde todo su dinero o si gana tres dólares, esto es, si tiene cuatro dólares. Realizar un diagrama de árbol para dicho experimento aleatorio.

PERMUTACIÓN Las permutaciones son los diferentes arreglos u ordenamientos que se pueden realizar con una parte o con todos los elementos de un conjunto. 

Permutación lineal.- Son los diferentes arreglos que se hacen en una línea referencial.

Ejemplo: ¿De cuántas maneras diferentes se ordenan A, B, C y D tomados de dos en dos? Se tienen cuatro elementos: A, B, C y D

Entonces tenemos 12 maneras diferentes de ordenar A, B, C y D Otra manera

Además se puede expresar

59 En general

Factorial de un número.- Es el producto de todos los números enteros positivos y consecutivos des de la unidad hasta n. Se denota n! n! = 1 x 2 x 3 x 4 x…x (n-1) x n Ejemplos:  4! = 1 x 2 x 3 x 4  7! = 1 x 2 x 3 x 4 x 5 x 6 x 7 Nota: Por convención se asume que 0! = 1 

Permutación Circular.- Es un arreglo u ordenamiento de elementos alrededor de un objeto o punto de referencia.

Ejemplo: ¿De cuántas maneras diferentes se pueden sentar 4 personas alrededor de una mesa circular? Sean A, B, C y D las personas que se van a ubicar alrededor de la mesa.

Se tiene 6 maneras. En general



Permutación lineal con elementos repetidos.- Es un ordenamiento lineal cuyos elementos no todos son distintos entre sí, es decir, hay elementos que se repiten.

Ejemplo: ¿De cuántas maneras diferentes se pueden ordenar en una fila dos fichas iguales de color negro y dos fichas iguales de color blanco?

60 Sean las fichas N, N, B y B

Se observa que hay seis maneras diferentes de ordenar. Otra manera

En general

Ejemplo: ¿Cuántas palabras diferentes se pueden formar con las letras de la palabra CASACA?

Se pueden formar 60 palabras diferentes con la palabra CASACA COMBINACIÓN Viene a ser los diferentes grupos que se pueden formar con una parte o todos los elementos de un conjunto determinado sin considerar el orden de los agrupamientos. Ejemplo: ¿De cuantas maneras diferentes se pueden agrupar A, B, C y D al tomar de 2 en 2? Tenemos cuatro elementos, la cual se agrupa de 2 en 2.

Se observa que hay 6 maneras diferentes de agrupar de 2 en 2. Otra manera

61 Es una combinación de 4 elementos que se toman de 2 en 2 y se obtiene:

En general

Ejemplo: Un grupo de 7 estudiantes se desea conformar dos comisiones. La primera comisión debe estar integrada por 4 estudiantes y la segunda comisión por 3 estudiantes. ¿De cuántas maneras diferentes se puede elegir a los alumnos que deben conformar la primera comisión? El grupo tiene 7 estudiantes, entonces n = 7 La primera comisión está conformada por 4 estudiantes, entonces k = 4.

62 EJERCICIOS 1.- Un artículo de computo se vende en tres galerías; en el primero se tienen disponibles 4 tiendas, en el segundo 7 y en el tercero 6 tiendas. ¿De cuántas maneras se puede elegir una tienda para comprar dicho artículo?

2.- ¿De cuantas maneras pueden ubicarse 8 personas en una banca de capacidad para 5 personas?

3.- Un entrenador de fútbol tiene 16 jugadores a su cargo, de los cuales uno está lesionado y no puede jugar. ¿De cuántas maneras podrá formar su equipo, si cualquiera de los jugadores puede desempeñarse en cualquier puesto?

4.- En el hipódromo de Monterrico se va alargar una carrera donde competirán 6 caballos. ¿De cuántas maneras podrán ocupar los primeros 3 puestos? De esta manera se puedan repartir los premios.

63 5.- ¿De cuántas maneras distribuiríamos 3 monedas de S/.5 y 4 monedas de S/. 2 en una misma línea?

6.- En el comedor de la ciudad universitaria se ofrece un menú que consiste en una sopa, un segundo, un postre y una bebida. ¿Cuántos almuerzos son posibles, si podemos elegir 4 tipos de sopas, 3 tipos de segundo, 5 postres y 4 bebidas?

7.- Se debe formar una comisión de tres ingenieros: uno de sistemas, uno de electrónica y otro de industrial ¿Cuántas posibilidades de formar dicha comisión hay? Si se cuentan con tres de sistemas, cuatro de electrónica y seis industriales.

64

PROBABILIDADES El concepto de probabilidad es manejado por mucha gente. Frecuentemente se escuchan preguntas como las que se mencionan a continuación:    

¿Cuál es la probabilidad de que me saque la lotería? ¿Qué posibilidad hay de que me pase un accidente automovilístico? ¿Qué posibilidad hay de que hoy llueva? para llevar mi paraguas o no. ¿Existe alguna probabilidad de que repruebe el examen final?

Estas preguntas en el lenguaje coloquial esperan como respuesta una medida de confianza representativa o práctica de que ocurra un evento futuro, o bien una forma sencilla de interpretar la probabilidad. En este tema lo que se quiere es entender con claridad su contexto, como se mide y como se utiliza al hacer inferencias. El conocimiento de la probabilidad es de suma importancia en todo estudio estadístico. El cálculo de probabilidades proporciona las reglas para el estudio de los experimentos aleatorios o de azar, que constituyen la base para la estadística inferencial. 

Experimento determinístico

Un experimento determinístico es aquel cuyos resultados del experimento están completamente determinado y puede describirse mediante una fórmula matemática llamada también modelo determinístico. Ejemplos:  Lanzar una pelota en un tanque de agua y ver si flota o se hunde.  Soltar una piedra en el aire. 

Experimento no determinístico

Un experimento no determinístico se da cuando los resultados de los experimentos no pueden predecirse con exactitud antes de realizar el experimento. Ejemplos:  Lanzar una moneda y observar la cara superior (cara o sello)  Lanzar un dado y observar el número que aparece en la cara superior. EXPERIMENTO ALEATORIO En la vida podemos encontrar situaciones que no se pueden predecir, como cuando se realiza un partido de fútbol, se lanza una moneda, etc. En todos estos casos no sabemos qué resultado se tendrá y por eso a estas situaciones se les llama experimentos aleatorios. Un experimento aleatorio, tiene dos propiedades en común:  

Uno de estas es que cada experimento tiene varios resultados posibles que pueden especificarse de antemano. La segunda propiedad es que estamos inciertos acerca del resultado de cada experimento.

65 Ejemplos:  Conocer el número de alumnos que faltaran a clases, la próxima semana.  Preguntar a un profesor de secundaria la especialidad que tiene (Matemática, Química, Biología, etc.)  Verificar la legalidad de un billete de $100 (legal o falso). ESPACIO MUESTRAL El espacio muestral asociado a un experimento aleatorio, es el conjunto de todos los resultados posibles de dicho experimento aleatorio.  Lanzar una moneda y observar la cara superior (cara o sello) Ω1 = {C, S}  Lanzar un dado y observar el número que aparece en la cara superior. Ω2 = {1, 2, 3, 4, 5, 6}  Tiempo de espera hasta ser atendido en el banco. Ω3 = { t / 0 ≤ t} EVENTOS Un evento es un subconjunto del espacio muestral de un experimento aleatorio y lo denotaremos por A, B, C, D, etc. SUCESO Un suceso es todo elemento del espacio muestral y lo designaremos por w, x, y, etc. Ejemplos:  Consideremos el experimento aleatorio de lanzar un dado Ω = {1, 2, 3, 4, 5, 6} Un evento podría ser:

A: “ocurre un número par” A = {2, 4, 6}

 Observar el tiempo de vida del foco de una lámpara. Ω = { t / 0 ≤ t} Un evento podría ser:

B: “el foco dura más de 200 horas” B = {t / t > 200}

Evento imposible Evento que no ocurre nunca en un experimento aleatorio. Algunos eventos nunca pueden ocurrir en el experimento aleatorio, y por eso se llama imposible. Se simboliza con Ø.

66 Ejemplo: Sea el evento

A: Lanzar dos dados y que la suma del resultado sea 14. A=Ø

Evento seguro Evento que “siempre ocurre” en un experimento aleatorio. Ejemplo: Sea el evento

B: Sacar una bola roja, de una urna que contiene 6 bolas rojas B = Sacar una bola roja es un evento seguro, pues todas son rojas.

OPERACIÓN CON EVENTOS Unión de eventos Dado dos eventos A y B, se llama unión de eventos “A U B” al evento formado por los sucesos que pertenecen a A o a B ó a ambos. A U B = {w ϵ Ω / w ϵ A v w ϵ B} Ejemplo: Se realiza el experimento de lanzar un dado y se dan los siguientes eventos: Evento B

B: los resultados son mayores o iguales a tres

Evento D

D: “los resultados son números impares”

Entonces:

Intersección de eventos Dado dos eventos A y B, se llama intersección de A con B “A ∩ B” al evento formado por todos los sucesos favorables a A y a B. Es decir ambos eventos ocurren. AB = A ∩ B = {w ϵ Ω / w ϵ A ᴧ w ϵ B} Evento B

B: Los resultados son mayores o iguales a tres

67

Evento D

D: Los resultados son números impares

Entonces:

Eventos mutuamente excluyentes Dos eventos A y B definidos en el mismo espacio muestral, se dice que son mutuamente excluyentes si no pueden ocurrir juntos. Es decir la ocurrencia de uno excluye la ocurrencia del otro. A∩B=φ Ejemplo: Evento C

C: Los resultados son números pares.

Evento D

D: Los resultados son números impares

Los eventos C y D son mutuamente excluyentes C∩D=φ Complemento de un evento Si A es un evento del espacio muestral Ω, se llama complemento de A, al evento formado por todos los sucesos que no pertenecen a A. Es decir, no ocurre A. A’= Ᾱ = {w ϵ Ω / w ɇ A} Ejemplo: Evento A

A: Los resultados son mayores o iguales a tres

PROPIEDADES DE LAS OPERACIONES CON EVENTOS

68

DEFINICIÓN DE PROBABILIDAD  ENFOQUE CLÁSICO DE PROBABILIDAD La probabilidad de un evento es la razón entre el número de casos (sucesos) favorables y el número total de casos (sucesos) posibles, siempre que nada obligue a creer que algunos de estos sucesos debe tener preferencia a los demás, lo que hace que sean igualmente posibles. La probabilidad de un evento A: P(A), es un número, que mide el grado de certeza en el que un evento A ocurre, y se obtiene con la fórmula conocida como regla de Laplace.

Ejemplo: En una urna se tienen tres bolas blancas y siete bolas rojas. ¿Cuál es la probabilidad de que cuando se extraiga una bola este sea de color rojo?

 ENFOQUE DE FRECUENCIA RELATIVA Si un experimento bien definido se repite n veces (n grande) y sea nA el número de veces que el evento A ocurre en los n ensayos (nA < n), entonces la frecuencia relativa de veces que ocurre el evento A “nA/n”, es la estimación de la probabilidad que ocurra el evento A, o sea:

69

Observación: La frecuencia relativa de un evento, está comprendido entre 0 y 1, por lo tanto 0 ≤ P(A) ≤ 1  ENFOQUE SUBJETIVO DE PROBABILIDAD Este enfoque nos dice que la probabilidad de ocurrencia de un evento es el grado de creencia por parte de un individuo de que un evento ocurra, basado en toda la evidencia a su disposición. Bajo esta premisa se puede decir que este enfoque es adecuado cuando solo hay una oportunidad de ocurrencia del evento. Es decir, que el evento ocurrirá o no ocurrirá esa sola vez. El valor de probabilidad bajo este enfoque es un juicio personal. Ejemplo:  La probabilidad que apruebe el curso es de 0,86  La probabilidad que mi equipo de futbol gane el campeonato es de 60% AXIOMAS DE PROBABILIDADES Independientemente de la forma como definimos la probabilidad, esta cumple los siguientes axiomas. Axioma 1

0 ≤ P(A) ≤ 1, para cada evento A en Ω

Axioma 2

P(Ω) = 1

Axioma 3 Para cualquier número finito de K eventos mutuamente excluyentes

Si A y B son dos eventos mutuamente excluyentes en Ω, entonces P[A U B] = P[A] + P[B]

TEOREMA DE PROBABILIDADES Teorema 1

Si φ es el evento imposible, entonces P(φ) = 0

Teorema 2

Para cada evento A, se cumple que

70 P[Ᾱ] = 1 – P[A] Teorema 3

o

P[A] = 1 - P[Ᾱ]

Si A y B son eventos tales que P[A] ≤ P[B]

Teorema 4

Si A y B son dos eventos cualesquiera en Ω, entonces P[A U B] = P[A] + P[B] - P[A ∩ B]

Teorema 5

Si A, B y C son tres eventos cualesquiera en Ω, entonces P[A U B U C] = P[A] + P[B] + P[C] - P[A ∩ B] - P[A ∩ C] - P[B ∩ C] + P[A ∩ B ∩ C ]

Ejemplo: De acuerdo con la tabla ¿cuál es la probabilidad de que una familia escogida al azar tenga un ingreso familiar a) Entre $20 000 y $40 000, b) menor que $40 000, c) en cada uno de los extremos, o sea menor que $20 000 o cuanto menos de $100 000?

De la tabla, podemos decir que los eventos (categorías) son mutuamente excluyentes.

Ejemplo: De 300 estudiantes de la facultad de ingeniería, 100 se encuentran inscritos en matemática y 80 están inscritos en estadística aplicada. Estas cifras incluyen a 30 estudiantes que están inscritos en ambos cursos. ¿Cuál es la probabilidad de que un estudiante elegido de manera aleatoria esté inscrito en matemática (A) o en estadística aplicada (B)? Por lo descrito, podemos concluir que los eventos no son mutuamente excluyentes. Lo pedido se puede expresar como P(A U B). P(A U B) = P(A) + P(B) – P(A ∩ B)

71 EJERCICIOS 1.- Se extraen dos bolas de una urna que se compone de una bola azul, una roja, una verde y otra negra. Escribir el espacio muestral cuando: a. La primera bola extraída se devuelve a la urna antes de sacar la segunda (con reposición). b. La primera bola extraída NO se devuelve a la urna antes de sacar la segunda (sin reposición).

2.- En una urna que tiene 10 bolas enumeradas del 0 al 9, se extrae una bola al azar. a. ¿Cuál es el espacio muestral? b. Describe los eventos: A: "Mayor que 6" B: "No obtener 6" C: "Menor que 6" escribiendo todos sus elementos. c. Hallar la probabilidad de los eventos: AUB, A∩B y B'∩A'.

3.- Se lanzan dos dados y se suman los puntos obtenidos. Calcular la probabilidad de que la suma sea: a. par b. múltiplo de 3 c. múltiplo de 5 d. mayor que 6

72

4.- Dos amigos juegan con dos dados. Uno apuesta a obtener suma igual a 6 y el otro apuesta a obtener suma igual a 7. ¿Te parece el juego justo?

5.- Dos personas eligen al azar, cada una de ellas, un número del 1 al 5. ¿Cuál es la probabilidad de que las dos elijan el mismo número?

6.- Sean A y B los eventos tales que: P[A] = 0,4 Calcula P[A U B] y P[B]

P[A' ∩ B] = 0,4

P[A ∩ B] = 0,1

73

7.- En una clase en la que todos practican algún deporte, el 60% de los alumnos juega al fútbol o al baloncesto y el 10% practica ambos deportes. Si además hay un 60% que no juega al fútbol, cuál será la probabilidad de que escogido al azar un alumno de la clase: a. juegue sólo fútbol b. juegue sólo baloncesto c. Practique uno solo de los deportes d. No juegue ni al fútbol ni al baloncesto.

8.- En un viaje organizado por Europa para 120 personas, 48 de los que van saben hablar inglés, 36 saben hablar francés, y 12 de ellos hablan los dos idiomas. Escogemos uno de los viajeros al azar. a. ¿Cuál es la probabilidad de que hable alguno de los dos idiomas? b. ¿Cuál es la probabilidad de que hable francés, sabiendo que habla inglés? c. ¿Cuál es la probabilidad de que solo hable francés?

74

9.- Se hace una encuesta en un grupo de 120 personas, preguntando si les gusta leer y ver la televisión. Los resultados son: -

A 32 personas les gusta leer y ver la tele. A 92 personas les gusta leer. A 47 personas les gusta ver la tele.

Si elegimos al azar una de esas personas: a. ¿Cuál es la probabilidad de que no le guste ver la tele? b. ¿Cuál es la probabilidad de que le guste leer, sabiendo que le gusta ver la tele? c. ¿Cuál es la probabilidad de que le guste leer?

75 10.- Considere elegir al azar un alumno de cierta universidad, y sea A el evento de que el individuo seleccionado tenga una tarjeta de crédito Visa y B el evento análogo para una MasterCard. Suponga que P(A)=0.5, P(B)=0.4 y P(A∩B)=0.25 a. Calcule la probabilidad de que el individuo seleccionado tenga al menos una de las dos tarjetas (es decir, la probabilidad del evento A U B) b. ¿Cuál es la probabilidad de que el individuo elegido no tenga ninguna de esas tarjetas? c. Describa, en términos de A y B, el evento de que el alumno seleccionado tenga una tarjeta Visa, pero no una MasterCard, y luego calcule la probabilidad de este evento.

76

PROBABILIDAD CONDICIONAL Cuando se definió las probabilidades, en cualquiera de sus enfoques, se relacionó a todo el espacio muestral Ω y utilizamos el símbolo P(A) para denotar la probabilidad de estos eventos; podríamos haber usado el símbolo P(A/Ω), que se lee “probabilidad del evento A dado que ha ocurrido Ω”.

Frecuentemente estamos interesados en obtener la probabilidad de un evento, donde dicho evento está condicionado a la ocurrencia de un subconjunto del espacio muestral. Es decir, se da que el evento B ha ocurrido, y se quiere saber la probabilidad que ocurra el evento A. Se dice que ya ha ocurrido B, entonces se tiene que el espacio muestral Ω se ha restringido al subconjunto B. Por lo tanto sería razonable definir “la probabilidad del evento A dado que ha ocurrido B” la cual se denota por P(A/B)

De la misma manera como se hubiera expresado la P(A) como una probabilidad condicional.

Ejemplo: Si se lanza un dado, ¿cuál es la probabilidad de que se observe un número impar, dado que el número que ha salido es mayor que 3? A: “se observa un número impar” A = {1, 3, 5} B: “se observa un número mayor que 3” B = {4, 5, 6}

77 Del gráfico adjunto se calculan algunas probabilidades P(A∩B) = 1/6 y P(B) = 3/6 Reemplazando en:

Ejemplo: Una revista especializada en asuntos políticos realizó una encuesta sociológica acerca de la actitud política (progresista o conservadora), realizada a 375 universitarios de ambos sexos, las cuales están registradas en la siguiente tabla.

¿Cuál es la probabilidad de que al seleccionar a uno de los universitarios sea progresista dado que se sabe que es varón?

REGLA DE MULTIPLICACIÓN De la definición de probabilidad condicional, obtenemos una fórmula para hallar la probabilidad de la intersección de dos eventos.

Ejemplo: Una urna contiene 5 bolas rojas y 6 negras; se extraen al azar sucesivamente y sin reposición dos bolas, ¿cuál es la probabilidad de que las dos resulten rojas?

78

La probabilidad pedida es la del evento E.

E = A∩B

Entonces P(E) = P(A∩B) = P(A)P(B/A) El siguiente paso será calcular P(A) y P(B/A)

Con estas probabilidades tenemos la probabilidad del evento pedido.

TEOREMA Si A, B y C son eventos en Ω, entonces P(A∩B∩C) = P(A) P(B/A) P(C/A∩B)

PARTICIÓN DE UN ESPACIO MUESTRAL Se dice que la colección de eventos B1, B2, B3,…BK del espacio muestral Ω representa una partición del muestral Ω, si cumple las siguientes condiciones: a) Los eventos B1, B2, B3,…BK son mutuamente excluyentes Bi ∩ Bj = φ i ≠ j i,j=1,2,3 … k b) Los eventos B1, B2, B3,…BK son colectivamente exhaustivos

TEOREMA PROBABILIDAD TOTAL Sean B1, B2, B3,…BK una partición del espacio muestral Ω, entonces para cualquier evento A en Ω, se cumple:

79

Ejemplo: En un criadero de aves se tienen palomas de color blanco y negro, además se tienen tres jaulas. En la jaula 1 hay dos palomas negras y tres blancas, en la jaula 2 cuatro palomas negras y dos blancas y en la jaula 3 cinco negras y cinco blancas. Se selecciona al azar una jaula y se saca una paloma al azar de esta jaula. ¿Cuál es la probabilidad que la paloma escogida sea blanca?

El espacio muestral está dado por las palomas de las tres jaulas y estas forman una partición del espacio muestral. Ω = B 1 U B 2 U B3 Además A = B1A U B2A U B3A, entonces por el teorema de probabilidad total P(A) = P(B1)P(A/B1) + P(B2)P(A/B2) + P(B3)P(A/B3) Como se tiene que escoger una jaula al azar, las tres jaulas tienen la misma posibilidad de ser seleccionadas, entonces P(B1) = P(B2) = P(B3) = 1/3   

Si se selecciona la jaula I : P(A/B1) = 3/5 Si se selecciona la jaula II : P(A/B2) = 2/6 Si se selecciona la jaula III : P(A/B3) = 5/10

Reemplazando en el teorema de la probabilidad total P(A) = P(B1)P(A/B1) + P(B2)P(A/B2) + P(B3)P(A/B3)

Supongamos ahora que la paloma elegida aleatoriamente se ve que es blanco. ¿Cuál es la probabilidad que provenga de la jaula I?

80 Para responder a ello debemos calcular P(B1/A)

El P(A) ya lo calculamos por la probabilidad total y reemplazando los valores, se tiene:

TEOREMA DE BAYES Si los eventos B1, B2, B3,…BK forman una partición del espacio muestral Ω y A es un evento cualquiera de Ω, entonces: para r = 1, 2, 3… k

Ejemplo: La probabilidad de que un autobús que va del Callao a Chosica sufra un accidente en un día lluvioso es del 9% y en día seco del 0.5%. Durante un período de 10 días ha habido 7 días secos y 3 lluviosos. Sabiendo que se ha producido un accidente en esos días ¿cuál será la probabilidad de que haya ocurrido un accidente: a) en día lluvioso, b) en día soleado?

a) En día lluvioso

81

b) En día soleado

EVENTOS INDEPENDIENTES En los ejemplos, solía suceder que P(A/B) era distinta a la probabilidad P(A), indicación de que la información “ocurrió B” produjo un cambio en la probabilidad de la ocurrencia de A. Sin embargo, hay otras situaciones en las que la probabilidad de que ocurra, o ya haya ocurrido, A no resulta afectada si se sabe que ocurrió B, así que P(A/B) = P(A). Entonces es natural pensar en A y B como eventos independientes, lo que significa que la ocurrencia o no ocurrencia de un evento no tiene nada que ver con la probabilidad de que ocurra el otro. En conclusión: •

Dos eventos A y B, se dice que son independientes cuando se cumple que: P(B|A) = P(B)



y

P(A|B) = P(A)

Cuando dos eventos son independientes la probabilidad de su intersección es igual al producto de las probabilidades de cada uno de ellos. A y B independientes ⇒ P(A∩B) = P(A)P(B)

Ejemplo Se sabe que 30% de las lavadoras de cierta compañía requieren servicio mientras está vigente la garantía, en tanto que sólo 10% de sus secadoras necesitan este servicio. Si alguien compra una lavadora y una secadora de esta compañía, ¿cuál es la probabilidad de que ambas máquinas requieran servicio de garantía? Sea A el evento en el cual la lavadora necesite servicio mientras está vigente la garantía y sea B el evento definido de manera análoga para la secadora. Entonces, P(A) = 0.30 y P(B) = 0.10. Suponiendo que las dos máquinas funcionan de modo independiente, la probabilidad deseada es P(A ∩ B) = P(A) P(B) = (0.30) (0.10) = 0.03 La probabilidad de que ninguna máquina requiera servicio es P(A’ ∩ B’) = P(A’) P(B’) = (0.70) (0.90) = 0.63

82 EJERCICIOS 1.- Un gato persigue a un ratón. Este puede entrar en uno de los callejones A, B o C. La probabilidad de que elija cada uno de ellos es del 30%, 50% y 20%, respectivamente. Y de que sea cazado en cada uno de ellos del 40%, 60% y 10% respectivamente. Calcula la probabilidad de que el gato cace al ratón. (prob total)

2.- Supongamos, siguiendo con el ejercicio anterior, que vemos al gato perseguir al ratón. Al poco rato llega con él en la boca, ¿en cuál de los tres caminos es más probable que lo haya cazado? (bayes)

3.- Una comercializadora de ventas de automóviles usados ofrece tres tipos de marca de autos. De las ventas el 50% son de la marca 1, 30% son de la marca 2 y 20% de la marca 3. Cada fabricante ofrece un año de garantía en los repuestos y servicio técnico. Se sabe que 25% de los autos de la marca 1 requieren garantía, en tanto que los porcentajes correspondientes para las marcas 2 y 3 son 20% y 10% respectivamente. ¿Cuál es la probabilidad de que un comprador elegido al azar tenga un auto que requiera reparación mientras esté en garantía? (prob total)

83

4.- El 20 % de los empleados de una empresa son ingenieros y otro 20% son economistas. El 75% de los ingenieros ocupan un puesto directivo y el 50 % de los economistas también, mientras que de los no ingenieros y no economistas solamente el 20 % ocupan un puesto directivo. ¿Cuál es la probabilidad de que un directivo elegido al azar sea ingeniero? (bayes)

5.- Un jugador de baloncesto suele acertar el 75 % de sus tiros desde el punto de lanzamiento de personales. Si acierta el primer tiro, puede tirar de nuevo a canasta. Calcula la probabilidad de que: a) haga dos puntos b) haga un punto c) no haga ningún punto (princ de multiplicac)

6.- En una empresa hay 200 empleados: 100 hombres y 100 mujeres. Los fumadores son 40 hombres y 35 mujeres. Determina las probabilidades P(Mujer/Fumador) y P(Fumador/Mujer) (prob. condic)

84

7.- Una compañía de prospección petrolera tiene dos proyectos activos, uno en Asia y otro en Europa. Sea A el evento donde el proyecto asiático tiene éxito y B el evento donde el proyecto europeo sea exitoso. Suponga que A y B son eventos independientes con P(A) = 0.4 y P(B) = 0.7. a. Si fracasa el proyecto asiático, ¿cuál es la probabilidad de que también fracase el proyecto europeo? Explique su razonamiento. b. ¿Cuál es la probabilidad de que por lo menos uno de los proyectos tenga éxito? c. Dado que por lo menos uno de los dos proyectos es exitoso, ¿Cuál es la probabilidad de que sólo el proyecto asiático tenga éxito?

85

DISTRIBUCIÓN DE PROBABILIDADES Una distribución de probabilidades muestra los posibles resultados de un experimento y la probabilidad de que cada uno se presente. Ejemplo: Suponga que le interesa el número de caras que aparecen en tres lanzamientos de una moneda. Los posibles resultados son:

Este experimento se esquematiza en la siguiente tabla:

De la tabla obtenemos la distribución de probabilidad.

A la distribución de probabilidades también se le puede acompañar de un gráfico, de esta manera se puede analizar mejor dicho experimento aleatorio.

86

Características de una distribución de probabilidad 1. La probabilidad de un resultado en particular se encuentra entre 0 y 1. 2. Los resultados son mutuamente excluyentes. 3. La lista es colectivamente exhaustiva. Así, la suma de las probabilidades de los diversos eventos es igual a 1. Algunos experimentos aleatorios dan origen a resultados de índole cuantitativa (estatura, peso o número de hijos de una familia); otros dan origen a resultados de naturaleza cualitativa (estado civil, creencia religiosa, género, etc.) A los atributos de este tipo de variables se les puede asignar un número, por ejemplo en el caso de género (masculino: 1 y femenino: 2) Cada valor de la variable aleatoria se relaciona con una probabilidad que indica la posibilidad de un resultado determinado. VARIABLE ALEATORIA Cantidad que resulta de un experimento que, por azar, puede adoptar diferentes valores. A continuación algunas situaciones.  Si se cuenta el número de alumnos ausente a la clase de estadística, el número puede ser 0, 1, 2, 3… El número de ausencias es una variable aleatoria.  Si se pesan lingotes de oro, los pesos pueden ser 2453 libras, 2456 libras, 2500 libras, etc. El peso es una variable aleatoria.  El número de focos defectuosos que se puedan contar en una caja de 1000 de estas.  El número de taxis que llegan a la estación del aeropuerto Jorge Chávez al cabo de una hora. Variable aleatoria discreta.- Es aquella que sólo adopta valores claramente separados. Este tipo de variables pueden asumir cualquier número finito de valores o una sucesión infinita de valores como 0, 1, 2,… Por ejemplo  Si hay 100 empleados en una empresa, el recuento de la cantidad de ausentes el lunes sólo puede ser 0, 1, 2, 3, … 100  Número de automóviles que pasarán por las casetas del pago de peaje en la panamericana sur un fin de semana: 0, 1, 2, 3,…

87 Variable aleatoria continua.- Estas pueden tomar una infinidad de valores, con ciertas limitaciones. Por ejemplo  Si se mide algo, como la anchura de una pizarra, la estatura de una persona o la presión de la llanta de un automóvil.  Los tiempos de vuelos comerciales de Lima al Cusco pueden ser 1.02 horas, 0.987 horas, 1.012 horas, etc. La variable aleatoria es la cantidad de horas.

DISTRIBUCIÓN DE PROBABILIDAD DISCRETA Para el caso de una variable aleatoria discreta x, la distribución de probabilidad se define por medio de una función de probabilidad, denotada por f(x). La función de probabilidad proporciona la probabilidad para cada valor que puede asumir la variable aleatoria discreta. Consideremos el ejemplo anterior (número de caras que aparecen en tres lanzamientos de una moneda) para poder ilustrar mejor lo explicado:

Nota: En algunos textos la función de probabilidad también lo denota con P(x).

Media Constituye un valor típico para representar la localización central de una distribución de probabilidad. Alternativamente se podría decir que es un valor promedio de la larga duración de una variable aleatoria. Es también conocida como valor esperado. Se trata del promedio ponderado en el que los posibles valores de una variable aleatoria se ponderan con sus correspondientes probabilidades de ocurrir.

Donde P(x) es la probabilidad de un valor particular x. Nota.- La media o valor esperado también de denota por E(x). Es decir μ = E(x).

88 Varianza y desviación estándar Describe el grado de dispersión en una distribución de probabilidades.

La desviación estándar “σ” se determina al extraer la raíz cuadrada de la varianza. Nota.- Una alternativa al cálculo de la varianza es: σ

2

= E(x2) – [E(x)]2

Ejemplo: Luis Sánchez vende automóviles en Maquinarias S.A. Luis sabe que el día de mayores ventas son los días sábados. Con la experiencia en ventas que tiene llega a elaborar la distribución de probabilidades de la cantidad de automóviles que espera vender un sábado determinado.

¿De qué tipo de distribución de probabilidades se trata? Si la variable aleatoria es el número de automóviles vendidos, entonces se trata de una distribución de probabilidades discreta. ¿Cuántos automóviles espera vender Luis un sábado normal? Para ello se debe calcular la media de la distribución de probabilidades, es decir el valor esperado.

Interpretaciones:  

Este valor indica que, a lo largo de una gran cantidad de sábados, Luis espera vender un promedio de 2.1 automóviles un sábado cualquiera. Si Luis trabaja 50 sábados en un año, puede esperar vender (50)(2.1) ó 105 automóviles solo los sábados.

¿Cuál es la varianza de la distribución? Haciendo uso de la tabla, se sistematizan los métodos para el cálculo de la varianza.

89

La desviación estándar:

Interpretación: 

Si su compañero José Ángeles tiene el mismo promedio de venta los días sábados (2.1) y una desviación estándar de 1.830 automóviles, concluiríamos que hay más variabilidad en las ventas sabatinas de José que en las ventas de Luis (1.830 > 1.136).

90 EJERCICIOS 1.- Dada una variable aleatoria donde su distribución de probabilidades está dada por la siguiente tabla: x P(x) 0,25 3 0,50 6 0,25 9 Calcule el valor esperado, la varianza y la desviación estándar de x, es decir E(x), σ2 y σ.

2.- Se presenta la distribución de probabilidad para la variable aleatoria x. x 20 25 30 35

P(x) 0,20 0,15 0,25 0,40

a. ¿Es válida esta distribución de probabilidad? Explique por qué. b. ¿Qué probabilidad existe de que x sea menor o igual a 25? c. ¿Cuál es la probabilidad de que x sea mayor que 30?

91 3.- Una prestigiosa universidad realizó un estudio acerca de la cantidad de veces que postularon sus alumnos hasta ingresar a la universidad. Dicho estudio se realizó el 2013 y la universidad contaba con 4000 alumnos. La información se muestra en la siguiente tabla. Número de Número de veces estudiantes 309 1 1203 2 2017 3 348 4 123 5

a. Sea X una variable aleatoria de indica el número de veces que postuló el estudiante hasta ingresar a la universidad. Muestre la distribución de probabilidades de esta variable aleatoria. b. ¿Cuál es la probabilidad de que el alumno haya ingresado luego de 4 intentos? c. Calcule el valor esperado e interprete, luego obtenga el coeficiente de variación.

92

DISTRIBUCIÓN BINOMIAL En el ámbito profesional tenemos muchas situaciones donde se espera que ocurra o no un evento específico. Éste puede ser de éxito o fracaso sin dar paso a un punto medio. Por ejemplo, en la producción de un artículo, éste puede salir bueno o malo. Casi bueno no es un resultado de interés. Para situaciones como éstas se utiliza la distribución binomial. ENSAYO DE BERNOULLI Es cualquier ensayo de algún experimento que conduce sólo a uno de dos resultados mutuamente excluyentes. Ejemplo:      

Vivo o muerto Enfermo o saludable Positivo o negativo Ganar o perder …………………………. ………………………….

De una sucesión de ensayos de Bernoulli se obtiene la distribución binomial. La formación de un proceso de Bernoulli se efectúa bajo las siguientes condiciones. 1. Se tiene un número finito de ensayos. 2. Cada ensayo conduce a uno de dos resultados mutuamente excluyentes. Uno de los resultados posibles se denomina (arbitrariamente) éxito y el otro fracaso. 3. La probabilidad de éxito, representada por p, permanece constante de ensayo a ensayo. La probabilidad de fracaso es (1-p) que también se representar por q. 4. Los resultados son independientes, es decir, el resultado de cualquier ensayo particular no es afectado por el resultado del otro ensayo.

CÁLCULO DE PROBABILIDADES CON LA DISTRIBUCIÓN BINOMIAL Al estudiar la distribución binomial se tiene interés en calcular la probabilidad de obtener k éxitos de un total de n ensayos de Bernoulli. FUNCIÓN DE DENSIDAD DE PROBABILIDAD BINOMIAL

Donde:    

P(X = k): Es la probabilidad de k éxitos en n ensayos. X: es la variable aleatoria. n: número de ensayos de Bernoulli. p: probabilidad de éxito en un ensayo (q = 1-p)

93  k: número de éxitos. k = 0, 1, 2, 3,…,n 

La distribución binomial presenta dos parámetros: n y p. En algunas ocasiones se representa de la siguiente manera: binomial (n,p)  

Esperanza: E(X) = np Varianza: Var(X) = npq

EJERCICIO Erick y José se ponen a apostar jugando con dados. Erick dice que si al lanzar el dado 10 veces y obtiene 3 veces el número 5, José le pagaría S/. 50, caso contrario Erick pagará la misma cantidad a José ¿Cuál es la probabilidad que gane Erick? Resolución Primero, en cada lanzamiento la probabilidad de que Erick obtenga un 5 es 1/6 la cual podríamos representar con p = 1/6 como la probabilidad de éxito. Los lanzamientos que se realizan son independientes y además la probabilidad de éxito permanece constante. Con esas características del experimento aleatorio podríamos decir que cumple las condiciones de la distribución de probabilidades binomial. Tenemos:  p=1/6 (probabilidad de éxito)  n= 10 (número de lanzamientos)  k=3 (número de éxitos requeridos para ganar el juego)

EJERCICIO Un estudiante, que no asiste frecuentemente a clase, queda sorprendido y muy preocupado al enterarse que ese día es el examen parcial. El examen consta de 8 preguntas y cada pregunta tiene 3 alternativas de opción múltiple. Lo único que le queda a este estudiante es adivinar la alternativa correcta en cada pregunta. Si para aprobar el examen tiene que responder 5 ó más preguntas correctamente. ¿Cuál es la probabilidad de que este estudiante apruebe el examen? Resolución La probabilidad de éxito en cada pregunta es: p = 1/3 Dado que son ocho preguntas, entonces n=8 y para aprobar el examen se necesita como mínimo responder correctamente 5 preguntas de las 8, entonces se tiene que k = 5, 6, 7 y 8.

94 Nos piden:

La probabilidad de aprobar el examen es de 0.08755

95 EJERCICIOS 1.- Un jugador de tenis tiene 2/3 de probabilidad de ganar. Si se jugó 4 partidos. Hallar la probabilidad que gane 2 partidos.

2.- El gerente de producción de la compañía record se encuentra realizando una revisión mensual de la producción de ollas. Se eligió 10 ollas y se observa si tiene defectos de fabricación. Se conoce que el 2% de la producción de ollas tiene defectos. a. ¿Cuál es la probabilidad de que en la muestra contenga más de 2 ollas en defectos de fábrica? b. ¿Cuál es la probabilidad que ninguna olla en la muestra tenga defectos de fábrica?

3.- En una oficina de servicio al cliente se atienden a 100 personas diarias. Por lo general 10 personas se van sin recibir bien el servicio. Determine la probabilidad de que en una encuesta a 15 clientes 3 no hayan recibido un buen servicio.

96 4.- El 70% de los ejecutivos que asisten a una reunión de directorio llevan una laptop. Si en un directorio se reúnen 10 ejecutivos. a. Calcule la probabilidad de que al menos tres ejecutivos no lleven su laptop. b. Cuál es el número esperado de laptops que llevaran los ejecutivos a la reunión.

5.- Una empresa cuando postula a un contrato tiene 1/4 de probabilidad de ganar. Si la empresa postula a 6 contratos. a. ¿Cuál es la probabilidad que gane más de 3 contratos? b. Calcule cuantos contratos espera ganar.

97

DISTRIBUCIÓN DE POISSON La distribución de Poisson debe su nombre al matemático francés Simeón Denis Poisson (1781-1840), aunque ya había sido introducida en 1718 por Abraham De Moivre (1667-1754) como una forma límite de la distribución binomial que surge cuando se observa un evento raro después de un número grande de repeticiones. Más adelante se detallará dicho límite o aproximación a la distribución binomial. La distribución de Poisson también surge cuando un evento o suceso “raro” ocurre aleatoriamente en el espacio o el tiempo. La variable asociada es el número de ocurrencias del evento en un intervalo o espacio continuo, por tanto, es una variable aleatoria discreta que toma valores enteros no negativos (0, 1, 2,...) El concepto de evento “raro” o “poco frecuente” debe ser entendido en el sentido de que la probabilidad de observar k eventos decrece rápidamente a medida que k aumenta. UTILIDAD 1. La distribución de Poisson se utiliza en situaciones donde los sucesos son impredecibles o de ocurrencia aleatoria. En otras palabras no se sabe el total de posibles resultados. 2. Permite determinar la probabilidad de ocurrencia de un suceso con resultado discreto. 3. Es muy útil cuando la muestra o segmento n es grande y la probabilidad de éxitos p es pequeña. 4. Se utiliza cuando la probabilidad del evento que nos interesa se distribuye dentro de un segmento n dado como por ejemplo: distancia, área, volumen o tiempo definido. Ejemplos:         

La llegada de un cliente al negocio durante una hora. Las llamadas telefónicas que se reciben en un día. Los defectos en manufactura de papel por cada metro producido. Los envases llenados fuera de los límites por cada 100 galones de producto terminado. Número de fallas en la superficie de una cerámica rectangular. Número de bacterias en un volumen de un m3 de agua. Número de accidentes de trabajo que ocurren en una fábrica durante una semana. El número de llamadas que recibe un servicio de atención a urgencias durante 1 hora. El número de glóbulos blancos en un milímetro cúbico de sangre.

CONDICIONES Para que una variable siga una distribución de Poisson deben cumplir las siguientes condiciones: 1. En un intervalo muy pequeño (p. e. de un milisegundo) la probabilidad de que ocurra un evento es proporcional al tamaño del intervalo. 2. La probabilidad de que ocurran dos o más eventos en un intervalo muy pequeño es tan reducida que, a efectos prácticos, se puede considerar nula. 3. El número de ocurrencias en un intervalo pequeño no depende de lo que ocurra en cualquier otro intervalo pequeño que no se solape con aquél. Estas propiedades pueden resumirse en que el proceso que genera una distribución de Poisson es estable (produce, a largo plazo, un número medio de sucesos constante por unidad de observación) y

98 no tiene memoria (conocer el número de sucesos en un intervalo no ayuda a predecir el número de sucesos en el siguiente). FUNCIÓN DE PROBABILIDAD DE LA DISTRIBUCIÓN DE POISSON

Donde:    

P(X=k): Es la probabilidad de ocurrencia cuando la variable discreta X toma un valor finito k. λ: Número promedio de ocurrencias esperadas por unidad de tiempo o de espacio. e: Tiene un valor aproximado de 2.71828183… k: Es el número de ocurrencias; k = 0, 1, 2, 3,…

Nota.- El parámetro de la distribución, λ, se le conoce también como “la tasa de ocurrencia” del fenómeno que se observa.  

Esperanza: E(x) = λ Varianza: Var (x) = λ

La distribución de Poisson de parámetro λ se puede utilizar como una aproximación de la Binomial (n; p), si el número de pruebas n es grande, pero la probabilidad de éxito p es pequeña, siendo λ = np; podemos considerar que la aproximación Poisson-binomial es “buena” si n ≥ 20 y p ≤ 0,05 y “muy buena” si n ≥ 100 y p ≤ 0,01. EJERCICIO La gerencia de un banco desea conocer información relacionado con la cantidad de personas que se acercan a retirar dinero de uno de sus cajeros automáticos un miércoles por la mañana. Si se tiene información que el número promedio de personas que llegan al cajero en un periodo de 15 minutos es 10. ¿Cuál es la probabilidad de que 5 personas lleguen al cajero en un periodo de 15 minutos? Resolución En este caso la probabilidad pedida es para un periodo de 15 minutos que coincide con la información que se tiene (un promedio de 10 personas en un periodo de 15 minutos) por lo tanto tomaremos λ = 10 y k = 5. Reemplazando en la distribución de probabilidad Poisson.

La probabilidad de que 5 personas lleguen al cajero en un periodo de 15 minutos es de 0,0378 Siguiendo el ejercicio anterior ¿Cuál es la probabilidad que llegue al cajero una persona en un periodo de 3 minutos? En este caso sería un error tomar el λ=10, porque la pregunta es para un periodo de 3 minutos (antes era de 10 minutos)

99 Para calcular dicha probabilidad se tendría que calcular el nuevo valor de λ, esto se podría hacer mediante una regla de tres simples.

En este caso el número promedio de personas que llegan al cajero en un periodo de 3 minutos es 2, es decir λ = 2. A la pregunta ¿Cuál es la probabilidad que llegue al cajero una persona en un periodo de 3 minutos? Se tiene que k = 1 y λ = 2.

La probabilidad que llegue al cajero una persona en un periodo de 3 minutos es de 0,271 EJERCICIO A una empresa de peajes le interesa saber de defectos importantes un mes después de repavimentarla. Si la empresa tiene información que la cantidad de defectos importantes ocurre con una tasa media de 2 por 5 kilometro de autopista. ¿Cuál es la probabilidad de no encontrar ningún defecto en un kilometro de autopista? Resolución

En este caso el número de defectos en la autopista por cada kilómetro es de 2/5, es decir λ = 2/5. Entonces la probabilidad de no encontrar ningún defecto en un kilómetro de autopista se calcula con k = 0 y λ = 2/5

EJERCICIO La probabilidad de que haya un accidente en una compañía de manufactura es de 0,02 por cada día de trabajo. Si se trabajan 300 días al año. ¿Cuál es la probabilidad de tener 3 accidentes al año? Resolución En este caso dicha probabilidad se puede calcular con la distribución binomial con parámetros p = 0,02 y n = 300 como nos piden 3 accidentes al año, entonces k = 3.

100

Para hacer uso de la aproximación Poisson-binomial se debe verificar ciertas condiciones: p=0,02 ≤ 0,05 y n=300 ≥ 20 podríamos decir que la aproximación será buena. Calculamos la probabilidad mediante la distribución Poisson, para ello el parámetro λ lo calculamos como λ = n*p = 300*0,02 = 6

Nota: como se puede ver la diferencia (0,0883 vs 0,0892) es por milésimas.

101 EJERCICIOS 1.- Al departamento de reservaciones de cierta Aerolínea llegan en promedio 30 llamadas por hora. a. ¿Cuál es la probabilidad de recibir 3 llamadas en un intervalo de 5 minutos? b. ¿Cuál es la probabilidad de no recibir llamada alguna en un intervalo de 2 minutos?

2.- En una academia, las llamadas entran con una frecuencia de una cada dos minutos. ¿Cuál es la probabilidad de recibir 3 llamadas en 5 minutos? y ¿Cuántas llamadas se espera recibir en 30 minutos?

102 3.- El número promedio de camiones que transporta azúcar que llegan a un puerto del norte del país es de 3 por hora. Las instalaciones del puerto pueden atender cuando mucho a 4 camiones por hora. ¿Cuál es la probabilidad de que en una hora determinada se tenga que regresar los camiones?

4.- Se supone que el número de defectos en tela de una determinada fábrica de producción es de 0,15 por metro cuadrado: a. Calcular la probabilidad de tener 3 defectos en un metro cuadrado. b. Calcular la probabilidad de tener 1 defecto en cinco metros cuadrados. c. Calcular la probabilidad de que no haya defectos en 8 metros cuadrados.

103 5.- Un ingeniero que labora en el departamento de control de calidad de una empresa eléctrica, inspecciona una muestra al azar de 200 alternadores de un lote. Si el 2% de los alternadores del lote están defectuosos. ¿Cuál es la probabilidad de que en la muestra, menos de tres estén con defectos?

104

DISTRIBUCIÓN HIPERGEOMÉTRICA La distribución Hipergeométrica surge en situaciones en donde el modelo aproximado de probabilidad se corresponde con muestreo sin reemplazamiento de una población dicotómica (Éxito y Fracaso) finita. Concretamente, las suposiciones que llevan a considerar esta distribución son:  La población o conjunto de donde deba hacerse el muestreo consta de N individuos o elementos a seleccionar.  Cada individuo puede ser caracterizado como un éxito (E) o fracaso (F).  Se selecciona una muestra de n individuos entre los r individuos marcados como éxito y los (N − r) restantes marcados como fracaso.

La diferencia entre la distribución binomial y la distribución hipergeométrica está en la forma en que se realiza el muestreo. En el caso de la binomial se requiere independencia entre las pruebas, es decir, el muestreo se realiza con reemplazamiento. Por otro lado, la distribución hipergeométrica no requiere independencia y el muestreo se realiza sin reemplazamiento. Las aplicaciones de la distribución hipergeométrica se encuentran en muchas áreas, con gran uso en control de calidad. Una variable aleatoria X tiene una distribución Hipergeométrica, si X representa: “El número de individuos de un total de n con cierta característica (éxito) si en N hay un total de r" FUNCIÓN DE PROBABILIDAD DE LA DISTRIBUCIÓN HIPERGEOMÉTRICA

Para k = 0, 1, 2,. . . , n

k ≤ r

y

n–k ≤ N-r

La distribución hipergeométrica presenta tres parámetros: N, r y n. En algunas ocasiones se representa de la siguiente manera: (N, r, n) 

Esperanza:



Varianza:

105 EJERCICIO Un fabricante de dispositivos eléctricos para automóviles los empaqueta en lotes de 25. El comprador los inspecciona tomando 3 dispositivos y acepta un lote si encuentra menos de dos dispositivos defectuosos. a. Calcular la probabilidad de que el comprador acepte un lote con 6 dispositivos defectuosos. b. ¿Cuál es el número esperado y la varianza de los dispositivos defectuosos en los 3 inspeccionados? Resolución Se tiene un conjunto de N = 25 dispositivos, en los que hay r = 6 defectuosos, y N – r = 19 no defectuosos. Extraemos n = 3 sin reemplazo. Considerando la variable aleatoria: X = “numero de dispositivos defectuosos en los 3 seleccionados”

(N = 25, r = 6, n = 3)

106 EJERCICIOS 1.- Como parte de un estudio de la contaminación del aire, un inspector decide examinar la emisión de gases de seis de los 24 camiones de carga de una compañía. Si cuatro de los camiones de la compañía emiten cantidades excesivas de contaminantes, ¿Cuál es la probabilidad de que ninguno de ellos sea incluido en la muestra del inspector?

2.- Entre los 120 aspirantes para ocupar un empleo, sólo 80 están realmente calificados para hacerlo. Si se selecciona al azar cinco de estos aspirantes para realizar una entrevista “a fondo”, determine la probabilidad de que dos de los cinco estén para el trabajo.

3.- Un ingeniero de control de calidad inspecciona una muestra tomada al azar de dos baterías para laptops de cada lote de 18 unidades que llega y acepta el lote si ambas están en buenas condiciones de funcionamiento; en caso contrario, se inspecciona todo el lote y el costo se carga al distribuidor. ¿Cuáles son las probabilidades de que este lote sea aceptado sin mayor inspección si contiene a.- tres baterías que no están en buenas condiciones de funcionamiento. b.- Once de las baterías en malas condiciones de funcionamiento?

107

4.- ¿Cuál es la probabilidad de que un auditor fiscal halle sólo dos declaraciones de impuestos sobre la renta con deducciones ilegítimas, si selecciona al azar cinco declaraciones de entre 15 de las cuales nueve contienen deducciones ilegítimas?

108

DISTRIBUCIÓN DE PROBABILIDAD CONTINUA La diferencia fundamental entre las variables aleatorias discretas y las continuas radica en la manera de calcular las probabilidades. Para las primeras, la función de probabilidad f(x) proporciona la probabilidad de que la variable aleatoria asuma un valor particular. Con las segundas, el homologo de la función de probabilidad es la función de densidad de probabilidad, que también se denota por f(x). La diferencia estriba en que la función de densidad de probabilidad no proporciona las probabilidades directamente. Sin embargo, el área bajo la gráfica f(x) que corresponde a un intervalo dado representa la probabilidad de que la variable aleatoria continua x asuma un valor dentro de ese intervalo. Esto es, que las probabilidades se obtendrán en su mayoría haciendo uso de las integrales (siempre y cuando estas existan)

Para cualquier constante real a y b con a ≤ b Nota: Siendo f(x) una función de distribución de probabilidad, entonces se debe cumplir que

PROPIEDAD Si x es una variable aleatoria continua, además a y b son dos constantes reales con a ≤ b, entonces

P(a ≤ x ≤ b) = P(a ≤ x < b) = P(a < x ≤ b) = P(a < x < b)

EJEMPLO APLICATIVO El desgaste del dibujo (en miles de kilómetros) de los neumáticos de cierto tipo es una variable aleatoria cuya función de densidad de probabilidad está dada por

Obtenga la probabilidad de que uno de estos neumáticos se desgastará cuando mucho a 19 000 km. Resolución Lo que nos piden es: P (0 < x ≤ 19)

109

ESPERANZA O VALOR ESPERADO En el caso de variables aleatorias continuas la esperanza se calcula de la siguiente manera:

2

2

2

Nota.- El cálculo de la varianza se podrá calcular mediante σ = E(x ) – [E(x)]

EJERCICIOS 1.- La función de densidad de probabilidad de la variable aleatoria x está dada por

Determine k y P (0.5 ≤ x ≤ 1)

110 2.- El retraso o adelanto (en minutos) de un vuelo de AeroLand a Lima es una variable aleatoria cuya densidad de probabilidad está dada por

donde los valores negativos son indicativos de que el vuelo llega adelantado y los valores positivos señalan que el vuelo llega retrasado. Determine las probabilidades de que uno de estos vuelos llegará a) b) c) d) e)

Cuando menos dos minutos antes Cuando menos un minuto retrasado Entre uno y tres minutos antes Exactamente cinco minutos tarde Calcule E(x)

111

DISTRIBUCIÓN DE PROBABILIDAD NORMAL Esta distribución es frecuentemente utilizada en las aplicaciones estadísticas. Su propio nombre indica su extendida utilización, justificada por la frecuencia o normalidad con la que ciertos fenómenos tienden a parecerse en su comportamiento a esta distribución. La importancia de la distribución normal se debe principalmente a que hay muchas variables asociadas a fenómenos naturales que siguen el modelo de la distribución normal.  Caracteres morfológicos de individuos (personas, animales, plantas,...) de una especie. Ejemplo: tallas, pesos, envergaduras, diámetros, perímetros.

 Características fisiológicas, por ejemplo: efecto de una misma dosis de fármaco a distintos pacientes, pérdida de peso por alguna dieta.

 Caracteres sociológicos, ejemplo: consumo de cierto producto por un mismo grupo de individuos, puntuación de exámenes.

 Características psicológicas, por ejemplo: coeficiente intelectual, grado de adaptación a un medio, niveles de estrés.

112 FUNCIÓN DE DENSIDAD DE PROBABILIDAD NORMAL



Esperanza:



Varianza:

Si la variable aleatoria está asociada a una distribución normal, se denota de la siguiente manera X ~ N(μ, σ²)

DISTRIBUCIÓN NORMAL ESTANDAR La distribución normal con media μ = 0 y varianza σ² = 1 se conoce como distribución normal estándar y su función de densidad es:

Para calcular las probabilidades se tiene que integrar la función de densidad en un intervalo del recorrido de la variable aleatoria.

En este caso estamos calculando la probabilidad acumulada de - ∞ hasta un valor específico z. Para evitar estos cálculos engorrosos existen tablas que nos facilitan estos cálculos.

113 TABLA DE DISTRIBUCIÓN NORMAL ESTÁNDAR Si

(0,1)

Ejemplos:      ¿Cómo hacemos si se quiere calcular probabilidades de una variable aleatoria que sigue una distribución normal con media μ y varianza σ²? Es decir, cuando la variable aleatoria tiene la siguiente función de densidad

114 En este caso a partir de la función de distribución normal realizamos un artificio para que este se pueda calcular mediante una función de distribución normal estándar como ya sabemos. A este artificio se le conoce como estandarización.

Ejemplo: Sea X una variable aleatoria asociada a una distribución normal con media 2 y varianza 9, es decir X N(2 ; 9). Calcular la probabilidad de que la variable aleatoria sea menor o igual a 2.5 ó sea P(x ≤ 2,5)

EJERCICIO El peso en Kg de los habitantes de una determinada población sigue una distribución normal de media 72 y varianza 7. Calcule la probabilidad de que un individuo de la población pese menos de 80 kg. Resolución: Considerando la variable aleatoria X como “el peso en Kg de los habitantes de una población” Piden:

EJERCICIO Las calificaciones del examen de ingreso a una universidad, están distribuidos normalmente con una media de 75 puntos y una desviación estándar de 5 puntos. Calcular la probabilidad de que al elegir a un alumno al azar, este haya obtenido un puntaje a. Mayor a 82 puntos. b. Menor a 73 puntos. c. Entre 68 y 81 puntos. Resolución: Parte a

Nos piden: P(x > 82)

115

Parte b Nos piden: P(x < 73)

Parte c

Nos piden: P(68 < x < 81)

116 EJERCICIOS 1.- Una empresa paga a sus empleados una remuneración promedio de 800 nuevos soles mensuales con una desviación estándar de 90 nuevos soles, se sabe que las remuneraciones sigue una distribución normal. a. ¿Qué porcentaje de los trabajadores reciben salarios entre 750 a menos de 900 nuevos soles? b. Si se llegase a seleccionar al 5% de trabajadores con mayores salarios de la empresa, de ese grupo ¿cuál sería el menor valor salarial?

2.- Una compañía de refrescos está determinando el nivel de llenado para las nuevas máquinas automáticas. El número de onzas de llenado sigue una distribución normal con una desviación estándar de 0.2 onzas. ¿Cuál debe ser el valor de la media que se establezca para que los envases de ocho onzas se sobrellenen una vez en mil?

117 3.- Una empresa que fabrica focos indica a sus clientes que la duración de focos para interiores del hogar tiene una distribución normal con una media de 2400 horas y desviación estándar 100 horas. Si una tienda comercializadora compro 2000 de estos focos. Calcule e interprete: a. ¿Cuántos focos duraran menos de 2000 horas? b. ¿Cuántos focos duraran entre 2350 y 2500 horas?

4.- La venta de gasolina de un grifo ubicado en la Av. Arequipa sigue una distribución normal con un promedio de 40 galones en una hora y con una desviación estándar de 5,4 galones. ¿Cuál es la probabilidad que en una hora se venda más de 42 galones?

118 5.- Los promedio de las calificaciones de los alumnos de secundaria sigue una distribución normal con un promedio de 12 y una desviación estándar de 1,2. a. Calcule la probabilidad que al seleccionar un alumno tenga menos de 13 de nota. b. Cual debe de ser la mínima calificación aprobatoria si solamente se desea que el 60% de los estudiantes pruebe.

6.- Se sabe que los gastos semanales efectuados por las familias sigue una distribución normal con una media de 350 nuevos soles y una desviación estándar de 75. a. ¿Cuántas familias gastan menos de 300 nuevos soles? b. ¿Cuántas familias gastan entre 380 y 400 nuevos soles? c. Si una familia presupuesto para la siguiente semana de 330 nuevos soles ¿Cuál es la probabilidad de que los gastos reales sean mayores a los presupuestados?

119

DISTRIBUCION LOG-NORMAL Muchas variables no se distribuyan de manera normal (gaussiana), sin embargo, aplicando alguna transformación es posible convertir los datos a una forma que esté distribuida de esa manera. La transformación logarítmica se aplica en muchos casos, en especial cuando el rango de las observaciones abarca varios órdenes de magnitud. Una variable aleatoria X cuyos logaritmos Y = ln(X) están distribuidos de manera normal, se dice que X sigue una distribución log normal. Es decir, si

(

,

) entonces

o -Normal

FUNCIÓN DE DENSIDAD DE LA DISTRIBUCIÓN LOG-NORMAL

Donde:  

Esperanza o media de Y: Varianza de Y:

La relación entre estos parámetros y los de la variable original X es:

En este caso la variable

sigue una distribución Gaussiana estándar N(0,1)

APROXIMACIÓN NORMAL DE LAS PROBABILIDADES BINOMIALES Recordemos que un experimento binomial consiste en una secuencia de n ensayos (de Bernoulli) independientes, idénticos, cada uno con dos resultados posibles: un éxito o fracaso, con la misma probabilidad de éxito para cada ensayo. Cuando el número de ensayos es grande, es difícil evaluar la función de probabilidad binomial a mano o con una calculadora. En los caso que np ≥ 5 y n(1-p) ≥ 5, la distribución normal proporciona una aproximación fácil de usar de las probabilidades binomiales. Cuando se usa la aproximación normal a la binomial, se establece que

120 Ejemplo En una empresa comercializadora de artículos de ferretería se cometen errores en el 10% de las facturaciones realizadas, debido a la rotación exagerada de su personal. Se tomo una muestra de 100 facturas y se quiere calcular la probabilidad de que 12 contengan errores. Es decir, se desea determinar la probabilidad binomial de 12 éxitos en 100 ensayos. Al aplicar la aproximación normal en este caso, se establece

Como sabemos la distribución normal está asociada a una variable aleatoria continua y la binomial a una discreta. Por tanto, para aproximar la probabilidad binomial de 12 éxitos, se calcula el área bajo la curva normal correspondiente entre 11.5 y 12.5. El 0.5 que se resta y suma del 12 se llama factor de corrección de continuidad. El factor de corrección se debe porque se está utilizando una distribución continua para aproximar una distribución discreta. Por tanto, P(x = 12) para la distribución binomial discreta se aproxima por P(11.5 ≤ x ≤ 12.5) para una distribución normal continua.

Por tanto, el área entre 11.5 y 12.5 es 0.1052 (= 0.7967 – 0.6915)

La aproximación normal a la probabilidad de 12 éxitos en n ensayos es 0.1052

121 EJERCICIO 1.- Un hotel de un centro vacacional en Máncora tiene 150 habitaciones. En los meses de verano, la ocupación del hotel es de aproximadamente 75%. a. ¿Cuál es la probabilidad de que por lo menos la mitad de las habitaciones esté ocupada en un día determinado? b. ¿Cuál es la probabilidad de que 120 o más habitaciones estén ocupadas en un día determinado? c. ¿Cuál es la probabilidad de que 70 o menos estén ocupadas en tal día?

122

MUESTREO El muestreo es una herramienta de la investigación científica, cuya función básica es determinar que parte de una población debe examinarse, con la finalidad de hacer inferencias sobre dicha población. Se denomina censo al recuento de individuos que conforman una población estadística, definida como un conjunto de elementos de referencia sobre el que se realizan las observaciones.



Establecer contacto con toda la población requeriría mucho tiempo.



El costo de estudiar todos los elementos de una población resultaría prohibitivo.

123 

Es imposible verificar de manera física todos los elementos de la población.



Algunas pruebas son de naturaleza destructiva.

El muestreo debe lograr una representación adecuada de la población, en la que se reproduzca de la mejor manera los rasgos esenciales de dicha población que son importantes para la investigación. Para que una muestra sea representativa, y por lo tanto útil, debe de reflejar las similitudes y diferencias encontradas en la población, es decir ejemplificar las características de ésta.

Existen diferentes criterios de clasificación de los diferentes tipos de muestreo, aunque en general pueden dividirse en dos grandes grupos: métodos de muestreo probabilísticos y métodos de muestreo no probabilísticos.

124 MUESTREO PROBABILISTICO Los métodos de muestreo probabilísticos son aquellos que se basan en el principio de equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para formar parte de una muestra y, consiguientemente, todas las posibles muestras de tamaño n tienen la misma probabilidad de ser seleccionadas. La ventaja del muestreo probabilístico estriba en que, por lo general, se identifica la distribución de muestreo del estadístico muestral correspondiente. La distribución de muestreo permite plantear afirmaciones probabilísticas acerca del error asociado con el uso de los resultados muestrales al hacer inferencias de la población.

 MUESTREO ALEATORIO SIMPLE (MAS) El muestreo aleatorio simple selecciona muestras mediante métodos que permiten que cada posible muestra tenga una igual probabilidad de ser seleccionada y que cada elemento de la población total tenga una oportunidad igual de ser incluido en la muestra. Ejemplo Se tiene un grupo de trabajo del curso de Estadística el cual lo constituyen cuatro integrantes (A, B, C y D), se desea seleccionar a dos de estos para la búsqueda de información en la biblioteca nacional.

El procedimiento para la obtención de la muestra es la siguiente: 1.- Se asigna un número a cada individuo de la población.

125 2.- A través de algún medio mecánico (bolas dentro de una bolsa, tablas de números aleatorios, números aleatorios generados con una calculadora u ordenador, etc.) se eligen tantos sujetos como sea necesario para completar el tamaño de muestra requerido. Ejemplo A manera de ejemplo, seleccionemos una muestra a partir del listado de alumnos matriculados en el curso.

Como se tiene la información de todos los alumnos del aula, podemos seleccionar a ocho estudiantes (muestra de tamaño 8) mediante MAS. Haremos uso del Excel para generar los números aleatorios.

126  MUESTREO SISTEMÁTICO En el muestreo sistemático, los elementos son seleccionados de la población dentro de un intervalo uniforme que se mide con respecto al tiempo, al ordeno o al espacio. Aun cuando este tipo de muestreo puede ser inapropiado cuando los elementos entran en un patrón secuencial, este método puede requerir menos tiempo y, algunas veces, tiene como resultado un costo menor que el método de muestreo aleatorio simple. La obtención de una muestra sistemática de tamaño n de una población de N elementos se consigue mediante el siguiente procedimiento.    

Conseguir un listado ordenado de los N elementos de la población. Determinar el tamaño muestral n. Definir el tamaño del salto sistemático k dado por k = N/n. Elegir un número aleatorio α entre 1 y k (α =arranque aleatorio). Este número permite obtener la primera unidad muestral.  A partir de la posición α, dando saltos de k unidades, obtendremos los elementos que conformaran la muestra. Ejemplo A partir del listado de 30 alumnos, seleccionar una muestra de tamaño 6 con el método de muestreo sistemático. Secuencia    

Listado de N = 30 alumnos Tamaño de la muestra n = 6 Tamaño del salto sistemático k = 30/6 = 5 Elección del arranque aleatorio α (entre 1 y 5, usando el MAS) α = 2

127 Luego se tiene los alumnos que conforman la muestra de tamaño 6.

 MUESTREO ESTRATIFICADO En el muestreo estratificado los elementos de la población primero se dividen en grupos, a los que se les llama estratos, de manera que cada elemento pertenezca a uno y sólo un estrato. La base para la formación de los estratos, que pueden ser departamento, edad, tipo de industria etc., está a discreción de las personas que diseña la muestra. Sin embargo, se obtienen mejores resultados cuando los elementos que lo forman son lo más parecido posible (homogeneidad dentro de los estratos). Una vez formado los estratos utilizamos uno de los dos planteamientos: o o

Seleccionar aleatoriamente, en cada estrato, un número específico de elementos correspondiente a la proporción del mismo en relación con la población completa. Extraemos el mismo número de elementos de cada estrato y después ponderamos los resultados considerando la proporción que el estrato representa con respecto a la población total.

Supongamos que los pacientes de un médico están divididos en cuatro grupos de acuerdo con su edad, como indica la tabla.

El médico desea averiguar cuantas horas duermen sus pacientes. Para obtener una estimación de esta característica de la población, podría tomar una muestra aleatoria de cada uno de los cuatro grupos de edades y ponderar las muestras de acuerdo con el porcentaje de pacientes en ese grupo. Nota: La ventaja de las muestras estratificadas es que, cuando se diseñan adecuadamente, reflejan de manera más precisa las características de la población de la cual fueron elegidas, en comparación con otro tipo de muestras.  MUESTREO POR CONGLOMERADOS En el muestreo por conglomerado (o clusters) los elementos de la población primero se dividen en grupos separados, llamados conglomerados o clusters. Cada elemento pertenece a uno y sólo un conglomerado. Se toma una muestra aleatoria simple de los conglomerados. Todos los elementos en cada conglomerado muestreado forman la muestra.

128 Este muestreo tiende a proporcionar mejores resultados cuando los elementos dentro de los conglomerados no son semejantes. Lo ideal es que cada conglomerado sea una representación, a pequeña escala, de la población completa. Si todos son semejantes en este aspecto, tomando en la muestra un número pequeño de conglomerados, se obtendrá una buena estimación de los parámetros poblacionales. Una de las principales aplicaciones del muestreo por conglomerados es el muestreo de áreas, en el que los conglomerados son las manzanas de una ciudad u otras zonas bien definidas.

Si en una investigación de mercado tiene la intención de determinar por muestreo, el número promedio de televisores por casa en una ciudad grande, podrían usar un mapa de la ciudad para dividir el territorio en manzanas y luego escoger un cierto número de éstas (conglomerados) para entrevistar a sus habitantes. Cada casa pertenecientes a cada una de estas manzanas sería considerada para entrevistar a sus habitantes.

129 EJERCICIOS 1.- Una empresa proveedora de servicio de cable desea seleccionar una muestra de tamaño 10 de toda una manzana de la urbanización Miramar del distrito de San miguel, para posteriormente hacer un estudio de mercadeo. En la tabla adjunta se tiene la información del número de televisores que poseen en cada vivienda de la manzana.

Si usted es el encargado de esta selección, obtenga los vecinos que compondrán la muestra mediante la técnica de muestreo aleatorio simple y el sistemático.

130 2.- Se tiene el registro de notas de los alumnos del curso de Estadística Aplicada. Seleccione mediante el MAS y el sistemático una muestra de tamaño 6 para luego obtener el promedio de notas de la muestra seleccionada con ambos métodos.

131 3.- El encargado de recursos humanos de un empresa está interesado en saber el número promedio de hijos que tienen sus empleado que laboran en tres turnos (1er turno: 6am a 2pm, 2do turno: 2pm a 10pm y 3er turno: 10pm a 6am). Mediante el muestreo estratificado, calcule dicho promedio.

132

DISTRIBUCIÓN DE LA MEDIA MUESTRAL En la sesión anterior hemos obtenido muestras acerca de la estatura de los estudiantes (como indica la tabla). Lo que pretendemos ahora es hacer una comparación entre los valores de la media muestral y obtener la distribución de la media muestral.

Se observa que los valores de cada muestra difieren del valor poblacional. Y además solo hemos obtenido tres muestras, imaginemos obtener 100 muestras y calculamos sus medias, es de hecho que la gran mayoría de estos difieren del valor verdadero del parámetro. Si a las medias de estas 100 muestras las organizamos en una tabla de distribución de frecuencias para luego graficarlas mediante un Histograma de frecuencias relativas podríamos sacar algunas conclusiones.

En este caso las

se convierten en variables aleatorias.

Recordemos que en distintas muestras aleatorias simples se obtuvieron valores diferentes para cada media muestral , como cada variable aleatoria puede tener muchos valores, suele ser de interés conocer la media de todos los valores de que se obtiene con las diferentes muestras aleatorias. A la media de la variable aleatoria se conoce como valor esperado de cuya notación es: E( ) = μ la cual se nos indica que: “Se espera que el valor esperado de sea igual a la media poblacional μ”

133 La varianza de la media muestral : NOTA:  En el caso de que la población sea finita la varianza estará dada por:  A la desviación estándar de la media muestral también se le conoce como error estándar. Es de hecho que cada característica acerca de la media muestral merece una demostración, pero para facilitar el análisis mostraremos un ejemplo donde se pueda verificar lo planteado. Ejemplo: Se tiene registro del número de meses que dura una llanta de bicicleta hasta antes de su primera refacción a cinco niños (N=5).

Por lo tanto tenemos la DISTRIBUCIÓN DE MUESTREO DE

Donde:  : varianza poblacional.  n : tamaño de la muestra.  N : tamaño de la población. Los resultados anteriores respecto al valor esperado y la varianza en la distribución de muestreo de son aplicables a cualquier población. Lo que queda ahora es identificar las características de la distribución de muestreo, para ello consideraremos dos casos.

134  La población tiene distribución normal En muchas situaciones es razonable suponer que la población de la que se selecciona la muestra aleatoria simple tiene una distribución normal o casi normal. Cuando esto ocurre, la distribución de muestreo de está distribuida normalmente cualquiera que sea el tamaño de la muestra. 

La población NO tiene distribución normal

Cuando la población de la que se tomó la muestra aleatoria simple no tiene distribución normal, el teorema del límite central ayuda a determinar la forma de la distribución de muestreo de . TEOREMA DE LÍMITE CENTRAL Cuando se selecciona una muestra aleatoria simple de tamaño n de una población, la distribución de muestreo de la media muestral puede aproximarse a una distribución normal a medida que el tamaño de la muestra se hace grande (n ≥ 30).

Que para fines prácticos también podría decirse que distribución normal estándar.

cuando (n → ∞) tiende a una

Ejemplo: En Lima el precio promedio del kilo de arroz es de S/. 3,2 con una desviación estándar de S/. 0,4. Si se selecciona una muestra de 100 tiendas comercializadoras de arroz. ¿Cuál es la probabilidad de que el precio medio muestral del arroz sea menor a S/. 3,3?

135 EJERCICIOS 1.- En una muestra de 25 observaciones a partir de una distribución normal con media 98.6 y desviación estándar 17.2, a) Determine el valor de P ( < 95) b) Calcule P (92< 100)

136 2.- Sofía Lerner, auditora de una compañía de tarjetas de crédito, sabe que el saldo promedio mensual de un cliente dado es S/. 152 y la desviación estándar de S/. 66. Si Sofía audita 50 cuentas seleccionadas al azar, encuentre la probabilidad de que el saldo promedio mensual de la muestra sea a) Menor que S/. 140 b) Entre S/. 150 y S/. 160

3.- El costo promedio de un departamento, según una revista inmobiliaria, es de $ 58 000 con una desviación estándar de $ 4 800. ¿Cuál es la probabilidad de que un departamento elegido al azar cueste igual o menos de $ 60 000?

137 4.- En una distribución normal con media de 375 y desviación estándar de 48, ¿de qué tamaño debe tomarse una muestra para que la probabilidad sea un 0.95 de que la media de la muestra caiga entre 370 y 380?

138

ESTIMACIÓN CONCEPTOS PREVIOS  



POBLACIÓN.- Es un conjunto de datos que consta de todas las observaciones concebibles (o hipotéticamente) posibles de un fenómeno determinado. MUESTRA.- Es un subconjunto de individuos extraídos de la población con el fin de inferir mediante su estudio, características de la población.

PARÁMETRO

Son todas aquellas medidas que describen numéricamente las características de una población. También se les denomina valor verdadero, ya que una característica poblacional tendrá un solo valor del parámetro. Sin embargo una población puede tener varias características y, por tanto, varios parámetros.

Ejemplo:

139

Numerosas situaciones requieren información sobre un grupo grande de elementos (personas, empresas, votantes, familias, productos, clientes, etc.), pero por razones de tiempo, costos y otras consideraciones solo se puede recabar datos de una pequeña porción del conjunto, es decir una muestra. La razón por la que se selecciona una muestra estriba en recabar datos para realizar una inferencia y responder una pregunta de investigación acerca de una población. 

ESTADÍGRAFOS O ESTADÍSTICO MUESTRAL

Es aquella descripción numérica de una característica correspondiente a los elementos de una muestra. De una población se pueden obtener M números de muestra posibles y en cada una de ellas se puede cuantificar la característica, obteniéndose por lo general valores diferentes para cada muestra. ESTIMADOR PUNTUAL Un estimador puntual es el valor numérico de un estadístico muestral que se usa para estimar el valor de un parámetro de una población o proceso. Una de las características más importantes de un buen estimador es que sea insesgado, es decir, que el valor esperado es igual al valor del parámetro que se está estimando.

Por ejemplo; Como se tiene la información de todos los alumnos del aula, podemos seleccionar a ocho estudiantes (muestra de tamaño 8) de forma aleatoria, de esta manera calcular el estimador puntual de la media y la proporción poblacional.

140 El estimador de la media poblacional μ es ……….

os damos cuenta que estos valores difieren.

Siempre que se seleccione una muestra aleatoria simple y se use el valor de la media muestral para estimar el valor de la media poblacional μ, no se podrá esperar que la media muestral sea exactamente igual a la media poblacional. La razón práctica por la que interesa la distribución de muestreo de estriba en que se puede usar para proporcionar información probabilística acerca de la diferencia entre la media muestral y la media poblacional. Nos podemos dar cuenta que existe una relación entre el tamaño de la muestra y la distribución de muestreo de . Observamos que E( ) = μ es independientemente del tamaño de la muestra, entonces la media de todos los valores posibles de es igual a la media poblacional μ independientemente del tamaño de la muestra n. No obstante, el error estándar de la media , está relacionado con la raíz cuadrada del tamaño de la muestra. Siempre que este tamaño aumente el error estándar de la media disminuirá. ESTIMACIÓN POR INTERVALOS Hasta ahora sabemos que un estimador puntual es un estadístico muestral que se usa para estimar un parámetro poblacional. Como no se puede esperar que dicho estadístico muestral suministre el valor exacto del parámetro poblacional, se suele calcular una estimación por intervalo al sumar y restar a la estimación puntual una cantidad conocida como margen de error. La forma general de una estimación por intervalo es:

El objetivo de la estimación por intervalo es aportar información sobre qué tan cerca se encuentra la estimación puntual obtenida de la muestra, del valor del parámetro poblacional.  ESTIMACIÓN POR INTERVALOS PARA LA MEDIA POBLACIONAL Para obtener una estimación por intervalo para la media poblacional se necesita la desviación estándar poblacional σ o la desviación estándar muestral s a efecto de calcular el margen de error. En la mayoría de los casos no se conoce σ, y para calcular el margen de error se calcula s. 

CASO 1: CUANDO σ ES CONOCIDA

En el ejemplo que estamos desarrollando, conocemos σ, por lo tanto se tiene . Es posible saber la distribución de muestreo de la media muestral de las estaturas de los alumnos para una muestra de ocho estudiantes.

141

Observación En la tabla de probabilidad normal estándar se encuentra que 95% de los valores de cualquier variable aleatoria distribuida normalmente aparecen dentro del ± 1.96 desviación estándar de la media. Para nuestro ejemplo

INTERPRETACIÓN DE UNA ESTIMACIÓN POR INTERVALO o o

Si se obtuvieran 100 intervalos de la forma a la media μ. Se tiene 95% de confianza que los

95 de estos contendrían intervalos contengan a μ.

142

Tabla distribución normal estándar

Para ilustrar lo explicado volvamos a nuestro ejemplo.

143 DETERMINACIÓN DEL TAMAÑO DE LA MUESTRA Si se desea elegir un tamaño suficientemente grande para obtener un margen de error deseado, usaremos la estimación por intervalo dada anteriormente

Donde:

es el margen de error deseado.

Por lo tanto el tamaño de la muestra será:

Ejemplo Halle el tamaño de muestra para un nivel de confianza de 90% y margen de error de ____



CASO 2: CUANDO σ NO ES CONOCIDA

Cuando se calcula una estimación por intervalo para la media poblacional, a veces no se cuenta con el valor de la desviación estándar poblacional o no se puede hallar un buen estimador de ésta, entonces se utiliza s para estimar σ. El margen de error y la estimación por intervalo de la media poblacional se basan en una distribución de probabilidad conocida como distribución t.

144 Para ilustrar lo explicado volvamos a nuestro ejemplo

 ESTIMACIÓN POR INTERVALO PARA LA DIFERENCIA DE DOS MEDIAS POBLACIONALES En muchas investigaciones, en el análisis inferencial estadístico nos interesa efectuar comparaciones entre los valores promedios de poblaciones con distribución normal y varianza conocida.

Para luego verificar mediante la información muestral correspondiente, si puede ocurrir una de las siguientes situaciones:

Para ello es necesario construir intervalos de confianza para la diferencia de medias Siendo:

y

las medias muestrales de tamaño

Donde:

Para nuestro ejemplo:

y

de cada población respectivamente.

145 ¿Se podría decir que ambas poblaciones tienen en promedio la misma estatura, para un nivel de confianza del 99%?

146 EJERCICIOS 1.- Se toma una muestra de 49 observaciones de una población normal con una desviación estándar poblacional de 10. La media de la muestra es de 55. Determine el intervalo de confianza de 99% para la media poblacional.

2.- Se toma una muestra de 81 observaciones de una población normal con una desviación estándar poblacional de 5. La media de la muestra es de 40. Determine el intervalo de confianza de 95% para la media poblacional.

147 3.- Se desea estimar la media del tiempo empleado por un nadador en una prueba olímpica, para lo cual se cronometran 10 pruebas, obteniéndose una media de 41,5 minutos. Sabiendo por otras pruebas que la desviación típica poblacional de esta variable para este nadador es de 0,3 minutos, obtener un intervalo de confianza con un 95% de confianza. ¿Cuántas pruebas habría que cronometrar para que el margen de error en la estimación de la media fuese tres segundos. (Suponemos siempre que la variable que mide el tiempo del nadador sigue una distribución normal.)

4.- Un estudiante de administración pública desea determinar la cantidad media que gana al mes los miembros de los concejos ciudadanos de las grandes ciudades. El error (o margen de error) al calcular la media debe ser inferior a S/. 100, con un nivel de confianza de 95% y además a partir de un informe del Ministerio de Trabajo el estudiante encontró que la desviación estándar es de S/. 1000. a.- ¿Cuál es el tamaño de muestra que se requiere? b.- Si el estudiante incrementar el nivel de confianza al 99% ¿cuánto sería el tamaño de muestra?

148 5.- El propietario de AVINCA desea calcular la cantidad media de huevos que pone cada gallina. Una muestra de 25 gallinas indica que ponen un promedio de 20 huevos al mes, con una desviación estándar de 2 huevos al mes. a. Construya un intervalo de confianza del 95% para la medio poblacional. b. ¿Es razonable concluir que la media poblacional es de 22 huevos? ¿Y de 27 huevos?

6.- La empresa COSTA S.A. contempla ofrecer un servicio de guardería para sus empleados. Como parte del estudio de la viabilidad del proyecto, desean calcular el costo medio semanal por el cuidado de niños de los empleados. Una muestra de 10 empleados que recurren al servicio de guardería revela las siguientes cantidades gastadas la semana pasada (en nuevos soles). 92 108 100 96 120 98 99 80 104 102 Construya un intervalo de confianza de 90% para la media poblacional.

149 7.- El salario medio semanal en una muestra de n=30 empleados de una empresa grande es $280 y la desviación estándar muestral es $14. En otra empresa grande en una muestra aleatoria de n=40 empleados el salario medio semanal es $270 y la desviación estándar muestral es $10. Construya el intervalo de estimación para diferencia entre los niveles de los salarios medios semanales en las dos empresas con un nivel de confianza de 95%.

8.- Un fabricante de ordenadores está desarrollando un nuevo modelo de monitor, para lo cual puede utilizar dos tipos de esquemas transistorizados. El fabricante selecciona una muestra de esquema transistorizados del primer tipo, de tamaño 12, y otra del segundo de tamaño 11. Los datos muestrales respecto a la vida de cada esquema son los siguientes:

Determine el intervalo de confianza de la diferencia de medias al 95%.

150 9.- Una muestra aleatoria de 50 familias de la comunidad A tiene un ingreso medio familiar de $44 600 y la desviación estándar es s = $2200. Una muestra aleatoria de 50 familias de la comunidad B tiene un ingreso medio familiar de $43 800 y la desviación estándar es s = $2800. Estime la diferencia entre los ingresos medios familiares de las dos comunidades mediante un intervalo de 90% de confianza.

151  PROPORCIÓN POBLACIONAL Para la estimación por intervalo de la proporción poblacional p, se usará: La distribución de

se aproxima mediante una distribución normal siempre que:

La media de la distribución de muestreo de de es:

es la proporción poblacional p, la desviación estándar

Para calcular el margen de error no se puede usar directamente ya que no se conoce p, pues es lo que estamos tratando de estimar. Lo que se hace es sustituir p por de esta forma el margen de error será:

152 Para nuestro ejemplo Conocemos p = , pero nuestro tamaño de muestra es muy pequeño n=8, imaginemos un tamaño de muestra más grande n = 15 y que = Con esta información se podría construir un intervalo de estimación para la proporción poblacional, con un nivel de confianza de 90%.

 ESTIMACIÓN POR INTERVALO PARA LA DIFERENCIA DE PROPORCIONES POBLACIONALES Sea la proporción poblacional 1 y sea de y estimador de .

la proporción poblacional 2, además

es un estimador

Si se desea construir una estimación por intervalo para la diferencia de proporciones, los tamaños de muestra deben ser suficientemente grandes para que

sean todos mayores o iguales que 5, de esa manera la distribución de muestreo de aproximada por una distribución normal. Donde el margen de error es:

-

puede ser

153 Donde:

Para nuestro ejemplo:

¿Se podría decir que ambas poblaciones tienen la misma proporción de alumnos procedentes de colegios particulares, para un nivel de confianza del 95%?

154 EJERCICIOS 1.- Una empresa de investigación de mercado establece contacto con una muestra aleatoria de 100 hombres de una comunidad muy grande y encuentra que una proporción muestral de 0.40 prefiere las hojas de afeitar fabricada por la empresa cliente que a las otras marcas. Construir un intervalo de estimación para la proporción de los hombres que prefieren la hoja de afeitar del cliente, para un nivel de confianza del 99%.

2.- El director académico de la facultad de administración reúne una muestra aleatoria a nivel nacional, datos de 250 estudiantes inscritos en programas de maestría en administración de negocios, y encuentra que 54 de ellos tiene licenciatura en negocios. Estime la proporción en la población a nivel nacional de estos estudiantes que tienen licenciatura en negocios, use un intervalo de 95% de confianza.

155 3.- En una muestra aleatoria de 500 familias que tienen televisores en una cierta ciudad, se encuentra que 340 están suscritas a un cierto canal de cable. Encuentre un intervalo de confianza de 99% para la proporción real de familias en esta ciudad suscritas al canal de cable. Determine también el tamaño de muestra necesario si queremos tener una confianza de al menos 90% de que nuestra estimación de p esta dentro de 0.02 (margen de error) asumiendo la muestra anterior como una muestra preliminar que nos proporciona una primera estimación de p.

4.- Una empresa que se dedica a elaborar declaraciones de impuestos desea comprobar la calidad del trabajo que se realiza en dos de sus oficinas regionales. Con muestras aleatorias de declaraciones de impuestos elaboradas en dichas oficinas y verificando la exactitud de los reportes, la empresa podrá estimar la proporción de declaraciones con errores en que incurrió cada una de estas oficinas. Para ello se selecciona una muestra y se obtienen los siguientes datos.

Obtenga un intervalo de poblacionales.

90% de confianza para la diferencia entre las dos proporciones

156 5.- En una prueba de calidad de dos comerciales en televisión, cada anuncio se transmitió en aéreas separadas de prueba, seis veces en una semana. A la semana siguiente se realizó una encuesta telefónica para identificar a individuos que vieron los comerciales. A estas personas se les pidió su opinión sobre cuál era el principal mensaje de los anuncios. Se obtuvieron los siguientes resultados.

Obtenga un intervalo de poblacionales.

95% de confianza para la diferencia entre las dos proporciones

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF