Apuntes de probabilidad y estadística

April 7, 2017 | Author: Maru Ruiz Ramirez | Category: N/A
Share Embed Donate


Short Description

Download Apuntes de probabilidad y estadística...

Description

qwertyuiopasdfghjklzxcvbnmqwerty uiopasdfghjklzxcvbnmqwertyuiopasd fghjklzxcvbnmqwertyuiopasdfghjklzx APUNTES cvbnmqwertyuiopasdfghjklzxcvbnmq PROBABILIDAD Y ESTADÍSTICA ESIME ZACANTENCO wertyuiopasdfghjklzxcvbnmqwertyui opasdfghjklzxcvbnmqwertyuiopasdfg hjklzxcvbnmqwertyuiopasdfghjklzxc vbnmqwertyuiopasdfghjklzxcvbnmq wertyuiopasdfghjklzxcvbnmqwertyui opasdfghjklzxcvbnmqwertyuiopasdfg hjklzxcvbnmqwertyuiopasdfghjklzxc vbnmqwertyuiopasdfghjklzxcvbnmq wertyuiopasdfghjklzxcvbnmqwertyui opasdfghjklzxcvbnmqwertyuiopasdfg hjklzxcvbnmrtyuiopasdfghjklzxcvbn mqwertyuiopasdfghjklzxcvbnmqwert yuiopasdfghjklzxcvbnmqwertyuiopas dfghjklzxcvbnmqwertyuiopasdfghjklz xcvbnmqwertyuiopasdfghjklzxcvbnm qwertyuiopasdfghjklzxcvbnmqwerty Página 1 de 190

Francisco Muñoz Apreza, Juan Alfaro Yllescas, Genoveva Barrera Godínez, Rosa María Estrella Montoya.

MODULO I ESTADÍSTICA DESCRIPTIVA Y MUESTREO Esta Modulo I está diseñado para que el alumno comprenda los fundamentos y aplicaciones de la Estadística descriptiva. Se abordarán los temas en dos vertientes; la primera a partir de los fundamentos teóricos y aplicaciones y la segunda mediante un Muestreo por encuestas.

TEMARIO 1.Características del muestreo Levantamiento de la encuesta Uso del SPSS 17 para la elaboración de las tablas de frecuencia 2.-

Tabla de Frecuencia 2.1 Teoría Elemental 2.2 Frecuencias Acumuladas 2.3 Frecuencias Relativas 2.4 Ejemplos 2.5 Ejercicios

3.-

Representación gráfica de las Tablas de Frecuencias 3.1 Teoría Elemental 3.2 Gráficas e Histogramas 3.3 Ejemplo 3.4 Ejercicio

4.-

Medidas de Tendencia Central 4.1 Teoría Elemental 4.2 Moda 4.3 Media 4.4 Mediana 4.5 Media geométrica 4.6 Ejemplo 4.7 Ejercicios

5.-

Medidas de Tendencia Central con Datos Agrupados 5.1 Teoría Elemental 5.2 Ejemplo 5.3 Ejercicios

6.-

Medidas de Dispersión 6.1 Teoría Elemental 6.2 Cuartiles 6.3 Porcentiles 6.4 Varianza 6.5 Desviación Estándar 6.6 Ejemplo 6.7 Ejercicios

2.- Tablas de Frecuencia

2

Teoría Elemental

Definición de tabla de Frecuencia: Una tabla de frecuencia es el conjunto de datos organizados con base en la información contenida en una muestra. Definición de frecuencia relativa: La frecuencia Relativa fi/n : es una frecuencia particular entre el número total de observaciones. Definición de escala ordinal. Una escala Ordinal: es aquella escala representada por valores numéricos Ejemplo: {1, 2. 3.....}; < 1, 5, >,. Definición de escala nominal Una escala Nomina: es aquella escala representada por valores no numéricos Ejemplo < masculino, femenino >. Determinación del tamaño del intervalo: La fijación de este tamaño dependerá de las necesidades del investigador, puede ser todos del mismo tamaño o de tamaños desiguales.

Determinación del número de intervalos de clase: A medida que el número de intervalos de clase disminuye, la información es menos precisa pero su tratamiento analítico es mayor. El número de intervalos se sugiere que sea entre 5 y 15 dependiendo de las necesidades de investigador. Definición Límite superior e inferior: son los existentes en un intervalo de clase < límite inferior, límite superior >. Frecuencia acumulada: Para elaborar este tipo de tabla se van sumando las frecuencias de cada una de los intervalos de clase. Su utilidad consiste en que podemos conocer el comportamiento del proceso estadístico de los intervalos de clase con respecto a la primera variable.. En los intervalos de clase, por ejemplo ( 13 a 15 ) del cuadro del ejemplo que se desarrolla, el 13 representa el límite inferior y el 15 el límite superior. En el cuadro del siguiente ejemplo el investigador organizó su información en 7 intervalos de clase sacrificando precisión en la información pero ganó claridad analítica en ella.

Ejemplo 3

Tamaño de la muestra 812 Edad a que entró a Trabajar Edad 9 – 12 13 - 15 16 – 17 18 – 20 21 – 25 26 en adelante No contestó Total

Frecuencia 72 153 190 313 45 9 30 812

Al analizar el cuadro 4, observamos que los datos están agrupados por intervalos de clase ordinal, de conformidad con la necesidad que el investigador tiene de conocer parámetros que le permitan inferir acerca del trabajo infantil ( 9 a 12 ), la pubertad (13 a 15 ) y la adolescencia (18 a 20 ) y la juventud teniendo un intervalo mixto y uno nominal . Tabla de frecuencia acumulada Al elaborar una tabla de frecuencia acumulada del cuadro 4 se van sumando las frecuencias de cada uno de los intervalos. Ahí la utilidad para el investigador consiste en que puede conocer en cada uno de los intervalos el comportamiento total. Detecta en particular que 225 trabajadores se iniciaron en el trabajo asalariado entre los 9 y 15 años de edad.

Tamaño de la muestra 782 Inicia labor de asalariado Clase 9 – 12 9 - 15 9 – 17 9 – 20 9 – 25 9 ó 26 en adelante No contestó Total

Frecuencia Acumulada 72 225 415 728 773 782 782

Tablas de frecuencia relativa La utilidad para el investigador de representar sus datos mediante una tabla de frecuencias relativas, consiste en que ésta da claridad sobre el comportamiento de cada intervalo de clase respecto al total. De tal forma si se desea conocer el peso que tiene en la rama del vidrio en los trabajadores que iniciaron una actividad remunerada en la época de la adolescencia vemos que representa el 38.54 %.

Tamaño de la muestra 812 Inicio en labores asalariadas

4

Clase 9 – 12 13 – 15 16 – 17 18 – 20 21 – 25 26 en adelante No contestó Total

Frecuencia 8.8 18.84 23.39 38.54 5.54 1.1 3.7 100.00

Cuadro 1 Tamaño de la muestra 812 Edad Edad Frecuencia 0 – 17 12 18 – 20 60 21 – 25 143 26 – 30 171 31 - 35 148 36 – 40 137 41 – 45 61 46 - 50 52 51 - 55 21 55 o más 5 No contestó 2 Total 812

CUADRO 2 Tamaño de la Muestra 812 Sexo Frecuencia Masculino 712 Femenino 67 No Contestó 33 Total 812

CUADRO 3 Tamaño de la Muestra 812 Estado Civil Frecuencia Soltero 206 Casado 544 Viudo 13 Divorciado 15 Unión Libre 28 No Contestó 6 Total 812

Ejercicios del Tema I 1.- ¿Qué utilidad tendría utilizar la frecuencia acumulada en los cuadros 1, 2 y 3 ?. 5

2.- ¿Qué utilidad tendría utilizar la frecuencia relativa en los cuadros 1, 2 y 3 ?. 3.- ¿Qué ventajas tiene el utilizar frecuencias de amplitud total en los cuadros 1, 2 y 3. 4.- ¿Tiene sentido la frecuencia de amplitud total en los cuadros 1, 2 y 3?. ¿En cuáles no tiene sentido plantear intervalos de clase?.

TEMA II

El visualizar el comportamiento de los datos de las tablas de frecuencia mediante diagramas de barras, gráficas de líneas, diagramas circulares, polígonos de frecuencia rinden beneficios analíticos al investigador

GRÁFICA Tipo I

GRÁFICA Tipo 2

GRÁFICA Tipo 3

El utilizar una u otra representación visual va a ser importante en la medida que describa a la información con mayor claridad y facilite la interpretación.

6

Se debe tener cuidado con la escala con las cuales elaboren las gráficas; si se usa una escala errónea el gráfico arrojará una falsa idea en su comportamiento.

Ejemplo (Tema II) Cuadro 5 Salario Semanal Clase Frecuencia Hasta 125 31 125 – 250 194 251 – 375 224 376 – 500 123 510 ó más 240 No contestó 0 Total 812

La presentación de los intervalos de clase en el salario semanal esta dada en combinación ordinal y nominal < hasta 125 >, < 501 ó más >. En el polígono de frecuencia podemos deducir que la mayor concentración de los trabajadores se localiza en los niveles salariales de 4 salarios mínimos ó más. Además de peso de los trabajadores que perciben hasta un salarios mínimo prácticamente inexistente. Cuadro 6

Años 0– 1 2– 5 6 – 10 11 – 15 16 – 20 21 – 25 26 – 29 300 ó más Total

Antigüedad Frecuencia 143 290 183 86 56 35 12 7 812

Ejercicios (Tema II) 1.- Elabore la gráfica del cuadro 6. 2.- ¿Qué tipo de escalas se utilizan en el cuadro 6?. 3.- ¿Qué ventajas le ve usted a elaborar una tabla de frecuencias acumuladas en el cuadro 6?. 4.- ¿Qué análisis se desprende de la gráfica del cuadro 6?.

Medidas de tendencia central

7

Las medidas de ubicación proporcionan información sobre el lugar hacia donde existe la tendencia central dentro de un grupo de números. Las medidas de ubicación presentadas en esta unidad para datos no agrupados son la media, la mediana, y la moda. Media: La media aritmética (o el promedio, media simple) es calculada sumando todos los números de un conjunto de números (xi) y después dividiéndolos por el número de observaciones (n) del conjunto. Media =

= Xi /n,

La media utiliza todas las observaciones, y cada observación afecta la media. Aunque la media es sensible a los valores extremos; es decir, los datos extremadamente grandes o pequeños pueden causar que la media se ubique o más cerca de uno de los datos extremos; A pesar de esto, la media sigue siendo la medida lo más usada para medir la localización. Esto se debe a que la media posee valiosas propiedades matemáticas que la hacen conveniente para el uso en el análisis estadístico de inferencia o deductivo. Media Ponderada: en algunos casos, los datos de una muestra o población no deberían ser ponderados de la misma manera, es preferible ponderarlos de acuerdo a su importancia. Mediana: La mediana es el valor medio de una grupo ordenado de observaciones. Si existe un número par de observaciones correspondientes al grupo podrían haber dos medianas La mediana es normalmente utilizada para resumir los resultados de una distribución. Si la distribución es sesgada , la mediana es un buen indicador de medida para saber donde los datos observados se encuentran concentrados. Generalmente, la mediana proporciona una mejor medida que la media cuando las observaciones son extremadamente grandes o pequeñas La media tiene dos ventajas distintas sobre la mediana. Es más estable, y uno puede calcular la media basada de dos muestras combinando las dos medios de las mismas. Moda: La moda es el valor lo más con frecuencia posible que ocurre de un sistema de observaciones. Los datos pueden tener dos modas. En este caso, decimos que los datos son bimodales, y los grupos de observaciones con más de dos modos están referidos como multimodales. Observe que la moda no es una medida útil de ubicación, porque puede haber más de una moda o quizás ninguna. Características de la Moda, Mediana y Media Hechos

8

Moda

Mediana

Media

1

Es el valor mas frecuente en la distribución. Es el punto de más alta densidad.

Es el valor del punto medio de la selección (no del rango), tal que la mitad de los datos están por arriba y por debajo de ella.

Es el valor en algún agregado, el cual se obtendría si todos los valores fueran iguales.

2

Su valor es establecido por la frecuencia predominante, no por los valores en la distribución.

El valor de la media es fijado por su posición en la selección, y no refleja valores individuales.

La suma de las desviaciones en cualquier lado de la media son iguales; por lo tanto la suma algebraica de sus desviaciones es cero.

3

La distancia agregada Este es el valor mas entre la mediana y Esta refleja la magnitud de probable, por lo tanto el cualquier otro punto de cada valor. mas común. la muestra es menor que

en cualquier otro punto.

4

Una distribución puede tener mas de 2 modas, Cada selección tiene pero no existe moda en solo una mediana. una distribución rectangular.

5

No puede ser manipulada algebraicamente. Modas de subgrupos no pueden ser ponderadas o combinadas.

6

Es estable en cuanto a Es inestable, puede ser que procedimientos para influenciada en el agrupar no afecta su proceso de agrupación. apreciación.

Es estable en cuanto a que procedimientos para agrupar no afecta su apreciación.

7

La moda no refleja el grado de modalidad.

Podría ser calcula igualmente cuando los valores individuales son desconocidos, si se posee la suma de los valores y el tamaño de la muestra.

8

Puede ser calculada Puede ser calculado cuando los extremos de cuando los valores los valores de los extremos son abiertos. grupos son abiertos.

No puede ser calculado de una tabla de frecuencia cuando sus valores extremos son abiertos.

9

Valores deben ser ordenados para su cálculo.

Los valores no necesitan ser ordenados para su cálculo.

No puede ser manipulada algebraicamente. Medianas de subgrupos no pueden ser ponderadas o combinadas.

No es aplicable para datos cualitativos.

Valores deben ser ordenados y agrupados para su cálculo.

Una muestra tiene solo una media.

Pueden ser manipuladas algebraicamente. Medias de subgrupos pueden ser combinadas cuando son ponderadas apropiadamente.

La Media Geométrica: La media geométrica (G) de n valores no negativos es la enésima raíz del producto de los n valores. Si algunos valores son muy grandes en magnitud y otros muy pequeños, la media geométrica proporciona una mejor representación de los datos que un simple promedio. La Media Armónica: H = n/[

(1/x(i)].

La media armónica es útil para calcular promedios de variables expresadas en proporciones de unidades por tiempo. Histogramas: Analizando la Homogeneidad de la Población Un histograma es una representación gráfica de una estimación para la densidad (para variables aleatorias continuas) o la función de probabilidad total (para variables aleatorias discretas) de la población. Las características geométricas del histograma nos permiten descubrir información útil sobre los datos, por ejemplo: 1. La localización del “centro” de los datos. 9

2. El grado de dispersión. 3. La sección a la cual se sesga, es decir, cuando no cae simétricamente en ambos lados del pico. 4. El grado de agudeza del pico. Cómo se levanta y baja la pendiente. Las medidas de variación más comunes son: varianza, desviación estándar, y el coeficiente de variación. Cuartiles: Cuando requerimos sean divididos en cuartos, Q1... Q4, conocidos como cuartiles. El primer cuartíl (Q1) es el valor donde están 25% de los valores mas pequeños y en el otro 75% los más grandes. El segundo cuartíl (Q2) es el valor donde están 50% de los valores mas pequeños y en el otro 50% los más grandes. En el tercer cuartíl (Q3) es el valor donde están 75% de los valores mas pequeños y en el otro 25% los más grandes. Porcentajes: Los porcentajes tienen la ventaja que pueden ser subdivididos en 100 porciones. Los porcentajes y los cuartiles son más convenientes de leer cuando son tomados de una función de distribución acumulativa. Varianza: Es una importante medida de variabilidad. La varianza es el promedio de las desviaciones estándar elevadas al cuadrado de cada una de las observaciones con respecto a la media. Var(x) = (xi -

2

) / (n - 1),

de donde n por lo menos es igual a 2.

La varianza es una medida de dispersión entre valores de los datos. Por lo tanto, mientras más grande sea la varianza, menor será la calidad de los datos. Desviación Estándar: Ambas, la varianza y la desviación estándar proporcionan la misma información; una siempre puede ser obtenida de la otra . Es decir, el proceso de cálculo de la desviación estándar siempre implica el cálculo de la varianza. Puesto que la desviación estándar es la raíz cuadrada de la varianza, esta siempre es expresada en las mismas unidades que el conjunto de datos: Desviación estándar=  = (Varianza)

½

Coeficiente de Variación: El coeficiente de variación (CV) es la desviación relativa absoluta con respecto al tamaño , siempre que sea cero, expresado en porcentaje: CV =100 |S/ | % El CV es independiente de las unidades de medida. En la estimación de un parámetro, cuando su CV es menos del 10%, la estimación se asume aceptable. En el caso contrario, digamos, 1/CV se llama el Cociente de señal de ruido. El coeficiente de variación se utiliza para representar la relación de la desviación estándar hacia la media, diciendo cuan representativa es la media de los números de los cuales fue calculada. Esta expresa la desviación estándar como porcentaje de la media; es decir, refleja la variación de una distribución con respecto a la media. Sin embargo, los intervalos de la confianza para el coeficiente de variación generalmente no son expresados. Una de las razones es que el cálculo exacto del intervalo de confianza para el coeficiente de variación es tedioso de obtener.

10

Observe que, para un conjunto de datos agrupados o sesgados, el coeficiente de variación cuartíl es: VQ = 100(Q3 - Q1)/(Q3 + Q1)% es mas útil que el CV. Cociente de Variación para Datos Cualitativos: Puesto que la moda es la medida mas usada para la tendencia central de variables cualitativas, la variabilidad es medida con respecto a la moda. El estadístico que describe la variabilidad de datos cuantitativos es el cociente de variación (VR): VR = 1 - fm/n, de donde fm es la frecuencia de la moda, y n es el número total de cálculos en la distribución. Cálculo de Estadísticos Descriptivos para Datos Agrupados: Una de las maneras más comunes de describir una sola variable es con una distribución de frecuencia. Un histograma es una representación gráfica de una estimación para la distribución de frecuencia de la población. Dependiendo de las variables particulares, todos los valores de los datos podrían ser representados, o se podrían agrupar los valores primero por categorías . Generalmente, no sería sensible determinar las frecuencias para cada valor. Preferiblemente, los valores deberían ser agrupados en rangos, y luego determinar la frecuencia. Las distribuciones de frecuencia se pueden representar de dos maneras: como tablas o como gráficos, los cuales a menudo se refieren a histogramas o gráfico de barras. Los gráficos de barras son normalmente utilizados para mostrar la relación entre dos variables categóricas. Los datos agrupados son derivados de informaciones ordinarias, y consisten en frecuencias (cálculo de valores ordinarios) tabulados con las clases en las cuales ocurren. Los límites de las clases representan los valores más pequeños (inferiores) y más grandes (superior) que la clase contendrá. Las fórmulas para los estadísticos descriptivos son mucho más simples para los datos agrupados, así como se muestra en las siguientes formulas para la media, varianza, y la desviación estándar, respectivamente, de donde f representa la frecuencia de cada clase, y n es la frecuencia total:

Seleccionando entre Desviación Cuartíl, Media de Desviación Absoluta y Desviación Estándar Una guía general para seleccionar el estadístico adecuado para describir la dispersión de la población, incluye la consideración de los siguientes factores: 1. El concepto de dispersión que el problema requiere. ¿Es un simple par de valores adecuado, tal como los dos extremos o los dos cuartiles (rango o Q)? 2. El tipo de datos disponibles. Si son pocos en números, o contiene valores extremos, evite la desviación estándar. Si se encuentran sesgados, evite la

11

media de desviación absoluta. Si existen brechas entre los cuartiles, la desviación cuartíl se debería evitar. 3. La peculiaridad de la dispersión que los mide. Estos son resumidos en el cuadro de “las Características Principales de la Desviación Cuartíl, la Media de Desviación Absoluta y la Desviación Estándar”, que se muestra a continuación. Características Principales de la Desviación Cuartíl, la Media de Desviación Absoluta y la Desviación Estándar La Desviación Cuartíl

La Media de Desviación Absoluta

La Desviación Estándar

La desviación cuartíl es fácil de calcular y entender. Sin embargo, esta es inconsistente si existen brechas entre los datos alrededor de los cuartiles.

La Media de Desviación Absoluta tiene la ventaja de dar igual peso a la desviación de cada valor con respecto a la media o la mediana.

La Desviación Estándar es normalmente mas útil y mejor adaptable a análisis mas profundos que lo que es La Media de Desviación Absoluta.

2

Solo depende de dos valores, los cuales incluyen la mitad central de los mismos.

Es una medida de dispersión más sensitiva que cualquiera de las descritas anteriormente, y normalmente tiene errores de muestreo más pequeños.

Es más adaptable como estimador de la dispersión de la población que cualquier otra medición, haciendo que la distribución sea normal.

3

Es más fácil de calcular y Es normalmente superior entender, además es al rango como una menos sensible que la medida cruda de desviación estándar a dispersión. valores extremos.

Es la más amplia medida de dispersión usada, y la más fácil de manejar algebraicamente.

4

Esta podría ser determinada en una distribución abierta en los extremos, o en una en la cual los datos pueden ser seleccionados pero no medidos cuantitativamente.

Desafortunadamente, es muy difícil de manejar algebraicamente, dado que el signo negativo debe ser ignorado cuando se calcula.

En comparación con los demás, esta es mas difícil de calcular y de entender.

5

Es muy útil en distribuciones muy sesgadas, o en aquellas en las cuales otras medidas de dispersión serian deformadas por valores extremos.

Su aplicación principal es la precisa elección de modelos en técnicas de predicciones comparativas.

Es normalmente afectada por valores extremos, los cuales podrían ocasionar el sesgamiento de los datos.

Hechos

1

Muestreo

12

Al tomar una cantidad de elementos de una población para poder contar con criterios de decisión, estamos tomando una muestra de ella. Del tamaño de la población (N) se pueden extraer varias muestras. Un cierto estadístico puede ser calculado para cada una de las muestras posibles extraídas de la población. Una distribución del estadístico obtenida de esta manera es llamada la distribución del estadístico.

En estadística un muestreo es la técnica para la selección de una muestra a partir de una población. Terminología para el muestreo Los términos usados en inferencia estadística son: Estadístico: medida usada para describir alguna característica de una muestra aritmética, mediana. desviación estándar)

(media

Parámetro: representación del estadístico. Los símbolos usados para representar los estadísticos y los parámetros, en éste y los siguientes capítulos, son resumidos en la tabla siguiente: Tabla 1

Medida Media Desviación estándar Número de elementos Proporción

Símbolo para el estadístico X S N P

Símbolo para el parámetro µ s N P

Al elegir una muestra, se espera que sus propiedades sean extrapolables a la población. Este proceso permite ahorrar recursos, obteniendo resultados parecidos que si se realizase un estudio de toda la población. Cabe mencionar que para que el muestreo sea válido y se pueda realizar un estudio fiable (que represente a la población), debe cumplir ciertos requisitos, lo que lo convertiría en una muestra representativa. En el muestreo, si el tamaño de la muestra es más pequeño que el tamaño de la población, se puede extraer dos o más muestras de la misma población. Al conjunto de muestras que se pueden obtener de la población se denomina espacio muestral. La variable que asocia a cada muestra su probabilidad de extracción, sigue la llamada distribución muestral Error Estándar: La desviación estándar de una distribución, en el muestreo de un estadístico, es frecuentemente llamada el error estándar del estadístico. Error muestral o error de muestreo: La diferencia entre el resultado obtenido de una muestra (un estadístico) y el resultado el cual deberíamos haber obtenido de la población (el parámetro correspondiente) se llama el error muestral o error de muestreo. Un error de muestreo usualmente ocurre cuando no se lleva a cabo la encuesta completa de la población, sino que se toma una muestra para estimar las características de la población. El error muestral es medido por el error estadístico, en términos de probabilidad, bajo la curva normal. El resultado de la media indica la precisión de la estimación de la población basada en el estudio de la muestra. Mientras más pequeño el error muestras, mayor es la precisión de la 13

estimación. Deberá hacerse notar que los errores cometidos en una encuesta por muestreo, tales como respuestas inconsistentes, incompletas o no determinadas, no son considerados como errores muéstrales. Los errores no muéstrales pueden también ocurrir en una encuesta completa de la población. Métodos de selección de muestras. Una muestra debe ser representativa si va a ser usada para estimar las características de la población. Los métodos para seleccionar una muestra representativa van a depender del objeto de estudio. Muestreo simple: Este tipo de muestreo toma solamente una muestra de una población dada para el propósito de inferencia estadística. Puesto que solamente una muestra es tomada, el tamaño de muestra debe ser lo suficientemente grandes para extraer una conclusión. Una muestra grande muchas veces cuesta demasiado dinero y tiempo. Muestreo doble: Bajo este tipo de muestreo, cuando el resultado del estudio de la primera muestra no es decisivo, una segunda muestra es extraída de la misma población. Las dos muestras son combinadas para analizar los resultados. Este método permite a una persona principiar con una muestra relativamente pequeña para ahorrar costos y tiempo. Si la primera muestra arroja una resultado definitivo, la segunda muestra puede no necesitarse. Muestreo múltiple: El procedimiento bajo este método es similar al expuesto en el muestreo doble, excepto que el número de muestras sucesivas requerido para llegar a una decisión es más de dos muestras. Los elementos de una muestra pueden ser seleccionados de dos maneras diferentes: a. Basados en el juicio de una persona. b. Selección aleatoria (al azar) Muestreo Aleatorio: Una muestra se dice que es extraída al azar cuando la manera de selección es tal, que cada elemento de la población tiene igual oportunidad de ser seleccionado. A. Muestreo aleatorio simple. Una muestra aleatoria simple es seleccionada de tal manera que cada muestra posible del mismo tamaño tiene igual probabilidad de ser seleccionada de la población. Para obtener una muestra aleatoria simple, cada elemento en la población tenga la misma probabilidad de ser seleccionado, el plan de muestreo puede no conducir a una muestra aleatoria simple. Por conveniencia, este método pude ser reemplazado por una tabla de números aleatorios. Cuando una población es infinita, es obvio que la tarea de numerar cada elemento de la población es infinita, es obvio que la tarea de numerar cada elemento de la población es imposible. Por lo tanto, ciertas modificaciones del muestreo aleatorio simple son necesarias. Los tipos más comunes de muestreo aleatorio modificado son sistemático, estratificado y de conglomerados. B. Muestreo sistemático. Una muestra sistemática es obtenida cuando los elementos son seleccionados en una manera ordenada. La manera de la selección depende del número de elementos incluidos en la población y el tamaño de la muestra. El número de elementos en la población es, primero, dividido por el número deseado en la muestra. El cociente indicará si cada décimo, cada onceavo, o cada centésimo elemento en la población va a ser seleccionado. El primer elemento de la muestra es seleccionado al azar. Por lo tanto, una muestra sistemática puede dar la misma precisión de estimación acerca de la población, que una muestra aleatoria simple cuando los elementos en la población están ordenados al azar. C. Muestreo Estratificado. Para obtener una muestra aleatoria estratificada, primero se divide la población en grupos, llamados estratos, que son más homogéneos que la población como un todo. Los elementos de la muestra son entonces seleccionados al azar o por un método sistemático de cada estrato. Las estimaciones de la población, basadas en la muestra 14

estratificada, usualmente tienen mayor precisión (o menor error muestral) que si la población entera muestreada mediante muestreo aleatorio simple. El número de elementos seleccionado de cada estrato puede ser proporcional o no proporcional al tamaño del estrato en relación con la población. D. Muestreo de conglomerados. Para obtener una muestra de conglomerados, primero dividir la población en grupos que son convenientes para el muestreo. En seguida, seleccionar una porción de los grupos al azar o por un método sistemático. Finalmente, tomar todos los elementos o parte de ellos al azar o por un método sistemático de los grupos seleccionados para obtener una muestra. Bajo este método, aunque no todos los grupos son muestreados, cada grupo tiene una igual probabilidad de ser seleccionado. Por lo tanto la muestra es aleatoria. Una muestra de conglomerados, usualmente produce un mayor error muestral (por lo tanto, da menor precisión de las estimaciones acerca de la población) que una muestra aleatoria simple del mismo tamaño. Los elementos individuales dentro de cada "conglomerado" tienden usualmente a ser iguales. Por ejemplo la gente rica puede vivir en el mismo barrio, mientras que la gente pobre puede vivir en otra área. No todas las áreas son muestreadas en un muestreo de áreas. La variación entre los elementos obtenidos de las áreas seleccionadas es, por lo tanto, frecuentemente mayor que la obtenida si la población entera es muestreada mediante muestreo aleatorio simple. Esta debilidad puede reducida cuando se incrementa el tamaño de la muestra de área. El incremento del tamaño de la muestra puede fácilmente ser hecho en muestra de área. Los entrevistadores no tienen que caminar demasiado lejos en una pequeña área para entrevistar más familias. Por lo tanto, una muestra grande de área puede ser obtenida dentro de un corto período de tiempo y a bajo costo. Por otra parte, una muestra de conglomerados puede producir la misma precisión en la estimación que una muestra aleatoria simple, si la variación de los elementos individuales dentro de cada conglomerado es tan grande como la de la población.

15

Modulo II PROBABILIDAD CÁSICA Teoría de conjuntos: Un poco de historia El matemático alemán Georg Cantor en el siglo XIX formalizó por primera vez la teoría de conjuntos. El concepto de conjunto es fundamental en el análisis matemático toda vez que nos permite encontrar relaciones, implícita o explícitamente, en todas las ramas de las matemáticas. En su forma explícita, los principios y terminología de los conjuntos se utilizan para construir proposiciones matemáticas más claras y precisas y para explicar conceptos abstractos como el infinito. Definición de Conjunto “Un conjunto es una agrupación de elementos bien definidos” Ejemplo de conjuntos: S1 = {2, 4}; S2 = {2, 4, 6, …, 2n, …} = {todos los enteros pares}; Notaciones de conjuntos Es usual denotar los conjuntos por letras mayúsculas. Los elementos de los conjuntos se representan por letras minúsculas A = { 1,3,5,7,9,11 } Separando los elementos por comas y encerrándolos entre llaves {}. Esta es llamada forma tabular de un conjunto. Pero si se define un conjunto enunciando propiedades que deben tener sus elementos. Ejemplo: Sea B el conjunto de todos los numero pares, entonces se emplea una letra, por lo general x, para representar un elemento cualquiera y se escribe B={x/xa los números pares } lo que se lee “B es el conjunto de los números x tales que x es par” se dice que esta es la forma de definición por comprensión o constructiva de un conjunto. Téngase en cuenta que la barra vertical se lee “ Tales Que” . si un objeto x es el elemento de un conjunto A, es decir, si A contiene a x como uno de sus elementos, se escribe. xA que se puede leer también “x pertenece a A” ó “x esta en A”. Si por el contrario un objeto x no es elemento de un conjunto A, es decir, si A no contiene a x entre sus elementos, se escribe xA Es costumbre que en los escritos matemáticos poner una línea vertical o una oblicua “/” tachando un símbolo para indicar lo opuesto o la negación del significado de símbolos. Decimos que el elemento P pertenece al conjunto S si P está contenido en el conjunto S. Decimos que el conjunto A está contenido en el conjunto S si todos los elementos del conjunto A son elementos del conjunto S. Igualdad o identidad de conjuntos El conjunto A es igual al conjunto B si ambos tienen los mismo elementos, es decir, si cada elemento en A pertenece también a B, y si cada elemento en a B pertenece a A. Se denota la igualdad de los conjuntos A = B. Decimos que la identidad de dos conjuntos A Y B se da, cuando A está contenido en B y B está contenido en A. Ejemplo Sean. A={1,2,3,4 } y B={3,1,4,2 }, entonces A=B, porque los elementos 1,2,3,4 de A pertenece a B y cada uno de los elementos 3,1,4 y 2 de B pertenece a A. Debemos de observar que en un conjunto el orden de aparición de sus elementos no cambia su contenido.

16

UNIÓN La unión de los conjuntos A y B es el conjunto de todos los elementos que pertenecen a A o a B o a ambos. Se denota la unión de A y B por A U B = { x / x en A ό x en B }

el cual se lee “A unión B”.

Intersección La intersección de los conjuntos A y B es el conjunto de los elementos comunes en A Y B, esto es, aquellos elementos que pertenecen a A y que también pertenecen a B. Se denota la intersección de A y B por: A∩B={x/x Є A y xЄB} Que se lee “A intersección B”

El complemento de un conjunto, es el conjunto de elementos que no pertenecen a A, es decir la diferencia del conjunto universal U y del A. Se denota el complemento de A por: A' = { x / x  A }

17

Diferencia La diferencia de los conjuntos A y B es el conjunto de elementos que pertenecen a A pero no a B. Se denota la diferencia de A y B por: A─B={x/x Є A y x B} Que se lee “A diferencia B” o simplemente “A menos B”

Definición de conjunto vacío El conjunto vacío es un conjunto sin elementos. Φ={ }

Conjunto Universal El Conjunto Universal es el conjunto que tiene todos los elementos. U = { Todos los elementos que están contenidos en el diagrama de Venn }

18

Es importante señalar que el conjunto universal se debe definir en primer lugar y todos los demás conjuntos deberán estar contenidos en él.

Por Ejemplo Si definimos que el Conjunto Universal está definido por los diez número dígitos entonces U = { 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 } Ejemplo Si el Conjunto Universal está definido por los números dígitos entonces U = { 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 } Ejemplo: Sea U={ x / 0< x < 2} A={x /1/2 < x < 1 } B={x / ¼< x < 3/2 } C= {x / 1/3 < x < 3/2 }

Entonces AUB = { x / x Є A ó x Є B} = { x / ¼ < x < 3/2 } A∩B ={x / x Є A y x Є B } = { x / ½ < x < 1} Ā= {x / x  A , x Є (U - A)} = { x / 0 < x < ½ } U { 1 < x < 2}

/

Con base en el desarrollo anterior C

C

C

C

C

C

C

C

C

C

C

C

Calcula (AUB) , (A∩B) , A ∩B , A∩B , A ∩ B , A UB , C , A∩C , A UC , A UC. Solución (AUB) = { x / x  AUB, x Є (U- AUB) } = { x / (0 < x < ¼) U (3/2 < x < 2)} C

(A∩B) = { x / x A∩B, x Є U – (A∩B) } = { x / (0 < x < 1/2) U (1 < x < 2)} C

A ∩B = { x / x  A y x Є B} = { x / (1/4 < x < 1/2) U (1 < x < 3/2)} C

= { x/ x Є A y x  B} = { Ø }

C

A∩B

A ∩ B = { x / x A y x  B} = { x / (0 < x < 1/4) U (3/2 < x < 2)} C

C

A UB = { x / x  A ó x  B} ={ x / (0 < x < 1/2) U (1 < x < 2)} C

C

C

C = { x / x C , x Є (U – C)} = { x / (0 < x < 1/3) U (3/2 < x < 2)}

19

A∩C = { x / x Є A y x ЄC} = { x /1/2 < x < 1 } A UC = { x / x  A y x C } = { x / (0 < x < 1/2) U (1 < x < 2)} C

C

A UC = { x / x  A ó x Є C } = { x / 1/3 < x < 3/2 } C

Producto cartesiano

Definición: El producto cartesiano de un conjunto E por el conjunto F, es el conjunto de todas las parejas ordenadas ( x , y ) tales que x  E , y  F .

El producto cartesiano de E y F, se escribe como E × F

Ejemplo:

si A = {1, 2} y B = {x, y, z}

entonces:

A × B = {(1, x), (1, y), (1, z), (2, x), (2, y), (2, z)}.

B × A = {(x, 1), (y, 1), (z, 1), (x, 2), (y, 2), (z, 2)}.

En este caso, A × B = B × A, pues al ser pares ordenados, el par (1, x) es distinto del par (x, 1).

Conjunto Potencia La familia de todos los subconjuntos S se llama conjunto de potencia de S. Se le designa por

2s Ejemplo: Si

M  {a, b}, entonces

2M  {{a, b}, {a}, {b}, } si un conjunto S es infinito digamos que S tenga n elementos, entonces el conjunto potencia de S tendrá 2n elementos, como se puede demostrar. Esta es una razón, para llamar conjunto de potencia de S la clase de los subconjuntos de S y para denotarla por 2 s .

20

Ejemplos

1.- Sea el conjunto universal

u  ( x, y) | x  D1 , y  D2 ,1  x  0,1  y  0 y x, y  Z  . Sea:

A  {x  D1 , y  D2 | x  y  10} B  {x  D1 , y  D2 | x  y 2 } C  {x  D1 , y  D2 | x 2  y 2  10} D  {x  D1 , y  D2 | x 2  2} E  {x  D1 , y  D2 | 2  x  2 y  10} Determinar

u , A, B , C , D

y

E.

Solución:

u  {(1,1), (1,2), (1,3), (1,4), (1,5), (1,6), (2,1), (2,2), (2,3), (2,4), (2,5), (2,5), (2,6), (3,1), (3,2), (3,2), (3,3), (3,4), (3,5), (3,6), (4,1), (4,2), (4,3), (4,4), (4,5), (4,6), (5,1), (5,2), (5,3), (5,4), (5,5), (6,1), (6,2), (6,3), (6,4), (6,5), (6,6)} A  {(4,6), (5,6), (6,6), (6,4), (6,5), (6,6)} B  {(1,2), (1,3), (1,4), (1,5), (1,6), (2,2), (2,3), (2,4), (2,5), (2,6), (3,2), (3,3), (3,4), (3,5), (3,6), (4,3), (4,4), (4,5), (4,6), (5,3), (5,4), (5,5), (5,6), (6,3), (6,4), (6,5), (6,6)} C  {(1,1), (1,2), (1,3), (2,1), (2,2), (31, )} D  {(2,1), (4,2), (6,3)} E  {(1,1), (2,1), (3,1), (1,4), (1,5)...} u 2.- Sean los conjuntos:

u  x | x  R,0  x  9 A  x | x  3  {x | 3  x  9} B  x | x  3  {x | 0  x  3} C  x | A  x  6 D  x | x  3, o x  8  {x | 0  x  3  8  x  9}

Encontrar

A' , A B , A'( B'C ) , A  ( B'c) , B  ( A'C ) .

Solución:

A'  {x | x  A}  {x  3  x  9}  {x  0  x  3}  B A  B  {x | x  R,0  x  9} A  ( B'C )  {x | 3  x  9 ó ( x)3  x  9 y 4  x  6 } A  ( B'c)  {x  A ó x | 4  x  6}  {x | 3  x  9}  A B  ( A'C )  B  {0  x  3  4  x  6}  {0  x  3}  B Problemas propuestos 1.- Escriba los elementos de los siguientes conjuntos: 

21

A) Sea el conjunto de enteros entre 1 y 50 y que además cumplen con ser divisible entre 8.

Respuesta:

x   A   x | 1  x  50 ,  Z    8,16 ,24 ,32 ,40 ,48 8  

 

x 2  x  12  0 B  x | x 2  x  12  0, x  Z    3,4

B) Sea B el conjunto de las x que cumplen con

Respuesta:  

Respuesta:  

x2  4x  5  0 C  x | x 2  4 x  5  0, x  Z   1,5

C) Sea C el conjunto de las x que cumplen con

D) Sea E el conjunto donde x es un continente.

D  x | x  Continente

D  América , Europa, áfrica , Asia , Oceanía 2.- Sea el conjunto universal un intervalo de 0 a 15 obtener: a) El conjunto A todas x > 10. El conjunto B todas las x de por lo menos 1 hasta 4. El conjunto C todas las x de por lo menos 7 a lo más 9. El conjunto D las x < 2 o x > 8. El conjunto E las x > 8 y x < 10. b) B’ c) B’ ∩ D’ d) A U (C∩E’) Respuesta:

U  0,1,2,3,4,5,6,7,8,9,10 ,11,12 ,13,14 ,15 A  x | x  10 , x  R  x | 10  x  15, x  R (

0

2

4 6

]

8

10

12

14

B  x | 1  x  4, x  R

[

]

0

2

4

6

8

10

12

14

C  x | 7  x  9, x  R [

0

2

]

4

6

8

10

12

14

D  x | x  2 o x  8, x  R  x | 0  x  2 o 8  x  15, x  R [

)

0

(

2

4

6

]

8

10

12

14

E  x | x  8 y x  10, x  R  x | 8  x  10, x  R [

]

0 22

2

4

6

8

10

12

14

B|  x | x  B, x  R  x | 0  x  1 o 4  x  15, x  R

B|  D|  x | x  B y x  D B|  D|  x | x  0  x  1 o 4  x  15 y x  2  x  8, x  R  x  4  x  8





AU C  E |  x | 7  x  8 o 10  x  15, x  R Simbología  Є Pertenece. 

Conjunto vacío.

 

U ∩



Representa un conjunto con sus elementos. ≤ menor igual que. ≥ mayor igual que. < menor que. = igual. exactamente igual. Por lo menos significa mayor o igual que A lo más significa menos o igual que Al menos: significa mayor o igual que No más: significa menos o igual que Igual a = Relación entre dos cantidades del mismo valor.

         

Unión. Intersección.

Tema II.- Probabilidad

23

La probabilidad es la rama de las matemáticas que se ocupa de medir cuantitativamente la posibilidad de que ocurra un determinado suceso. La probabilidad matemática comenzó como un intento de responder a varias preguntas que surgían en los juegos de azar. Las grandes fortunas que se ganaban y perdían ocasionó que los apostadores intentaran llevar ventaja sobre sus oponentes, de esta forma encontraron que existía una relación inversamente proporcional entre los casos favorables y los casos posibles. La creación de la probabilidad se atribuye a los matemáticos franceses del siglo XVII Blaise Pascal y Pierre de Fermat, aunque algunos matemáticos anteriores, como Gerolamo Cardano en el siglo XVI, habían aportado importantes contribuciones a su desarrollo. La probabilidad es una disciplina matemática que se aborda desde tres enfoques: a) El contenido lógico formal. La probabilidad es analizada desde un punto de vista axiomático por lo que establece un conjunto de reglas. b)Antecedentes intuitivos. La intuición y la experiencia física son interdependientes, es un problema del que necesitamos ocuparnos. c)Aplicaciones En las aplicaciones, los modelos matemáticos abstractos sirven de instrumentos; además, diferentes modelos pueden describir la misma situación empírica. La forma en que se aplican las teorías matemáticas no depende de ideas preconcebidas; es una técnica con un fin determinado, que depende y cambia con la experiencia. Tipos de experimentos Experimento determinístico: Son aquellos eventos que se cumplen inexorablemente y cuya probabilidad de ocurrencia es 1 Ejemplo de ello es “Todos los humanos nos vamos a morir”. Experimentos no determinísticos: son aquellos eventos cuya probabilidad de ocurrencia se encuentra en 0  P(E)  1. A este tipo de experimentos corresponde “Al arrojar un dado legal cual es la probabilidad de que aparezca un dos”

Probabilidad clásica P(x) = casos favorables / casos posibles

Al utilizar el modelo probabilística en otro tipo de problemas surgió un problema nodal por resolver, esto es, se requería saber contar tanto los casos favorables como los posibles. Para responder a esta necesidad surgieron las técnicas del conteo, las que podemos agrupar en: espacio muestral, análisis combinatorio y los diagramas de árbol.

Ejemplo:

En una urna hay 30 bolas: 10 rojas, 5 azules y 15 blancas.

Hallar la probabilidad de que al extraer una bola al azar ésta sea de color. 24

Podemos observar que son 30 los casos posibles entonces: P(roja) = 10/30 = 1/3 P(azul) = 5/30 = 1/6

Espacio Muestral

Comencemos por la técnica del espacio muestral, esta técnica se recomienda utilizarla cuando el número de eventos posibles sea del orden de no más de 50.

Definición: “Un espacio muestral es el conjunto de

Definición: “Un evento simple es un evento que no se puede descomponer”. A cada evento simple le corresponde uno y sólo un punto muestral. Construcción de espacios muestrales Ejemplo 1: Exprese simbólicamente el espacio muestral S que consiste en todos los puntos (x,y) dentro de una circunferencia de radio 3 con centro en el punto (2,-3) 2

2

{(x,y)/ (x - 2) + (y + 3) < 9} Ejemplo 2: Supongamos que en un sistema físico aislado hay tres moléculas M1, M2 y M3 cada una con cero, una o dos unidades de energía, la suma de sus energías es dos. Supóngase que todas las distribuciones de energía entre las tres moléculas son igualmente probables. Constrúyase un modelo matemático para esta situación. ¿Cuántos eventos elementales hay? ¿Cuántos eventos elementales son favorables al evento “M1 tendrá energía cero”? ¿Cuál es su probabilidad?. M1 (0,1,2) M2 (0,1,2) M3 (0,1,2)

(0,0,0) (0,0,1) (0,0,2) (0,1,0) (0,1,1) (0,1,2) (0,2,0) (0,2,1) (0,2,2) (1,0,0) (1,0,1) (1,0,2) (1,1,0) (1,1,1) (1,1,2) (1,2,0) (1,2,1) (1,2,2) (2,0,0) (2,0,1) (2,0,2) (2,1,0) (2,1,1) (2,1,2) (2,2,0) (2,2,1) (2,2,2)

Como la suma de sus energías es dos, entonces: (0,0,2) (0,1,1) (0,2,0) (1,0,1) (1,1,0) (2,0,0) por lo tanto, a) Hay 6 eventos elementales. b) “M1 tendrá energía cero”: (0,0,0) por lo tanto, cada uno tiene probabilidad de 1/6, entonces: (0,0,2) (0,1,1) (0,2,0) =1/6 + 1/6 + 1/6 = 3/6 c) Su probabilidad es: Pr (C) = 3/24 / 6/24 = 3/6 = ½ Problemas propuestos 1.- Constrúyase un modelo para el experimento de lanzar un par de dados estándar ¿cuántos eventos elementales hay, y cuales son sus posibilidades? 25

¿Qué suposiciones se hacen para establecer el modelo? b)¿Cuántos eventos elementales favorables para el evento “caerá un total de ocho puntos por los dos dados”? c)¿Cuál es la probabilidad de tirar “ojos de víbora”(Un total de 2 puntos)?. d)¿Cuál es la probabilidad de tirar 7 u 11? e)¿Cuál es la probabilidad de tirar 2,3 o 12?. f) Supóngase que un dado es rojo, el otro es blanco. ¿cuál es la probabilidad de que el numero de puntos del dado rojo sea menor que el numero de puntos del dado blanco? Respuesta y solución

(1,1)(1,2)(1,3)(1,4)(1,5)(1,6) (2,1)(2,2)(2,3)(2,4)(2,5)(2,6) (3,1)(3,2)(3,3)(3,4)(3,5)(3,6) (4,1)(4,2)(4,3)(4,4)(4,5)(4,6) (5,1)(5,2)(5,3)(5,4)(5,5)(5,6) (6,1)(6,2)(6,3)(6,4)(6,5)(6,6) a) existen 36 eventos diferentes y es una suposición que los dados no están cargados a) total de eventos 36 probabilidad de 1/36 b) p(b)= 5 c) p©=1/36 d) p(7)=6/36 +P(11)=6/36+2/36=8/36=2/9 e) P(2)=1/36 +P(3)=3/36 +P(12)=1/36=4/36=1/9 f) P(f)=15/36=5/12

2.- Encontrar el espacio muestral de preguntarle a tres mujeres si ve la telenovela a las 8:00 pm. Respuesta y solución

S  SSS , SSN , SNS , SNN , NSS , NSN , NNS , NNN  3.- ¿Cuál será el espacio muestral si se quiere obtener de un grupo de química a tres personas que son hombres y mujeres? Respuesta y solución

S  HHH , HHM , HMH , HMM , MHH , MHM , MMH , MMM  4.- Encontrar el espacios muestral del siguiente experimento: se inspeccionan 3 artículos si se encuentran o no defectuosos: Respuesta y solución

Sea

26

D : articulo defectuoso y N : articulo no defectuoso.

S  {DDD, DDN , DND, DNN , NDD, NDD, NND, NNN } 5.-Si se lanzan dos monedas al mismo tiempo : a) Cual es la probabilidad de que caigan 2 soles b) Que caiga un águila o un sol o águila y sol Respuesta y solución

S = { A A,AS, SA,SS} a) P(A y A) = P(A∩A) =P(A)*P(A) = ½ * ½ = 1/4 b) P(S y A) o P(A y S) = (1/2 * 1/2) + (1/2 * 1/2) = 1/2 Para tres monedas:

S = {AAA,AAS,ASA,ASS,SAA,SAS,SSA,SSS}

a) Probabilidad de que caiga SSA P(SSA) = P(S∩S∩A) = P(S)*P(S)*P(A) = 1/2*1/2*1/2 = 1/8 b) Probabilidad de que salgan 2 soles y 1 águila P(SSA) o P(SAS) o P(ASS) = 1/8*1/8*1/8 = 3/8

La probabilidad desde el punto de vista de la frecuencia relativa: Si un experimento se repite un número grande (N) de veces y de éstas el evento A ocurre n veces la probabilidad de A es: P(A) = na / N A cada punto muestral se le asigna P(Ej) tal que: 1.- 0 < P(Ej) < 1 2.-  P(E) = 1 s

1.- Una urna contiene 20 papeletas blancas numeradas del 1 al 20, 10 papeletas rojas numeradas del 1 al 10, 40 papeletas amarillas numeradas del 1 al 40 y 10 azules numeradas del 1 al 10. Se revuelven las papeletas en la urna para que todas tengan probabilidad de ser seleccionadas. a) ¿Cuál es la probabilidad de seleccionar una papeleta azul ó blanca? b) ¿Cuál es la probabilidad de obtener un 1, 2, 3,4 ó 5? c) ¿Cuál es la probabilidad de obtener una roja ó amarilla y numeradas de 1, 2, 3, 4? d) ¿Cuál es la probabilidad de sacar un 5,15,25 ó un 35? e) ¿Cuál es la probabilidad de seleccionar una papeleta blanca con un número mayor que 12 ó amarilla y con un número mayor que 26?

27

S  blancas1  20, rojas(1  10), amarillas(1  40), azules(1  10) Pazules o blancas  P1,2,3,4,5 

30 80

20 80

P1,2,3,4 roja o amarilla  P5,16,25,35 

8 20

8 80

Pblanca  12 o amarilla  26 

22 80

2.- Cuantas palabras de 5 letras se pueden formar usando las letras empleadas en la palabra caaas. Se tienen 5! = 120 permutaciones si no tomamos en cuenta el orden. Si lo tomamos en cuenta solamente las letras se forman seis palabras iguales, esto resulta del hecho que hay 3! = 3·2·1 =6 maneras diferentes de colocar las letras Esto es cierto para cada una de las otras posiciones posibles en donde las a aparezcan. Por consiguiente hay 20 palabras diferentes de 5 letras, que pueden formarse tomando las letras de la palabra caaas.

5! 120   20 3! 6

b)

4.- Se van a construir en Puebla, Acapulco, Toluca y Tepic hoteles y condominios y casas los que se ubicarán en la planicie o en la montaña. a) ¿Cuál es el espacio muestral? b) ¿Cuál es la probabilidad de tener un hotel? c) ¿Cuál es la probabilidad de tener en Acapulco un condominio de desarrollo turístico? d) ¿Cuál es la probabilidad de tener un desarrollo turístico?

S  24 P H  

8 24

PC  Con  DT   PDT  

8 24

12 1  24 2

5.- En una escuela 100 estudiantes tienen las siguientes asignaturas , 54 estudiaron matemáticas, 69 historia y 35 ambas materias. Si se selecciona aleatoriamente uno de estos estudiantes encuentre la probabilidad de que: 28

a) Se haya dedicado a matemáticas o historia. b) No haya cursado ninguna de estas materias. c) Haya estudiado historia pero no matemáticas.

6.- La probabilidad de que una moneda al ser lanzada aparezca cara y cruz son 0.52 y 0.48 respectivamente. Si la moneda se lanza 3 veces ¿Cuáles son las probabilidades de sacar: a) Solo caras b) Dos cruces y una cara en ese orden a) P(C  C  C) = P(C)*P(C)*P(C) = (0.52)(0.52)(0.52) = 0.14060 b) P(Z  Z  C) = P(Z)*P(Z)*P(C) = (0.48)(0.48)(0.52) = 0.1198

7.- Se lanzan dos dados en donde se registran el conjunto de todos los pares posibles que se pueden observar entonces defina los siguientes subconjuntos de S. A: el número en el segundo dado es par. B: la suma de los dos números es par. C: al menos un número en el par ordenado es impar. (1,1) (1,2) (1,3) (1,4) (1,5) (1,6)

(2,1) (2,2) (2,3) (2,4) (2,5) (2,6)

(3,1) (3,2) (3,3) (3,4) (3,5) (3,6)

(4,1) (4,2) (4,3) (4,4) (4,5) (4,6)

(5,1) (5,2) (5,3) (5,4) (5,5) (5,6)

(6,1) (6,2) (6,3) (6,4) (6,5) (6,6)

A =: (1,2),(1,4),(1,6),(2,2),(2,4),(2,6),(3,2),(3,4),(3,6) (4,2),(4,4),(4,6),(5,2),(5,4),(5,6),(6,2),(6,4),(6,6) B =: (1,1),(1,3),(1,5),(2,2),(2,4),(2;6),(3,1),(3;3),(3,5) (4,2),(4,4),(4,6), (5,1),(5,3),(5,5),(6,2),(6,4),(6,6) C =: (1,1),(1,2),(1,3),(1,4),(1,5),(1,6),(2;1),(2,3),(2,5) (3,1),(3,2),(3,3),(3,4),(3,5),(3,6),(4,1),(4,3),(4,5) (5,1),(5,2),(5,3),(5,4),(5,5),(5,6),(6,1),(6,3),(6,5) A n B = (2,2),(4,2),(6,2),(2,4),(4,4),(6,4),(2,6),(4,6)(6,6) _ A n B =(1,2),(3,2),(5,2),(1,4),(3,4),(5,4),(1,6),(3,6),(5,6) _ A u B = (1,1),(2,1),(3,1),(4,1),(5,1),(6,1),(1,3),(2,3),(3,3) (4,3),(5,3),(6,3),(1,5),(2,5),(3,5),(4,5),(5,5),(6,5) 29

(2,2),(2,4),(2,6),(4,2),(4,4),(4,6),(6,2),(6,4)(6,6)

Eventos independientes Definición: Se dice que dos eventos son independientes si cumplen alguna de las condiciones: i) PA/B) = P(A) ii) P(B/A) = P(B) iii) P(A∩B) = P(A)P(B Caso contrario los eventos son dependientes Eventos mutuamente excluyentes Si A y B son mutuamente excluyentes entonces P(A∩B) = 0 y

P(AUB)= P(A) +P(B) 6.- Si A y B son eventos mutuamente excluyentes y P(A) = 0.3 y P(B)=0.5 encuentre: a) P(AUB) | b) P(A ) | c) P(A UB)

P A  B   P A  PB   0.3  0.5  0.8

 

P A|  x | x  A  0.7

A

B





P A|  B  x | x  A y x  B  0.7  0.5  0.5

A

B

7.- Una persona al llegar a una intersección tiene tres opciones, dar vuelta a la derecha, a la izquierda, o seguir de frente. a) Obtenga el espacio muestral del experimento. b) Determine la probabilidad de que la persona de vuelta, suponiendo que todos los puntos maestrales tienen la misma probabilidad.

30

S  VD,VI , F  PVD 

1 3 1 PVI   3 1 P F   3 PV   PVD  VI   PVD  PVI  

1 1 2   3 3 3

8.- En una empresa su personal tiene las siguientes características Empleado

Desempleado

460 140 600

40 260 300

Hombre Mujer

500 400 900

Obtener: a) b) c) d) e)

P(M) P(M|Desempleado) P(Desempleados) P(M ó Desempleados) P(Empleados|Hombres)

P M  

400 4  900 9

260 300 300 1 P( Desempleados)   900 3 44 P( M ó Desempleados)  90 460 P( Empleados | Hombres)  500 P( M | Desempleados) 

Técnica de Análisis combinatorio Principio fundamental del Conteo: Si un evento puede realizares de n1 maneras diferentes, y si, continuamos el procedimiento, con n2 maneras diferentes, y n3 maneras diferentes, y así sucesivamente, entonces el número de maneras en que los eventos pueden realizarse en el orden indicado es producto n 1· n2 · ·n3...... Notación Factorial n!.es el producto de los enteros positivos desde 1 hasta n inclusive 31

Conviene también definir 0! = 1.

Definición de Combinaciones El número de combinaciones de n objetos tomados de r veces a la vez, es el número de subconjuntos no ordenados de tamaño r que se pueden formar con los n objetos está dada por:

n

Cr 

n! r!(n  r )!

Definición de Permutaciones Son la cantidad de manera en que podamos ordenar n objetos diferentes tomados de r a la vez está dada por:

P(n, r ) 

n! (n  r )!

Teorema. El numero de permutaciones de n objetos de los cuales n1 son iguales, n2 son iguales, ..., nr son iguales, es

n! n1!n2!···nr!

Ejemplo 1.- Cuantas permutaciones se pueden hacer para 4 personas que juegan al Briget.

Solución: 4

Pn  24

Ejemplo 2.- De cuantas maneras un investigador puede seleccionar a 3 familias que viven en un complejo departamental que consta de 20 departamentos.

Solución: n

Cr  20 C3  1140

Ejemplo 3.- En cuantas maneras diferentes pueden 6 lanzamientos de una moneda producir 2 águilas y soles.

Solución: 32

6

C 2 6C 4  225 6 C6

Ejemplo 4.- ¿Cuántos comités diferentes de dos químicos y un físico se pueden formar con 4 químicos y 3 físicos de una universidad.

Solución: 4

C4 3 C1  18

5.- En una mano de póquer que consta de 5 cartas, encuentre la probabilidad de tener: a) Tres ases Solución: Número de formas en que se pueden repartir una mano póquer es n Cr 52 C5  2598960 De esas 5, de cuantas maneras puedo recibir tres ases

C3 12 C3  4 C1  4 C1  21120 Favorables 21120 p(tres ases)    .008126 Posibles 2598960

4

6.- Si un cliente invierte con una probabilidad de .6 en bonos, en fondos de inversión con una probabilidad de .3 y en ambos instrumentos con una probabilidad de .15. Encuentre: a) La probabilidad de que invierta ya sea en bonos libres o en fondos de inversión. b) En ninguno de los instrumentos. Solución: Sea L: Bonos l y M: fondos de inversión.

p( L)  .6

p ( L  M )  p ( L)  p ( M )  p ( L  M )  .6  .3  .15

a)

p( M )  .3

b)

p( M  L)  .15  .75 p( L  M )C  p( LC  M C )  .25

7.- Un jurado integrado por ocho personas; cinco mujeres y tres hombres. Votaron por una mujer las cinco mujeres y los tres hombres en contra. Se apeló la decisión alegando parcialidad de género. Si no hubiera parcialidad se podría concluir que cualquiera de los miembros de la junta votara a favor de la mujer con la misma probabilidad. Si esto fuera cierto. ¿cuál es la probabilidad de que el voto se diera como el jurado votó? 5M 5 3H

Pvsex 

33

5C5 3C3 C85

P(cinco sean mujeres)= 5/8

5! 3! 5! (5  5)! 3! (3  3)! 1 Pvsex   8! 56 5! (8  5)! 8.- En un paquete de 52 cartas de un naipe inglés. a) ¿Cuál es la probabilidad de sacar un as?

P(as) = 4 /52 = 1/ 13

b) La probabilidad de sacar un rey rojo

P(Rey Rojo) = 2/52 =1/26

c) Probabilidad de sea una figura negra

P(Fig. Negra) = 26/52 = ½

d) Probabilidad de que sea par

P(par) = (13)(13) 5C2 ) / 52C5 = 0.000652 -3

e) Probabilidad de un Full

P(Full) = (13)(12) 5C3 5C2) / 52C5 = 6 x 10

9- En una urna existen 20 bolitas y solo hay 5 premiadas, ¿Cuál es la probabilidad de sacar las 5 bolitas con premio?, obtener el recorrido de la variable. Solución: 20C5

= 15504 maneras de sacar 5 bolitas.

P(x) = eventos posibles / total de eventos x = numero de bolitas ganadoras. x=0,1,2,3,4,5

P(0) 

15

P(1) 

15

C5 * 5 C0 1001  15504 5168

C4 * 5 C1 2275  15504 5168

P(2) 

15

P(3) 

15

P(4) 

15

P(5) 

15

C3 * 5 C2 2275  15504 7752

C2 * 5 C3 175  15504 2584 C1 * 5 C4 25  15504 5168 C0 * 5 C5 1  15504 15504

La probabilidad de sacar las 5 bolitas ganadoras es 1/15504 Axiomas de probabilidad

34

Sean S cualquier espacio muestral y A cualquier evento de éste. Se llamara función de probabilidad sobre el espacio muestral S a P(A) si satisface los siguientes axiomas. 1.- p(A)  0 para todo A  S 2.- p(S) =1 3.- p(A+B) = p(A) + p(B)

si AB = 

Teoremas importantes a.- p( A´ ) = 1- p(A) b.- p(A)  1 para todo A S c.- p() = 0. d.- p(A+B) p(A) + p(B) -p(AB) e.- p(A1+A2+... An) = p(A1) + p(A2) + ...p(An ) si Ai Aj =  para ij f.- p(A)  p(B) si A B g.- P() = 0 h.- P (A  B) = P(A) + P (B) - (A  B) Diagramas de Árbol

1.- Una persona tiene probabilidad de sobrevivir a un trasplante de corazón en un 55%. Si el paciente sobrevive a la operación, la probabilidad de que su cuerpo rechace el trasplante es del 20%. ¿Cuál es la probabilidad de que sobreviva a estas etapas críticas?.

0.2 Su cuerpo rechace 0.55 Sobreviva P 0.45 No sobreviva P(salvarse) = (0.55) ( 0.80) = 0.44

35

0.8 Su cuerpo No rechace

PROBABILIDAD CONDICIONAL

Definición. Sean A y B dos sucesos tales que P(A)>0. Denotamos por P(B\A) la probabilidad de B dado que A ha ocurrido.

P(B/A) = P( A B) / P(A)

Ejemplos 1.- Los resultados de una investigación de campo arrojan la siguiente información del comportamiento de 50 empresas de servicio: Antigüedad mas de 10 años (A) menos de 10 años (B) Total

Buen servicio (BS) 16 10

Mal servicio (MS) 4 20

Total 20 30

26

24

20

a) ¿Cuál es la probabilidad de que seleccione una agencia de automóviles que proporcione buen servicio dado que ha operado más de diez años? P(BS | A)  16 / 20 

P(BS  A) 16 / 50   16 / 20  4 / 5 P( A) 20 / 50

b) ¿Cuál es la probabilidad de que en la agencia que ha operado con menos de 10 años proporcione un buen servicio de garantía? P(BS | B) 

P(BS  B) 10 / 50   10 / 30  1 / 3 P(B) 30 / 50

2.- Se sabe por experiencia que el 80% de los productos están a tiempo para ser embarcados y que el 72% se entregan a tiempo al comprador.¿Cuál es la probabilidad de que una orden se entregue a tiempo dado que estuvo lista para el embarque a tiempo? A = es el evento de que este a tiempo para el embarque = 0.80 B = es el evento de que se entregue a tiempo P(B|A) = P(A∩B)/P(A) = 0.72 / 0.80 = 0.9

36

Teorema de Bayes

Los exámenes del laboratorio de una clínica privada resultan correctos en el 95% de los casos de infección cuando la infección esta presente. Estos exámenes arrojan un resultado "positivo" que es falso en el 1% de las personas sanas que se someten al examen, es decir, que si la persona esta sana entonces el examen le puede decir con una probabilidad .01 que ella esta enferma. Además se sospecha que el 5% de la población tiene esa infección. ¿Cual es la probabilidad de que una persona tenga la infección dado que recibió un resultado positivo ? Solución. Si D: La persona tiene la infección y E: El resultado del examen es positivo, la interrogante será P(D/E) ?.

Esto significa que solo el 83,3% de las personas cuyos resultados fueron positivos tienen la infección. Se ha observado que los hombres y las mujeres reaccionan de una manera diferente en ciertas circunstancias; 70% de las mujeres reaccionan positivamente en dichas circunstancias, mientras que el porcentaje en los hombres es solamente del 40%. Se sometió a prueba un grupo de 20 personas, 15 mujeres y 5 hombres, y se les pidió llenar un cuestionario para descubrir sus reacciones. Una respuesta escogida al azar de las 20 resultó negativa. ¿Cuál es la probabilidad de que haya sido contestada por un hombre? SOLUCION: M+ = 70% M_ = 30%

P(x

H)=

H+ = 40% M_ = 60%

( 25 ) ( 60 ) = 0.4 (25)(60) +(75)(30)

Existen dos métodos A y B para enseñar a los trabajadores cierta habilidad industrial el porcentaje de fracasos es 20% para A y 10% para B. Sin embargo, B cuesta más y por esto se utiliza solamente en el 30% de los casos (se utiliza A en el otro 70%). Se entreno a un trabajador según uno de los dos métodos pero no logro aprenderlo correctamente ¿Cuál es la probabilidad de que haya recibido el entrenamiento con el método A? 37

(tomando a x como el trabajador)

A  B  x x  A ó x  B P( x | A)  0.2 P( x | B)  0.1 P( A)  0.7 P( B)  0.3 P( A) P( x | A) P( A) P( x | A)  P( B) P( x | B) (0.7)(0.20) P( A | x)   0.82 (0.7)(0.2)  (0.3)(0.1) P( A | x) 

1. Se extrae una carta de una baraja española de 40 cartas. Si la carta extraída es un rey, nos dirigimos a la urna I; en caso contrario a la urna II. A continuación, extraemos una bola. El contenido de la urna I es de 7 bolas blancas y 5 negras y el de la urna II es de 6

bolas

blancas

y

4

negras.

Halla:

a) La probabilidad de que la bola extraída sea blanca y de la urna II b) La probabilidad de que la bola extraída sea negra.

2. Dos personas piensan cada una de ellas un número del 0 al 9. Calcula la probabilidad de que las dos personas no piensen el mismo número. 38

39

Modulo III.- Variable aleatoria discreta y sus distribuciones de probabilidad Contenido a) Variables aleatorias Definición de una variable aleatoria, definición de una variable aleatoria discreta, definición de función de probabilidad de una v.a.d. b) Distribución de probabilidad Binomial, definición de ensaño Bernulli, definición de variable aleatoria binomial. c) Distribución de probabilidad Geométrica, serie geométrica, definición de v.a. geométrica, función de probabilidad geométrica. d) Distribución de probabilidad Poisson, proceso Poisson, v.a. Poisson, Función de probabilidad Poisson. e) Valor esperado, varianza, desviación estandar, de una v.a.d. definición de valor esperado de una v.a.d. definición de valor esperado de la función de una v.a.d. cáculo del valor esperado de las distribuciones binomial, geométrica y de Poisson. f) Propiedades del valor esperado g) Definición de varianza y desviación estandar. h) Teoremas i) Función generatriz de momentos, definición del i-esimo momento de una v.a. respecto al origen, definición del i-esimo momento de una v.a. respecto a su media, definición de función generatriz de momentos, teoremas. j) Usando la función generatriz de momentos calcular las variables de esta para la binomial, geométria y Poisson.

40

VARIABLE ALEATORIA DISCRETA: CASO 1.- Si X es una variable aleatoria discreta y Y es igual a H(X), entonces Y es también una variable aleatoria discreta. Supóngase que los valores posibles de X pueden enumerar como x1,x2... ,xn... con seguridad, los valores posibles de Y se pueden enumerar como y1= H(x1), y2= H(x2),... (Algunos de los valores anteriores pueden ser iguales, pero esto e no impide el hecho de que esos valores pueden enumerarse.). Una variable aleatoria discreta lo es, si los valores que toma se pueden contar , es decir, provienen de un espacio muestral numerable finito o infinito. DEFINICIÓN: Sea X una variable aleatoria, si el número de valores posibles de X es finito o infinito numerable se dice que X es una variable aleatoria discreta. Esto es, se pueden notar los valores posibles de X como x1,x2,... xn. Y la lista de ellas dependerá del total de valores tomando en consideración. Ejemplos: * El número de automóviles vendidos en un mes * El número de accidentes ocurridos en una determinada semana e una planta de manufactura, también determinada. Función de probabilidad de una v.a. d. La Función de probabilidad de una v.a.d. es la función que representa las probabilidades asociadas a cada valor posible de una variable aleatoria discreta. La función f definida de esta forma como hemos visto se le conoce como función de probabilidad de la variable aleatoria X. La distribución de probabilidad de X será la colección de partes[xi, f(xi)] con i=1, 2.... PROBLEMÁS Sea el experimento de observar un hospital, el sexo del primer recién nacido en un día determinado. Calcular S ,X, f y F. Solución:

S = { M,H} X = Rx= {0,1} ahora obtenemos f y F

X = xi f(xi) F(xi)

o 1 ½ ½ ½ 2/2

Consideremos el nacimiento de un pequeño en donde los resultados: niño o niña son igualmente posibles y los nacimientos son independientes.

Hallar S, X, f, F. De la variable aleatoria (uno de los niños que nacen en tres partos normales) 41

Solución:

S = {MMM,MMH,MHM,HMM,MHH,HMH,HHM,HHH}

X= {0,1,2,3}

.ahora obtenemos f y F

X = xi

0

1

.f(xi)

1/8

3/8

F(xi)

1/8

4/8

2

3/8

7/8

3

1/8

8/8

Sea

K         X  1,2,3,4  P( X)   X   0           e.o.c.  a) b) c) d)

Encontrar K para ser una función de probabilidad. Graficarla. Encontrar E(x), VAR(X), r. Hacer un intervalo de I =   2r

a) k = ? P(1) = K = 12/25 P(2) = K/2 = 6/25 P(3) = K/3 = 4/25 P(4) = K/4 = 3/25 = K(25/12) K = 12/25

b) E(X), VAR(X), r E(X) =  X P(X) E(X) = 1 (12/25) + 2 (6/25) + 3 (4/25) + 4 (3/25) 42

E(X) = 12/25 + 12/25 + 12/25 + 12/25 = 48/25 2

2

2

2

2

2

E(X ) = X P(X) = 1 (12/25) + 2 (6/25) + 3 (4/25) + 4 (3/25) 2 E(X ) = 12/25 + 24/25 + 36/25 + 48/25 = 24/5 VAR (X) = E(X ) -  = (24/5) – (48/25) = 1.1136 2

r = (VAR(X)) c)

1/2

2

= 1.0552

Hacer un intervalo de I =   2r I = { -0.1905 , 4.0305 }

43

2

LA DISTRIBUCIÓN BINOMIAL. La Distribución Binomial es una de las distribuciones discretas de la probabilidad más útil. Sus áreas de aplicación incluyen inspección de calidad, ventas, mercadotecnia, medicina, investigación de opciones y otras. Mediante ella usted puede imaginar un experimento en el que el resultado es la ocurrencia o la no-ocurrencia de un evento. Sin perdida de generalidad, llámese "éxito" a la ocurrencia del evento y "fracaso" a su no-ocurrencia. Además, p nos representa la probabilidad de éxito cada vez que el experimento se lleva a cabo y q=(1- p ) la probabilidad de fracaso. Supóngase que el experimento se realiza n veces y cada uno de estos es independiente de todos los demás, y sea X la variable aleatoria que representa el número de éxitos en los n ensayos. El interés está en determinar la probabilidad de obtener exactamente X = x éxitos durante los n ensayos. Las suposiciones claves para la distribución binomial son: 1.- El experimento consiste en n ensayos idénticos 2.- Cada ensayo produce uno de dos resultados posibles. Uno llamado éxito y otro fracaso. 3.- La probabilidad de éxito es p y es constante para todos los ensayos. La probabilidad de falla es q= 1-p 4.- Los ensayos son independientes 5.- El experimento se interesa en los y aciertos observados en los n ensayos. Varios problemas prácticos parecen adherirse razonablemente a las suposiciones anteriores. Por ejemplo, un proceso de manufactura produce un determinado producto en el que algunas unidades se encuentran defectuosas. Si la proporción de unidades defectuosas producidas por este proceso es constante durante un periodo razonable y, si como procedimiento de rutina, se selecciona aleatoriamente un determinado número de unidades, entonces las proposiciones de probabilidad con respecto al número de artículos defectuosos pueden hacerse mediante el empleo de la distribución binomial. Para obtener la función de probabilidad de la distribución binomial, primero se determina la probabilidad de tener, en n ensayos, x éxitos consecutivos seguidos de n-x fracasos consecutivos se tiene: p. p ... p. x términos

x

(1-p)(1-p).....(1-p) = p (1-p) (n - x) términos.

n-x

La probabilidad de obtener exactamente x éxitos y n-x fracasos en cualquier otro orden es la misma puesto que los factores p y (1 - p) se reordenan de acuerdo con el orden particular. Por lo tanto, la probabilidad de tener x éxitos y n - x fracasos en cualquier orden, es el producto de x n-x p (1-p) por el número de órdenes distintos. Este último es el número de combinaciones de n objetos tomando x a la vez. De acuerdo con lo anterior se tiene la siguiente definición:

Definición: Sea X una variable aleatoria que representa el número de éxitos en n ensayos y p la probabilidad de éxito con cualquiera de éstos. Se dice entonces que X tiene una distribución de probabilidad

n! p x (1  p ) n  x (n  x)! x! p(x: n , p) = 0 para cualquier otro valor

44

x = 0,1,2,......n.

0 p 1

Los parametros de la distribución binomial son n y p. Estos definen una familia de distribuciones binomiales, donde cada miembro tiene la función de probabilidad determinada Para ilustrar el efecto de estos parámetros la figura proporciona algunas gráficas de la distribución binomial.

n=5, p=0.2

n =5 , p =0.5

0.45

n =5, p=0.8

0.35

0.4

0.45

0.3

0.4

0.35 0.25

p(x)

0.3 0.25

0.35 0.3

0.2

0.2

0.25 0.2

0.15

0.15

0.15 0.1

0.1 0.05

0.1 0.05

0.05

0

0 1

2

3

4

5

0

1 1

2

3

4

2

3

4

5

5

Gráficas de la función binomial de probabilidad

Ejemplos Para ilustrar él calculo de probabilidad mediante el empleo de la binomial : Sea n = 5 y p =0.4 entonces:

p(x; 5 , 0.4) =

5! ( 0 .4 ) x ( 0 .6 ) 5  x (5  x)! x!

p(3; 5 , 0.4) =

5! (0.4)3 (0.6)5  3  0.2304 (5  3)!3!

x = 0,1,2,3,4,5; p(0;5,0.4)=

5! (0.4)0 (0.6)5  0.0778 (5  0)!0!

p(4; 5 , 0.4) =

5! (0.4) 4 (0.6)5  4  0.0768 (5  4)!4!

p(1;5,0.4)= p(5; 5 , 0.4) =

5! (0.4)1 (0.6)5 1  0.2592 (5  1)!1!

5! (0.4)5 (0.6)5 5  0.0102 (5  4)!4!

p(2; 5 , 0.4) =

5! (0.4) 2 (0.6)5  2  0.3456 (5  2)!2! La probabilidad de que una variable aleatoria X sea menor o igual a un valor especifico de x, se determina por la función de distribución acumulativa.

p(X

 x ) = F(x; n, p) =

x

( i 0

n i

) p i (1  p ) n  i

Sea n = 10 y p = 0.3. La probabilidad de que X pueda ser cuatro es: p(X

 4 ) = F(4; 10, 0.3) = 0.8497

La probabilidad de que X sea menor de dos es :

45

p(X>2) = p(  3)  1  p( X  2)  1  F (2;10,0.3)  0.6172 )

Esperanza matemática. Usando la función generadora de momentos tenemos:

Por lo tanto,

Entonces Varianza. 2

Para calcular la Varianza, derivemos primero E[X ] de la siguiente manera:

Por lo tanto,

Entonces:

Ejercicios. Una moneda es lanzada 20 veces. Calcule el número más probable de salidas de cara y cual es la probabilidad de que salga ese número. Solución: El número más probable de caras es evidentemente n p =10. Y la probabilidad de que salga 10 veces es:

46

Supongamos que la probabilidad de recuperar un carro robado en Caracas es de 0.04. a) ¿Cuál es la probabilidad de que de 10 carros robados sean recuperados a lo sumo 3 de ellos? b) ¿ Cuál es la probabilidad de que al menos 7 de los 10 carros sean recuperados? Solución: a) P(X=0) + P(X=1) + P(X=2) + P(X=3) = .66 + .27 + .05 + .0058 = .9995 b) P(X=7) + P(X=8) + P(X=9) = .00055

Un tubo de radio puesto e cierto tipo de equipo, tiene una probabilidad de 0.2 de funcionar más de 500 hrs. Si se prueban 20 tubos , ¿cuál es la probabilidad de que exactamente k de ellos funcionen más de 500 hrs. K=0, 1, 2, ..., 20? solución: Si X es el número de tubos que funcionan más de 500 hrs. Se tiene una distribución binomial. Donde: P=0.2 Q=1-P=0.8

P(X=10)=0.002 P(X=K)=0

 N  K NX  P Q X

P(X)= 

 20  0.2K 0.820 K k 

P(X=K)= 

Sustituyendo los valores de K: P(X=0)=0.012 P(X=1)=0.058 P(X=2)=0.137 P(X=3)=0.205 P(X=4)=0.218 P(X=5)=0.175 P(X=6)=0.109 P(X=7)=0.055 P(X=8)=0.022 P(X=9)=0.007 47

+

Las probabilidades para X>10 son menores de 0.001

.. .. .. .. .

LA DISTRIBUCIÓN DE PROBABILIDAD GEOMÉTRICA. . La variable a aleatoria que tiene distribución geométrica se define para un experimento que es muy similar al experimento binomial. También se refiere a pruebas idénticas e independientes, y cada uno puede tener dos resultados, éxito o fracaso. La probabilidad de tener éxito es igual a p y es constante para cada prueba. Sin embargo, la variable aleatoria geométrica Y es el número de la prueba en la cual ocurre el primer éxito, en lugar del número de éxitos que ocurren en n pruebas. Entonces el experimento consiste en una serie de pruebas que termina al obtener el primer éxito. Por consiguiente, el experimento podría terminar en la primera prueba al obtener el éxito o podría seguir indefinidamente.

El espacio muestral S para el experimento contiene el siguiente conjunto infinito contable de puntos muestrales.

E1 : S E2 : F S E3 : F F S

... éxito en la primera prueba 

... fracaso en la priemra, éxito en la segunda 

... fracasos en la primera y la segunda, éxito en la tercera 

E4 : F F F S . . . EK : F F F... F S k 1

Como la variable aleatoria Y es el número de pruebas hasta tener el primer éxito inclusive, Y  1, Y  2 y Y  3 contendrán E1, E 2 , E3 , respectivamente, y en general, el evento numérico Y  y y contendrán solamente E y . De este modo,

 

p y   p E y  p F F F ... F S y 1

48

.. .. .. .. de la intersección de y eventos independientes da lugar a la distribución de La probabilidad . probabilidad geométrica. Un histograma para p(y), en donde p = 0.5 se muestra en la figura 1. Las áreas sobre los intervalos corresponden a probabilidades, tal como era el caso de las distribuciones de frecuencia de datos, solamente debe considerarse que Y puede tomar valores discretos, y=1,2,...,.

Gráfico de una distribución de probabilidad geométrica con p=0.5 0.6 0.5 0.4 p(y)0.3 0.2 0.1 0 1

2

3

4

5

6

7

8

Y

La distribución de probabilidad geométrica se usa frecuentemente como modelo para las distribuciones de longitud de tiempos de espera. Por ejemplo, supongamos que se da mantenimiento periódico al motor de un avión comercial de tal manera que sus diferentes partes se cambian en distintos momentos y por eso tiene tiempos de servicio diferentes. Entonces, puede ser razonable suponer que probabilidad de p, de falla del motor durante cualquier intervalo de una hora Y hasta el primer mal funcionamiento o descompostura.

Esperanza matemática de X Geométrica

E[X] = E[Y] –1 = (1-p)/p

49

Ejemplos

.. .. .. .. .

La probabilidad de que una componente de un sistema computacional falle en un ciclo de tiempo (dt) es p. a. ¿ Cuál es el tiempo promedio esperado antes de que la componente falle? b. Solución: Asumiendo que las fallas ocurren independientemente entre si, el número de ciclos (1 dt) para la primera falla debería seguir una distribución geométrica. Luego el tiempo promedio de falla de una componente será 1/p. c. Suponga que se requieren „n‟ componentes para construir una parte. Asumiendo que la parte falla, si falla una de sus componentes, ¿ cual es la probabilidad de que cualquiera de sus componentes falle? Solución: Para n componentes, la probabilidad de falla de la parte, es la acumulada a „n‟de la Geométrica, es decir, – (1-p)

n

[para p pequeño, suma a n de p = np, entonces el tiempo esperado para que ocurra la 1ª. Falla será 1/(np) ]

El fabricante de un lector óptico de precios asegura que la probabilidad de que su aparato lea mal el precio de cualquier producto al interpretar mal el código de barras de la etiqueta es de 0.001. En el momento de que uno de los lectores se instalo en un supermercado, el gerente de la tienda probo su desempeño. Sea “y” el numero de pruebas (es decir el numero de precios leídos por el aparato) hasta que se observa el primer error en la lectura de un precio. a) Si la aseveración del fabricante es correcta, calcule la distribución de probabilidad para “y” (suponga que las pruebas representan eventos independientes) b) Si lo que dice el fabricante es cierto, ¿Qué probabilidad hay de que el lector leerá bien por lo menos los primeros cinco precios? c) Si de hecho se lee mal el tercer precio, ¿Qué inferencia haría usted acerca de lo que el fabricante asegura, explique.

Solución. y-1 a) Geométrica p(y)=pq y-1 P(y)=(0.001) (0.999) 1-1

b) p(y)= (0.001)(0.999) + (0.001)(0.999) 5-1 -3 (0.001)(0.999) = 4.99 x 10 p(y  5)= 1- p(

5 1

2-1

+ (0.001)(0.999)

3-1

+ (0.001)(0.999)

p(y)) = 0.775

c) Que no sería confiable lo que nos dice la probabilidad del fabricante.

50

4-1

+

.. .. .. .. . Distribución de Probabilidad Poisson Definición y propiedades de la distribución de Poisson. Función de probabilidad.- Sea X una variable aleatoria con una distribución discreta y supóngase que el valor de X debe ser un entero no negativo.. Se dice que X tiene una distribución de Poisson con media  ( > 0 )si la f.p de X es la siguiente:

 e   x para  x  0,1,2,.... x  f     x!   0  en.otro.caso

Esta claro que f (x/  ) = 0 para cada valor de x . Para verificar que la función f (x/ ) definida por la ecuación anterior satisface los requisitos de toda f.p, se debe demostrar que la función sea igual a 1. Por tanto.



 x 0

  x  x f   e      e  e   1  x  0  x! 

Si X es una v.a. de Poisson , entonces X mide : - El número de ocurrencias discretas (éxitos) en un espacio continuo. Un proceso de Poisson tiene las siguientes características: - El número de éxitos en un intervalo de tiempo o región específicos es independiente del número de éxitos en cualquier otro intervalo ajeno de tiempo o región del espacio considerado. - La probabilidad de que un éxito ocurra en un intervalo de tiempo o espacio muy corto es proporcional a la longitud del intervalo o tamaño de la región y no depende del número de resultados que ocurren fueran de esta intervalo o región. - La probabilidad de que más de un resultado ocurra en ese intervalo de tiempo tan corto o regiones tan pequeñas que es despreciable.

La distribución de Poisson a menudo servirá como una distribución de probabilidad apropiada para variables aleatorias tales como el número de llamadas telefónicas recibidas por una central telefónica durante un periodo de tiempo fijo, el número de partículas atómicas emitidas por un a fuente radiactiva que golpea un cierto punto durante un periodo de tiempo fijo o el número de defectos en una longitud especifica de un cinta magnética de grabación . Cada un de estas variables aleatorias representan el número total X de ocurrencia de un fenómeno durante un periodo de tiempo fijo que genera estas ocurrencias satisface tres condiciones matemáticas especificas, entonces la distribución de X debe ser una distribución de Poisson . Se presentara ahora un adscripción completa de las tres condiciones que se necesitan. En la siguiente exposición supóngase que se observa el número de ocurrencias de un fenómeno concreto durante un periodo de tiempo fijo. La primera condición es que el número de ocurrencias en dos intervalos cualesquiera de tiempo distintos deben ser independientes entre si. La segunda condición es que la probabilidad de una ocurrencia durante cualquier intervalo de tiempo muy pequeño debe ser aproximadamente proporcional a la longitud de ese intervalo.

51

.. .. .. . Para expresar. esta condición más formalmente se utiliza la notación matemática estándar o(t) . que denota cualquier función de t con la propiedad de que: lim t 0

0(t ) 0 t

De acuerdo con esta formula, o(t ) debe ser una función que se aproxima a cero cuando t –0 y además, esta función debe aproximarse a cero más rápido que t . La segunda condición se puede expresar ahora como sigue: Existe una constante  > 0 tal que para cualquier intervalo de tiempo de longitud t, la probabilidad de almenas una ocurrencia durante ese intervalo tiene la forma  t +o(t) . Entonces para cualquier valor muy pequeño de t , la probabilidad de al menos una ocurrencia en un intervalo de longitud t , es igual a  t más una cantidad que tiene una magnitud de orden menor. Una de las consecuencias de la segunda condición es que el proceso observado debe ser estacionario sobre el periodo de observación completo; esto es , la probabilidad de una ocurrencia debe ser la misma sobre el periodo completo. No puede haber periodos ocupados, durante los cuales se sabe de ante mano que es probable que las ocurrencias sean más frecuentes. Esta condición se refleja en el hecho de que la misma constante  expresa la probabilidad de una ocurrencia en cualquier intervalo durante el periodo completo de observación. La tercera condición que se debe satisfacer es que la probabilidad de que haya dos o más ocurrencias en cualquier intervalo de tiempo muy pequeño debe tener una magnitud de menor orden que la probabilidad de que haya solo una ocurrencia. En símbolos, la probabilidad de dos o más ocurrencias en cualquier intervalo muy pequeño debe de despreciable en comparación con la probabilidad de una ocurrencia. Claramente, de la segunda condición resulta que la probabilidad de una ocurrencia en ese mismo intervalo será despreciable por si misma en comparación con la probabilidad de no ocurrencia. Si se verifican las tres condiciones anteriores, entonces se puede demostrar por los métodos de ecuaciones diferenciales elementales que el proceso cumplirá las dos propiedades siguientes. El número de ocurrencias en cualquier intervalo de tiempo fijo de longitud t tendrá un distribución de Poisson cuya media es  t Como se supuso en la primera condición, los números de ocurrencias en dos intervalos cualquiera de tiempos distintos serán independientes. Un proceso para el que se satisfacen estas dos propiedades se llama un proceso de Poisson. La constante positiva  es el número esperado de ocurrencias por unidad de tiempo. La distribución Poisson con función de probabilidades.

Se le llama distribución de Poisson, debido a que S.D. Poisson lo introdujo en 1837.

Y F(x)=0 cuando x < 0. La distribución de Poisson tiene aplicaciones importantes. De hecho, esta distribución es una aproximación conveniente de la distribución binomial en casos en donde existe un gran número n de ensayos y una probabilidad pequeña p de éxito en un solo ensayo. Esto es una consecuencia de la sig. Proposición. Si en la función de probabilidades binomial para x fijo, hacemos que n   y p  0 a través de sucesiones de valores en donde np es igual a un número  fijo.

52

.. .. .. .. . Para demostrar esto, partimos de  = np y tenemos:

Y

De igual manera,

Entonces:

Cuando n  , la expresión:

Tiende a 1, y también la expresión de las llaves, mientras que la de los paréntesis - rectangulares tiende a e . Esto completa la demostración, que también prueba para  como la media de la distribución de Poisson.

Ejercicios : Refiérase al estudio publicado en Science (abril de 1993) relativo a las propiedades espectroscópicas de los asteroides de la franja principal. Las investigaciones revelaron que, en promedio, se observan 2.5 exposiciones de imagen espectral independientes por asteroide. a) Suponiendo una distribución de Poisson, calcule la probabilidad de observar exactamente una exposición de imagen espectral independiente durante la observación de un asteroide de la franja principal. b) Suponiendo una distribución de Poisson, calcule la probabilidad de observar cuando más dos exposiciones de imagen espectral independientes durante la observación de un asteroide de la franja principal. SOLUCION: Tanto la media como la varianza de una variable aleatoria de Poisson son iguales a λ. Por tanto, en este problema será: μ = λ = 2.5;

σ² = λ = 2.5

por lo tanto σ = √2.5 = 1.58

53

a)

.. .. .. .. conocer la probabilidad de que se observe exactamente Queremos . espectral. La distribución de probabilidad de “y” es: imagen

una exposición de

P (y) = (λ*y)(℮*-λ) / y! Entonces, dado que λ = 2.5, y = 1 y ℮*-2.5 = 0.082085 por lo tanto: P(y = 1) = (2.5* 1)(.082085)/(1!) = (2.5)(.082085)/(1) = 0.20521 P(y = 1) = 0.20521 b) Queremos conocer la probabilidad de que se observe cuando más dos exposiciones de imagen espectral. Entonces, dado que λ = 2.5, y ≤ 2 y ℮*-2.5 = 0.082085 por lo tanto: P(y ≤ 1) = P(0) + P(1) +P(2) P(y ≤ 1) = (2.5* 0)(.082085)/(0!) + (2.5* 1)(.082085)/(1!) + (2.5* 2)(.082085)/(2!) P(y ≤ 1) = (1)(.082085)/(1) + (2.5)(.082085)/(1) + (6.25)(.082085)/(2∙1) P(y ≤ 1) = 0.082085 + 0.20521 + 0.25651 P(y ≤ 1) = 0.543805

54

.. .. .. .. . DISTRIBUCIÓN HIPERGEOMETRICA La distribución Binomial es importante en muestreos con reemplazo. Supongamos que queremos conocer el número de elementos defectuosos presentes en una muestra de „n‟ elementos, extraídos de una urna que contiene „N‟ elementos de los cuales „M‟ están defectuosos. Si la extracción es con reemplazo entonces la probabilidad de escoger x elementos defectuosos tendrá un comportamiento Binomial, es decir:

Sin embargo, lo correcto en un caso como el de inspección, sería hacer la selección sin reemplazo, en cuyo caso en la 1ª. selección la probabilidad de que salga defectuoso es M/N, pero la segunda vez seria (M-1)/(N-1) ó M/(N-1) si antes salió defectuoso o no (número de casos favorables / número de casos posibles).

Luego, la probabilidad de escoger x elementos defectuosos en una muestra de n elementos sin reemplazo será:

la cual da lugar a la distribución conocida como Hipergeométrica. Esperanza matemática de la Hipergeométrica: Supongamos que n elementos de la muestra son seleccionados desde los N de la población manera secuencial. Si definimos la VA:

Entonces, n elementos.

Luego, se tiene que:

, nos señala el número de elementos defectuosos de la muestra de

y como E[Xi] = 1. p(Xi=1) + 0 . p(Xi=0) = p(Xi=1) = M/N,

E[ X ] = n . M/N

55

.. .. .. . El cálculo de.la Varianza es problemático porque las Xi no son independientes y en . hay que considerar indicadores no considerados hasta ahora consecuencia (Covarianzas). El resultado es:

La función generadora de momentos

Supóngase que X es una variable aleatoria; es decir, X es una función del espacio muestral a los números reales. Al calcular diversas características de la variables aleatoria X, como E(X) o V(X), trabajamos directamente con la distribución de probabilidades de X. La distribución de probabilidad de una función: la fdp en el caso continuo, o las probabilidades puntuales p(xi) = P(X = xi) en el caso discreto. La ultima también se puede considerar como una función que toma valores distintos de cero sólo si X = xi, i = 1, 2,------.

Posiblemente podemos presentar

otra función y hacer los cálculos necesarios mediante ella (tal como antes asociábamos con cada número un nuevo número). Esto es, de echo, lo que haremos precisamente. Primero daremos una definición normal.

Definición. Sea X una variable aleatoria discreta con distribución de probabilidades P(xi)=P(X = xi), i = 1, 2,..........La función, MX, llamada función generadora de momentos de X, se define con:

 txj MX (t )   e p( xj) j 1

Si X es una variable aleatoria continua con fdp f, definimos la función generadora de momentos con

 MX (t )   e tx f ( x)dx 

Observaciones:

a) tanto en el caso discreto como en el continuo, Mx(t) es simplemente el tX

valor esperado de e . Por tanto, podemos combinar las expresiones anteriores y escribir:

56

.. .. .. .. .

MX (t )  E (etX )

I. MX(t) es el valor que toma la función MX por la variable (real) t. La notación que indica la dependencia de X se usa porque quizá deseemos considerar dos variables aleatorias, X y Y, y luego investigar la función generadora de momentos de cada una, esto es, Mx y My.

II. Usaremos la forma abreviada fgm para la función generadora de momentos. III. La fgm, como se definió anteriormente, se escribe como una serie infinita o integral (impropia), dependiendo de si la variable aleatoria es discreta o continua. Tal serie (o integral) puede no existir siempre (es decir; convergir aun valor infinito) para todos los valores de t. Por tanto, puede suceder que la fgm no esté definida para todos los valores de t. Sin embargo, no nos interesará esta posible dificultad. Cada vez que hagamos uso de la fgm, siempre supondremos que existe. (Para t = O, /a fgm siempre existe y es Igual a 1.) IV. Hay otra función muy relacionada con la fgm que a menudo se usa en su lugar. Se itX

llama función característica, se denota con Cx, y se define con Cx(t) = E(e ), donde 1/2

i=(-1) , la unidad imaginaria. Por razones teóricas, hay una ventaja considerable al usar Cx(t) en vez de Mx(t). Por esta razón, Cx(t) siempre existe para todos los valores de t. Sin embargo, a fin de evitar cálculos con números imaginarios complejos restringiremos nuestra exposición a la función generadora de momentos. Teoremas Teorema 1 (n)

n

M (0)=E(X ) n

(Esto es, la n-ésima derivada de Mx(t) calculada en t=0 da E(X ) n

Los números E(X ), n=1, 2, ........, se llaman n-ésimos momentos de la variable aleatoria X respecto a cero. Por tanto, hemos demostrado que conociendo la función Mx, pueden generarse los momentos (de aquí el nombre de función generadora de momentos).

Teorema 2 Supóngase que la variable aleatoria X tiene fgm Mx sea Y = X+. Entonces, My, la fgm de la variable aleatoria Y, esta dada por:

57

.. .. .. .. .

My(t) = etMx(t).

En palabras, para encontrar la fgm la fgm de Y=X+ calculamos la fgm en t (en vez de t) y multiplicamos por et Yt

My(t) = E(e ) = E[e

(xX+)t

]

= etE[etX] = etMx(t)

Teorema 3

Sean X y Y dos variables aleatorias con fgm, Mx(t) y My(t), respectivamente. Si Mx(t) = My(t) para todos los valores de t, entonces X y Y tienen la misma distribución de probabilidades.

Sin embargo, es muy importante comprender exactamente lo que establece el teorema. Este dice que si dos variables aleatorias tienen la misma fgm, entonces tienen la misma distribución de probabilidades.

Esto es, la fgm determina unívocamente la distribución de

probabilidades de la variable aleatoria.

Teorema 4

Supóngase que X y Y son variables aleatorias independientes, sea Z = X + Y. Sean Mx(t), My(t) y Mz(t) las fgm de las variables aleatorias X, Y y Z, respectivamente. Entonces: Mz(t) = Mx(t)My(t)

58

.. .. .. .. .

MODULO IV.- Variable aleatoria continua y sus distribuciones de probabilidad. Contenido a) Variable aleatoria continua Definición de v.a.c definición de función de distribución acumulada, función de densidad de una v.a.c. propiedades de la función de distribución acumulada, valor esperado, varianza y desviación estadar de una v.a.c. definición de valor esperado de una v.a.c, propiedades del valor esperado de una v.a.c. esperanza de una función de una v.a.c. la varianza y desviación estandar de v.a.c. teoremas. b) Distribución uniforme Definición de la distribución uniforme, valor esperado de una distribución uniforme, varianza y desviación estandar de una distribución uniforme. c) La distribución exponencial La función de densidad exponencial, función de distribución acumulada de una función de densidad exponencial, el valor esperado de una función de densidad exponencial, varianza y desviación estandar de una exponencial. Propiedades de pérdida de memoria de la exponencial. d) La distribución normal La función de densidad normal, función de distribución acumulada de una v.a. normal, función de densidad normal estandar, función de distribución acumulada de una v.a. normal, estandarización de la distribución normal, media y varianza de la distribución normal. e) Distribución de probabilidad Ji cuadrada f) Distribución de probabilidad F g) Distribución de probabilidad T h) Distribución de probabilidad gamma i) Distribución de probabilidad Beta j) Función generadora de momentos Definición del i-esimo momento de una v.a. con respecto al origen, Definición del i-esimo momento de una v.a. con respecto a su media, teoremas, Teorena de Tchebysheff.

59

.. .. .. .. .

a) Variable aleatoria continua Definición: Se dice que X es una variable aleatoria continua, si existe una función f, llamada función de densidad de probabilidad (fdp) de X, que satisface la siguientes condiciones: 1)

f ( x)  0 para toda x,

2)



3)

Para cualquier a, b, tal que    a  b  , tenemos





f ( x)dx  1

b

P(a  X  b)   f ( x)dx. a

Definición de variable aleatoria acumulada o continua

Una variable aleatoria Y se dice continua si no puede tomar un conjunto numerable de valores. (X,Y) es una variable aleatoria bidimensional discreta si los valores posibles de (X,Y) son finitos o infinitos numerables. Es decir, los valores posibles de (X,Y) se pueden representar como (xi,yi),=1,2,.....,n,....;j=1,2,....,m,.. (X,Y) es una variable aleatoria bidimensional continua si (X,Y) puede tomar todos los valores en un conjunto no numerable del plan euclidiano.

Definición de función de distribución acumulativa Sea Y cualquier variable aleatoria. La función de distribución de Y, denotada por F(y) está dada por: F(y) = P( Y  y) - 45 ) = P( 25  x  45 )

45

1

1

 30dx  30 x

25

C)

45 45 25 20 2    30 30 30 3 25

  1.5

  E (X ) =

VAR 

a  b 20  50   35 2 2

b  a  2 12

  VAR 



50  20 2 12



30 2 12

 75

75  8.66

Con la siguiente función acumulativa encontrar las siguientes probabilidades. P(2 < x ≤ 6) P(x = 4) P(7 < x < 9) P(x >5) P(x >3)

F(x)=

0 1/3 ½ 5/6 1

xo

=0 para cualquier otro valor. Una integral inmediata indica que:





0

f ( x )dx  1

y, por tanto, la ecuación representa un fdp.

La distribución exponencial desempeña un papel importante en la descripción de una gran clase de fenómeno, especialmente en el área de la teoría de la confiabilidad. Por el momento, sólo investiguemos algunas de las propiedades de la distribución exponencial.

Propiedades de la distribución exponencial. a) La fda F de la distribución exponencial está dada por: x

F ( x)  P( X  x)   e t dt  1  e x , x  0 0

= 0 para cualquier otro valor. Por tanto, P( X  x)  e x

b) El valor esperado de X se obtiene como sigue: 

E ( X )   xe x dx 0

76

.. .. .. .. .

Integrando por partes y haciendo e x dx  dv y x=u, obtenemos v= v  e x y du=dx. Luego E ( X )   xe x

 0  0 e x dx  1 



c) La varianza de X puede obtenerse con una integración semejante. Encontramos que E ( X 2 )  2  2 y por lo tanto,



V ( X )  E ( X 2 )  E ( X )  2

1

2

La distribución exponencial tiene la siguiente propiedad importante, análoga a la ecuación descrita para la distribución geométrica. Considerando para cualquier s, t>0, P(X>s+t | X>s). Tenemos:

P( X  s  t X  s) 

P ( X  s  t ) e  ( s t )  s  e t P( X  s) e

Por lo tanto,

P( X  s  t X  s)  P( X  t )

Así hemos demostrado que la distribución exponencial también tiene la propiedad de "no tener memoria" como la distribución geométrica.

Un caso especial muy importante de la distribución gama, se obtiene si hacemos   12 y r=n/2, donde n es un entero positivo. Obtenemos una familia de distribuciones de un parámetro con fdp f ( z)

n 1 z z 2 1 e  2 , 2 2  ( n 2) n

z>0

Una variable aleatoria Z que tiene fdp dada por la ecuación anterior se dice que tiene una distribución X-cuadrada con n grado de libertad (se denota con X 2 n ). Una consecuencia inmediata de la ecuación del inciso c, es que si Z tiene fdp de la ecuación anterior, tenemos:

77

.. .. .. .. .

E (Z )  n ,

V ( Z )  2n

Ejemplo Un enfermo de gripa tiene tos a un promedio de 6

5

de accesos de tos por

minuto. Calcular la probabilidad de que en un momento dado transcurra mas de 1 minuto hasta el segundo acceso de tos dado que el acceso ocurrió. 

6



6



6



 x 6  x 6  x 65 P( x  1)   e 5 dx   e 5 dx     eu du   e 5  * 51 5  6 1 1 5 1

6 u x 5 6 du   dx 5

*= e

6   5

 6     e 5   0  0.3012  0.3012  

La duración (en horas) de la unidad central de proceso de cierto tipo de microcomputadora es una variable aleatoria exponencial con parámetro =1,000. a. Calcule la media y la varianza de la duración de la unida central de proceso. b. ¿Qué probabilidad hay de que una unidad centra de proceso tendrá una duración de por lo menos 2,000 horas? c. ¿Qué probabilidad hay de que una unidad centra de proceso tendrá una duración de cuando más 1,500 horas? Solución: a) =1000

2=2=1000000

b)P(2000)=e-y/ = e-2000/1000 = .135 c)P(y
View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF