Trabajo de Probabilidades

September 1, 2017 | Author: Luis Edgardo Guillen Bonilla | Category: Skewness, Normal Distribution, Mean, Probability, Probability Distribution
Share Embed Donate


Short Description

Download Trabajo de Probabilidades...

Description

Eventos Dependientes La ocurrencia de un evento influye en la ocurrencia de otro evento. Si un proyecto se empieza tarde otro proyecto que dependa del mismo requerirá tiempo adicional. Si los eventos son dependientes, entonces, por definición, se debe considerar el primer evento al determinar la probabilidad del segundo. Es decir, la probabilidad del evento B depende de la condición que A ya haya ocurrido. Se necesita del principio de probabilidad condicional.

P (A n B) = P(A) X P(B lA)

La

probabilidad de

los eventos conjuntos A y B es:

Aunque el uso de una tabla puede simplificar los cálculos de probabilidad, existen ejemplos en los cuales es muy diftcilla creación de una tabla, por tanto se requiere el uso de fórmulas. El siguiente ejemplo ilustra este caso. El gerente de créditos de Dollar- Wise Department Store recolecta datos.sobre 100 de sus clientes.

De los 60 hombres, 40 tienen

tarjetas de crédito (C ). De las 4(} mujeresr'Sfl tienen tarjeta de crédito (C). Diez de los hombres tienen saldos vencidos (B), mientras que 15 de las mujeres tienen saldos vencidos (8). El gerente de crédito

desea

determinar

la

probabilidad

seleccionado al azar sea: a.

Una mujer con tarjeta de crédito.

b.

Una mujer con un saldo.

c.

Un hombre sin un saldo. 1

de

que

un

cliente

d.

Un hombre con un saldo.

Solución Crear una tabla de probabilidad es difícil ya que existen tres factores: género, tarjeta de crédito y saldo en la tarjeta. El uso de la fórmula previa sea quizá el modelo preferido, como se muestra a continuación: .

í a. P(W n C) = P(W) x P(C I W). Claramente P(W) = 40/100. Además, de las 40 muje re \ 30 tienen tarjetas de crédito. Por tanto, dado que el cliente es una mujer, la probabilidad de tenga

una

Entonces:

tarjeta

P(W n C) =

de

crédito

que

es P(C I W) = 30/40.

P(W) x P(C I W) = (40/100) X (30/40)

=0.30

b. P(WnB) ==P(W) xP(B I W ). De las 40 mujeres, 15 tienen saldos. Dado que el cliente es una mujer, la probabilidad de que tenga un saldo es de 15/40. De manera que

P(W n B) =

P(W) x P(B I W )= (40/100)(15/40) =0.15.

c.

P(MnB) = P(M) x P(B IM). Debido a que 50 de los 60 hombres

no tienen saldos,

P(B I M )= 50/60. Entonces, P(M nB) = P(M)

x P(B I M) = (60/100).(50/60) = 0.50.

d.

P(MnB):=P(M) x P(B I M). De los 60 hombres, 10 tienen

saldos. P(B IM) = 10/60. Así, P(MnB) = P(M) x P(B 1M) =(60/100) (10/60)= 0.10. 2

Interpretación Pueden determinarse las probabilidades de otros eventos conjuntos que ayudarían al gerente de crédito a determinar las políticas de la tienda y a incrementar las ventas. La Distribución Normal La distribución normal fue reconocida por primera vez por el francés Abraham de Moivre (1667-1754). Posteriormente, Carl Friedrich Gauss (1777-1855) elaboró desarrollos más profundos y formuló la ecuación de la curva; de ahí que también se la conozca, más comúnmente, como la "campana de Gauss". La distribución de una variable normal está completamente determinada por dos parámetros, su media y su desviación estándar. Lo cual determina la curva en forma de campana. Así, se dice que una característica sigue una distribución normal de media y varianza. Al igual que ocurría con un histograma, en el que el área de cada rectángulo es proporcional al número de datos en el rango de valores correspondiente si, en el eje horizontal se levantan perpendiculares en dos puntos a y b, el área bajo la curva delimitada por esas líneas indica la probabilidad de que la variable de interés, X, tome un valor cualquiera en ese intervalo. Puesto que la curva alcanza su mayor altura en torno a la media, mientras que sus "ramas" se extienden asintóticamente hacia los ejes, cuando una variable siga una distribución normal, será mucho más probable observar un dato cercano al valor medio que uno que se encuentre muy alejado de éste. Importancia de la Distribución Normal • Existen numerosas variables que parecen seguir una forma

similar a la distribución normal (pesos, alturas, coeficientes 3

intelectuales, calificaciones en exámenes, entre otros.) • La distribución muestral de muchos estadígrafos muestrales como la media tienen una distribución aproximadamente normal e independiente de la configuración de la población, si los datos son suficientemente numerosos. • Es una excelente aproximación a otras distribuciones

muestrales como la de Poisson y Binomial, por ejemplo.Propiedades de la distribución normal. Propiedades de la Distribución Normal La distribución normal posee ciertas propiedades importantes que conviene destacar: I.

Tiene una única moda, que coincide con su media y su

mediana. II.

La curva normal es asintótica al eje de abscisas.

cualquier valor entre – infinito

Por ello,

y + infinito es teóricamente

posible. El área total bajo la curva es, por tanto, igual a 1. III.

Es simétrica con respecto a su media. Según esto, para este

tipo de variables existe

una probabilidad de un 50% de

observar un dato mayor que la media, y un 50% de observar un dato menor. IV.

La distancia entre la línea trazada en la media y el punto de

inflexión de la curva es igual a una desviación típica.

Cuanto

mayor sea, más aplanada será la curva de la densidad. V.

El área bajo la curva comprendida entre los valores situados

aproximadamente a dos desviaciones estándar de la media es igual a 0.95.

En concreto, existe un 95% de

observar un valor comprendido en el intervalo

posibilidades de .

VI. La forma de la campana de Gauss depende de los parámetros media y desviación estándar. La media indica la posición de la campana, de modo que para diferentes valores de la gráfica es desplazada a lo largo del eje horizontal. 4

Por otra parte, la

desviación estándar determina el grado de apuntamiento de la curva. Cuanto mayor sea el valor, más se dispersarán los datos en torno a la media y la curva será más plana. Un valor pequeño de este parámetro indica, por tanto, una gran probabilidad de obtener datos cercanos al valor medio de la distribución. Como se deduce de este último apartado, no existe una única distribución normal, sino una familia de distribuciones con una forma común, diferenciadas por los valores de su media y su varianza. De entre todas ellas, la más utilizada es la distribución normal estándar, que corresponde a una distribución de media 0 y varianza 1.

La curva normal o campana de Gauss se concibe

como un histograma donde el número de intervalos aumenta de forma indefinida, disminuyendo progresivamente su amplitud. Esta propiedad resulta especialmente interesante en la práctica, ya que para una distribución N (0,1) existen tablas publicadas a partir de las que se puede obtener de modo sencillo la probabilidad de observar un dato menor o igual a un cierto valor z, y que permitirán

resolver

preguntas

de

probabilidad

acerca

del

comportamiento de variables de las que se sabe o se asume que siguen una distribución aproximadamente normal. La distribución normal es una distribución continua (no discreta). Se utiliza para reflejar la distribución de variables tales como estaturas, pesos, distancias y otras medidas que son divisibles infinitamente. Tales variables continuas generalmente son el resultado de la medida. Asi pues, tiene muchas y muy importantes propiedades, como, por ejemplo: • La altura máxima la alcanza en el punto central, cuyo valor (valor máximo) se sitúa en

la media de la distribución.

• La curva es simétrica con respecto al eje vertical que pasa por la media. • En cualquier distribución normal, la media, la moda y la mediana 5

tienen el mismo valor.

5

4

3

2

1

0 -3

-2

-1

0

1

2

3

Dependiendo de la media y de la desviación típica existen infinitas

curvas

normales

pero

todas

ellas

equivalentes.

Sin

embargo, la distribución con la que habitualmente se trabaja en la normal típica, es aquella que tiene de media 0 y de desviación típica 1. La Función Normal

Es una curva lisa, de forma acampanada y unimodal como se presenta en la siguiente figura:

Se dice que una variable x numérica de experimentación con media

aritmética

probabilística

µx y

desviación

estándar

probabilística positiva σx sigue una distribución normal o es una variable normal si tiene definida una función densidad probabilidad dada por: 6

de

fn( x ) =

1

σ x 2π

e

1  x −µ x −  2 σ x

  

2

En las fórmulas anteriores intervienen las siguientes constantes:

π

Aproximadamente 3.141592

e

Aproximadamente 2.718281

σx

Parámetro desviación estándar probabilística de x (variables

normales

diferentes pueden tener distintas desviaciones

estándar probabilísticas, pero para cada variable normal, su desviación estándar probabilística es constante). µx

Parámetro media aritmética de probabilística de x (variables

normales diferentes pueden tener distinta medias aritméticas probabilísticas,

pero

para

cada

variable

normal

su

media

aritmética probabilística es constante). Distribución Normal Estandar o Tipificada Una variable de experimentación es estándar o tipificada si su media aritmética probabilística es cero (0) y su desviación estándar probabilística es uno (1). Si una variable de experimentación x es normal y tipificada, su función de densidad de probabilidad se denomina normal estándar o normal tipificada y se ajusta a la fórmula:

fnt ( x) =

x2

− 1 e 2 2π

Curva Normal Tipificada

7

Con el fín de suprimir la individualidad de cada una de las distribuciones señaladas gráficamente, se convierte a la curva normal, en un modelo matemático con características fijas y definidas y así se hace posible el cálculo de probabilidades. Este proceso se conoce con el nombre de tipificación de la curva normal. Para lo cual se supone: a) La media o promedio de la población es cero µ =0 b) La desviación estándar igual a uno c) La variable independiente x, se transforma en un valor z.

-3

-2

-1

0

1

2

3

Desviación normal estándar Fórmulas de cálculo se reproducen a continuación como las fórmulas:

z≡

x − µx σx

za =

Característica de la curva normal tipificada

8

a − µx σx

a) Es simétrica respecto a su media (50% a la derecha y 50% a la izquierda de la media)

b)

El área encerrada es 1 o 100%

c)

La media, mediana y moda son iguales.

Ejemplos de los casos más frecuentes del cálculo de probabilidades de intervalos.

9

= P ( z < −a ) + P ( z > b)

. - a

b

Calculos de Área bajo la curva normal

La curva normal representa un histograma en el que el intervalo es infinitamente pequeño. Al igual que en el histograma, para averiguar la proporción de elementos que obtienen puntaciones inferiores o superiores a una dada, bastará con saber la proporción del área de la parte referida. Cuando

utilizamos

“z”

hacemos

comparables

todas

las

puntuaciones. Cuando tenemos una “z” sabemos el área que ocupa 10

expresada en porcentajes. Para ello, hay que buscar el valor de “z” en la tabla anexa (áreas bajo la curva normal). Para su cálculo, en todos los casos los casos que se ilustran a continuación, seguiremos el siguiente proceso: 1º Dibujar la curva con una distribución normal. 2º Representar los datos que tenemos en la curva normal. 3º Calcular la puntuación típica “z”. 4º Establecer el valor del porcentaje de “z”, en la tabla anexa.

Caso 1: Cálculo del número de individuos que quedan por encima y por debajo de una puntuación directa Dado un test que nos ofrece una Media de 50 y una Desviación típica de 6 y suponiendo que la muestra se distribuye normalmente, debemos averiguar las frecuencias en % por encima y por debajo del valor X1= 60. ¿Cuál es el número de individuos en % que quedan por encima y por debajo de la puntuación? X 1= 6 50

X

= 50

1,6

Hallamos el valor Z asociado a la puntuación directa según la fórmula de cálculo:

z =

X 1− X 50

60 -

= 1,67

= 6

s

Buscamos esa Z en la tabla anexa y localizamos el área: 11

1,67 0,4525 que en % es igual a 45,25% de los individuos. Es el número de sujetos que hay entre la Χ y la Z=1,67. (la parte rayada). Si al 45,25% de los casos le sumamos el 50% obtenemos

el

95,25%,

deduciendo

que

la

puntuación

obtenida por el sujeto se encuentra por encima del 95,25% de los casos y por debajo del 4,75% (100%-95,25%).

Caso

2:

Cálculo

del

número

de

individuos

comprendidos entre dos puntuaciones directas Teniendo en cuenta los siguientes datos: Media=50, Desviación Típica=6, X1=45, X2=35, averiguar el porcentaje de individuos que tienen puntuaciones comprendidas entre X1 y X2. X 1= 4

X 2= 35

-2.5

-0.8

X

= 50

Hallamos los valores Z asociados a cada puntuación directa según la fórmula de cálculo y buscamos las áreas asociadas en la tabla pertinente:

z = X 1− X 1 s

=

z = X 2− X 2 s

=

-5 6

-15 6

12

= - 0. 83

= - 2. 5

Para calcular el número de sujetos entre las dos puntuaciones hay que restar los dos porcentajes obtenidos: 49,38% - 29,67% = 19, 71 % 29,67%

49,38%

13

Caso 3: Cálculo de una puntuación directa a partir de un área determinada ¿Cuál es la puntuación que deja por debajo el 75 % de los casos teniendo en cuenta los siguientes datos: Media=59, Desviación típica: 6?

75 %

X = 50 Como el 75% de los casos no se puede buscar en la tabla de las áreas, buscamos el 25% (dado que son valores simétricos) que, aproximadamente, es 24,86. Esto es igual a Z=0,67. Despejando:

0,67

=

X 1− 5 6

X1 - 50 = 0,67 (6) X1 50 = 4,02 X1= 4,02 + 50 = 54,02 Caso 4: Cálculo de las puntuaciones directas que comprenden un área determinada Averiguar las puntuaciones que hay que obtener a ambos lados de la media para que el área comprendida entre ambos puntos, contenga al 50% de los casos, sabiendo que la Media es 50 y la Desviación Típica 6. 25%

25%

X = 50

Buscamos el 25% en la tabla de áreas bajo la curva normal que, aproximadamente, es 24,86 %, cuyo valor asociado de Z es 0,67. Despejando en la fórmula de cálculo de las puntuaciones Z obtendremos las puntuaciones directas: X1 - 50 = 0,67 (6) X1 - 50 = 4,02 X1= 4,02 + 50 = 54,02 por encima --------------------X2 - 50 = - 0,67 (6) X2 - 50 = - 4,02 X2= - 4,02 + 50 = 45,98 por debajo Caso 5: Cálculo del área comprendía por encima y por debajo de una puntuación directa Hallar la probabilidad en porcentaje (%) de que un valor escogido al azar sea inferior a X1= 60, conociendo los siguientes datos: Media=50, Desviación típica=6.

45,25% 50

X 1 = 60

X = 50

z=

60

–5

= 1,67

45,25 %

6 La probabilidad es: 50% + 45,25% = 95,25%

Caso 6: Cálculo de un área comprendida entre dos puntuaciones directas Hallar la probabilidad en porcentaje (%) de que un individuo escogido al azar obtenga una puntuación comprendida entre X1 y X2,

teniendo

en

cuenta

los

siguientes

datos:

Media=50,

Desviación típica=6, X1=39 y X2=62.

- 1,83

X = 50

2

Hallamos:

z

1

=

-11 39 - 50 = s 6

12 z = 62 − 50 =

= - 1.83

= 2

46,64%

47,72%

s Para calcular el número de sujetos entre las dos puntuaciones hay que: 46,64% + 47,72% = 94,36 %

14

Introducción a las medidas de forma: asimetría y curtosis Además de las medidas de tendencia central y dispersión, se utilizan otros dos tipos de medidas que nos ayudarán a describir mejor las variables: la asimetría y la curtosis. El índice de asimetría representa el grado en el que los datos de una distribución de frecuencias se reparten por encima y por debajo de la tendencia central. La distribución normal es simétrica y tiene un valor de asimetría igual a 0. Una distribución que tenga una asimetría positiva significativa tiene una cola derecha larga. Una distribución que tenga una asimetría negativa significativa tiene una cola izquierda larga. Como regla aproximada, un valor de la asimetría mayor que el doble de su error típico se asume que indica una desviación de la simetría. Índices: As =

X - Mo SX

(Q As =

) − (Q 2 ) 2

-Q

3

-Q 1

Q 3 -Q 1

3

As = z =

∑( X n⋅ S X

i 3

− 3 X)

15

A

X

0

B

1

2

3

C

4

5

6

Interpretación: A. Si As > 0: Asimetría positiva B. Si As = 0: Simetría C. Si As < 0: Asimetría negativa

Su valor es cero cuando la distribución es simétrica, positivo cuando existe asimetría a la derecha y negativo cuando existe asimetría a la izquierda.

El índice de curtosis representa el grado de apuntamiento de una distribución de frecuencias. Para una distribución normal, el valor del estadístico de curtosis es 0 y diremos que ésta es mesocúrtica. Una curtosis positiva indica que las observaciones se concentran más y presentan colas más largas que las de una distribución normal, así como su apuntamiento; se trata de una distribución leptocúrtica. Una curtosis negativa indica que las observaciones se agrupan menos y presentan colas más cortas,

siendo la distribución platicúrtica.

Índice de curtosis:

g2 =

∑(xi − X)4ni ns4

−3

Miden la mayor o menor cantidad de datos que se agrupan en torno a la moda. Se definen 3 tipos de distribuciones según su grado de curtosis:

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF