Página 1 de 17
Avda. Andalucía, 84 – Bajo 23006 – Jaén.
Teléfono y Fax: 953 085 888
www.cedavinci.com –
[email protected]
(FORMULARIO ESTADÍSTICA - UNIVERSIDAD MAGNITUD
EXPRESIÓN O FÓRMULA
SIGNIFICADO DE VARIABLES
ESTADÍSTICA DESCRIPTIVA UNIDIMENSIONAL UNIDIMENSIONAL x i i ≡ Valores de la variable estadística.
TABLA DE FRECUENCIAS xi ni N i f i F i TABLA DE FRECUENCIAS:
N i i ≡ Frecuencia absoluta acumulada del valor x xi. Es decir, Suma de todos los valores anteriores de N , i, i
más su ni, o también N i = ∑n j . j=1
DISTRIBUCIÓN DISCRETA
S A I C N E U C E R F E D S A L B A T
ni ≡ Frecuencia absoluta del valor x xi correspondiente (número de veces que se repite).
ni
f i i ≡ Frecuencia relativa ( N ), donde N =
n
ni siendo ∑ i1 =
n el número de valores de la tabla.
N i
F i i ≡ Frecuencia relativa acumulada ( F i = N ). xi deja por debajo de él un Significa que el valor x F i % de la distribución. 100· F ci ≡ Intervalo de valores de la variable estadística. Conocido como “clase “ clase”. ”. a +b
x i i ≡ Marca de clase. Es decir, 2 .
TABLA DE FRECUENCIAS ci xi ni N i f i F i TABLA DE FRECUENCIAS:
[a, b)
ni ≡ Frecuencia absoluta del intervalo ci correspondiente (número de valores dentro del rango [a, b ) ). N i i ≡ Frecuencia absoluta acumulada del valor x xi. Es decir, Suma de todos los valores anteriores de N , i, i
DISTRIBUCIÓN CONTÍNUA
más su ni, o también N i = ∑n j . j=1
ni
f i i ≡ Frecuencia relativa ( N ), donde N =
n
ni , ∑ i1 =
siendo n el número de intervalos de la tabla. N i
F i i ≡ Frecuencia relativa acumulada ( N ). Significa
que el valor b (límite superior del intervalo) deja por debajo de él un 100· F F i % de la distribución.
Formulario de Estadística, v. 1
Página 2 de 17
Teléfono y Fax: 953 085 888
Avda. Andalucía, 84 – Bajo 23006 – Jaén.
MAGNITUD
www.cedavinci.com –
[email protected]
EXPRESIÓN O FÓRMULA
≡ Media aritmética de la variable estadística.
n
MEDIA ARITMÉTICA PROPIEDAD DE LA MEDIA ARITMÉTICA
x =
ni · xi ∑ i 1
Las demás variables tienen el mismo significado que en las tablas de frecuencias anteriores.
=
N
- Si se suma una constante a todos los valores de la variable, su media aumenta en dicha constante. Si
Y = a · X + b entonces Y = a· X + b
MODA:
N DISTRIBUCIÓN Ó I DISCRETA C A Z I L A R T N MODA: E DISTRIBUCIÓN C CONTÍNUA ó E D AGRUPADA S A D I D E M MEDIANA: DISTRIBUCIÓN DISCRETA
SIGNIFICADO DE VARIABLES
Mo ≡ El valor de la variable xi que más se repite ( ni mayor).
Mo
1º.- Se calcula la columna de hi:
hi =
ni ai
2º .- Se elige el intervalo de mayor hi, y se
aplica la fórmula:
Mo = Li −1 + ai ·
- Si se multiplican todos los valores de la variable por una constante, la media queda multiplicada por dicha constante.
hi − hi −1 (hi − hi −1 ) + (hi − hi +1 )
En caso de variable no agrupada (frecuencias ni = 1), una vez ordenados los datos de menor a mayor, la mediana es el valor central si n es impar, y la media de los dos valores centrales si n es par.
Mo ≡ Moda. (El valor debe estar comprendido entre los límites del intervalo escogido por tener mayor hi). ai ≡ Anchura del intervalo elegido. hi = Valor de h para el intervalo elegido. hi-1 = Valor de h para el intervalo anterior al elegido. (En caso de ser elegido el primer intervalo, este valor será 0) hi+1 = Valor de h para el intervalo posterior al elegido. (En caso de ser elegido el último intervalo, este valor será 0). Li-1 = Límite inferior del intervalo escogido.
n ≡ Número de valores de la tabla.
En caso de variable agrupada, se corresponde con el percentil 50, P 50, por lo que la vamos a calcular con el percentil (α = 50).
MEDIANA: DISTRIBUCIÓN CONTÍNUA
Se corresponde con el percentil 50, P 50, por lo que la vamos a calcular con el percentil ( α = 50).
CUARTILES: DISTRIBUCIONES DISCRETAS Y
Primer Cuartil, Q1: se corresponde con el valor de la xi que deja por debajo un 25 % de la distribución. Es igual que el percentil 25, P 25. Lo calculamos con la fórmula de los Percentiles. Segundo Cuartil, Q2: se corresponde con el valor de la xi que deja por debajo un 50 % de la distribución. Es igual que el percentil 50, P 50 e igual que la Mediana, Me. Lo calculamos con la fórmula de los Percentiles.
Formulario de Estadística, v. 1
Página 3 de 17
Avda. Andalucía, 84 – Bajo 23006 – Jaén.
MAGNITUD
CONTÍNUAS
EXPRESIÓN O FÓRMULA
Teléfono y Fax: 953 085 888
www.cedavinci.com –
[email protected]
SIGNIFICADO DE VARIABLES
Tercer Cuartil, Q3: se corresponde con el valor de la xi que deja por debajo un 75 % de la distribución. Es igual que el percentil 75, P 25. Lo calculamos con la fórmula de los Percentiles. 1º.- Se calcula la columna de F i. 2º.- Se busca en la columna anterior el
valor de
α
100
P α ≡ Valor de la variable xi que deja por debajo, como , y surgen dos casos posibles: mínimo un α % de la distribución estadística.
Ó 2.1.- Si el valor anterior está I PERCENTIL α, ( P α) F i ≡ Frecuencia relativa acumulada C n exactamente en la columna F , entonces I N i S DISTRIBUCIÓN P α es la media entre ese valori de xi y el F = ( i N ).donde N = ∑ni , siendo n el número de O DISCRETA i=1 siguiente. P valores de la tabla. E 2.2.- Si el valor no está en la D columna F i , entonces P α es el valor de xi S α ≡ Valor entre 0 y 100. A α cuya F i está justamente encima de . D I 100 D 1º.- Se calculan las columnas de F i y f i. E M ai ≡ Anchura del intervalo elegido. 2º.- Se escoge el intervalo en que F i esté PERCENTIL α, ( P α) justamente por encima del valor α . En 100 DISTRIBUCIÓN este intervalo, se aplica la fórmula: CONTÍNUA α
P α = Li−1 + ai · 100 S A T U L O S B A N Ó I S R E P S I D E D S A D I D E M
− F i−1
f i
RECORRIDO
R = xn − x1
RECORRIDO INTERCUARTÍLICO
R I = Q3 − Q1
DESVIACIÓN ABSOLUTA MEDIA
Formulario de Estadística, v. 1
n
ν h =
ni · xi − h ∑ i 1 =
N
Li-1 ≡ Límite inferior del intervalo escogido. F i-1 ≡ Frecuencia relativa acumulada del intervalo anterior al escogido.
f i ≡ Frecuencia relativa del intervalo seleccionado. R ≡ Diferencia entre el último valor ( xn) y el primero ( x1) de la variable xi. R I ≡ Diferencia entre el Tercer Cuartil , Q3, y el Primer Cuartil, Q1. - Si h = x , entonces ν h ≡ ν x , y se llama Desviación Absoluta Media respecto de la Media Aritmética. - Si h = Mo, entonces ν h ≡ ν Mo , y se llama Desviación Absoluta Media respecto de la Moda. - Si h = Me, entonces ν h ≡ ν Me , y se llama Desviación Absoluta Media respecto de la Mediana.
Página 4 de 17
Teléfono y Fax: 953 085 888
Avda. Andalucía, 84 – Bajo 23006 – Jaén.
MAGNITUD S A T U L O S B A N Ó I S R E P S I D E D S A D I D E M
N Ó I S R E S P A S I V D I E T D A L S E A R D I D E M
A M R O F E D S A D I D E M
EXPRESIÓN O FÓRMULA n
VARIANZA (σ2)
σ 2 =
∑ ni · ( xi − x ) i =1
SIGNIFICADO DE VARIABLES n
2
DESVIACIÓN TÍPICA (σ)
=
2 n x · ∑i i i =1
− ( x )2
(Mejor la última forma)
σ = σ 2 Si
PROPIEDAD DE LA VARIANZA Y LA DESVIACIÓN TÍPICA
www.cedavinci.com –
[email protected]
Si
Y = a · X + b entonces σ 2Y = a 2 ·σ 2 X
Y = a · X + b entonces σ Y = a·σ X
COEFICIENTE DE APERTURA RECORIDO RELATIVO RECORRIDO SEMIINTERCUARTÍLICO COEFICIENTE DE VARIACIÓN DE PEARSON COEFICIENTE DE ASIMETRÍA DE PEARSON COEFICIENTE DE ASIMETRÍA DE FISHER
Formulario de Estadística, v. 1
x n x1
C a ≡ Cociente entre el último valor ( xn) y el primero ( x1) de la variable xi.
R xn − x1 = x
Indica el número de veces que el recorrido contiene a la media.
C a =
R R =
RSI =
Q3 − Q1 Q3 + Q1
CV ( x) = G p =
σ
x
x − Mo σ n
γ 1 ( x ) =
- Si a los valores de una variable se les suma una misma constante, la varianza no cambia. - Si a los valores de una variable se les multiplica por la misma constante positiva, la varianza queda multiplicada por el cuadrado de esa constante. - Si a los valores de una variable se les suma una misma constante, la desviación típica no cambia. - Si a los valores de una variable se les multiplica por la misma constante positiva, la desviación típica queda multiplicada por esa constante.
1
ni · ( xi − x )3 ∑ i 1
σ
N
3·
=
Q1 ≡ Primer Cuartil de la distribución. Q3 ≡ Tercer Cuartil de la distribución. σ ≡ Desviación típica. ≡ Media aritmética de la variable estadística. - Si G p > 0, Asimétrica sesgada hacia la derecha. - Si G p < 0, Asimétrica sesgada hacia la izquierda. - Si G p = 0, Distribución Simétrica. - Si γ 1 ( x ) derecha. - Si γ 1 ( x ) izquierda. - Si γ 1 ( x )
> 0, Asimétrica sesgada hacia la < 0, Asimétrica sesgada hacia la = 0, Distribución Simétrica.
Página 5 de 17
Teléfono y Fax: 953 085 888
Avda. Andalucía, 84 – Bajo 23006 – Jaén.
www.cedavinci.com –
[email protected]
MAGNITUD
EXPRESIÓN O FÓRMULA
COEFICIENTE DE KURTOSIS O APLASTAMIENTO
n ni · ( xi − x )4 ∑ 1 −3 γ 2 ( x ) = 4 · i =1 σ N
SIGNIFICADO DE VARIABLES - Si γ 2 ( x )
= 0, Distribución similar a la Normal. - Si γ 2 ( x ) > 0, Distribución apuntada. - Si γ 2 ( x ) < 0, Distribución aplastada.
ESTADÍSTICA DESCRIPTIVA BIDIMENSIONAL
TABLA DE FRECUENCIAS DE DOBLE ENTRADA
y1 y2 n11 n12 n21 n22
yi n1i n2i
yn n1n n2n
xk nk1 nk2
nki
nkn
x1 x2
xm nm1 nm2
S E L A N I G R A M S E N O I C U B I R T S I D
DISTRIBUCIÓN MARGINAL DE X
nmi
nmn
xi x1 x2
ni n11+n12+ … + n1i+ … + n1n n21+n22+ … + n2i+ … + n2n
xk
nk1+nk2+ … + nki+ … + nkn
x1, x2, …, xm ≡ Valores de la variable X. (m valores de X) y1, y2, …, yn ≡ Valores de la variable Y. (n valores de Y)
nki ≡ Número de veces que se repite el par de valores de X eY, ( xk , yi). Por ejemplo, si n21 = 7, significa que el par de valores ( x2, y1) se repite 7 veces.
- Por otro lado, recordar que estos valores de X e Y pueden ser marcas de clase de intervalos, si la distribución está agrupada por intervalos.
nk ≡ Es el número de veces que se repite la variable xk . Es decir, en la tabla de doble entrada, la suma de las frecuencias de la FILA correspondiente a xk .
xm nm1+nm2+ … + nmi+ … + nmn
DISTRIBUCIÓN MARGINAL DE Y
yi ni y1 n11+n21+ … + nk1+ … + nm1 y2 n12+n22+ … + nk2+ … + nm2 yi
n1i+n2i+ … + nki+ … + nmi
ni ≡ Es el número de veces que se repite la variable yi. Es decir, en la tabla de doble entrada, la suma de las frecuencias de la COLUMNA correspondiente a
yi.
yn n1n+n2n+ … + nkn+ … + nmn DISTRIBUCIONES Son las distribuciones marginales de X ó Y, pero escogiendo un rango inferior de CONDICIONADAS la variable; es decir, restringiendo los valores de la variable X ó Y. DE X ó Y
Formulario de Estadística, v. 1
Página 6 de 17
Teléfono y Fax: 953 085 888
Avda. Andalucía, 84 – Bajo 23006 – Jaén.
MAGNITUD
www.cedavinci.com –
[email protected]
EXPRESIÓN O FÓRMULA m
N Ó I S E P S I D E D S A D I D E M
MEDIAS MARGINALES
x =
σ XY =
COVARIANZA
=
n
=
=
y =
nij · xi · y j ∑∑ i 1 j 1
m
VARIANZAS MARGINALES
2 σ X
=
ni · ( xi − x ) ∑ i 1
r =
A E N I L N RECTA DE Ó I S REGRESIÓN DE Y E SOBRE X R G E R RECTA DE E D REGRESIÓN DE X E SOBRE Y T S U J A VARIANZA
RESIDUAL DE Y SOBRE X
ni · yi ∑ i 1
=
=
n
=
=
nij ∑∑ i 1 j 1
extraídos de la correspondiente distribución marginal.
- Si σ XY > 0, la relación entre las dos variables es DIRECTA (Cuando X aumenta, Y aumenta). - Si σ XY < 0, la relación entre las dos variables es INVERSA (Cuando X aumenta, Y disminuye). - Si σ XY = 0, las variables son INCORRELADAS.
v − ( x · y )
ni · xi2 ∑ i 1
m
ni ≡ Son los valores de frecuencias
=
m
2
=
COEFICIENTE DE L CORRELACIÓN
Siendo N =
n
ni · xi ∑ i 1
m
SIGNIFICADO DE VARIABLES
n
2
− ( x )
σ Y 2 =
n
ni · ( yi − x ) ∑ ni · yi2 ∑ i 1 i 1 2
=
=
=
2
− ( y )
r ≡ Valor situado en el intervalo [− 1, 1] . - Si r es un valor próximo a 1 ó -1, entonces existe
σ XY
dependencia lineal fuerte entre las dos variables, siendo ésta directa e inversa, respectivamente. - Si r es un valor próximo a 0, entonces la dependencia lineal es débil, siendo ésta nula si el valor es 0.
σ X ·σ Y
σ XY Y − y = 2 · ( X − x ) ⇒ Y = 2 · X + y − 2 · x σ X σ X σ X σ XY
σ XY
σ XY X − x = 2 · (Y − y ) ⇒ X = 2 ·Y + x − 2 · y σ Y σ Y σ Y σ XY
σ XY
n
2 = σ rY
Formulario de Estadística, v. 1
ni · ( yi − y ( xi )) ∑ i 1
2
=
N
ni ≡ Frecuencia del valor yi en la distribución marginal de Y (hay n valores de Y) y ( xi ) ≡ Valor calculado de Y, a partir de la recta de regresión de Y sobre X, sustituyendo X = xi.
Página 7 de 17
Teléfono y Fax: 953 085 888
Avda. Andalucía, 84 – Bajo 23006 – Jaén.
MAGNITUD
www.cedavinci.com –
[email protected]
EXPRESIÓN O FÓRMULA
SIGNIFICADO DE VARIABLES
CÁLCULO DE PROBABILIDADES ESPACIO MUESTRAL () SUCESO ELEMENTAL
S SUCESO O S E C U S E D A SUCESOS R B CONTENIDOS E G L Á SUCESOS Y S COMPLEMENTARIOS E O CONTRARIOS N O I C SUCESO I DIFERENCIA N I F E D SUCESO UNIÓN
SUCESO INTERSECCIÓN
es el conjunto de todos los posibles resultados de un experimento Aleatorio. Los posibles resultados de un experimento aleatorio que no se pueden descomponer en otros más sencillos; estos resultados son excluyentes entre sí . Se le llama a todo subconjunto del espacio muestral o, lo que es lo mismo, a la unión de cualquier número de Sucesos Elementales. Existen dos sucesos especiales: - Suceso Imposible: aquel que nunca ocurre. Se representa por el conjunto vacío, Ø.
P (∅ ) = 0 - Suceso Seguro: aquel que ocurre siempre. Es el espacio muestral, es decir, .
P (Ω ) = 1 ⊂ B si todo suceso Se dice que el Suceso A está contenido en el Suceso B, y se designa por elemental de A lo es también necesariamente de B; es decir, siempre que se verifica A también lo hace el suceso B.
P ( A) ≤ P ( B) Dado el Suceso A del espacio de Sucesos , se define el suceso Complementario o Contrario de A, Ac, A’ ó A , como el formado por todos aquellos sucesos elementales que no sean de A; o sea, aquel suceso que ocurre cuando no ocurre A.
P ( A ) = 1 − P ( A) − como el formado por los sucesos Dados dos sucesos A y B, se define el suceso Diferencia elementales que están en A, pero no en B. Por lo tanto, el suceso que ocurre cuando se verifica A y no se verifica B. Dados dos sucesos A y B, se define el suceso Unión, A ∪ como el suceso formado por todos los sucesos elementales de A ó B; es decir, el suceso que ocurre cuando se verifica A ó se verifica B.
∩ B como el suceso formado por Dados dos sucesos A y B, se define el suceso intersección , los sucesos elementales que están en A y en B simultáneamente; es decir, el suceso que ocurre cuando se verifica A y se verifica B .
SUCESOS Dos sucesos A y B se dicen Incompatibles cuando A ∩ B = ∅ . Lo que significa que al INCOMPATIBLES verificarse uno de ellos, no se puede verificar el otro simultáneamente. ÁLGEBRA DE SUCESOS: LEYES DE MORGAN Formulario de Estadística, v. 1
A ∩ B = ( A ∪ B ) A ∪ B = ( A ∩ B )
Página 8 de 17
Teléfono y Fax: 953 085 888
Avda. Andalucía, 84 – Bajo 23006 – Jaén.
MAGNITUD
www.cedavinci.com –
[email protected]
EXPRESIÓN O FÓRMULA
SIGNIFICADO DE VARIABLES
SUMA TOTAL DE PROBABILIDAD
Si Ω = A1 ∪ A2 ∪ ... ∪ Ak , entonces P ( A1 ) + P ( A2 ) + ... + P ( Ak ) = 1
RELACIÓN ENTRE UNIÓN E INTERSECCIÓN
P ( A ∪ B ) = P ( A) + P ( B ) − P ( A ∩ B ) y, en particular, SÓLO si los sucesos son INCOMPATIBLES ( A ∩ B = ∅ ⇒ P ( A ∩ B ) = 0 ):
P ( A ∪ B) = P ( A) + P ( B) nº de casos favorables P ( A) = n º de casos posibles
REGLA DE LAPLACE S E PROBABILIDAD D A CONDICIONADA D I L I B A TEOREMA DEL B PRODUCTO O R P E D O L U C L SUCESOS Á C INDEPENDIENTES
Se define la probabilidad del suceso B condicionada a que se dé antes el suceso A, P ( B / A) :
P ( B / A) =
P ( B ∩ A) P ( A)
Como consecuencia de la definición anterior, despejando la probabilidad de la intersección se tiene
P ( B ∩ A) = P ( A) · P ( B / A)
o también es válida:
P ( B ∩ A) = P ( B) · P ( A / B )
Se dice que dos sucesos A y B son INDEPENDIENTES, si se cumple que
P ( A / B) = P ( A)
por lo que la fórmula anterior del Teorema del Producto se quedaría reducida a
P ( B ∩ A) = P ( B ) · P ( A)
Para comprobar si dos sucesos son Independientes se calculan las 3 probabilidades anteriores, cada una por separado, y se comprueba si se cumple la igualdad anterior: En caso negativo, no son independientes. Nota: No confundir Sucesos INDEPENDIENTES en los que se cumple la relación
anterior, con sucesos INCOMPATIBLES , en los que se cumplía esta otra relación:
P ( A ∪ B) = P ( A) + P ( B)
TEOREMA DE BAYES ó PROBABILIDAD A POSTERIORI
Si nos preguntan por el valor de la probabilidad de que ocurra un Suceso A i (de un conjunto de posibles sucesos A1, A2, … A k ) habiéndose dado anteriormente el suceso B, pero realmente ha ocurrido antes el Suceso Ai que el B, entonces nos preguntan por probabilidad a Posteriori, y se calcula con la fórmula:
P ( Ai / B) =
P ( B / Ai ) · P ( Ai ) P ( B / Ai ) · P ( Ai ) = k P total ( B ) ∑ P ( B / A j ) · P ( A j ) j =1
Formulario de Estadística, v. 1
Página 9 de 17
Teléfono y Fax: 953 085 888
Avda. Andalucía, 84 – Bajo 23006 – Jaén.
MAGNITUD
www.cedavinci.com –
[email protected]
EXPRESIÓN O FÓRMULA
SIGNIFICADO DE VARIABLES
Notas:
TEOREMA DE BAYES ó PROBABILIDAD A POSTERIORI
- Abajo se tendrá una suma de términos, de los cuáles el correspondiente al caso A i estará también arriba, con lo que uno de los términos de la suma de abajo debe estar arriba. - Un ejemplo de aplicación de esta fórmula sería: Supongamos que tenemos 2 urnas ( 1 Y 2) con bolas blancas ( BL)y negras (N). 1º se elige la urna y luego se saca la bola; pero si nos dicen que ya conocemos que la bola es blanca, y ¿cuál es la probabilidad de provenga de la urna 2?, nos están preguntando por una probabilidad en orden contrario al que han sucedido los hechos, por lo que se aplica esta fórmula de Probabilidad a Posteriori o Teorema de Bayes. La aplicación de la fórmula a este caso concreto nos daría la siguiente expresión:
P ( 2 / BL) =
P ( BL / 2) · P (2) P ( BL / 2) · P (2) = P total ( BL) P ( BL / 1) · P (1) + P ( BL / 2) · P (2)
VARIABLES ALEATORIAS (DISCRETAS Y CONTINUAS) FUNCIÓN DE PROBABILIDAD CONDICIÓN PARA QUE SEA FUNCIÓN DE PROBABILIDAD
S A T E R C FUNCIÓN DE S I D DISTRIBUCIÓN S A I R O T A E L A S E L PROPIEDADES Y B CÁLCULO DE A I R PROBABILIDADES A V
f ( xi ) = P ( X = xi ) =
ni n
(Se utiliza la regla de Laplace)
Para que una función sea una función de Probabilidad, debe que cumplirse que la suma de todos los valores posibles de la función dé 1:
∑i f ( xi ) = 1,
∀i i
F ( xi ) = P ( X ≤ xi ) = ∑ P ( x j ) j =1
Puesto que los valores de la mayoría de las distribuciones se obtienen de tablas, y en éstas sólo aparecen los valores de F(x i), es importante saber calcular cualquier probabilidad con operaciones que involucren la función de distribución. A continuación se enumeran estas operaciones:
P ( X ≤ a ) = F (a ) Ejemplo: P ( X ≤ 4) = F ( 4) P ( X = a) = P ( X ≤ a ) − P ( X ≤ a − 1) = F ( a ) − F ( a − 1) Ejemplo:
P ( X = 7) = P ( X ≤ 7) − P ( X ≤ 6) = F (7) − F (6)
P ( X < a ) = P ( X ≤ a − 1) = F (a − 1) Ejemplo:
P ( X < 7) = P ( X ≤ 6) = F (6)
P ( X ≥ a) = 1 − P ( X ≤ a − 1) = 1 − F ( a − 1) Ejemplo:
Formulario de Estadística, v. 1
P ( X ≥ 5) = 1 − P ( X ≤ 4) = 1 − F (4)
Página 10 de 17
Teléfono y Fax: 953 085 888
Avda. Andalucía, 84 – Bajo 23006 – Jaén.
MAGNITUD
www.cedavinci.com –
[email protected]
EXPRESIÓN O FÓRMULA
SIGNIFICADO DE VARIABLES
P ( X > a) = P ( X ≥ a + 1) = 1 − P ( X ≤ a ) = 1 − F (a ) Ejemplo:
S A T E R C S I D S PROPIEDADES Y A I CÁLCULO DE R O PROBABILIDADES T A E L A S E L B A I R A ESPERANZA V
P ( X > 5) = P ( X ≥ 6) = 1 − P ( X ≤ 5) = 1 − F (5)
P (a ≤ X ≤ b) = P ( X ≤ b) − P ( X ≤ a − 1) = F (b) − F (a − 1) Ejemplo:
P (3 ≤ X ≤ 7) = P ( X ≤ 7) − P ( X ≤ 2) = F (7) − F (2)
P (a < X < b) = P ( X ≤ b − 1) − P ( X ≤ a ) = F (b − 1) − F (a ) Ejemplo:
P (3 < X < 7) = P ( X ≤ 6) − P ( X ≤ 3) = F (6) − F (3)
P (a ≤ X < b) = P ( X ≤ b − 1) − P ( X ≤ a − 1) = F (b − 1) − F (a − 1) Ejemplo:
P (3 ≤ X < 7) = P ( X ≤ 6) − P ( X ≤ 2) = F (6) − F (2)
P (a < X ≤ b) = P ( X ≤ b) − P ( X ≤ a ) = F (b) − F ( a ) Ejemplo:
P (3 < X ≤ 7) = P ( X ≤ 7) − P ( X ≤ 3) = F (7) − F (3)
E ( X ) = ∑ xi · f ( xi )
MATEMÁTICA
i
σ 2 ( X ) =
VARIANZA
∑ xi2 · f ( xi ) − [ E ( X )] 2
i S A U N I T N O C S A I R O T A E L A S E L B A I R A V
Es una función tal que debe cumplir estas dos condiciones necesariamente:
FUNCIÓN DE PROBABILIDAD
f ( x ) ≥ 0 ∀ x donde esté definida
#
+∞
#
f ( x) dx = 1 ∫ x
(Condición que se utiliza para hallar la Constante K de la función)
=−∞
x
FUNCIÓN DE DISTRIBUCIÓN
F ( x ) = P ( X ≤ x) =
f (t ) dt ∫ t = −∞
Puesto que los valores de la mayoría de las distribuciones se obtienen de tablas, y en éstas sólo aparecen los valores de F(x i), es importante saber calcular cualquier probabilidad con operaciones que involucren la función de distribución. A continuación se enumeran estas operaciones:
Formulario de Estadística, v. 1
Página 11 de 17
Teléfono y Fax: 953 085 888
Avda. Andalucía, 84 – Bajo 23006 – Jaén.
MAGNITUD
www.cedavinci.com –
[email protected]
EXPRESIÓN O FÓRMULA
SIGNIFICADO DE VARIABLES b
P (a ≤ X ≤ b) = ∫ f (t ) dt = F (b) − F (a)
PROPIEDADES Y CÁLCULO DE PROBABILIDADES
t = a
a
P ( X = a ) = ∫ f (t ) dt = 0 t = a
De esta propiedad se deduce que en Distribuciones Continuas, a diferencia de en Distribuciones Discretas, no hay que preocuparse de los signos “=” que aparecen con “”.
P ( X ≤ a) = P ( X < a ) = F ( a) S A U N I T N O C S A I R O T A E L A S E L B A I R A V
Ejemplo: P ( X ≤ 4) = P ( X < 4) = F ( 4)
P ( X ≥ a) = P ( X > a ) = 1 − P ( X ≤ a ) = 1 − F (a ) Ejemplo:
P ( X ≥ 4) = P ( X > 4) = 1 − P ( X ≤ 4) = 1 − F (4)
P (a ≤ X ≤ b) = P (a < X < b) = P (a ≤ X < b) = P (a < X ≤ b) = F (b) − F (a) Ejemplo:
P (2 ≤ X ≤ 6) = P (2 < X < 6) = P (2 ≤ X < 6) = P (2 < X ≤ 6) = F (6) − F (2) +∞
ESPERANZA MATEMÁTICA
E ( X ) =
x · f ( x) dx ∫ x =−∞
+∞
σ ( X ) =
VARIANZA
2 2 [ ] x · f ( x ) dx E ( X ) − ∫
x = − ∞
ALGUNAS DISTRIBUCIONES IMPORTANTES
P ( X = k ) = DISTRIBUCIÓN UNIFORME DISCRETA
Formulario de Estadística, v. 1
1 n
con k = 0, 1, 2, …
n +1 E ( X ) = 2 n · (n + 1) · ( 2n + 1) σ 2 = 6
Un experimento sigue una distribución uniforme discreta si presenta n resultados distintos, todos ellos equiprobables y tal que la probabilidad de cada resultado es 1 n .
Página 12 de 17
Avda. Andalucía, 84 – Bajo 23006 – Jaén.
MAGNITUD
EXPRESIÓN O FÓRMULA
P ( X = éxito) = p DISTRIBUCIÓN DE BERNOUILLI
P ( X = fracaso ) = q = 1 − p E ( X ) = p σ 2 = p· q
n f ( x ) ≡ P ( X = k ) = · p k ·q n−k k tomando k valores entre 0 y n.
S A T E R DISTRIBUCIÓN C BINOMIAL S I D B(n, p) S E N O I C U B I R T S I D
E ( X ) = n · p
Teléfono y Fax: 953 085 888
www.cedavinci.com –
[email protected]
SIGNIFICADO DE VARIABLES Consideremos un experimento cualquiera con dos únicos resultados A y A ; es decir éxito o fracaso, cada uno de ellos con probabilidades
P ( A) = p
y
P ( A ) = q = 1 − p
Entonces, se dice que este tipo de experimentos sigue una distribución de BERNOUILLI, ya que sólo presenta 2 posibilidades: Éxito o Fracaso. A este tipo de distribuciones también se las conoce como Dicotómicas.
Un experimento sigue la Distribución Binomial si: 1º- Cada prueba del experimento es de Bernouilli. 2º- Al realizar n veces el experimento, el resultado de la siguiente experiencia no depende de lo que ha ocurrido anteriormente ( CON REEMPLAZAMIENTO).
- P(X = k) es la probabilidad de obtener k éxitos en n extracciones (siempre se realizan n extracciones). - p≡ Probabilidad de éxito, que es constante ya que el experimento es con reemplazamiento. - q = 1 – p, es la probabilidad de Fracaso.
2 σ =
n · p · q
- Recordar que los valores se obtienen de la tabla, en la que sólo se encuentra la F(x i), por lo que habrá que utilizar las propiedades de las distribuciones discretas.
e − λ ·λ k f ( x) ≡ P ( X = k ) = k !
La distribución de Poisson se aplica en situaciones en que se tiene una distribución Binomial con p pequeño y n muy grande, pero el producto de n·p se mantiene constante.
E ( X ) = λ
- Se suele utilizar con distribuciones en las que el experimento dependen del tiempo: Número de llamadas telefónicas recibidas en 10 minutos, Número de radiaciones radiactivas por segundo, …
DISTRIBUCIÓN DE POISSON
P (λ ) σ 2 = λ Formulario de Estadística, v. 1
- La función de probabilidad f(x) no se utiliza para calcular la probabilidad, ya que se utilizan las tablas para calcular F(x i), por lo que tendremos que utilizar las propiedades de las distribuciones discretas.
Página 13 de 17
Teléfono y Fax: 953 085 888
Avda. Andalucía, 84 – Bajo 23006 – Jaén.
MAGNITUD
APROXIMACIÓN DE UNA BINOMIAL POR UNA POISSON
www.cedavinci.com –
[email protected]
EXPRESIÓN O FÓRMULA
SIGNIFICADO DE VARIABLES
La distribución de Poisson P (λ ) se considera una buena aproximación a la distribución Binomial B (n, p) , en caso de que n·p< 5 y p < 0.1 ó n>100 y p 0
σ 2 =
λ
σ ·
Se dice que una variable aleatoria sigue una
2
a+b 2
a!
- Recordar que = b b! · (a − b )!
1 f ( x ) ≡ b − a si a ≤ x ≤ b 0 resto si x < a 0 x − a F ( x ) = si a ≤ x ≤ b − b a si x > b 0
DISTIBUCIÓN UNIFORME CONTINUA S A U N I T N DISTRIBUCIÓN O C EXPONENCIAL S E N O I C U B I R T S I D DISTRIBUCIÓN
SIGNIFICADO DE VARIABLES
1 λ 2
−1 X − µ 2 σ
2
- Se utiliza como modelo para representar tiempo de funcionamiento o de espera. También puede expresar el tiempo que transcurre entre sucesos que se contabilizan mediante la distribución de Poisson. - Por ejemplo, tiempo de espera en la parada de autobús, tiempo transcurrido entre dos llamadas telefónicas, número de vehículos que llegan a un semáforo, … - Una de las distribuciones más importantes es la distribución Normal, puesto que son muchos los fenómenos naturales y sociales que se ajustan a ella. - Aunque existen fenómenos que no se ajustan a una distribución normal, ciertas funciones de las muestras, ( , …) sí siguen esta distribución.
N ( ,σ ) ≡ Distribución Normal, con media de la población
y desviación típica de la población σ .
- La función de probabilidad f(x) no se utiliza para calcular la probabilidad, ya que se utilizan las tablas para calcular F(x i), por lo que tendremos que utilizar para ello, las propiedades de las distribuciones continuas. Aunque antes de buscar en las tablas hay que transformar la variable x en z, con el proceso que se explica a continuación:
Formulario de Estadística, v. 1
Página 15 de 17
Avda. Andalucía, 84 – Bajo 23006 – Jaén.
MAGNITUD
S A U N I T N DISTRIBUCIÓN O NORMAL C S E N (0,1) N O I C U σ = 1 =0 B I R T S I D
Teléfono y Fax: 953 085 888
www.cedavinci.com –
[email protected]
EXPRESIÓN O FÓRMULA
SIGNIFICADO DE VARIABLES
x ∈ N ( µ , σ ) → z ∈ N (0,1)
- Debido a que sería necesaria una tabla para cada par de valores de la distribución normal, se utiliza un par de valores yσ especiales que son = 0 y σ = 1.
tal que
z =
x − σ
- Al proceso de transformación de una distribución cualquiera N ( , σ ) en N (0,1) , necesario para buscar en la tabla se le lama TIPIFICAR. - Ejemplo: Sea una distribución N (50,8) en la que queremos calcular la probabilidad P ( x > 48) . En primer lugar habrá que transformar la variable x en variable z, tipificando:
48 − 50 = P ( z > −0.25) 8 probabilidad que para dejarla en función de F(x i)
P ( x > 48) = P z >
hay que utilizar las propiedades de las variables aleatorias continuas:
P ( z > −0.25) = 1 − p ( z < −0.25) = 1 − F (−0.25)
) 1 , 0 ( N
A L E D S E D A D E I P O R P
Formulario de Estadística, v. 1
Página 16 de 17
Avda. Andalucía, 84 – Bajo 23006 – Jaén.
MAGNITUD
EXPRESIÓN O FÓRMULA
Teléfono y Fax: 953 085 888
www.cedavinci.com –
[email protected]
SIGNIFICADO DE VARIABLES
El Teorema Central del Límite nos asegura que la suma de variables aleatorias independientes con idéntico modelo de probabilidad, ya sean discretas o continuas, converge a una distribución N (0,1) a medida que aumenta el tamaño de la muestra o número de veces que se repite el experimento, n. Por ejemplo:
TEOREMA CENTRAL DEL LÍMITE
Suma de Puntuaciones de 10 dados:
Tirados 100 veces
Tirados 1000 veces
Tirados 10000 veces
TEOREMA CENTRAL DEL LÍMITE: Evolución cuando
APROXIMACIÓN DE UNA DISTRIBUCIÓN BINOMIAL A UNA NORMAL
B(n, p ) ~ N (n · p, n · p · q )
Formulario de Estadística, v. 1
si se cumple que
n · p ≥ 5 y n · q ≥ 5
n → ∞.
- Cuando la n es suficientemente grande para que se cumpla la condición de aproximación, la distribución Binomial se puede aproximar por la normal, según el Teorema Central del Límite. - Hay que tener en cuenta las CORRECCIONES POR CONTINUIDAD, que se enumeran posteriormente, ya que estamos aproximando una distribución discreta por una continua.
Página 17 de 17
Avda. Andalucía, 84 – Bajo 23006 – Jaén.
MAGNITUD
Teléfono y Fax: 953 085 888
www.cedavinci.com –
[email protected]
EXPRESIÓN O FÓRMULA
SIGNIFICADO DE VARIABLES
P (λ ) ~ N (λ , λ )
- Cuando la n es suficientemente grande para que se cumpla la condición de aproximación, la distribución de Poissonl se puede aproximar por la normal, según el Teorema Central del Límite.
APROXIMACIÓN DE UNA DISTRIBUCIÓN DE POISSON A UNA NORMAL
D A D I U N I T N O C R O P S E N O I C C E R R O C
Formulario de Estadística, v. 1
si se cumple que
λ → ∞ , y en la práctica λ > 10
- Hay que tener en cuenta las CORRECCIONES POR CONTINUIDAD, que se enumeran posteriormente, ya que estamos aproximando una distribución discreta por una continua.