Daniels Capítulo 4 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

October 4, 2017 | Author: Carolina Andrea Giuffra Godoy | Category: Histogram, Probability, Sampling (Statistics), Random Variable, Probability Distribution
Share Embed Donate


Short Description

Download Daniels Capítulo 4 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W...

Description

4.1

INTRODUCCION

En el capitulo anterior se presentaron los conceptos basicos de probabilidad y los metodos para ca1cular la probabilidad de un eventQ. En este capitulo se amplla,n estos conceptos y se exploran form as para calcular las probabilidades de un evento bajo condiciones un poco mas complicadas. En este capitulo se estudian las relaciones entre los valores de la variable aleatoria y las probabilidades de que su ocurrencia pueda resumirse por medio de un mecanismo Hamado dislt"ibuci6n de probabilidad. La distribucion de probabilidad se puede expresar forma de tabla, grafica 0 formula. Conocer la distribucion de probabilidades para la variable aleatoria proporciona al medico y al investigador herramientas podero­ sas para simplificar y describir un conjunto de datos, y para llegar a conclusiones acerca de la poblacion de datos sobre la base de una muestra de datos extraidos de lapoblacion.

4.2 DISTRIBUCION DE PROBABllIDAD DE VARIABLES DISCRETAS Para iniciar el estudio de las distribuciones de probabilidad, se cbnsidera en primer lugar la distribucion de probabilidad de una variable discreta, ·la cual se define comosigue:

83

CAPITULO 4

DISTRIBUCIONES DE PROBABILIDAD

DEFINICION La distribucion de probabilidad de una variable aleatoria discreta es una tabla, unagratica, una fannula u otro sistelDa utilizado para especificar todos losvalores posibles de una variable aleatoria discreta junto con sus probabilidades respectivas. EJEMPLO 4.2.1

- - - - - ..

En un articulo de la revistaAmericanJournal o/Obstetrics and Gynecology, Buitendijk y Bracken (A-I) aseguran que durante 25 afios se ha tornado mayor conciencia de los efectos potencialmente dafiinos de los medicamentos y quimicos en el desarrollo de los fetos. En una poblaci6n de mujeres dadas de alta en maternidad, en un hospital del este de EUA, entre 1980 y 1982, los autores valoraron y estudiaron la asociaci6n del uso d~ medicamentos con varias caracteristicas de la madre, por ejemplo uso de alcohol, tabaco y adicci6n a farmacos. Sus hallazgos sugieren quela

TABIA4.2.1

Prevalencia del medicmnentos prescritos y no prescritos durante el embarazo enUelllujeres dadas de alta depues del parto en un hospital del este de EUA CODSUIDO de

·N6mero de medicamentos

o 1

1425

1351

2

793

3 4 5 6 7 8

348

156

58

28

15

6

9 10

12

Total

Frecuencia

3

Simone Buitendijk y Michael B. Brac­ ken, "Medication in Early Pregnancy: Prevalence of Use and Relationship to Maternal Characte­ ristics", AmericanJournal ofObstetrics and Gyneco­ logy, 165,33-40.. FUENTE:

4185

mujer que muestra un comportamiento mas propenso a correr riesgos durante e1 embarazo, tambien esta mas propensa a utilizar medicamentos durante el mismo. La tabla 4.2.1 muestra la prevalencia del consurno de medicamentos prescritos y no prescritos durante el embarazo entre las mujeres estudiadas.

--~

4.2

DISTRIBUCION DE PRQBABILIDAD DE VARIABLES DISCRETAS

85

TABlA 4.2.2 Distribucion de probabilldad del nUrnero de medicamentos consumidos con y sin prescripcion durante el embarazo entre las mujeres desClitas en el ejemplo 4.2. t Numero de medicamentos (x)

0 I

2 3 4 5 6 7 8 9 10 12 Total

P(X

= x)

.3405 .3228 .1895 .0832 .0373 .0139 .0067 .0036 .0014 .0007 .0002 .0002 1.0000

Se pretende construir la distribuci6n de probabilidad de la variable discreta X, donde X = nurnero de rnedicarnentos prescritos y no prescritos consurnidos por los individuos estudiados. Soluci6n: Los valores de X son XI = 0, x 2 1, ... , XlI = lOy X 12 = 12. Se calculan las probabilidades para estos valores dividiendo sus respectivas frecuencias entre el total, 4185. Asl, porejemplo. P(X x) = 1425/4185 = .3405. EI resultado se rnuestra en la tabla 4.2.2 que representa la distribuci6n de probabilidades deseada. • Altemativarnente. se puede presentar esta distribuci6n de probabilidad en forma grafica, como en la figura 4.2.1. En dicha figura, la longitud de cada barra vertical indica la probabilidad para el valor correspondiente de x. En la tabla 4.2.2 se observa que los valores de P(X = x) son todos positivos. rnenores que 1. y la surna de los rnismos es igual a 1. Estas no son caracterfsticas particulares de este ejernplo, sino que son caracterfsticas para todas las distribu­ ciones de probabilidad de variable discreta. Por 10 tanto, se dan las siguientes propiedades indispensables en una distribuci6n de probabilidad para una varia­ ble discreta:

1) 0.::;; P(X = x).::;; 1

2)

LP(X= x) = 1

86

CAPiTULO 4DISTRIBUCIONES DE PROBABILIDAD'

.35 .34

.33 .32

.31 .30

.29 .28

.27 .26

.25 .24 .23 .22

.21

.20 "0

,19

'" .18 J,l

:0

~ .17 .16

a:

,15

.14 .13 .12 .11

.10 .09 .08

.07 .06 .05 .04 " .03

.02 ,01

o

2

3

4 x (numero de medicamentos)

FIG,URA 4.2.1 tabla 4.2.1.

Representaci6n grafica de la distribuci6n de probabilidad de la

Tambien se observa que cada una de las probabilidades de la tabla 4.2.2 es la

frecuencia relativa de ocurrencia de cada valor de X. Cuando se tiene disponible la distribuci6n de probabilidad, es posible hacer afir­ maciones acerca de la variable aleatoria X. Se muestra con los siguientes ejemplos.

4.2

DISTRIBUCI6N DE PROBABILIDAD DE VARIABLES DISCRETAS

87

EJEMPLO 4.2.2 . . ~

.

.

~Cual

esla probabilipad d~ ,que una mujer seleq:ionada aleatoriamente sea una de las que consumieron tres medicamentos con 0 sin .prescripci6n? Solucion: Se puede escribir la probabilidad deseada comoP(X = 3). En la tabla • 4.2.2 se puede ver que la respuesta es .0832. EJEMPLO 4.2.3 ~Cual es la probabilidad de que una mujer seleccionada aleatoriamente haya con­ sumido uno 0 dos medicamentos?

Solucion: Para responder a la pregunta, se utiliza la regIa de adici6n para eventos mutuamente excluyentes. Mediante el uso de la notaci6n de probabili­ dad y los resultados de la tabla 4.2.21a respuesta se escribe como P(l u 2) P(l) + P(2) .3228 + .1895 = .5123.. •

lJiStrihuciOlles acumulqdas. AIgunas veces es mas conveniente trab~jar con la distribuci6n de probabilidad acumulada de una variable aleatoria. La distribuci6n de probabilidadacumuladaparala variable discreta cuya distribuci6n de probabilidad esta dada en la tabla 4.2.2 puede obtenerse sum'ando sucesivamente las probabili­ dades, P(X = x), que aparecen en la ultima columna. La probabilidad acumulada para Xi se escribe como F(x) P(X: Probability Distributions>

Poisson

Seleccionar Cumulative probability. Teclear .70 en Mean. Seleccionar Input column y teclear Cl. Clic OK.

MTB > CDF Cl; Poisson SUBC>

.70.

Resultados: Probability Distribution Function Poisson with mu x

0.00 1.00 2.00 3.00 4.00 5.00 6.00

=

0.700000

P(X = x) 0.4966 0.8442 0.9659 0.9942 0.9992 0.9999 1.0000 FIGURA 4.4.2 Calculo efectuado par el paquete MINITAB de la probabilidad de Poisson acumulada para x = 0 hasta x 6 y Ie = .7.

104

CAPiTULO 4

DISTRIBUCIONES DE PROBABILIDAD

4.4.2 Suponga que en un periodo de varios aftos el nfunero promedio de muertes por cierta enfer­ medad no contagiosa es de 10. Si el numero de muertes por esa enfermedad sigue la distri­ buci6n de Poisson, emil es la probabilidad de que durante el ano en curso: Exactamente siete personas mueran por esa enfermedad b) Diez 0 mas personas mueran por esa enfermedad c) No haya muertes por esa enfermedad a)

4.4.3 Si el numero promedio de accidentes graves por ano en una fibrica grande (donde el nfunero de empleados es constante) es de cinco, calcule la probabilidad de que en el ano en curso haya: a) Exactamente siete accidentes

b) Diez 0 mas accidentes

c) Cero accidentes

d) Menos de cinco accidentes

4.4.4 En un estudio sobre a la efectividad de un insecticida contra cierto insecto, se fumig6 una gran area de tierra que, mas tarde, se examin6 por cuadrantes elegidos aleatoriamente y en la que se cont6 el numero de insectos vivos por secci6n. Experiencias previas han demostra­ do que el numero promedio de insectos vivos por cuadrante, despues de fumigar, es de .5. Si el numero de insectos vivos por secci6n sigue una distribuci6n de Poisson, emil es la probabi­ lidad de que cierto cuadrante elegido tenga: a)

b) Cero insectos vivos

Exactamente un insecto vivo

c) Exactamente cuatro insectos vivos

d) Uno 0 mas insectos vivos

4.4.5 En cierta poblaci6n, cada ano se diagnostica un promedio de 13 nuevos casos de cancer esofagico. Si la incidencia anual de este tipo de cancer sigue una distribuci6n de Poisson, calcule la probabilidad de que en un ano determinado el numero de nuevos casos diagnosti­ cados de cancer sea: Exactamente 10 c) No mas de 12

a)

b) AI menos ocho

d) Entre nueve y IS, inclusive

e) Menos de siete

4.5 DISmmUCIONES DE PROBABHIDAD CONTINUA Las distribuciones de probabilidad consideradas hasta aqui, binomial y de Poisson, son distribuciones de variable discreta. Ahora se consideran las distribuciones de variable aleatoria continua. En el capitulo 1 se dijo que una variable continua es aquella que puede asumir cualquier valor en un intervalo espedfico de valores. Consecuentemente, entre cualesquiera dos valores asumidos por la variable conti­ nua existe un m1mero infinito de valores. Para comprender, la naturaleza de la distribuci6n de una variable aleatoria continua, considere los datos presentados en la tabla 1.4.1 yen la figura 2.3.2. En la tabla hay 169 valores para la variable aleatoria edad. EI histograma de la figura 2.3.2 esta construido con puntos espedficos localizados sobre una linea, que repre­ senta la medici6n de interes y que forma una serie de rectangulos, cuyas bases son las distancias entre dos puntos espedficos, sobre la linea y cuyas alturas representan el numero de val ores de la variable que caen entre los dos puntos especificados. Los intervalos delimitados por cualquier par de puntos especificados consecutivos se llaman intervalos de clase.

4.5

105

DISTRIBUCIONES DE PROBABILIDAD CONTINUA

fIx)

x

FIGURA 4.5.1 Histograma resultante de un gran numero de valo­ res y c1ases de intervalos pequenos.

Como se estudi6 en el capitulo 2, las subareas del histograma corresponden a las frecuencias de ocurrencia de los valores de la variable entre los lfmites de la esc ala horizontal de esas subareas. Esto proporciona un metodo para calcular la frecuen­ cia relativa de ocurrencia de valores entre dos puntos especfficos; tan s610 es nece­ sario determinar la proporci6n del area total del histograma que se encuentra entre los puntos especificados. Esto se puede hacer mas convenientemente consultando las columnas de frecuencia relativa 0 frecuencia relativa acumulada en la tabla 2.3.2. Imagine ahora una situaci6n donde el numero de valores de la variable aleatoria es muy grande y la amplitud de los intervalos de clase es muy pequefia. EI histograma resultante seria como el que se muestra en la figura 4.5.1. Si se conectan los puntos medios de las celdas del histograma en la figura 4.5.1 para formar un poligono de frecuencia, se obtendra una figura mas suave que el polfgono de frecuencia de la figura 2.3.4. En general, cuanto mas se aproximan a infinito el numero de n observacio­ nes, y la amplitud de los intervalos de clase se aproximan acero, el polfgono de frecuencia se aproxima a una curva mas suave como la que se muestra en la figura 4.5.2. Estas curvas suaves se utili zan para representar gnlficamente las distribucio­ fIx)

FIGURA 4.5.2

Representaci6n grafica de una distribuci6n continua.

106

CAPiTULO 4

DISTRIBUCIONES DE PROBABILIDAD

fIx)

a x FIGURA 4.5.3 Gratica de una distribuci6n continua que muestra el area entre a y b.

nes de las variables aleatorias continuas. Esto tiene algunas consecuencias imp or­ tantes cuando se trabaja con distribuciones de probabilidad. Primero, el area total bajo la curva es igual a uno, como 10 es para el histograma, y la frecuencia relativa de ocurrencia de los valores entre dos puntos especfficos cualesquiera, sobre el eje de las x, es igual al area total delimitada por la curva, el eje de las x y las rectas perpen­ diculares levantadas sobre ambos puntos del eje de las x, tal como 10 muestra la figura 4.5.3. La probabilidad de cualquier valor especifico de la variable aleatoria es cera. Esto es logico, puesto que un valor especffico se representa como un punto sobre el eje de las x y el area por encima de ese punto es cero. COIRO encontrar el area bajo la curva En un histograma, seg(tn se ha visto, las subareas de interes se calculan sumando areas representadas por las co­ lumnas (celdas). En el caso de una curva, esta no presenta celdas, por 10 que se debe buscar un metodo para calcular las subareas. Este metodo es suministrado por el cileu­ 10 integral. Para calcular el area bajo la curva entre dos puntos cualesquiera a y b, se integra lafunci6n de densidad de a a b. Unafunci6n de densidad es una formula em­ pleada para representar la distribuci6n de una variable aleatoria continua. La inte­ gracion es el caso lfmite de la sumatoria, aunque aqui no se efectua ninguna integracion, puesto que las materna tic as involucradas estan mas aHa del alcance de este Iibro. Tambien, como se ve mas adelante, para todas las distribuciones conti­ nuas a considerar existe una forma mas fadl para calcular el area bajo la curva. Aunque la definicion de distribucion de probabilidad para una variable aleatoria continua esta implfcita en el estudio anterior, a modo de resumen se pre· senta como sigue en forma mas concreta.

DEFINICION A una funci6n no negativa f(x) se Ie llama distribucion de probabilidad (tambien llamada, algunas veces, funci6n de densidad de probabilidad) para la variable aleatoria continua X, si el area total deliInitada por su curva y el eje de las x es igual a 1 y si la subarea delimitada por la curva, el eje de las x, y por las lineas perpendiculares levantadas sobre dos puntos cualesquiera a y b da la probabilidad de que X este entre los puntos a y b.

4.6

4.6

DISTRIBUCI6N NORMAL

107

DISTRIBUCION NORMAL A continuaci6n se estudia la distribuci6n mas importante en toda la estadistica: la distribucwn normal. La f6rmula para esta distribuci6n fue publicada por Abraham De Moivre (1667-1754) el 12 de noviembre de 1733. Muchos otros matem:hicos destacan en la historia de la distribuci6n normal, induyendo a Carl Friedrich Gauss (1777-1855). A esta distribuci6n frecuentemente se Ie llama distribuciOn de Gauss como reconocimiento a las contribuciones de este matematico. La densidad normal esta dada por f(X) =

/20')

oo
View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF