Manual de Bioestadística Básica I PDF

December 30, 2022 | Author: Anonymous | Category: N/A
Share Embed Donate


Short Description

Download Manual de Bioestadística Básica I PDF...

Description

 

MANUAL DE BIOESTADÍSTICA BÁSICA PRIMERA PARTE: B IOES OESTA TADÍSTI DÍSTICA CA I

CAC

  0

 

MANUAL DE BIOESTADÍSTICA BÁSICA CAPITULO 1 LOS DATOS Y LA LAS S ESTADÍSTICAS

Índice 1. Introdu cción a la Bioesta Bioestadísti dística ca ……………………………………………………..4 2. Tipos de variables…………..…………………………………………………….7  3. Distribución de frecuencias ………………………………………………..…..8

3. 3.1. 1. Descrip Descrip ción de variables cu alitativas alitativas 3. 3.2. 2. Descrip Descrip ción d e va variables riables cu antitativas 3. 3.2. 2.1 1 Descripc Descripción ión de variables cu cuantitativas antitativas discretas dis cretas 3. 3.2. 2.2 2 Descripc Descripción ión de variables cu antitativas con continúas tinúas 4. Represen R epresentaciones taciones gráficas……………………………………………………1 3

4. 4.1. 1. Representacion Representacion es gráficas de variables cu alitativas alitativas 4. 4.2 2 Representaciones gráfic gráficas as de variables cuantitativas Representaciones iones gráficas de variables cuantitativas discretas discret as  4.2.1 Representac 4.2.2. Represe Representaciones ntaciones gráficas de variables cuanti cuantitativ tativ as continúas   5. Medidas Medidas caracterí características: sticas: Me Medidas didas de posic on y medid medidas as de dispersion …………………………………………………………………………....18  5. 5.1. 1. Medidas Medidas de pos posoicio oicio n 5. 5.2. 2. Medidas Medidas de d dispersio ispersio n 5.3. 5. 3. M Medias edias de for forma ma 5. 5.4. 4. El diagrama d de e caj caja aoB Boxp oxp lot CAPITULO 2  INDICADORES DEMOGRÁFICOS Y EPIDEMIOLÓGICOS 1. Intdroduccion ……………………………………………………………………42  2. Tasa de natalidad, morbilidad, mortalidad………………………………….44 3. Tasa Tasa de incid encia, prevalencia …………………………………………...….47

  1

 

CAPITULO 3 PROBAB ILIDAD: CONCEPTO CONCEPTOS S B ASICOS  1. Introducc Introducción ión histórica ………………………………………...……………….47

2. Conceptos básicos ………………………………………………………………48  2.1. Experimento aleatorio 2. 2.2 2 Espacio muestral. Sucesos 3. Definicion Definiciones es de pro probabilidad babilidad …………………………………………………52  3. 3.1 1 Definición clásica o d de e La Laplace place 4 Probabilidad condicionada ……… ……………………………………………52 5. Independencia de suc esos ……...……………………………………………54 6. Teoremas clásicos:…………..…………………………………………………54 6. 6.1 1 Regla del prod uct ucto o 6. 6.2 2 Ley de las las pro probabilidades babilidades totales 6.3 6. 3 Teorema de Bayes CAPITULO 4. VARIABLES ALEATORIAS DISCRETAS Y DISTRIBUCIONES DE PROBABILIDA PROBAB ILIDAD D DISCRETAS 1. Introducción ……...………………………………………………………………58

2. Variable aleatoria.. ………………………………………………………………59  2.1. Variables aleatorias discretas 3. Medidas características de una variable aleatoria discreta…… ..……….61

3.1. Media 3.1. Media o es esperan peranza za 3.2. Varianza 4. Principales modelos de distribuciones discretas…………………………6 2

4.1. Distribución de Bernoulli 4.2. Distribución binomial 4.3. Distribución de Poisson

  2

 

CAPITULO 5. VARIABL ES ALEA ALEATORI TORIAS AS CONTI CONTINUAS NUAS Y DISTRIBB UCIONE UCIONES S DE PROBAB ILIDA ILIDAD D CONTINUA CONTINUAS S Índice 1. Introducción ………………………………………………………….…………...68 2. Variables aleatorias continuas……………………………………….……….68 3. Medidas características de una variable aleatoria continua… .……..…..69

3.1. Media 3.1. Media o es esperan peranza za 3.2. Varianza 4. Principale Principaless modelos de distribucio nes c ontinuas …………………………70 5. 5.La La distribucion de probabilida probabilidad d normal ………………………………………70 4. 4.1. 1. La distribu ción no normal rmal estánd estándar ar N( N(0, 0,1) 1) 2 4.2. La distribución normal N(µ,σ ) Literatura consultada………………………………………………………………………78.

  3

 

Notas del autor

El objetivo inicial inici al de este manu manual al es serv servirir de apoyo en el estu estudio dio de la mater materia ia de Estadística en el Grado en Medicina aunque pensamos que puede ser de utilidad para cualquier estudiante o profesional de Ciencias de la Salud que desee entender aplicar la Estadística a un nivel básico. Por nuestra intenció inten ción n no es e s yprofu profundizar ndizar en los aspectos más formales de tanto, la materia, ni abarcar métodos avanzados que vayan más allá de los contenidos que se imparten en unas 50 horas lectivas en este tipo de asignaturas. Tampoco pretendemos hacer hincapié en cuestiones relativas al cálculo. En lugar de ello, nos esforzaremos en facilitar la comprensión de los conceptos fundamentales, delegando la ejecución de los diferentes algoritmos en un programa estadístico. El estudio de la Estadística en Ciencias de la Salud, más conocida como Bioestadística, está motivado por la enorme incertidumbre que presentan los diferentes fen fenómenos ómenos a comprender, ddee ah ahíí la necesidad de diseñar ttécnicas écnicas de recogida y tratamiento de datos con la idea de extraer la mayor información posible acerca de los mismos. Así, la Bioestadística podría entenderse como la metodología a seguir para aprender de observaciones con de el propósito de explicar los fenómenos biomédicos. La las Bioestadística es uno los campos científicos que más se ha desarrollado en las últimas décadas. Prof. C. A. Cornielle

  4

 

Prof. C. A. Cornielle

CAPITULO 1. LOS DATOS Y LA LAS S ESTADÍSTI ESTADÍSTICAS CAS 1. Introdu cció n a la Bio Bioestadí estadística stica

La creciente atención que está recibiendo en la literatura médica especializada pone de manifiesto la importancia de esta disciplina y el hecho, cada vez más patente, de que los profesionales médicos han dado a la investigación en Bioestadística un puesto dominante dentro de su formación. La estadística permite analizar situaciones en las que los componentes aleatorios contr contribuyen ibuyen de forma important importantee en la variabili variabilidad dad de llos os datos obtenidos. La variabilidad es uno de los aspectos más esenciales de nuestra vida. La consiguiente incertidumbre que genera dicha variabilidad es importante y en muchos mu chos campos, como el de llaa medici medicina, na, es fu fundamen ndamental tal contar con co n métodos que nos permitan cuantificar dicha incertidumbre y minimizar su impacto en las decisiones que tomemos. Se podría podría definir la Bi Bioestadí oestadística stica como la ciencia que m maneja aneja med mediante iante métodos estadísticos la incertidumbre en el campo de la medicina y la salud. En medicina, los componentes aleatorios se deben, entre otros aspectos, al desconocimiento o a la imposibilidad imposibi lidad de medir algu algunos nos determinan determinantes tes de los los estados de salud y enfermedad, así como a la variabilidad en las respuestas de los pacientes. La fuente más común de incertidumbre en la medicina es la variabilidad natural de carácter biológico que existe entre individuos. Además, la variabilidad entre laboratorios, observadores, iinst nstrum rumentación, entación, etc. también son fuen fuentes tes de incertidumbre a tener en cuenta. La Bioestadística es la ciencia que maneja mediante métodos estadísticos la incertidumbre en el campo de la medicina y la salud. Por supuesto la Bioestadística no sólo se centra en medir incertidumbres sino que se preocupa también del control dde e su impacto. Por otra parte el profesio profesional nal de la medicina no solo se forma para p ara atender al paci pacient ente, e, si sino no que tiene además una responsabilidad y obligación social con la colectividad. Debe por lo tanto conocer los problemas de salud que afectan a su comunidad, los recursos con que cuenta y sus posibles soluciones, para lo cual necesita conocer la Estadística de Salud Pública y aplicarla en el proceso de planificación, ejecución y evalu evaluaci ación ón de ac accio ciones nes colectivas de salu salud. d.

  5

 

Prof. C. A. Cornielle

El campo de la estadística tiene que ver con la recopilación, presentación, análisis y uso de datos para tomar decisiones y resolver problemas. Cualquier persona, tanto en su carrera profesional como en la vida cotidiana recibe información en forma de datos a través de periódicos, de la televisión y de otros medios. Ejemplo Un cardiólogo, que investiga un nuevo fármaco paramayores rebajar de el colesterol,1:desea conocer el consumo de grasas en varones adultos 40 años. años. Cómo debe proceder? Población: Es el universo de individuos al cual se refiere el estudio que se pretende realizar. Muestra: Subconj Muestra: Subconjun unto to de la població poblaciónn cu cuyos yos valores de la vvariab ariable le que se pretende analizar son conocidos. Vari able: R Variable: Rasgo asgo o caracterí característica stica de los elementos de la población que se pretende analizar. Unaa muest Un muestra ra aleatoria es uunn subconju subconjunt nto o de casos o individuos de uuna na pob población. lación. En el Ejemplo la población la formada todos los varones adultos1,mayores de 40objeto años.deLaestudio variablesería de interés es elpor consumo de grasas. El cardiólogo podría pensar en analizar a todos los individuos de la población. poblaci ón. Sin Si n embargo, esto resul resulta ta inv inviab iable le ( y así ocurre en mu muchas chas otras situaciones prácticas prác ticas debi debido do al coste, al tiempo que requ requiere,...) iere,...) Enton Entonces ces se conformará con extraer una muestra. La muestra proporciona información sobre el objeto de estudio estudio.. Lo habitual en nnuestr uestro o contex contexto to es qu quee en el procedimi procedimiento ento de extracción extracción interv intervenga enga el az azar. ar. Por ejemplo, el cardió cardiólogo logo seleccionarí seleccio naríaa al az azar ar a 100 varones adultos mayores de 40 años y estudiaría el consumo de grasas de cada uno uno de ellos. Ejemplo 2: Se quiere analizar analizar el tiempo qu quee dedi dedican can al estu estudio dio s emanal los alumnos alum nos del Grado en Medici Medicina na de esta Un Universidad iversidad.. P Para ara ello ello ssee pregunt preguntaa a 50 alumnos de esta titulación. Población: Todos los estudiantes del Grado en Medicina de esta Universidad. Variable: Número de horas de estudio semanal. Muestra: 50 alumnos encuestados. Ejercicio 1: Se desea estimar el porcentaje de albúmina en el suero proteico de personas sanas. Para ello se analizan muestras de 40 personas, entre 2 y 40 años de edad. a) Cuál es la población objeto de estudio? b) Cuál es la variable de interés? c) Cuál es la muestra con la que se realiza el estudio?

  6

 

Prof. C. A. Cornielle

Clasificamos las tareas vinculadas a la Estadística en tres grandes disciplinas: Estadística Descrip Descrip tiva. Se ocupa de recoger, clasi clasificar ficar y resu resumir mir la informació informaciónn contenida en la muestra. Cálculo  Es unaaleatorios. parte de la matemática teórica que estudia las leyes de queProbabilidades. rigen los mecanismos Inferencia Estadística. Pretende extraer conclusiones para la población a partir Inferencia del resultado observado en la muestra.

La Inf Inferencia erencia Estadíst Estadística ica tiene uunn ob objetivo jetivo más ambi ambicios ciosoo que el de la mera descripción de la muestra (Estadística Descriptiva). Dado que la muestra se obtiene mediante procedimientos aleatorios, el Cálculo de Probabilidades es una herramienta esencial de la Inf Inferencia erencia Estadí Estadística. stica.

2. Tipos de variables

Vari ables cu Variables cualitativas: alitativas: No aparecen en fforma orma nnum umérica érica,, sino como categ categorí orías as o atributos. Por ejemplo el sexo, color de ojos, profesión, resultado de un tratamiento, tratamient o, etc. Las vvariab ariables les ccual ualitativas itativas se cl clasi asifican fican a su vvez ez en: Cualitativas nominales: Miden características que no toman valores numéricos. A estas características se les llama modalidades. Por ejemplo, en la variable sexo las modalidades son hombre y mujer. Cualitativas ordinales: Miden características que no toman valores numéricos pero sí presentan entre sus posibles posib les vvalores alores un unaa relaci relación ón de orden. Por ejemplo, si se desea examinar el resu resultado ltado de un tratamient tratamiento, o, las modalidades podrían ser: en remisión, mejorado, estable, empeorado. El nivel de estudios puede tomar los valores: sin estudios, primaria, secundaria, etc. Es importante clasificar correctamente las variables de interés ya que los procedimientos procedi mientos que vveremos eremos a continu continuació ación n dependerán del ttipo ipo de vvariab ariable le con que trabajemos Va riables Varia bles cuantitativas: Toman valores nu numéri méricos cos po porque rque son frec frecuent uentemente emente el resultado resul tado de un una a medici medición. ón. Por ejemplo, el peso (kg.) de uuna na persona, la es estatu tatura ra o (m.), número de llamadas diarias a un servicio de urgencias, temperatura ( C) corporal, etc. Las La s variables cuant cuantitativas itativas se clasific clasifican an a su vvez ez en: e n: Cuan Cuantitativas titativas discreta di scretas: s: T Toman oman un nnúmero úmero discre di screto to de valores (en el conjun conjunto to de números números

  7

 

Prof. C. A. Cornielle

naturales). natural es). Por ejemplo el nnúmero úmero de hijos de un unaa famili familia, a, nú número mero de cigarri cigarrillos llos fumados por día, etc. Cuantitativas continuas: Toman valores numéricos dentro de un intervalo real. Por ejemplo, la altura, el peso, concentración de un elemento, tiempo transcurrido tran scurrido hast hastaa que se inici iniciaa uuna na reacci reacción ón alérgica a una picadura de insecto, etc. 3. Distribución de frecuencias

La primera forma de recoger y resumir la información contenida en la muestra es efectuar un recuento del número de veces que se ha observado cada uno de los distintos valores que puede tomar la variable. A eso le llamamos frecuencia. Daremos definiciones precisas del concepto de frecuencia en sus distintas formas de presentación a través de un ejemplo práctico. Ejemplo 3: En la última hora han acudido al servicio de urgencias de un hospital ocho pacient paci entes, es, cuy cuyos os da datos tos de ingreso se en encuen cuentran tran resumidos en la si siguient guientee tabla. Clasifica las variables recogidas (sexo, peso, estatura, temperatura, número de visitas previas al servicio de urgencias y dolor). Sexo Peso (kg.) Estatura (m.) Temperatura ( oC) Visitas Dolor Sxo

Peso(kg) Estatu Estatura(m) ra(m) Temperatu Temperatura ra (C)

Vi Visitas sitas Dolor

M

63

1.74

38.0

0

Leve

M

58

163

36.52

2

Intenso

H

84

1.86

37.20

0

Intenso

M M

47 70

1.53 1.75

38.20 37.11

0 1

Moderado Intenso

M

57

1.68

36.80

0

Leve

H

87

1.82

38.41

1

Leve

M

55

1.46

36.61

1

Intenso

En primer lugar, lugar, definimos el ttamaño amaño muestral, al que denotamos por n, como el número de individuos o de observaciones en la muestra. En el Ejemplo 3, el tamaño muestral es n = 8.

  8

 

Prof. C. A. Cornielle

3. 3.1 1 Descripción Descrip ción de variables cu alitativas. alitativas.

Supongamos que los distintos valores que puede tomar la variable son: C1, c2,

, , , c m.

Frecuencia absoluta: Se denota por f i y representa el número de veces que ocurre el resultado ci . Frecuencia relativa: Se denot denota a por fr y represent representa a la proporción prop orción ddee datos en cada una de las clases, f rr  = fi /∑f i  La frecuencia relativa es igual a la frecuencia absoluta dividida por el tamaño muestral. Frecuencia absoluta acum ac umul ulada ada.. Es el nnúm úmero ero de vveces eces que se hhaa obse observ rvado ado eell resultado ci o valores anteriores. La denotamos por Fi, es una suma continua de las frecuencias absolutas. En la mayor parte de procedimientos estadísticos es necesario manejar conjunt conju ntos os de observ observacio aciones nes nu numéricas. méricas. Para rep representar resentar de forma concisa los cálculos, se ha desarrollado una notación matemática abreviada. Por ejemplo, para designar la adición se usa la letra griega ∑ .  Frecuencia relativa acumulada. acumulada. Es la frecu frecuencia encia aabsolut bsolutaa acumul acumulada ada dividi dividida da por el tamaño muestral. La denotamos por Fr, y es igual: Fr = Fi / ∑fi Debemos observar que las frecuencias acumuladas sólo tienen sentido cuando es posible establecer una relación de orden entre los valores de la variable, esto es, cuando la variable es ordinal. Las frecuencias se pueden escribir ordenadamente mediante una tabla de frecuencias, que adopta la siguiente forma: Xi

fi

fr

Fi

Fr

X1

f1

fr1

Fr1

X2

f2

fr2

Fr2

X3

f3

fr3

Fr3

.

.

.

.

.

.

.

.

.

.

Xn

fn

frn Fi Finn

Fr n

  9

 

Prof. C. A. Cornielle

Propiedades: Frecuencias absolutas

0 ≤ fi ≤ n

Frecuencias relativas Frecuencias absolutas acumu acumuladas ladas

0≤ f r ≤ 1.00 0≤FI ≤ f i

Frecuencias relativas acumu acumuladas ladas

0 ≤ Fi ≤ 1.00

∑f r =1.00 Claramente, la suma de las frecuencias absolutas es el número total de datos, n; y la suma de las frecuencia frecuenciass re relativas lativas es 1.0 Observa qque ue el último último valor de la distribución de frecuencias absolutas acumuladas coincide con el número de observaciones. Análogamente, el úúltimo ltimo valor ddee la distribución de fr frecuen ecuencia cia s relativas acumuladas es uno. La distribución de frecuencias acumuladas permite conocer la proporción proporci ón de valores valores por debajo de cierto vvalor alor de la variable, o entre dos valores especificados, o por encima de cierta cantidad. Como ejemplo, vamos a construir la tabla de frecuencias para la variable Dolor del Ejemplo 3. La variable Dolor es una variable cualitativa ordinal que presenta tres modalidades: modalidad es: lev leve, e, moderado e inten intenso. so. Tendrí Tendríamos amos así la tabla de frecuencias: Xi Leve Moderado Inten ntenso so

Xi 3 1 4 ∑f i = 8

fr 0.375 0.125 0.5

Fi 3 4 8 1.00

Fr 0.375 0.5 100

-I -Int nterpreta erpreta los result resultados ados obtenidos y comprueba que se veri erifican fican las propiedades de las frecuencias. -Quéé porcentaje de pacientes qu -Qu quee acudieron al serv servici icioo de urgen urgencias cias suf sufren ren ddolor olor intenso? -Cuántos pacientes acudieron al servicio de urgencias con dolor leve o moderado? Ejercici o 2. Constru Ejercicio Construye ye la tabla de frecu frecuencias encias para el resto de vvariab ariables les cualitativas que aparecen en el Ejemplo 3.

  10

 

Prof. C. A. Cornielle

Ejercici o 3. Con el objetivo de estudiar la iinfl Ejercicio nfluen uencia cia de la durez durezaa del agua en ciertos trastornos gastrointestinales simples, un laboratorio determinó la dureza del agua de 10 muestras muestras obteniendo los siguientes re resul sultados: tados: Muestra n Dureza 1 2

Agua blanda Agua blanda

3

Agua dura

4

Agua muy dura

5

Agua muy dura

6

Agua extremadamente dura

7 8

Agua blanda Agua blanda

9 10

Agua dura Agua muy dura

Construye la tabla de frecuencias relativas para la variable “Dureza del agua”  3. 3.2 2 Descripció n de variables cuantitativas .  3. 3.2. 2.1 1 Descripc Descripción ión d de e variables cu antitativas disc retas.

Una variable cuantitativa discreta es una variable que toma un número finito o infinito numerable numerable de valores posi posibles. bles. La forma de resu resumir mir los datos observados de una una varia variable ble cuant cuantitativa itativa dis discreta creta es simi similar lar a la forma de resum resumirir datos de unaa variable cu un cualitativa. alitativa. Vere Veremos mos cómo const construir ruir la tabla tabla de d e frecu frecuencias encias de un unaa variable discreta a través de un ejemplo. Considera ahora la variable Visitas del Ejemplo 3. Fíjate que la variable Visitas es discreta ya que que puede tomar los vvalores alores 0,1,2,. 0,1,2,..... (un número número infinito numerable de valores). valores). A con continu tinuació ación n constr construimos uimos la latabla tabla de frecu frecuencias: encias: Xi

fi

fr

Leve

3

0.375

3

0.375

Moderado

1

0.125

4

0.5

Inten ntenso so

4

0.5

8

1.00

∑f i = 8

Fi

Fr

1.00

  11

 

Prof. C. A. Cornielle

Fíjate en la información que nos ofrece la tabla de frecuencias. Observamos por ejemplo que el 87.5%de los pacientes registrados regi strados nnoo habí habían an acudido con anterioridad en más de una ocasión al servicio de urgencias. También observamos que sólo 1 paciente había acudido anteriormente en 2 ocasiones al servicio de urgencias (lo que representa un 12.5% del total de pacientes registrados). Ejercicio 4: Consideremos una muestra de 200 familias en las que contamos el número de hijos. Supongamos que se han observado 50 familias sin hijos, 80 familias con un hijo, 40 familias con dos hijos, 20 familias con tres hijos y 10 familias con cuatro hijos. Construye la tabla de frecuencias correspondiente. 3. 3.2. 2.2 2 De Descr scripció ipción n de variables cuantit ativas con tinú tinúas. as.

Para constru construirir tablas de ffrecuen recuencias cias de vvariab ariables les cuan cuantitativas titativas continuas continuas es habitual agrupar los valores que puede tomar la variable en intervalos. De este modo contamos contamos el nú número mero de veces que la vvariab ariable le cae en cada int interval ervalo. o. A cada uno de estos intervalos le llamamos intervalo de clase y a su punto medio marca de clase. Por tanto, para la definición de las frecuencias y la construcción de la tabla de frecuencias sustituiremos los valores ci por los intervalos de clase y las marcas de clase. Algunas consideraciones a tener en cuenta: Número de intervalos a considerar: Para adoptar esta decisión tendremos en cuenta: 1. Cuantos menos intervalos tomemos, menos información se recoge. 2. Cuantos más intervalos tomemos, más difícil es manejar las frecuencias. Aunque no hay unanimidad al respecto, un criterio bastante extendido consiste en tomar como número de intervalos el entero más próximo a √n.  Amplitud de cada intervalo: intervalo: Lo más común es tomar todos los iint nterval ervalos os de igual longitud. Posi ción de llos Posición os interv intervalos: alos: Los int interval ervalos os deben situarse allí do donde nde se encu encuentra entra n las observaciones de d e forma con contigua. tigua. Es acon aconsejable sejable qque ue llos os restos de interv intervaa los en los los extr extremos emos derecho e iizqu zquierdo ierdo del conju conjunt ntoo de observ observacio aciones nes sean similares. Si una una variab variable le cu cuant antitativa itativa discre discreta ta toma mu muchos chos valores disti distint ntos os puede ser convenie conven iente nte un unaa ag agrupaci rupación ón por inter intervalos valos como en el caso continuo. A continu continuaci ación ón veremos un ejemplo práctico de cómo se con constru struyen yen los intervalos y la tabla de frecuencias para variables cuantitativas continuas. En la resolución de los ejemplos será útil ordenar la muestra de observaciones y después calcular el recorrido o rango, que de mínimos como la diferencia entre

  12

 

Prof. C. A. Cornielle

el dato más grande y el más pequeño de la muestra. El recorrido se usa para obtener la amplitud de los intervalos. La ordenación facilita mucho también el recuento recuen to de las frecu frecuencias encias encada iint nterval ervalo. o. Considera la variable Peso del Ejemplo 3. En primer lugar vamos a ordenar los datos de la muestra de menor a mayor para que sea más sencillo el recuento de frecuencias. Muestra ordenada: 47; 55; 57; 58; 63; 70; 84; 87. Recorrido= 87- 47 = 40. Número de intervalos = √8 = 2.82 = 3 Como 40/3 = 13.3, podemos tomar 3 interv intervalos alos de amplitud 14 y así consegu conseguimos imos contener toda la muestra y los extremos de los intervalos resultan manejables. Int ntervalo ervalo de clase Marca de clase: [Li - Li+1)

xi

ni

Fi

Fr

46 60 60 - 74 74 - 88

53 67 81

42 2

0.5 0.25 0.5 0.75 0.25 1.0

Observamos, por ejemplo, que hay 2 pacientes con peso comprendido en el intervalo interv alo [74; 88) y que el 75% de los pacientes atendidos pesan menos de 74 kg. Ejercicio 5: En un estudio sobre trastornos de sueño se analizó el comportamiento de d e 10 varon varones es cuy cuyas as edades se muestran a con continu tinuació ación: n: 52; 47; 51; 28; 64; 31; 22; 53; 29; 23 Calcula una una tabla de frecu frecuencias encias para la variable Ed Edad ad organizan organizando do los datos en tres intervalos [20,35), [35,50), [50,65).

  13

 

Prof. C. A. Cornielle

4. Representacion Representacion es gráficas

La representación gráfica de la información contenida en una tabla estadística es una manera obtener una información clarade y evidente los valoresa asignados a la de variable estadística. Existenvisual multitud gráficos de adecuados cada situación. Unos se emplean con variables cualitativas otros con variables cuantitativas. 4. 4.1 1 Representaciones gráficas gr áficas de variable variabless cualitativas

Di Diagrama agrama de barras: Representaremos las ffrecuen recuencias cias absolutas o relativas de variables cualitativas mediante un diagrama de barras. Para ello, situamos las modalidades de la variable en el eje de abscisas, respetando su orden si lo hubiera, y dibujamos barras verticales sobre ellas. Las alturas de las barras representan frecuencias absolutas, relativas o porcentajes. En la la Figura 1 se mu muestra estra el diagrama de barras de frecuencias frecuencias aabso bsolu lutas tas para la variable Dolor del Ejemplo 3 Diagrama de barras Frecs. Absols. 5 4 3 2 1 0 Leve

Mo derado

Inten so

  14

 

Prof. C. A. Cornielle

Di Diagrama agrama de sectores: Se obtiene di dividiendo vidiendo uunn cír círcul culoo en tan tantos tos se sectores ctores como modalidades tome la variable. La amplitud de cada sector debe ser proporcional a la frecuencia del valor correspondiente. En la Figura 2 se muestra el diagrama de sectores de la variable Dolor del Ejemplo 3. DOLOR

37.5%

50%

12.5%

Leve

Mo dera do

Inten so

Ejercicio 6: Un laboratorio está desarrollando unas nuevas tiras de orina para detectar los niveles niv eles de aceton acetona. a. S See realizan 50 pruebas de ace aceton tonaa en pacientes y se obtiene en 15 ocasiones el color naranja, naranja, 25 vveces eces se obt obtiene iene el co color lor amarillo y en 10 ocasiones ocasi ones resu resulta lta el co color lor vverde. erde. C Const onstruy ruye e la tabla de ffrecuen recuencias cias y representa las gráficas adecuadas para la variable Color de reacción. 4. 4.2 2 Representaciones gráficas gráfic as de va variables riables cu antitativas 4. 4.2. 2.1 1 Representaciones gráficas de varia variables bles ccuantitativas uantitativas disc retas

Representaremos los datos de variables cuantitativas discretas mediante diagramas dia gramas de barras, al igual que hici hicimos mos con vvariab ariables les cu cualitativas. alitativas. En llaa F Figura igura 3 se muestra el diagrama de barras de frecuencias absolutas para la variable Visitas Visi tas del Ejempl Ejemplo o 3.

  15

 

Prof. C. A. Cornielle

Figura 3: Diagrama de barras de frecuencias absolutas para la variable Dolor

4. 4.2. 2.2 2 Re Representacion presentacion es gráficas de variables cuantitativas cuant itativas c ont ontinuas inuas Las frecuencias de una variable cuantitativa continua también se pueden representar gráficamente. Sin embargo, el diagrama de barras no parece adecuado para este caso, pues lo que debemos representar son frecuencias de intervalos contiguos.

Histograma: Es un gráfico para la distribución de una variable cuantitativa continua contin ua que represent representa a frecu frecuencias encias mediante áreas. El hhistograma istograma se construye colocando en el eje de abscisas los intervalos de clase, como trozos de la recta real, y levan levantan tando do sobre ell ellos os rectángu rectángulos los con área proporcional a la frecu frecuencia encia.. Dibujamos en la Figura 4 el histograma correspondiente a la distribución de frecuencias obtenida para la variable Peso del Ejemplo 3. A diferencia del diagrama di agrama de barras, los rectángu rectángulos los se dibujan cont contiguos. iguos. El aspecto del histograma cambia cambi a variando eell nnúm úmero ero de clases y el pun punto to donde empieza la primera clase. Cuanto mayor es el área de una clase, mayor es su frecuencia. El histograma ayuda a describir cómo es la distribución de la variable, si es simétrica (con un eje e je de simetrí simetría), a), bimodal bi modal (con dos máx máximos),... imos),...etc. etc.

  16

 

Prof. C. A. Cornielle

Figura 4

Formalmente, la altura de los rectángulos de un histograma debería representar la densidad de frecuencia, que es el cociente fi / (Li+1 - Li). Así, el área total encerrada por el histograma sería igual a uno. Sin embargo, la mayoría de programas informáticos de estadística representan el histograma mediante rectángulos rectángu los de alt altura ura iigual gual a la frecu frecuencia encia absoluta o relativa de cada interv intervalo alo como se muestra en la Figura 4 El polígono de frecuencias. Otra forma de presentar una distribución de frecuencias frecu encias gráficamente es dibujar un polígono polígono de frecu frecuencias. encias. Se puede hhacer acer de dos formas: primero, si se dispone ya de un histograma, simplemente dibujando un punto en el punto medio de la parte superior de cada barra del histograma y uniendo luego estos puntos con líneas rectas, segundo, sin el histograma, el polígono polígono se obtiene localizan localizando do las coordenadas: las ordenadas, que son las las frecuen frecuencias cias de clases, y las absci abscisas, sas, que son los pu punt ntos os medio medios. s. Esto puntos se unen con segmentos de rectas. Considerando el peso del ejemplo 3 Li - Li+1)

xi

ni

46 - 60

53

4

60 - 74

67

2

74 - 88

81

2

  17

 

Prof. C. A. Cornielle

Figura 5 Poligono de frecuencia 4.5 4 3.5 3 2.5 2 1.5 1 0.5 0 40- 46

46-60

60- 74

74-78

78- 84

Como se nota nota el polí polígono gono de frecu frecuencias encias está form formado ado por los pun puntos tos medio medioss de las clases vecinas, este tiende acerrarse. 5. Medidas características: Medidas de posición y de dispersión

El objetivo fundamen fundamental tal de la estadí estadística stica es ext extraer raer conclu conclusiones siones sobre un unaa población basándonos en la información obtenida en la muestra. Hasta ahora hemos visto como resumir esa información mediante tablas de frecuencias y representaciones gráficas grá ficas que nnos os ayu ayudan dan a visual visualizar izar la distribución de los datos. Estudiaremos ahora como calcular medidas que nos den una descripción muyy resumida sobre algun mu alguna a propi propiedad edad con concreta creta del conju conjunt ntoo de datos. Por medida entendemos, pues, un número que se calcula sobre la muestra y que refleja cierta cualidad de la mis misma. ma. El cálcu cálculo lo de estas medi medidas das requ requiere iere efectuar operaciones con los valores que toma la variable. Por este motivo, a partir de ahora tratamos sólo con variables cuantitativas. Las medidas medid as de posi posición ción y de ttenden endencia cia cent central ral se calcu calculan lan tan tanto to para muestra como para población.

  18

 

Prof. C. A. Cornielle

5. 5.1 1 Medidas Medidas de pos ición

En esta sección estudiamos medidas que nos indican la posición que ocupa la muestra. La posición central son el objetivo de la media, la mediana y la moda. El estudio de d e posici posiciones ones no cent centrales rales se hhará ará con los cuan cuantiles. tiles. Media aritmética para una una muestra muestra simple (sin agru agrupar): par): Sean X1; X2, , , Xn un conjunt conju ntoo de n observaciones de la vvariab ariable le X. Se de define fine la media aritmética (o simplemente media) de estos valores como:   = µ=

  

  

∑,

Par Para a un una a muestra (1)

∑( ) Para

una poblacion (2)

Observamos que q ue el peso medio es 65.125 kg. Fí Fíjate jate que llaa unidad ddee medida de la media es la misma que la de los datos originales. Ejemplo 4: C Calcul alculamos amos el peso medi medioo de los paci pacient entes es de urgencias del Ejemplo 3. X = 63+58+84+…+55  = 61.125 kg Observamos que q ue el peso medio es 65.125 kg. Fí Fíjate jate que llaa unidad ddee medida de la media es la misma que la de los datos originales. Para una una mu muestra estra agrupada la m medi ediaa aritmética se calcul calculaa co conn la siguiente formula:  

  = ∑( )  

Pa Para ra un una a muestra

  19

 

Prof. C. A. Cornielle

Peso kg de 37 pacientes de un hospital Peso kg x

Pacient Pacientes es fi

Xi*fi

165

9

1485

195

7

1365

200

6

1200

210

4

480

225

3

675

Total

29

5205

 

  = ∑( ) = 

5205 = 179.48 kg 29

Si los datos están clasificados clasificado s se bu buscan scan las marcas de clase o pu punt ntos os medios de las clases. En caso de que que se trate de una una poblaci población ón se procede iigual, gual, pero se uutilizan tilizan todos los datos y se usa la formula (2). Propiedades: 1. min(xi) ≤x ≤ max(xi ) y tiene las mismas unidades que los datos originales. 2. Es el centro de gravedad de los datos: 3. Si yi = a + bxi y = a + bx. Ejemplo 5. Se ha detectado un error en la báscula con la que se han pesado los pacientes del Ejemplo 3. La báscula estaba mal equilibrada y añadía a todos los pacientes 5 kg. a su peso real .Cuál es entonces el peso medio correcto de los pacientes? Si X representa representa el pe peso so qu quee hemos medi medido do con error, Y = X - 5 representarí representaríaa el peso real de los pacientes. Para calcular el peso medio correcto no nos haría falta calcular de nuevo todos los pesos, ya que por las propiedades de la media (propiedad 3) sabemos que: y = x = 5 = 60.125 kg.   20

 

Prof. C. A. Cornielle

Efectivamente, los pesos reales serí Efectivamente, serían an 58, 53, 79, 42, 65 65,, 52, 82, 50. Por lo tanto la media de los pesos sería: y =58+53+79+…+50  = 60.125 6 0.125 kg 8 Mediana: Una vez ordenados los datos de menor a mayor, se define ne la mediana como el valor de la variable que deja a su izquierda el mismo número de valores valores que a su derecha. Si hhay ay un núm número ero impar de datos, la media mediana na es el valor central. Si hay un número par de datos, la mediana es la media de los dos valores centrales. La mediana para datos simples: Ejemplo 6: Calculamos el peso mediano de los pacientes de urgencias del Ejemplo 3. En primer lugar ordenamos los datos de menor a mayor: 47; 55; 57; 58; 63; 70; 84; 87 Tenemos un número par de datos (n = 8) y por lo tanto la mediana será: Me = 58 + 63 = 60:5 kg 2 Observa que la media y la mediana tendrán tendrán val valores ores simi similares, lares, salvo salvo cuan cuando do haya valores atípicos o cuando la distribución sea muy asimétrica. La mediana es la medida de posición central más robusta es decir, más insensible a datos anómalos). La mediana para datos agrupados sin clasificar. Si los datos están agrupados pero sin estar distribuidos en clases tanto para muestras como población, primero identificamos el área de la mediana, luego calculamos la mediana con la ayuda de la siguiente técnica: -I -Identificamos dentificamos donde recae la mitad de todos llos os vvalores alores N/2 = 28/2 = 14 pacientes.

  21

 

Prof. C. A. Cornielle

Pe kg de 37 pacientes de un hospital Peso kg x

Pacient Pacientes es fi

Fi

165

9

9

195

7

16

200

5

210

4

225

3

Total

28

Área de la median medi anaa

La mediana del peso de los pacientes Me= 195 kg Partiendo de datos agrupados y clasific clasificados ados la m medi ediana ana en uuna na di distribución stribución de frecuencias se halla por interpolación. El método de interpolación se basa en el supuesto de que los datos son continuos contin uos y qu quee los valores de la serie se distrib distribuy uyen en regularm regularment entee dentro de los intervalos interv alos de clases. Para situar la m media ediana na lo primero que hhay ay que hhacer acer es encontrar encon trar la posic posición ión en la distri distribución bución que di divvida la serie en dos partes ig iguales. uales. Usando el pesos de los paci pacient entes, es, localizaremos primero esta posi posici ción ón calculando n/2 = 14/2 = 7. Me = L Inf. + (n/2-F (n/2-F--1) i = 74 + _7 _7-6 -6 ) * 4 = 75.32 kg fi

3

Kg 46 - 60

xi  53

Pac. Fi 4 4

60 - 74

67

2

6

74 - 78

76

3

9

78 - 84

81

5

14

N/2 = 14/2=7 Área de la mediana

Me = L Inf. + (n/2-F (n/2-F--1) I = 74 + ( 7-6)2 = 74.67 Kg Fi

3

  22

 

Prof. C. A. Cornielle

Moda (Mo): Es el valor de la variable que se presenta con mayor frecuencia. A diferencia de las las otras medida medidas, s, la moda tambi también én se puede calcul calcular ar para variables cualitativas. Pero, al m mismo ismo tiempo, al estar tan vvincu inculada lada a la frecuencia, no se puede calcular para variables continuas sin agrupación por intervalos de cl intervalos clase. ase. Al interv intervalo alo con may mayor or frecuen frecuencia cia le llllamamo amamoss clase modal. Puede ocurrir que haya una única moda, en cuyo caso hablamos de distribución de frecuencias frecuencias un unimoda imodal.l. Si hhay ay más de uuna na mod moda, a, dire diremos mos qu quee la distribució distribuciónn es mul multimodal. timodal. Ejemplo 7: Calculamos la moda de la variable a número de hijos de pacientes con TBC: 6, 2, 1, 1, 2, 2, 4, 3, 0, 3, 4, 4, 0, 2. La moda es 2 hijos. Si los datos están agrupados pero sin clasificar, se hace el siguiente procedimiento: Número de hijos de pacientes con TBC No. de hijos

Paci Pacient entes es

0

8

1

6

2

4

3

5

4

3

6 Mo = 0 Hijos.

Cuando los datos están agrupados y clasificado, la moda se calcula por interpolación con la ayuda de la siguiente fórmula: Mo = Lim Li m in.f + ( Δ1 ) i

Δ1+ Δ2

  23

 

Prof. C. A. Cornielle

Donde Lim. inf = lílímite mite inferior de la cl clase ase modal

Δ1 = diferencia entre la frecuencia de la clase modal y la frecuencia de la premodal Δ2 = diferencia entre la frecuencia de la clase modal y la frecuencia de la posmodal i = tamañ tamañoo de la clase modal Ejemplo 8. En nuestro ejemplo la moda sería:

Número de hijos de pacientes con TBC No. de hijos Paci Pacient entes(fi) es(fi) 0-2

5

3-4

6

4-5

4

5-6

3

Total

área modal

18

Mo = 3 + (6-5) * 1 = 3.33 hijos (6-5) + 6-4)

  24

 

Prof. C. A. Cornielle

Una aplicac Una aplicación ión int interesante eresante ddee la moda es la co comprobaci mprobación ón de los cálcul cálculos. os. Si un cálculo se repite un número de veces, el resultado aceptado es el que aparece el mayor número de veces. Aunque la moda es un concepto muy sencillo, de interpretación muy clara y útil, su aplicación plantea muchos problemas difíciles. Primero, una distribución puede revelar que dos o más valores valores se repiten igual nú número mero de vvece, ece, y en tal caso no no hay forma llógi ógica ca de determinar qqué ué valor valor debe escogerse como la moda. En una una distri distribución bución con datos discretos la moda es el vvalor alor que ocu ocurre rre co con n mayor mayor frecuencia. Se gundo, al tratar un Segundo, unaa seri serie e continua cuy cuyos os valores si siguen guen uunos nos a otros aun para los datos discretos, puede que no encontremos un valor que aparezca más de unaa vez un vez,, como el caso de llas as poblaci poblaciones ones de las grandes ciudades chinas. Finalmente, la moda es un vvalor Finalmente, alor inestable. Tiende a cambia cambiarr si se modifica la manera de redondear los datos. Relación Re lación entre los promedios

Existen ciertas relaciones numéricas entre los promedios: Para cualquier serie, excepto para aquella cuyas observaciones son de idéntico valor, la media aritmética siempre es mayor que la media geométrica, la cual a su vez es mayor que la media harmónica. Para una distribución simétrica y unimodal la media = mediana = moda. Para una distribución de asimetría positiva (asimetría hacia la derecha), la

 X   >

Md > Mo.

Para una distribución de asimetría negativa (asimetría hacia la izquierda),  X    <

Md < Mo.

La gráfica 6 presenta lla a relación ent entre re la media, mediana y moda.

  25

 

Prof. C. A. Cornielle

Grafica 6

En conclusión, en ocasiones una descripción completa de una distribución de frecuencias requiere dos o más de estos promedios. El cálculo de dos o más promedios carga para cuando el investigador y para usuario demás la estadística. crea Pero,cierta esto se justifica se presenta una eldescripción completa de los datos y no la que se obtiene calculando una sola medida. Cuantiles:  Hemos visto q que ue la mediana ddivide ivide a los datos en dos partes iguales. i guales. Pero también tiene interés estudiar otros parámetros, llamados cuantiles, que dividen los datos de la distribución en partes iguales, ig uales, es decir en intervalos intervalos que comprenden el mismo número de valores. En general, sea p 2 (0; 1).

Se define el cuantil P como el número que deja a su izquierda una frecuencia relativa p. Observa que la mediana es el cuantil 0.5. Existen distintos métodos para calcular calcular los cu cuantiles. antiles. Un Unaa po posible sible forma de calcu calcular lar el cu cuant antilil p consistiría en ordenar la muestra muestra y tomar como cuan cuantil til el men menor or ddato ato de la mu muestra estra (primero de la muestra ordenada) cuya frecuencia relativa acumulada es mayor que p. Recuerda ordenar las observaciones de menor a mayor para calcular calcular la mediana y el resto de cuantiles. Algunos órdenes de los cuantiles tienen nombres específicos. Así los cuartiles son los cuant cuantiles iles de orden (0.25, 0.5, 0.75) y se representan por Q1, Q2, Q3. Los cuartiles cuartiles dividen la distrib distribución ución en cu cuatro atro pa partes. rtes. Los deciles son los cuan cuantile tiless de orden (0.1, 0.2,... 0.2,...,, 0.9). Los percentiles son los cuantiles cuantiles de orden j /100 do donde nde  j =1,2,. =1,2,... ..,99. ,99. Una medida de posición muy útil para describir una población, es la denominada 'percentil'. En forma intuitiva podemos decir que es un valor tal que supera un determinado porcentaje de los miembros de la población. El percentil es una medida no central usada en estadística que indica, una vez ordenados los datos de menor a mayor, el valor de la variable por debajo del cual se encuentra un porcentaje dado de observaciones en un grupo de observaciones.   26

 

Prof. C. A. Cornielle

Se representan representan con llaa letra P P.. Para el percen percentil til i-ésimo, i -ésimo, donde la i toma valores valores del 1 al 99. El i % de la muestra muestra son vvalores alores menores que él y el 100 100-i-i % restante restante son mayores. Aparecen citados en la literatura científica por primera vez por   Francis Francis Galton en 1885. P25 = Q1. P50 = Q2 =  = mediana.  mediana.   P75 = Q3. Cálculo del percentil Fórmulas Datos No Agrupados Si se tienen una serie de valores X 1, X 2, X 3, ..., Xn, se localiza mediante las siguientes fórmu fórmulas: las: Para los percentiles, cuando n es par: A* n = _P_ 100 Cuando n es impar: P/100(n + 1) Siendo P, el número del percentil. Es fácil ver que el primer cuartil coincide con el percentil 25; el segundo cuartil con el percentil 50 y el tercer cuartil con el percentil 75. Los percentiles son, tal vez, las medidas más utilizadas para propósitos de ubicación o estatura, clasificación como peso, etc.de las personas cuando atienden características tales Los percentiles son ciertos ci ertos nnúmeros úmeros qque ue dividen la sucesión de datos ordenados en cien partes porcentual porcentualment mente e iguales. Estos son llos os 99 valores que dividen en cien partes iguales el conjunto de datos ordenados. Los percentiles (P1, P2,... P99), leídos leídos primer percentil,.. percentil,...,., percentil 99. Datos Agrupados P = Lim inf. + P/100(n) – Fa-1  * i fi P= 1, 2,3,... 99

  27

 

Prof. C. A. Cornielle

Donde: Lim inf = Límite real inferior de la clase del decil k n = Núm Número ero de datos Fa-1 = Frecuencia Frecuencia acumu acumulada lada de la clase que ant antecede ecede a la clase del percentil P. fi = Frecuencia de la clase del percentil P. i = Longitud del intervalo de la clase del percentil P. Veamos un ejemplo para datos simples: Ejemplo 9. Se tiene el nivel de triglicéridos en sangre MG/ml par un grupo de 10 pacientes: 100 120 135 140 160 180

190 200 250 260

Determinar la medida de triglicéridos del 70% o menos de los pacientes. P70 ≤ P(n) = 70/100(10) = 7 lugar   Hay que ordenar los datos. P70 ≤190 MG/m MG/mLL  Ejemplo 10. En caso de que la variable sea impar: Se tiene el nivel de triglicéridos en sangre MG/ml par un grupo de 11 pacientes: 100 120 135 140 160 180

190 200 250 260 280

Determinar la medida de triglicéridos del 70% o menos de los pacientes lugar P70 ≤ P(n+1) = 0.7 (11) = 8.47 se redondea a 9no. lugar

P70 ≤ 250 MG/mL 

  28

 

Prof. C. A. Cornielle

Ejemplo 11 : Ahora su supongamos pongamos qque ue estos datos est están án agrupad agrupados os en uuna na ttabla abla de frecuencias: Triglicéridos No. de en sangre pacientes MG/mL Fi 100

5

5

120

4

9

135

8

17

180

3

190

6

200

3

250

1

Total

30

Determinar la medida de triglicéridos del 40% o menos de los pacientes. P40 = 0.4 (30) = 12 lugar

P40 ≤ 135 MG/mL El 40% de los pacientes tiene los triglicéridos menor o igual a 135 MG/mL Supongamos que los datos anteriores están agrupados y clasificados: Ejemplo 12 : Triglicéridos No. de en sangre pacientes Fi MG/mL 100-20 120-135 135-180 180-190 190-200 200-250

9 4 8 5 3 6

Total

35

9 13 21 25

Determinar la medida de triglicéridos del 60% o menos de los pacientes.  

  29

 

Prof. C. A. Cornielle

Procedimiento

Cuando los datos están agrupados y ordenado esn clases se interpolan interpolan los datos con la ayuda de la siguiente formula PL = Lim Li m inf. + P/10 P/100(n+1) 0(n+1)  – Fa-1  * i fi P(n+1)= 0.60*36 = 21.6 = 22 lugar P40= 180 + ( 22 –  21 )*10 = 180+5 = 185 MG/ MG/mL mL 5 El 60% de los pacientes tiene los triglicéridos menor o igual a 185 MG/mL Los cuartile cuartiless  son los tres tres valores que dividen al conj conjun unto to de datos ordenados en cuatro partes porc porcentu entualmente almente iguales. ig uales.

Hay tres cuartiles denotado denotadoss uusualmente sualmente Q1, Q2, Q3. El segundo cuartil es precisament preci samentee la med mediana. iana. El primer cu cuartil, artil, es el valor el valor en el cu cual al o por debajo del cual queda un cuarto (25%) de todos los valores de la sucesión (ordenada); el tercer cuartil, es el valor en el cual o por debajo del cual quedan las tres cuartas partes (75%) de los datos. Para Datos no Agrupados Si se tienen una serie de valores X 1, X2, X3 ... Xn, se localiza mediante las siguientes fórmu fórmulas: las: - El primer cuartil: Cuando n es par: Q1= 1n 4

Cuando n es impar:

Q1 = 1(n + 1) 4

  30

 

Prof. C. A. Cornielle

Para datos agrupados y clasificados:

Q3 = Lim inf +

3( n ) – F-1  4_____ fi

*i

Para el tercer cuartil Cuando n es par: Q3= 3(n ) 4

Cuando n es impar:

Q3 = 3(n + 1) 4

Cuando n es impar: Q3 = 3(n + 1) 4

Para Datos agru agrupados pados

Q3 = Li Lim m inf in f +

3( n ) – F-1  4_____ 4_____ fi

*i

Como los cuartiles cuartiles adquieren su may mayor or iimportancia mportancia cuan cuando do cont contamos amos un nnúm úmer eroo grande de d e datos y ttenemos enemos en cuenta que en estos casos generalmente los datos son resumidos en una tabla de frecuencia. La fórmula para el cálculo de los cuartiles cuando se trata de datos agrupados es la siguiente: k= 1,2,3

  31

 

Prof. C. A. Cornielle

Donde: Li inf = Límite real inferior de la clase la  clase del cuartil k n = Núm Número ero de datos Fi = Frecuencia Frecuencia acumu acumulada lada de la clase qu quee antecede a la clase del cu cuartil artil k. fi = Frecuencia de la clase del cuartil k i = Longitud del intervalo de la clase del cuartil k Si se desea calcular cada cuartil iindividual ndividualment mente, e, mediant media ntee otra fórmul fórmulaa se tiene lo siguiente: El primer cuartil Q1, es el menor valor que es mayor que una cuarta parte de los datos; es decir, aquel valor de la variable que supera 25% de las observaciones y es superado por el 75% de las observaciones. Para datos simples muestrales sin agrupar:

Del ejemplo 13. Se tiene el nivel de triglicéridos en sangre MG/ml par un grupo de 10 pacientes: 100 120 135 140 160 180

190 200 250 260

Calcular el cuartil 1. Q1 = ¼ (n) lugar del cuartil ( ¼*10) = 2.5 = lugar lugar 3 MG/ml El 25% de llos os paci pacient entes es tienen un niv nivel el de triglicéri triglicéridos dos en Q1  ≤ 135 MG/ml sangre de 135 MG/ml Para datos agru agrupados pados NO clasificados Ejemplo 14

Triglicéridos en sangre MG/mL 100 120 135 180 190 200 250 Total

No. de pacientes 5 4 8 3 6 3 1 30

Fi 5 9

  32

 

Prof. C. A. Cornielle

Q1 = (1/4 n) = 1/4 ( 30) 30) = 7.5 = 8 lugar lugar Q1 = 120 MG/ml MG/ml El 25% de los paci pacient entes es tienen un niv nivel el de triglicéri triglicéridos dos en sangre de 135 MG/ml.

Si los datos está están n agrup ados y clasifica clasificados dos  en  enton tonces ces interpolamos la medid medidaa y se calcula con la ayuda de la siguiente formula Q3 = Li Lim m inf in f +

3( n +1 ) – F-1  4_____ 4_____ *i fi

Ejemplo15. Calcular el cu cuartil artil 3 de los siguient siguientes es datos Triglicéridos en sangre MG/mL 100-20 120-135 135-180 180-190 190-200 200-250

No. de pacientes

Total

39

9 4 8 5 6 7

Fi 9 13 21 25 32

Q3= 3/4( n+1) n+1) = 3/4( 38) =28.5 = 29 lugar lugar Q3 = 190 +

3( 40 ) – 25 4_____ 6

* 10 =

120+ 8.33 = 128.33 MG/m MG/mll

El 75% de los pacientes tiene un nivel de trigliceridos menor o igual a128.33 MG/ml 5. 5.2 2 Medidas Medidas d de e dispersió dispersión n

En el capít capítul uloo ant anterior erior ddescrib escribimos imos la distrib distribución ución de frecu frecuencias encias con promedios, como valores significativos adoptados para representar la tendencia central de una serie, es una medida muy útil y poderosa. Pero el uso de un solo valor para describir una distribución oculta muchos hechos importantes. La toma de decisiones con frecuencia exige la revelación de estas características. Por consiguiente, debemos exponer ahora medidas estadísticas para resumir y describir esas características ocultas. No todas las observaciones en una serie son del mismo valor que el promedio del que se deri derivva. A menudo, las cant cantida idades des inclu incluida idass en uuna na distri distribución bución

  33

 

Prof. C. A. Cornielle

siempre difieren di fieren del vvalor alor central, aun aunque que el grado de desvia desviación ción varí varíaa de un unaa serie a otra. En muchos muchos casos, las formas de la distri distribución bución difi difieren eren de un unaa se serie rie a otra. Un Unas as son simétricas; otras, no. Por lo tanto, para describir una distribución necesitamos también una una medida del grado de simetría simetría o asimetrí asimetría, a, del equilibrio o la falta de equilibrio, en ambos lados del centro de la distribución. La variación es, con much mucho, o, la caracterí característica stica más important importantee de un unaa distri distribución: bución: puede ser la base para la toma de decisiones o una medida para seguir desarrollando la teoría y el método estadístico. Aunque la asimetría es una importante característica para definir el modelo preciso de una distribución, raramente se calcula en los negocios y la economía. Las medidas de disperso o de var variabi iabilidad lidad defin definición ición Las medidas de vvariabilidad, ariabilidad, tam también bién llamadas llamadas medidas de dispersión, son medidas medid as resumen de un conj conjun unto to de dataos, mu muestran estran la vvariab ariabili ilidad dad de un unaa distribución, indicando por medio de un número, si las diferentes puntuaciones de una variable están muy alejadas de la media. Cuanto mayor sea ese valor, mayor cuanto sea,omás homogénea será a la media. Así se será sabe lasi variabilidad, todos los casos sonmenor pareci dos parecidos vvarí arían an much muchoo ent entre re ellos. Las medidas de dispersión se utiliz utilizan an para describir la vvariabilidad ariabilidad o esparcimiento de los datos de la muestra respecto a la posición central. Para cuantificar cuantificar la disp dispersió ersión n de los datos se distingu distinguen en los tipos ddee ííndices: ndices: - Los que miden eell grado en que las pun puntaciones taciones se asemejan o diferencian entre sí: Amplitud total o rango y amplitud semi-intercuartil. - Los que la dispersión se mide con respeto al alguna medida de tendencia central centr al como la media aritmética: Vari Varianz anza, a, de desviación sviación títípica pica y coefici coeficient entee de variación. Las medidas de variabilidad más comunes son: -El rango -La desviación seimi-intercuatilica -La variación estándar o típica la varianza -El Coeficiente de variación

  34

 

Prof. C. A. Cornielle

Rango.

El rango se suele definir como la diferencia entre los dos valores extremos que toma la variable. Es la medida de dispersión más sencilla y también, por tanto, la que proporciona menos información. Además, esta información puede ser errónea,, pues el hhecho errónea echo de que nnoo iinfl nfluy uyan an más de dos vvalores alores del total de la serie puede provocar una deformación de la realidad. Recorrido o rango: R = X max xi -- Xmin xi  Comparemos, por ejemplo, estas dos series: El uso de esta medida de dispersión, será pues, bastante restringido. Variación estándar o típica y v arianza

Varianza: Si hemos empleado la media como medida de posición, parece razonable razon able tomar como medida de dispersi dispersión ón algún criteri criterioo de discre discrepancia pancia de los puntos respecto a la media. Según hemos visto, la simple diferencia de los puntos y la media, al ponderarla, da cero. Por tanto, elevamos esas diferencias al cuadrado para que no se cancelen los sumandos positivos con los negativos. El resultado resultado es la vvarianza, arianza, cuy cuya a definici definición ón se da a con continu tinuació ación. n. Sean x1  ,x2, , , , xn  un conjun conjunto to de n obs observaci ervaciones ones de la variab variable le X. Se define la varianza muestral como: Una medida de variabilidad más lógica sería

S2= (X1-X)2 +(X2-X )2 +(X3-X)2  +……..+( Xn-X)2  n-1

Propiedades: arianza no se vve e afectada por cambio cambioss de localización. 1. S2a+X = S2X. La vvarianza 2. S2bX = b2.S2X La varianza varianza se mi mide de en el cu cuadrado adrado de la escala de la vvariab ariable le Que una medida de dispersión no se vea afectada por cambios de localización, como ocurre con la varianza (propiedad 1), es una condición casi indispensable para admitirla como tal medida de dispersión. dispe rsión. La di dispersi spersión ón de uunn conju conjunt ntoo de datos no se ve alterada por una mera traslación de los mismos.

  35

 

Prof. C. A. Cornielle

La desviación típica Pa ra conoce Para conocerr con detalle un conjun conjunto to de datos datos,, no basta con conocer las medidas de tendencia central, sino que necesitamos conocer también la desviación que presentan los datos en su distribución respecto de la media aritmética de dicha distribución, con objeto de tener una visión de los mismos más acorde con la realidad al momento de describirlos e interpretarlos para la toma de decisiones. decisi ones. La vvariac ariación ión estándar o títípica pica es, con mu mucho, cho, la estadí estadística stica más importante entre todas las medidas de variación. Mide la variación de los datos en términos absolutos. La desviación típica es una medida una  medida del grado de dispersión de los datos con respecto al valor promedio. Dicho de otra manera, la desviación estándar es simplemente el "promedio" o variación esperada con respecto a la media la  media aritmética.   aritmética. Forma de calcular la variación estándar La desviación estándar o títípica matemáticament matemáticamentee se calcu calcula la ext extrayen rayendo do la raíz cuadrada de la media aritmética de las desviaciones al cuadrado de los datos con respecto a la media. Dependiendo de si los datos son muestrales o poblacionales y de si los mismos están agrupados o nno, o, la fórmu fórmula la para calcular la desv desviac iación ión estándar varí varía. a. La desviaci desviación ón están estándar dar de uuna na muestra a partir de datos sin agru agrupar: par: S es la variación estándar n

es el tamañ tamañoo de la muest muestra ra es la media aritmética de la muestra

Para obtener la desviación estándar muestral sin agrupar suponemos cinco pasos sencillos: Tomar la desviaci desviación ón de cada observación en relación a la media, ( X ), representada por d. Elevar al cuadrado las desviaci desviaciones ones (X -

)2 o d2.

Sumar las desviaciones, esta suma puede considerarse como la variación, y se simboliza como ∑ (X - )2  o ∑d2  Obtiene la media de las de las desviaciones al cuadrado, ∑ (X -

)2 / n

lama vvari arianza anza muestral y se repre representa senta por S 2. Prof. o ∑d2 / n. Este valor se lllama

  36

 

Prof. C. A. Cornielle

Extraer la raíz cuadra cuadrada da de llaa varia varianz nza, a, √∑d2 / n. El resul resultado tado así obtenido es la desviación estándar muestral para datos simples, y se representa por el símbolo S. De estademanera la raíz cuadrada de la variancia, que aa lasumedia. vez, esLas la media la media las desviaciones al cuadrado con respecto fórmulas para la desviación estándar y la varianza para muestras y población simple se escriben como sigue: La varianza para una muestra simple

La variación estándar o típica simple

La varianza para una población simple

La variación estándar para una muestra simple

Donde N es el tamaño de la población y

μ es la media aritmética de la pobl población ación  es la media aritmética de la muestra n es el tamañ tamaño o de la muest muestra ra Para usar estas fórmulas, es necesario llevar x a un número suficiente de lugares decimales con el objeto de obtener mayor precisión.

  37

 

Prof. C. A. Cornielle

La desviaci desviación ón están estándar dar de uuna na muestra a partir de datos agru agrupados pados A menudo, menudo, la des desviaci viación ón estándar se calcula ju junto nto a l medi media, a, y una una forma ca carta rta de calcular la media puede usarse para el cálculo de la desviación estándar. La fórmula utilizada para el cálculo de la desviación estándar para datos agrupados para una muestra es:

Para una población la variación estándar es:

Ejemplo 16. Calculamos la varianz varianza a del peso de los pacientes de urgen urgencias cias del Ejemplo 3. Recuerda que x = 65:125 kg. Varianza y desviación típica para muestrales simples:

s2 = (63 – 65.125)2 + (58 – 65.125)2 + , , , + (55 – 65.125)2

= 201:55 kg2 

7

S= √s 2 

S= √ s2  =  √ 201.55 =14.20 kg Ejemplo para datos agrupados muéstrales Ejemplo 17. Se ha ha desarrollado d esarrollado un una a nu nueva eva vacu vacuna na cont contra ra la di difteria fteria para aplica aplicarla rla a niños. niños. El nivel de pprotección rotección estándar obtenido por antiguas vacun vacunas as es de 10 µg/ml un mes después de la inmuniz inmunizació ación. n. Se han obten obtenido ido estos datos del nnivel ivel de protección de la nueva vacuna al transcurrir un mes: Protección mg/ml 11.5 12.5 13.5 14.5 Total

Cantidad de niños 8 6 5 4 24

  38

 

Prof. C. A. Cornielle

Calculemos el rango, la varianza y desviación típica para el nivel de protección contenido en esta vacuna. Fórmulas: Recorrido o rango: R = X max xi -- Xmin xi 

Procedimiento Desviación xi

xi-x

( xi-x )2 

( xi- x )2 *fi

11.5 12.5 13.5 14.5 Total

-1.4 0.13 1.31 2.31

1.96 0.09 1.72 5.34

15.68 0.54 8.6 21.36 46.18

Recorrido o rango: R = X max xi -- Xmin xi = 14.5 - 11.5 = 3.0 mg/mm X = 12.19 12 .19 mg/mm S2 = 46.18 = 1.92 ((mg/mm) mg/mm)2  24

S = √1.92 = 1.38 mg/ml  Coefi ciente de vvariaci Coeficiente ariación: ón: Si queremos uuna na medida de dispersi dispersión ón que no dependa de la escala y que, por tanto, permita una comparación de las dispersiones relativas de varias muestras, podemos utilizar el coeficiente de variación, que se define así: Para datos muéstrales simples:

CV = (s/x ) * 100 

  39

 

Prof. C. A. Cornielle

Para datos poblacionales poblacionales simples

CV = (σ/µ ) * 100  Por supuesto, supuesto, para que se pueda de definir finir esta medida es preci preciso so que la medi mediaa no sea Es m más, ás, el coefici coeficient entee de vvariac ariación sólosusceptibles ttiene iene sent sentido idode pa para ra varia ariables bles que cero. sólo tomen valores positivos y que noiónsean cambios de localización. Calculamos el coeficiente de variación del ejemplo anterior: CV = (s / x ) * 100 = 1.38 mm/ 12.9 mm CV = 10.98% Existe una baja dispersión Ejercicio. Ejercici o. U Unn estudio tiene como ob objetivo jetivo determinar la concen concentración tración de pH en muestras mu estras de los saliva hu humana. mana.resultados. Para ello6:59 se recogie recogieron ron7:08 datos 10 7:12 personas obteniéndose siguientes 7:37 7:15 5:75de5:83 7:23 7:13 5:60 -Calcular la media, mediana, desviación típica, coeficiente de variación, cuartiles y rango intercuartílico. Ejercicio. La siguiente tabla muestra el diámetro biparietal de los fetos de 38 semanas de edad gestacional, medido por ecografía en un hospital Diámetro (Cent) 85 90 95 100 105 110

Fetos fi 8 5 7 4 3 2

Total

29

-Calcular la media, mediana, desviación típica, coeficiente de variación, cuartiles y rango intercuartílico

  40

 

Prof. C. A. Cornielle

5.3 5. 3 Medid Medid as de form forma a

Las medidas de forma tratan de medir el grado de simetría y apuntamiento en los datos. Coeficiente de asimetría de Fisher: Se define como ∑ ( X – X )3   ASF  =  _______  ____________ _____ ns3 La interpretación de este coeficiente es la siguiente: Si su valor es prácticamente cero se dice que los datos son simétricos. Si toma valores significativamente mayores que cero diremos que los datos son asimétricos a la derecha y si toma valores significativamente menores que cero diremos que son asimétricos a la izquierda. Coe ficient Coeficie ntee de apu apunt ntamiento amiento de Fisher: Mide el grado de con concentració centraciónn de uuna na variable respecto re specto a su medid medidaa de cent centralización ralización usu usual al (medi (media). a). Se de define fine como:  AF  =

∑ ( X – X ) 4 

 ____________  _______ _____ ns4

Puesto que en Estadística el modelo de distribución habitual de referencia es el gausiano o normal y este presenta teóricamente un coeficiente de apuntamiento de 3, se suele tomar este valor como referencia. Así Así,, si este coeficient coefici entee es menor que 3 diremos que los datos presentan una una forma platicurt platicurtica ica,, si es mayor que 3 diremos que son leptocúrticos y si son aproximadamente 3 diremos que son mesocúrticos. Ejemplo 18. Con los datos del ejercicio 17 determinar la forma de la distribución. Calculamos el coeficiente de asimetría: Desviación xi

xi-x

(xi-x)3 

11.5 12.5 13.5 14.5

-1.4 0.13 1.31 2.31

-2.744 0.00212 2.248 12.33

Total

 ASF  =

11.84

∑ ( X – X ) 3   ____________  ____________ ns 3

= 11.84 = 2.95 Los diámetros bip biparietales arietales son de asimetrías positiva  4

  41

 

Prof. C. A. Cornielle

5. 5.4 4 El diagrama de caja caja o Bo xplo t

La informació informaciónn obtenida a pa partir rtir de las medidas de central centralización, ización, dis dispersió persiónn y forma se puede usar para realizar diagramas de caja (boxplots) que visualmente nos información sobre cómo están distribuidos los datos. El diagrama de caja dan consta de:   un unaa caja cent central ral que está delimi delimitada tada por la posici posición ón de los cuart cuartiles iles Q1 y Q3.   Dentro de esa caja se dib dibuj ujaa la lílínea nea que represent representaa la medi mediana ana (cuartil Q2).   De los ext extremos remos de la caja salen uunas nas llííneas (denominadas bigotes) que se extienden hasta los punt puntos os LI = max min(xi  ) ; Q1  -1.5RI -1.5 RI , y LS = min max (xi  ); Q3 + 1:5RI que repre representarí sentarían an el rango razonable hasta el cual se pueden encontrar datos. 





  Los datos qu quee caen fuera fuera de los bigotes se representan individualmente mediante ” *  “  (datos atípicos moderados) y “o” (datos atípicos extremos).



La Figura 5 muestra los diagramas de caja para datos de Estatura agrupados por Sexo. Fíjate que en ambos sexos hay datos atípicos moderados (personas cuyas estaturas están fuera del rango “razonable” de valores determinado por el conjunt conju ntoo de observaciones de cada sex sexo). o). Figura 5: Diagramas de caja para la variable Estatura agrupada por Sexo.

  42

 

Prof. C. A. Cornielle

CAPITULO 2  INDICADORES DEMOGRÁFICOS Y EPIDEMIOLÓGICOS

1. Intdroduccion

La epidemiologia es el estudio de la distribución y determinantes de enfermedades enf ermedades en poblaciones hhuman umanas, as, según la definici definición ón del CDC ((Centers Centers for Disease Di sease Control and Prev Prevent ention). ion). Si Siendo endo los determinant determinantes es cosas como factores que precipitan la enfermedad, la polución atmosférica, estilo de vida y nivel de colesterol. Los indicadores epidemiológicos   sirven sirven,, por ejemplo, para expresar la relación ent e ntre re eell su subconju bconjunt nto o de enferm enfermos os y el tot total al de iindiv ndividuos iduos de llaa poblaci población, ón, lo que que equivale a un cálculo simpli simplificado ficado del riesgo. rie sgo. Por ejemplo, si la prevalenci prevalenciaa de lar que gripelas enposi España es dede200 casos por 100.000 habitantes podríamos decir deci posibili bilidades dades su sufrirla frirla so son n decada un 0,2%. Las autoridades sanitarias manejan una gran variedad de indicadores epidemiológicos en salud pública. ¿Cuáles son los más habituales? Indicadores epide epidemiológicos miológicos básicos Casos: Número de personas afectadas por una patología determinada. Un caso podría ser pacientes hospitalizados o muertes. Este indicador puede ser: Di Discreto screto (presente o ausen ausente): te): por ejemplo, un unaa ppersona ersona tiene gripe o nnoo la tiene, no hay punto intermedio. Continuo: para condiciones de salud que admiten una graduación. Por ejemplo, presión arterial o colesterol.

  43

 

Prof. C. A. Cornielle

2. Tasa Tasa de natal natalidad, idad, morb ilidad, m mortalidad ortalidad La tasa de mortalidad   es una medida del número de muertes (en general, o debido a una causa específica) en alguna población, escalado al tamaño de esa

poblaci población, ón, pordeun unida idad d de por tiempo. ttasa asaindividuos de mortalidad ge generalm neralment entee se expresa en unidades muertes cadaLa1000 por año. Se calcula haciendo el cociente entre el número de defunciones ocurridas durante un período determinado y la población media de ese período; por mil. Existen varios tipos como la tasa de mortalidad materna, inf i nfant antil, il, especifica especi fica por edad, perinatal…  La tasa bruta de mortalidad es el indicador más utilizado en la medición de la mortalidad. Se obtiene de la relación entre el número de defunciones ocurridas en un período dde e tiempo tie mpo determi determinado nado (generalmente un año) y un unaa es estimac timació iónn de la población població n ex expuesta puesta al rriesg iesgoo de morir en el mismo período. La estimación de la población supone calcular el tiempo vivido por aquella durante dicho período. Dadas las dificultades que presenta su cálculo, se estima la población a mitad de periodo. Así: dz =

Dz ___ * 1000 N30  VI   Z 

Donde: dz es la Tasa Bruta de Mortalidad(a mitad de periodo) Dz son las Defunciones ocurridas en el año z N 30-VI-z la població poblaciónn estimada al 30 de Ju Junio nio ddel el año z( primeros 6 mes mesesdel esdel año) La tasa multiplicada por mil, representa la frecuencia relativa con la que ocurren las defunciones en una población durante un año. Ejemplo 1 para tasa de mortalidad d e todo tod o el año. TM es la rel relacio acionn en entre tre los fallecidos een n ese año ent entre re la cant cantida idadd total de la poblacion en ese año.

d 1999  =

158500 __ * 1000 = 6.28 25232226

Así, se puede afirmar afi rmar que en 1999, por cada Mil fallecieron un poco más de 6 personas.

  44

 

Prof. C. A. Cornielle

Mortalidad infantil

La mortalidad que ocurre antes de cumplir un año de edad, se denomina mortalidad inf i nfant antil. il. Es ev evide ident nte e que, en el primer año de vvida ida se ppresentan resentan las más altas tasas de mortalidad que en las edades siguientes. La esperanza de vida nacer, es que la esperanza de vida aSelaconsidera edad exacta que sería otro al indicador demenor la intensidad de la mortalidad. a la1,mortalidad infantil, infan til, como un foco de atención para todas las ppolí olíticas ticas de salu salud, d, así como un indicador de las condiciones de salud y mortalidad de una población. Una de las consideraciones más importantes, es saber diferenciar entre un nacido vivo y un nacido muer to. to. Un “nacido vivo” es cuando al momento de nacer, manifiesta algún signo de vida, como respiración, latidos, llanto, etc. Contrariamente un “nacido muerto” es cuando la defunción defunción ocurrió antes de la ex expul pulsión sión o ex extracció tracciónn del ser, producto de la concepción que ha alcanzado 28 semanas de gestación. En segundo lugar, debe tenerse en cuenta que las defunciones ocurridas en un año calendario corresponden a dos generaciones. Por ejemplo, los niños que fallecieron en 1999, pudieron haber nacido ese mismo año o en el año anterior. Por ello, en la medición medici ón de la m mortalidad ortalidad infan infantil, til, se requiere precisar preci sar e identificar ambas generaciones para no distorsionar la estimación final de su nivel. Se calcula como sigue: z TMI =

D 0  * 1000 Bz

Donde: TMI es la T Tasa asa de M Mortali ortalidad dad In Infantil fantil Dz 0  es el ttotal otal de defun defunciones ciones de men menores ores de uunn año ocurridas en el añ añoo Z. BZ es el nú número mero de nnacid acidos os vivos en el año Z Se observa que los componentes componentes para calcul calcular ar la T TMI MI,, son diferentes a la tasa de mortalidad por edad. En el denominador se registra regi stra el nú número mero de nacimientos ocurridos en el año, cuyo equivalente es “personas con edad exacta 0 años“. En tanto, de mortalidad comocon denominador la población media las de tasas menores de un año,por esedad decir,tienen personas edades cumplidas. En consecuencia, consecu encia, estas dos medida medidass son de nnatu aturalez ralezaa diferente, por el denominador que se utiliza en cada caso. También se puede afirmar que la tasa de mortalidad mortalidad infan infantil til es men menor or que la tasa cent central ral de mortalidad de los menores de un año, debido a que el número de nacimientos en un año es mayor que la población media de cero años. Esto representa al total de sobrevivientes de los nacimientos ocurridos en los 12 meses que empieza el 30 de junio del año anterior. Ejemplo 2 TMI =

25917 * 1000 = 42.5 609800 Es decir, en 1999, ocurrieron aproximadamente 43 defuncion

  45

 

Prof. C. A. Cornielle

La Tasa Tasa de Mortalid Mortalidad ad Ma Materna terna

Representa el número de las defunciones de mujeres por complicaciones durante el embarazo y el parto, que ocurre en un año determinado por cada 10000 mil nacimientos  (excl (excluy uyendo endo causas accidentales o incidental incidentales). es). TMM = DZM * 10000 BZ   Donde: TMI es la Tasa Tasa de Mortalidad Materna DZ M es el total de defunciones maternas en el año Z. BZ  es el número de nacidos vivos en el año Z. Para determinar con c on precisi precisión ón el riesg riesgoo de mu muerte erte debi debido do a esta causa, se debe aclarar que el denominador deberí de beríaa co cont ntener ener al nnúm úmero ero de embarazos que hu hubo bo en el año año co considerado nsiderado.. En la práctica, es imposi imposible ble obten obtener er esta información, por lo que se toma como aproximación, el número de embarazos que culmina con un nacido vivo. Es decir, los nacimientos ocurridos en el año Z. Morbilidad

Se entiende por morbilidad la cantidad de individuos considerados enfermos o que son víctimas de una enfermedad en un espacio y tiempo determinado. La morbilidad es un dato estadístico importante para comprender la evolución o retroceso de alguna enfermedad, las razones de su surgimiento y las posibles soluciones. En el sentido de llaa epidemiología se puede ampliar al estudio y cuantificación de la presencia y efectos de alguna enfermedad en una población. Tasa de morbilid ad

La frecuencia frecuencia de la enfermedad en prop proporción orción a uuna na ppoblaci oblación ón se especi especifique: fique: el período, el lugar y la hora por minuto. Las tasas de morbili morbilidad dad más frecu frecuent entement emente e usadas son las siguientes: Prevalencia: Frecuencia de todos los casos (antiguos y nuevos) de una enfermedad patológica en un momento dado del tiempo (prevalencia de punto) o durante un período definido (prevalencia de período). Incidencia: Es la rapidez con la que ocurre una enfermedad. También, la frecuencia frecu encia con que se agregan (desarrollan o descubren descubren)) nu nuevos evos casos de un unaa enfermedad/afección durante un período específico y en un área determinada.

  46

 

Prof. C. A. Cornielle

2. Tasa Tasa de incid encia, prevalencia Tasa de Incidencia,  es el número de personas que contraen una enfermedad durante un determinado período de tiempo, por cada 1000 personas.

Tasa de Incidencia = ( Nu Nuevos evos casos / Poblaci Poblacion on total ) * 1000 Ejemplo 3. En una población de 1000 personas no enfermas, 28 se infectaron con el VIH a lo largo de dos años de observación. La  proporción de iinc ncidencia idencia es de 28 casos por cada 1000 personas; es decir, un 2,8 % a lo largo de un periodo perio do de dos años, o 14 casos por 1000 persona-años (í (índice ndice de incidencia) porque la proporción de incidencia (28 por cada 1000) se divide entre el número de años . Tasa de Prevalencia, Prevalencia, es el nnúm úmero ero de personas que tie tienen nen uuna na enf enfermedad ermedad específica, en un determinado momento por cada 1000 personas. Tasa prev = Número Número de casos c asos existentes existentes en el lugar lugar X y momento en el tiempo * 1000 Número total de personas de la población en el mismo lugar y tiempo

Ejemplo 4. En una población de 10000 personas, se informa de que 500 personas sufren determinada enfermedad. ¿Cuál sería en ese caso la prevalencia de la enfermedad en esa población? Tasa prev. = 500 / 10000 = 0.005 * 1000 = 5 de cada mil habitantes habitantes Es decir, el 5% sufren sufren la determinada enfermedad.

  47

 

Prof. C. A. Cornielle

CAPITULO 3. PROBAB ILIDAD: CO CONCEPTOS NCEPTOS B ASICOS

1. Introdu Introdu cción h istórica

El objetivo de la Estadística es utilizar los datos para inferir sobre las características de una población a la que no podemos acceder de manera completa. En el tema anterior, hemos visto como realizar un análisis descriptivo de una una muestra de datos. La Proba Probabili bilidad dad es la disc discii plina cient cientíí_ca que proporciona y estudia modelos para fenómenos aleatorios en los que interviene el azar y sirve de soporte teórico para la Estadística. Como primeros trabajos con cierto formalismo en Teoría de la Probabilidad cabe destacar los realizadospor Cardano y Galilei (siglo XVI), aunque las bases de esta teoría fueron cientí_cos desarrolladas Pascal yalFermat en elde siglo adelante grandes hanpor contribuido desarrollo la XVII. De ahí en Probab ilidad, Probabilid ad, como Bernouilli, Bayes, Eul Euler, er, Gauss,.. Gauss,.... en los siglos X XVII VIIII y XIX. XIX. Será a _nales del siglo XIX y principios del XX cuando la Probabilidad adquiera una mayor formalización matemática,debida en gran medida a la llamada Escuela de San Petesburgo en la que cabe destacar los estudiosde chebychev, Markov y Liapunov. La Teoría de laProbabilidad surgió de los estudios realizados sobre losjuegos de azar, que se remontan miles de años atrás.

  48

 

Prof. C. A. Cornielle

2. Conceptos Conceptos básicos: 2. 2.1. 1. Experimento ale aleatorio atorio

Llamamos experimento aleatorio al que satisface los siguientes requisitos:   Todos sus posi posibles bles result resultados ados son conocidos de ant antemano. emano.



  El resultado particular de cada realización del experimento es imprevisible.



  El experiment experimentoo se puede repetir indefinidamente en condici condiciones ones idé idént nticas icas..



Cuando de un experimento podemos averiguar de alguna forma cuál va a ser su resultado resul tado antes de qu quee se realice, de decimos cimos qu quee el experimento es determiní determinístic sticoo . Así, podemos considerar que las horas de salida del Sol, o la pleamar o bajamar son determinísticas, pues podemos leerlas en el periódico antes de que se produzcan. produz can. Por el cont contrario, rario, no podemos en encont contrar rar en ningú ningúnn medio el nnúm úmer eroo premiado en la Lotería de Navidad antes del sorteo. Nosotros queremos estudiar experimentos experiment os que no son determiní determinístic sticos, os, pero no estamos iint nteresados eresados eenn todos ellos. Por ejemplo, no podremos estudiar un experimento del que, por no saber, ni siquiera sabemos por anticipado los resultados que puede dar. No realizaremos tareas de adivinación. Por ello definiremos experimento aleatorio como aquel que verifique ciertas condiciones que nos permitan un estudio riguroso del mismo. Ejemplo 23: Ejemplos de experimentos aleatorios son: E1 =Lanzar una moneda al aire, E2 =Lanzar =Lanzar dos vveces eces una moneda, E3 =Lanzar =Lanzar dos monedas a la vez, E4 =Medir la temperatura corporal de un paciente.

  49

 

Prof. C. A. Cornielle

2. 2.2 2 Esp acio muestr muestral. al. Sucesos. .

Espac io muest Espacio muestral: ral: Es el con conju junt nto o formado por todos los resul resultados tados posi posibles bles del experimento aleatorio. Lo denotamos por S Ejemplo 24: Si lan lanzamos zamos una moneda, S =( C, E) Suceso elemental: Es un suceso unitario. Está constituido por un solo resultado del experimento aleatorio. Ejemplo 25: Si lanzamos lanzamos un dado, S = (1; 2; 3; 4; 5; 6) , los su sucesos cesos elementales son: A = El resultado es uun n =1 B = El resultado es uun n =2 ..., F = El resultado es uun n = 6. Suceso: Cualquier Cualquier subcon subconju junt nto o del espaci espacio o mu muestral. estral. Ejemplo 26: Si lanzamos lanzamos un dado, s = (1; 2; 3; 4; 5; 6), pod podemos emos con conside siderar rar muchos sucesos: A = El resultado es par= (2; 4; 6 ) B = El resultado es menor que 3= (1; 2) , ... Deci mos qu Decimos quee hha a ocurrido un suceso cuando se ha obtenido algun algunoo de los resultados que lo forman. El objetivo de la Teoría de la Probabilidad es estudiar con rigor los sucesos, asignarles probabilidades y efectuar cálculos sobre dichas probabilidades. Observamoss que lo Observamo loss su suceso cesoss nnoo son otra cosa que conju conjuntos ntos y por tanto, tanto, será seránn tratados desde la Teoría Teoría de Conju Conjuntos. ntos. Recordamos las operaci operaciones ones bási básicas cas y las dotamos de interpretación para el caso de sucesos. Suceso seguro: Es el que siempre ocurre y, por tanto, es el espacio muestral, . Suceso imposible: Es el que nunca ocurre y, por tanto, es el vacío, ø  Unión.: Un ión.: Ocu Ocurre rre A U B si ocu ocurre rre al menos uuno no de los sucesos A o B.

  50

 

Prof. C. A. Cornielle

Intersección: Ocurre A ∩ B si ocurren los dos sucesos A y B a la vez. Complementario: Ocurre A c si y sólo si no ocurre A. Di Diferen ferencia cia de sucesos: Ocurr Ocurre e A \ B si ocurre A A,, pero no ocurre B B.. Por ttanto, anto, c A ∩ B = A \ B  . Sucesos incompatibles: Dos sucesos A y Bc  se dice dicenn incompatibles si nnoo pueden ocurrir a la vez. Dicho de otro modo, que ocurra A y B es imposible. Lo escribimos como A ∩ B = ø. Suceso contenido en otro: Diremos que A está contenido en B, y lo denotamos por A ⊂  B, si siempre que ocurra A también sucede B. Ejemplo 5: Estudiamos el experimento experimento aleatorio consistent consistentee en el lan lanzzamiento de un un dado, y consideramos los su sucesos: cesos: A = El resultado es par = (2; 4; 6) B = El resultado resultado es mú múltiplo ltiplo de tres = (3; 6). El suceso que salga par y múltiplo de tres se puede expresar como la intersección A U B = (2; 4; 6) \ (3; 6) = 6. De la misma manera, manera, el suceso qque ue salga par o mú múltiplo ltiplo de tr tres es se puede expresar como co mo la uunión nión A U B = (2; 4; 6) U (3; 6) = (2; 3; 4; 6). Propiedades

Asociativa Conmutativa   Distributiv

A U (B U C) = (A U B) U C A UB = B U A B) ∩ (A UC) A U (B ∩ C) = (A U B) 

A U (B ∩ C  C)) = (A B) ∩ C A ∩ B = B ∩  A A ∩ (B U C) = (A U B) U (A ∩ C) 

Ejercicio 1: Lanzamos un dado y consideramos los sucesos A = El resultado es par. B = El resultado es mayor que 2. Indica cuáles son los sucesos A U B, A U B. son los sucesos A y B incompatibles?, son los sucesos A y A c incompatibles?

  51

 

Prof. C. A. Cornielle

3. Definiciones de probabilidad

El principal objetivo de un experimento aleatorio suele ser determinar con qué probabilidad ocurre cada uno desucesos? los sucesos elementales. ¾Pero cómo asignamos probabilidades a los su cesos? 3. 3.1 1 Definición clásica o de Laplace

Nos encontramos ante un experimento, con su colección de sucesos, y nos preguntamos pregun tamos cómo tenemos que actuar para asignarle a cada suceso suceso un nnúm úmer eroo entre 0 y 1 que represente la probabilidad de que el suceso ocurra. Cuando el espacio muestral es finito, el problema se reduce a asignar probabilidade probabi lidadess a los su sucesos cesos eelemen lementales. tales. Las probabilid probabilidades ades de los demás sucesos se obtendrán sumando las de los sucesos ele mentales que lo componen (suma finita). Sin duda el caso más fácil es aquél en el que no tenemos razones para suponer que unos sucesos sean más probables que otros. Cuando, siendo el espaci espacio o mu muestral estral finito, ttodos odos los su sucesos cesos elemen elementales tales tienen la misma probabilidad, diremos que son equiprobables y podremos utilizar la conocida Regla de Laplace  P(A) = casos fav favorables orables a A casos posibles Ejercici o 2: Lan Ejercicio Lanzzamos dos dados y su sumamos mamos sus pu punt ntuaciones. uaciones. Cuál es la probabilidad probabi lidad de obten obtener er un 2? Cuál es la probabili probabilidad dad de obtener uunn 7?

  52

 

Prof. C. A. Cornielle

4. Probabilidad Probabilidad con dicionada

El concepto de probabilidad condicionada es uno de los más importantes en Teoría de la Probabilidad. La probabilidad condicionada pone de maniFIesto el hecho de que las probabilidades cambian cuando la información disponible cambia. Por ejemplo, Cuál es la probabilidad probabi lidad de sacar un 1 al lanz lanzar ar un ddado? ado? Y cuál es la probabi probabilidad lidad de sacar un 1 al lanzar un dado si sabemos que el resultado ha sidoun número impar? Ejemplo 27: 27 : Si lanz lanzamos amos un dado, la probabi probabilidad lidad de obtener uun n 1 es 1/6, pero pe ro si disponemos de la información adicional de que el resultado obtenido ha sido impar entonces reducimos los casos posibles de 6 a 3 (sólo puede ser un 1, un 3 o un 5), con lo cual la probabilidad de obtener un 1 (sabiendo que el resultado ha sido impar) es 1/6 + 1/6 = 2/6 = 1/3. Supongamos entonces que en el estudio de un experimento aleatorio nos interesa conocer la probabilidad de que ocurra un cierto suceso A pero dispongamos disp ongamos de inf informaci ormación ón previa sobre el experiment experimento: o: sabemos que que el suceso B ha ocurrido. Está claro que ahora la probabilidad de A ya no es la misma que cuando no sabíamos nada sobre B. La probabilidad del suceso A condicionada al suceso B se define: P(A/B) = P(A ∩ B) , siendo P(B) ≠  0 P(B) También se deduce de manera manera inmediata que P(A ∩ B) = P(A) * P(B/A) = P(B) * P(A/B).  Ejemplo 28: Se ha realizado una encuesta en Santiago para determinar el número nú mero de lectores de La Voz y de El Correo. Los resul resultados tados fu fueron eron que el 35% de los encuestados lee La Voz, el 20% de los encuestados lee El Correo. Además, analiz ando las respuestas estas se al concl concluy uyeeunque el 5% deCorreo, llos os en encuestados cuestados lee ambosanalizando periódicos. Si respu se selecciona azar lector de El ¾cuál es la probabilidad de que lea también La Voz?

  53

 

Prof. C. A. Cornielle

En primer lugar, vamos a ponerle nombre a los sucesos. Denotamos primer lugar, vamos a ponerle nombre a los sucesos. Denotamos A= Es lector de La Voz. B= Es lector de El Correo. Fíjate que la información que nos da el problema es: P(A) =en 0:35. P(B) = 0:2. P(A ∩ B) = 0:05. Lo que que nos pregun preguntan tan es uunn probab probabili ilidad dad condici condicionada. onada. Sabi Sabiendo endo que un unaa persona es lectora de El Correo, Cuál es la probabilidad de que también sea lector de La Voz? Es decir, debemos calcular P(A=B) = P(A ∩ B) = 0.05 = 0.25 P(B) 0.2 5. Independencia de suc esos

Dos sucesos A y B son independientes si P(A ∩ B) = P(A) * P(B) Comentarios: No debemos confundir sucesos independientes con sucesos incompatibles: los sucesos incompatibles son los los más dependie dependient ntes es que pu puede ede haber. Po Porr ejemplo, si en el lanz lanzamiento amiento de uuna na moneda consideramos los sucesos incompatibles 'salir cara' y 'salir escudo” escudo”, el conocimiento de que ha salido cara nos da el máximo de informació informaciónn sobre el otro suceso: ya qu quee ha salido cara ; es imposible impos ible que haya salido escudo. Recuerda que los dos sucesos son incompatibles si  A ∩  B = ø  Si los sucesos A y B son independientes, independientes, también lo so sonn los sucesos A y B Bcc ; los sucesos Ac y B; y los sucesos A c y Bc. Ejercicio 3: Se estima que entre la población de Estados Unidos, el 55% padece de obesidad, obesida d, el 20% es hhipertensa, ipertensa, y el 60% es obesa o hiperten hipertensa sa.. Es independiente el que una persona sea obesa de que padezca hipertensión? 6. Teoremas clásicos

En esta sección veremos tres teoremas muy importantes, tanto a nivel teórico como para la resolución resolución de ejercici ejercicios. os. Los en enun unciare ciaremos mos en su forma forma más general, aunque después veremos por medio de ejemplos que su aplicación no es complicada.

  54

 

Prof. C. A. Cornielle

6. 6.1 1 Regla del prod producto ucto ∩  A2 ∩….∩ …. ∩ An) 6 = ø, Si tenemos los sucesos A 1, A2;,,,,,,,An tales que P(A1 P(A1∩ entonces se cumple …. ∩ An) = P(A1) * P(A2 /A1) *P(A3 / A1 ∩ A2) … P(An / A1 ∩  \A2 ∩….∩ …. ∩  An-1) P(A1 ∩ A 2 ∩….∩ \A2∩

La regla del producto se utiliza en experimentos aleatorios que están formados por etapas consecutivas (de la 1 a la n) y nos permite calcular la probabilidad de que ocurra una una concatenación (i(int ntersecci ersección) ón) de su sucesos cesos a lloo largo ddee llas as etapas (A1 en la primera etapa y A2 en la segunda etapa y . . . y An en la etapa n). Esta probabilidad queda expresada como el producto producto de la probabilidad inicial P(A1) y las probabilidades en cada etapa condicionadas a las etapas anteriores, conocidas con ocidas como probabilidades de tran transición. sición. Ejemplo 29: Un grupo de investigadores de un laboratorio trata de desarrollar una vacuna efectiva contra parásitos gastrointestinales. La vacuna en la que trabajan en la actualidad es capaz de matar en la primera aplicación al 80% de los parásitos gastrointestinales. Los parási parásitos tos superv supervivientes ivientes desarrolla desarrollann resistencia y en cada aplicación aplicació n posterio posteriorr de llaa vacun vacunaa el porcent porcentaje aje de parási parásitos tos muertos se reduce a la mitad del verificado en la aplicación inmediatamente anterior : así en la segunda aplicación muere el 40% de los parásitos supervivientes superv ivientes de la primera aplicaci aplicación, ón, en la tercera apli aplicaci cación ón mu muere ere el 20 2 0 %, etc. a) Cuál es la la probab probabilid ilidad ad de que uun n parási parásito to sobreviva a dos apli aplicaci caciones ones de la vacuna? b) Cuál es la probabilidad de que un parásito sobreviva a tres aplicaciones de la vacuna? Como siempre, en primer lugar vamos a vamos a ponerle nombre a los sucesos. Denotamos: A1= El parásito sobrevive a la primera aplicación de la vacuna. A2= El parásito sobrevive a la segunda aplicación de la vacuna. A3= El parásito sobrevive a la tercera aplicación de la vacuna,... Fíjate en que la información que nos da el problema es: P(A1) = 0.2. P(A2/A1) = 0.6. P(A3/ A1 ∩ A2) = 0.8. Aplic ando la regla de la cadena podemos contestar a las dos pregun Aplicando preguntas tas del problema.

  55

 

Prof. C. A. Cornielle

a) La probabilidad de que un parásito sobreviva a dos aplicaciones de la vacuna será P(A1 / A2) = P(A1) * P(A2 / A1) = 0.2 * 0.6 = 0.12. b) La probabilidad de que un parásito sobreviva a tres aplicaciones de la vacuna será P(A1 ∩ A2  A2 ∩ A3) = P(A1) * P(A2 /A1) * P(A3 / A1 ∩ A2) = 0.2 * 0.6 ∩ 0.8 = 0.096. 6. 6.2 2 Ley de las las pro probabilid babilid ades totale totaless

El segundo segundo teorema es llaa llamada ley de las probabi probabilidade lidadess totales. Desco Descompone mpone la probabilidad de un suceso en la segunda etapa en función de lo que ocurrió en la etapa anterior. Previamente al enunciado de este teorema damos una definición. Sistema Si stema completo de sucesos. Es un unaa pa partició rticiónn del espacio mu muestral, estral, esto es, es unaa co un colección lección de sucesos A1, A2,,, A2,,,,,, ,,,,An ,An (subcon (subconju junt ntos os del espaci espacioo muest muestra ral)l) verificando A1 ∩ A2 ∩……. .… ∩  An = ø (son exhaustivos, exhaustivos, cubren todo el espa espaci cioo muestral) mu estral) y además son iincompatibles ncompatibles dos a dos (si se veri verifica fica un unoo de el ellos, los, no puede a la vvez ez ocurrir ningun ninguno o de los otros). Ley de las probabilidades totales. Sea A1, A2,,,,,, An un sistema completo de sucesos. Entonces se cumple que: P(B) = P(A1) * P(B=A1) + P(A2) *P(B=A2) + …… + P(An) * P(B=An) Ejemplo 30. Se sabe que una determinada enfermedad coronaria es padecida por el 7% de los fumadores fumadores y por eell 2.5% de los no fu fumadores. madores. Si en un unaa población poblaci ón de 5.000 habitant habitantes es hay 600 fu fumadores, madores, cuál es la proba probabili bilidad dad de qu quee una persona elegida al azar sufradicha enfermedad? En este caso: E enfermedad coronaria. A1==Sufre E s fu Es fumador. mador. A2 = Es E s no fu fumador. mador. Fijate que A1;A2 un sistema completo de sucesos. La información que nos da el problema es: P(E/A1) = 0.07. P(E/A2) = 0.025. P(A1) = 600 / 5000 = 0.12. P(A2) = 4400/5000 = 0.88 (también se puede calcular como P(A2) = 1-P(A1) ya que son sucesos complementarios). Entonces, Enton ces, por llaa ley de probabilid probabilidade adess totales P(E) = P(A1) * P(E=A1) P(E=A1 ) + P(A2 P(A2)) * P(E=A2) = 0: 0:12 12 * 0: 0:07 07 + 0:88 0:025 = 0:0304

  56

 

Prof. C. A. Cornielle

6.3. 6. 3. Teorema de Bayes B ayes

Por último, último, tratamos el teorema de Bay Bayes. es. C Consideremos onsideremos un experimento que se realiza en dos etapas: en la primera, tenemos un sistema completo de sucesos A1, A2,,,,,,, An con probabilidades P(Ai ) que denominamos probabilidades a priori. En una condicionadas segunda etapa, ha )ocurrido el en suceso B y se conocen las probabilidades P(B/Ai de obtener la segunda etapa el suceso B cuando en la primera etapa se obtuvo el suceso Ai, i = 1,,,,n. En estas condiciones el teorema de Bayes permite calcular las probabilidades P(Ai / B), que son probabilidades condicionadas en sentido inverso. Reciben el nombre de probabili proba bilidades dades a posterio posteriori, ri, pu pues es se ccalcul alculan an después de haber observado el suceso B. Teorema de Bayes. En las condiciones anteriores, P(Ai=B) = P(Ai ) * P(B/ P(B/Ai Ai ) P(B) Además, aplicando en el denominador la ley de probabilidades totales: P(Ai / B) =

P(Ai ) * P(B=Ai )_____________________ P(A1)* P(B/A1) P (B/A1) + P(A2) * P(B/A2) + ………. + P(An) * P(B/An)

Ejemplo 31: Volvamos al Ejemplo 9 y supongamos ahora que llega a nuestra consulta una persona que sufre la enfermedad coronaria citada. ¾Cuál es la probabilidad de que dicha persona sea fumadora? En este caso nos están preguntando P(A1/E). Por el Teorema de Bayes, P(A1/E) P(A1 /E) = P(A1)* P(E*A P(E*A1) 1) = 0.12 * 0.07 = 0.2763 P(E) 0.0304

  57

 

Prof. C. A. Cornielle

CAPITULO 4. VARIAB VARIABLES LES AL ALEATORI EATORIAS AS DISCRETAS Y DISTRIBUCIONES DE PROBAB ILIDAD DISCRE DISCRETAS TAS   1. Introdu Introdu cción

En el tema de Estadística Descriptiva hemos estudiado variables, entendiéndolas como mediciones que se efectúan sobre los individuos de una muestra. mu estra. Así, llaa Estadí Estadística stica De Descripti scriptiva va nos permití permitíaa analizar los distintos valores que tomaban las variables sobre una muestra ya observada. Se trataba, pues, de un estudio posterior a la realización del experimento aleatorio. En este tema trataremos las variables situándonos antes de la realización del experimento aleatorio. Por tanto, haremos uso de los conceptos del tema anterior (Probabilidad), mientras que algunos desarrollos serán análogos a los del tema de Estadística Descriptiva. 2. Variable aleatoria

De manera iinformal, nformal, una vvari ariable able aleatori aleatoriaa es un valor nnumérico umérico que corresponde al resultado de un experimento aleatorio. Por ejemplo, una variable X como resultado resultado de llanz anzar ar un unaa moneda al aire puede tomar el vvalor alor 1 si el resultado es cara y 0 si es cruz. De este modo, escribiremos, por ejemplo, P (X = 1) = 0:5: Otro ejemplo de variable aleatoria, Y; puede ser el resultado de medir en oC la temperatura corporal de adultos varones sanos. Cuando se han tomado muchí muchísimas simas observaciones (i(inf nfinitas), initas), se pu puede ede llegar a la con conclu clusió sión, n, por ejemplo, que la la pro probabi babilidad lidad de que la ttemperatura emperatura corporal sea inf inferio eriorr a o 36:8 C es igual a 0:8, lo que escribimos escribi mos con P (Y < 36:8) = 0:8: Definición Llamamos variable aleatoria unaque aplicación espaciode muestral asociado a1. un experimento aleatorio enaR, a cada del resultado dicho experimento le asigna un número real, obtenido por la medición de cierta característica. Denotamos la varia variable ble aaleatoria leatoria por uuna na letra mayú mayúscula. scula. El conju conjunt ntoo image imagenn de esa aplicación aplicaci ón es el conju conjunt nto o de vvalores alores que pu puede ede tomar la variable aleatoria, que serán denotados por letras minúsculas. Las variab variables les aleatoria aleatoriass son equ equivalen ivalentes tes a las las variables que analiz analizába ábamos mos en el tema de Estadística Descriptiva. La diferencia es que en el tema de Estadística Descriptiva Descri ptiva se trabajaba sobre uuna na mu muestra estra de datos y ahora vvamos amos a considerar que disponemos de toda la población (lo cual es casi siempre imposible en la práctica). Ahora vamos a suponer que podemos calcular las probabilidades de todos los sucesos resultantes de un experimento aleatorio.

  58

 

Prof. C. A. Cornielle

De modo idéntico a lo dicho en el tema de Descriptiva, podemos clasificar las variables aleatorias aleatori as en discretas y con continu tinuas as en fu función nción del con conju junt ntoo de vvalores alores que pueden tomar. Así, una variable aleatoria será discreta si dichos valores se encuent encu entran ran separad separados os entr entree ssíí. Por ttant anto o será representable por conju conjunto ntoss discretos. disc retos. U Una na variable aleatoria se será rá cont continu inuaa cuan cuando do el conju conjunt ntoo de vvalores alores que puede tomar es un intervalo. Al igual que en el tema de Estadística Descriptiva, las variables aleatorias se pueden clasificar en discretas y continuas 2.1 Variables aleatorias discretas .

Una variable aleatoria es discreta cuando toma una cantidad numerable (que se pueden contar) de valores. Por ejemplo, el número de caras al lanzar dos veces una moneda o el número de pacientes con enfermedades articulares en centros de salu sa lud. d. Si X es una variable discreta, su distribución viene dada por los valores que puede tomar y las las probabi p robabilidade lidadess de que aparezcan aparezcan.. Si x1 < xx22 < :: < xxn n son los posibles valores de la variable X, las diferentes probabilidades de que ocurran estos sucesos, p1 = P (X = x1) ; p2 = P (X = x2) ; ... pn = P (X = xn) xn) : constituyen constitu yen la distribución de X: función P (X = xx)) se de denomin nominaa fu función nción de probab probabilid ilidad ad o ffun unció ciónn Definición 2. La función de masa. La función función de probabi probabilidad lidad se puede represen representar tar aanálogamen nálogamente te al diagrama diag rama de barras. Ejercicio 1: Se lanza dos veces una moneda equilibrada. Sea X la variable que expresa el número número de caras en los dos lanz lanzami amientos. entos. Halla y represe representa nta la función función de probabili probabilidad dad de X. Ejercici o 2: Sea X la variable aleatoria que ex Ejercicio expresa presa número número de pacientes con enfermedades articulares en centros de salud con las siguientes probabilidades: Xi pi

0

2

0:230 0:322

3

4

5

6

0:177 0:067 0:024 0:015

7 0:01

Comprueba que se trata efectivamente de una función de probabilidad y represéntala.

  59

 

Prof. C. A. Cornielle

Definición 3. La función de distribución de una variable aleatoria se de_ne como: F: R R x0

F (x0) (x0) = P (X ≤ x0)

Calcularemos ariables les aleatorias di discretas scretas su ffun unción ción de masa y su fu funció nciónn de distribución.para variab El dia diagrama grama de barras de frecu frecuencias encias acumu acumuladas ladas para variables discretas del tema 1 se puede reinterpretar en términos de probabilidades y da lugar a lo que recibe el nombre de función de distribución, F (x) ; definida para cada punto x0   como la probabilidad de que la variable aleatoria tome un valor menor o igual que x0; F (x0) = P (X _ x0) : La función de distribución es siempre no decreciente y verifica que, F ( -∞) = 0 F (+∞1) = 1: Suponiendo que la variable X toma los valores x1 < x2 < ……..< xn, los puntos de salto de la función de distribución vienen determinados por: F (x1) = P (X ≤ x1) = P (X = x1) F (x2) = P (X ≤ x2) = P (X = x1) + P (X = x2) ... F (xn) (xn) = P (X ≤ xn)  xn) = P (X = x1) + ::: + P (X = xn) = 1 Obsérva la función función de distribución eess igual a uno en el máximo de todos los valores posibles.  Calcular lar la fun función ción de distribución de la vvariab ariable le X en el Ejercici Ejercicioo 1. Ejercicio 3:  Calcu Ejercicio 4: Calcular la función de distribución de la variable X en el Ejercicio 2. Ejercicio 5:  Calcula la probabilidad de que el número de caras sea al menos 1 en el Ejercicio 1. Ejercicio 6:   Calcula la probabilidad de que el número de pacientes con enfermedades articulares sea menor o igual que 4 y la probabilidad de que haya más de dos pacientes de este tipo en un centro de salud con la información del Ejercicio 2.

  60

 

Prof. C. A. Cornielle

3. Me Medidas didas caracterí características sticas d e una variable a alea leatoria toria disc discreta. reta.

Los conceptos que permiten resumir una distribución de frecuencias utilizando valores val ores nu numéricos méricos ueden utilizarse utilizarse también para descri describir bir la distri distribución bución de probabilidad deeluna aleatoria. Las de_niciones son análogas a las introducidas en temavariable 1. 3.1 Media o esperanza .

Se define la media poblacional o esperanza de una variable aleatoria discreta como la media de sus posibles vvalores alores x1, x2, x2,,,, ,,,,,,, xk ponderados por sus respectivas probabilidade probabi lidadess p1; p2,,,, p2,,,,,,, ,,,,, pk, es deci decir, r, µ = E(X) = x1p1 + x2p2 + ,,,,, + xkp =Σxp Ejercici o 7: Calcula la media de paci Ejercicio pacientes entes con enf enfermedades ermedades articulares del Ejercicio 2. La interpretación de la media o esperanza es el valor esperado al realizar el experimento con la variable aleatoria. Además, la media puede verse también como el valor central de la distribución de probabilidad. 3.2 Varianza.

Se define la varianza poblacional de una variable aleatoria discreta con valores x1; x2,,,,,,,,,, xk  como la media ponderada de las desviaciones a la media al cuadrado,

σ2 = Var(X) =Σ (x - µ )2pxi  Ejercicio 8: Calcula la varianza de pacientes con enfermedades articulares del Ejercicio 2. interpretación de la vvarianza arianza es la m misma isma que para un conju conjunt ntoo de datos: es un valor no negativo que expresa la dispersión de la distribución alrededor de la media. Además, se puede calcular la bbdesviación típica poblacional _ como la raízz cuadrada de la varianz raí varianza. a. Los vvalores alores pe pequeñ queños os de _ indica indicann concen concentració traciónn de la la distri distribución bución alr alrededor ededor de la esperanz esperanzaa y valores ggrandes randes corresponden a distribuciones más dispersas.

  61

 

Prof. C. A. Cornielle

4.  Principal Principales es mod elos de distribuciones discreta discretass  

Estudiaremos ahora distribuciones de variables aleatorias que han adquirido una especial relevancia por ser adecuadas para modelizar una gran cantidad de situaciones. Presentaremos de variables discretas y caracterizaremos estas distribuciones mediantemodelos la distribución de probabilidad. Calcularemos también los momentos (media y varianza) y destacaremos las propiedades de mayor utilidad. 4. 4.1 1 Distribución de Bernoulli

En muchas ocasiones nos encontramos ante experimentos aleatorios con sólo dos posibles resultados: Éxito y fracas fracasoo (cara o cruz en el lanz lanzami amiento ento de uuna na moneda, ganar o perd perder er un partido, aprobar o suspender un examen, una prueba diagnóstica da positivo o negativo... negativo...). ). Se pueden modelizar estas situaciones mediant medi antee la vvariab ariable le aleatoria 1 si Éxit Éxitoo X= 0 si fracas fracasoo

Lo único que hay que conocer es la probabilidad de éxito, p, ya que los valores de X son siempre los mismos y la probabilidad de fracaso es q = 1 - p. Definición De finición 4. Si denotamos por p a la probabilidad de éxito, entonces diremos

que la variable X tiene de de Bernoulli de de parámetro p , y lo denotamos X ∈  Bern Bernou oulllli(p). i(p).distribución La distribu distribución ción probabilidad X ∈  Bernoulli(p) viene dada por X 0 1 P(X = xi ) 1 - p p Por tanto, la probabilidad de éxito p determina plenamente la distribución de Bernoulli. La media y la varianza de una Bernoulli(p) son: µ = np. σ2 = nnpp (1 - p).

  62

 

Prof. C. A. Cornielle

4. 4.2 2 Distribución binomial

Empezando con una prueba de Bernoulli con probabilidad de éxito p, vamos a construir una nueva variable aleatoria al repetir n veces la prueba de Bernoulli. Ejemplo 31: Supongamos que lanzamos un dado normal 5 veces y queremos determinar la probabilidad de que exactamente en 3 de esos 5 lanzamientos salga el 6. Cada lanzam lanzamiento iento es independie independient nte e de los demás y podemos considerarlo como un ensayo ensayo de Bernou Bernoulli, lli, donde el éxito es sacar uunn 6 (p = 11=6). =6). Lo qu quee hacemos es repetir el experimento 5 veces y queremos calcular la probabilidad de que el número nú mero de éx éxitos itos ssea ea igual a 3 (es deci decir, r, obtener 3 éxitos y 2 fracasos) La distribución binomial sirve para modelizar situaciones en las que nos interesa contar el número de éxitos en n repeticiones de una prueba de Bernoulli con probabilidad de éxito p. La variab variable le aaleatoria leatoria binomial X es el nú número mero de éxitos en n repetici repeticiones ones de un unaa prueba de Bernoulli con probabilidd de exito p. Debe cumplirse   Cada prueba individual pu puede ede ser un éxito o un fracaso. 

  La probabi probabilidad lidad de éxito, p, es la misma en cada prueba.



  Las pruebas son independientes. El result resultado ado de un unaa ppru rueba eba no tiene influencia sobre los resultados siguientes.



Definición 5. La variable aleatoria X que representa el número de éxitos en n Definición intentos independientes, siendo la probabilidad de éxito en cada intento p, diremos que tiene distribución binomial de parámetros n y p.Lo denotamos X ∈ Binomial (n; p) o X ∈ Bin(n; p). La distribución binomial es discreta y toma

los valores 0; 1; 2; 3; : : : ; n con probabilidades P(X = k) = ncx px qn-x   Si k ∈  (0, 1 2 3 … n)  donde el coeficiente binomial ncx = n! x! (n-x (n-x)) ! repre representa senta el nú número mero de subconjun subconjuntos tos di diferentes ferentes de k elementos que se pueden definir a partir de un total de n elementos (combinaciones de n elementos tomados de k en k). La media y la varianza de una Bin(n; p) son: µ = n p. σ2 = n p ( 1- p).

  63

 

Prof. C. A. Cornielle

Como ejemplo 32 , la Figura 2 muestra muestra las funciones funciones de masa de uuna na variable con distribución binomial de parámetros n = 5 y p = 1/6 y una variable con distribución binomial de parámetros n = 60 y p = 1/6. Figur Fig uraa 2: En la izqu izquierd ierda, a, función función de masa de un unaa Bi Bin(5; n(5; 1/6). En llaa de derecha, recha, funci fun ción ón 1/6). de masa de uuna na Bin(60; Fig uraa 2: En la izqu Figur izquierd ierda, a, función función de masa de un unaa Bi Bin(5; n(5; 1/6). En llaa de derecha, recha, funci fun ción ón de masa de uuna na Bin(60; 1/6). Figur Fig uraa 1. Figura Fi gura 2.

Ejemplo 33. En una pobl ación hay un 440% 0% de ffumadores. umadores. La variable   que mide el número de ebinomial, n una muestra aleatoria eemplazamiento azamiento de 3 personas sigue un mode modelo lo de fumadores distribuci ónen distribución la probabil probabilidad idadcon de rreempl que ninguno sea fumador es:

  (0) = ( 3 c0 ) 0.40  (1 − 0.4) 3−0 = 0.63

4. 4.3 3 Distribución de P Poisson oisson

En muchas circunstancias (llamadas a una centralita telefónica, átomos que pueden emitir una radiación, . . . ) elnúmero de individuos susceptibles de dar lugar a un éxito es muy grande. Para modelizar estas situaciones mediante una distribución binomial tendremos problemas al escoger el parámetro n (demasiado grande o incluso difícil de determinar) y al calcular la distribución de probabilidad (la fórmula resulta inviable). Sin embargo, se ha observado que si mantenemos constante la media E(X) = np y hacemos n ∞ la distribución de

  64

 

Prof. C. A. Cornielle

probabi lidad de llaa binomial tiende a uuna probabilidad na nuev nuevaa distri distribución, bución, qu quee llamaremos de Poisson de parámetro ʎ = np Def inición 6. Una variable aleatoria X tiene distribución de Poisson de parámetro

ʎ, y lo denotamos X ∈ Poisson(ʎ ), si es discreta y P(X = k) = e -ʎ  ʎk  k Si k ∈ (0, 1, 2, 3 ,…, n) La media y la varianza varianza de la Poi Poisson sson de parámetro ʎ son: µ= ʎ  σ2 = ʎ  Como ejemplo, la Figura Fi gura 3 muestra muestra las ffun unciones ciones de masa de una variable con distribución de Poisson de parámetro λ  = 2 y una variable con distribución de Poisson de parámetro λ = 15. Figura 3

Figura 4

Fig uraa 3: En llaa iizqu Figur zquierd ierda, a, fu función nción de masa de uuna na P Poisso oisson(2). n(2). En la derecha, función de masa de una Poisson(15). En la práctica usaremos la distribución de Poisson como aproximación de la distribución distri bución binomial cuando n sea grande y p pequ pequeño, eño, eenn base al lílímite mite que hemos visto. Usaremos el siguiente criterio: Si > 50, p < 0:1 entonces tonces la distribución binomial ddee parámetros n y p puede sernaproximada poren uuna na Poi Poisson sson de parámetro ʎ = np.

  65

 

Prof. C. A. Cornielle

Ejemplo 34: La probabilidad de que una persona se desmaye en un concierto es p = 0:005. Cuál es la probabilidad de que en un concierto al que asisten 3000 personas se desmayen 18? variable personas que secalcular desmayan en el concierto sigue una distribuciXón=Número Bin(3000;de0:005). Queremos P(X = 18) = 3000c18 *0:00518 * 0:9952982  Estos valores están fuera de las tablas de la binomial y son difíciles de calcular, por eso es preferib preferible le aproximar por uuna na Poi Poisson sson de parámetro µ = np = 3000 * 0:005 = 15. Entonces: P(X = 18) = P(Poisson(15) x = 18) = e -15 1518 = 0:07061 18! Ejercicio 35: Se sabe que la probabilidad de que un individuo reaccione desfavorablemente desfavorablemen te tras la iiny nyecció ecciónn de un unaa vacun vacunaa es de 0.002. Determina la probabilidad probabi lidad de qu quee en un gru grupo po de 2000 personas vacu vacunadas nadas hay hayaa como mu mucho cho tres que reaccionen desfavorablemente. Aunque la di Aunque distribución stribución de Poi Poisson sson se hhaa obtenido como forma lílímite mite de un unaa distribución Binomial, tiene muchas aplicaciones sin conexión directa con las distribuciones binomiales. Por ejemplo, la distribución de Poisson puede servir como modelo del número de éxitos que ocurren durante un intervalo de tiempo o en una región específica. Defnimos el proceso de Poisson como un experimento aleatorio que consiste en contar el número de ocurrencias de determinado suceso en un intervalo de tiempo, verificando:   El nnúm úmero ero medio de sucesos por un unida idadd de ttiempo iempo es constan constante. te. A esa constante la llamamos intensidad del proceso.



  Los nnúmeros úmeros de independientes.



ocu ocurrencias rrencias

en

su subinterv bintervalos alos

disjuntos

son

En un proceso de Poisson, consideremos X = número de ocurrencias en un subinterval subint ervalo. o. Enton Entonces ces X tiene di distribución stribución de Poi Poisson, sson, cu cuyyo pará parámetro metro es proporcional a la longitud del subintervalo La distribución de Poisson sirve como aproximación de la distribución binomial Bin(n Bi n(n;; p) cuando n es grande y p pequeño y ttambié ambiénn es adecuada para modelizar

  66

 

Prof. C. A. Cornielle

situaciones en las que nos interesa contar el número de ocurrencias de un determinado suceso en un intervalo de tiempo Ejemplo 36: El número de nacimientos en un hospital constituye un proceso de Poisson con intensidad de 21 nacimientos por semana. Cuál es la probabilidad de que se produzcan al menos tres nacimientos la próxima semana? P(X ≤ 3) = 1 - P(X < 3) = 1 - [P(X = 0) + P(X = 1) + P(X = 2)] = 1 –  e-21 210  + e-21 211 + e-21 212  0! 1!+ 2!

  67

 

Prof. C. A. Cornielle

CAPITULO 5. VARIABL ES ALEA ALEATORI TORIAS AS CONTI CONTINUAS NUAS Y DISTRIBB UCIONE UCIONES S DE PROBAB ILIDAD CONT CONTINUAS INUAS

1. Introdu Introdu cción En el capít capítul uloo ant anterior erior hemos estu estudiad diadoo variables aaleatorias leatorias discretas. Recuerda que una variable aleatoria es un valor numérico que corresponde al resultado de un experimento aleatorio. Podemos clasificar las variables aleatorias en discreta di scretass y continu continuas as en fun funci ción ón ddel el conjun conjunto to de valores qque ue pueden tomar. Estudiaremos en este tema variables aleatorias continuas y nos centraremos en un modelo de distribución continua (la distribución normal) que ha adquirido una especial relevancia por ser adecuada para modelizar una gran cantidad de situaciones prácticas. 2. Variables Variables a alea leatorias torias con tinu tinuas as

Una variable aleatoria es continua cuando puede tomar cualquier valor en un intervalo. interv alo. Por ejemplo, el peso de un unaa pe persona rsona o el conten contenido ido de paracetamol en un lote de pastillas. El estudio de las variables continuas es más sutil que el de las discretas. Recordemos que la construcción del histograma es más delicada que el del diagrama de barras ya que depende de la elección de las clases. Se ha comprobado en la práctica que tomando más observaciones de una variable continua continua y hacie haciendo ndo más finas las clases, el hhistograma istograma tiende a estabilizzarse en un estabili una a curv curva a suav suavee que describ describee la distribución de la vvariab ariable le . Esta funci fun ción, ón, f(x); sse e llama fun funci ción ón de densida densidadd de la variab variable le X X.. La función función ddee densidad constituye una idealización de los histogramas de frecuencia o un modelo del cual suponemos que proceden las observaciones.

  68

 

Prof. C. A. Cornielle

3. Medidas Medidas caracterí características sticas de una variable alea aleatoria toria c ontin ua

Los conceptos que permiten resumir una distribución de frecuencias utilizando valores numéricos pueden utilizarse también para describir la distribución de probabilidad de una variable aleatoria. 3.1 Media o esperanza

Se define la media poblacional o esperanza de una variable aleatoria continua como  µ = E(X) = Σ(Xi pxi) = npx

Ejemplo 37. La interpretación de la media o esperanza es el valor esperado al realizar el experimento con la variable aleatoria. Además, la media puede verse también como el valor central de la distribución de probabilidad 3.2 Varianza

Se define la varianza de una variable aleatoria como

σ2= VarX = Σ pxi(X - X)2  Edjemplo Edjempl o 38 Probabilidades de vida de pacientes terminales de cancer Nivel de cancer Nivel 1 Nivel 2 Nivel 3 Total Calcular el valor valor terminal

Pacientes xi 3 2 1 6 esperado o miedi miedia a y llaa

Probab Probabilid ilidades ades de vida % 25 35 40 100% varianz varianzaa de pacie pacient ntes es con can canser ser

µ = E(X) = Σ(Xi pxi) = npx = 1.85 pacientes

npxi 3*0.25= 0.75 2*0.35= 0.7 1*0.40= 0.40 Total = 1.85

X-X 1.15 0.15 -0.85 -

(X – X)2  1.3225 0.025 0. 0.7225 7225 -

pxi(X – X)2  0.330625 0.07875 0.289 0.698375

σ2= VarX = Σ pxi(X - X) 2 =0.6983 σ =0.83 pscientes

  69

 

Prof. C. A. Cornielle

La interpretación de la vvarianza arianza eess la misma que ppara ara uunn conj conjun unto to de datos: es un valor no negativo que expresa la dispersión de la distribución alrededor de la media.. Además, se puede calcu media calcular lar la desviación títípica pica poblaci poblacional onal como la rraíz aíz cuadrada de la varianza. Los valores pequeños de indican concentración de la distribución de la esperanza y valores grandes corresponden a distribucionesalrededor más dispersas. 4. Principal Principales es modelos de distribuciones continu as 5. La distribución no rmal

La distribución normal es la más importante y de mayor uso de todas las distribuciones continuas de probabilidad. Por múltiples razones se viene considerando la más idónea para modelizar una gran diversidad de mediciones de la Medic Medicina, ina, Fí Física, sica, Quí Química mica o Bi Biologí ología. a. La nnormal ormal es uuna na fami familia lia de vvariab ariables les que depende de dos parámetros, la medi mediaa y la varianz varianza, a,  fue reconocida por primera vez por el francés Abraham de Moivre (1667-1754). Posteriormente, Carl Friedrich Gauss Gau ss (1777-1855) elaboró elaboró desarrollos más profundos profundos y formuló la ecuación de la curva; c urva; de ahí que también se le conozca, más comúnmente, como la "campana de Gauss" .

Dado que todas todas están relaci relacionadas onadas ent entre re ssii medi mediant antee un unaa tran transformación sformación muy sencilla, empezaremos estudiando la denominada normal estándar para luego denir la familia completa. 5. 5.1 1 La distribuc distr ibuc ión nor normal mal estánd estándar ar N( N(0, 0,1) 1) La distribución de una variable normal está completamente determinada por dos parámetros, su media (µ) y su desviación estándar σ . Con esta notación, la densidad de la normal viene dada por la ecuación llamada Funcion de densidad de probabilidad normal :

, que determina la curva c urva en forma de campana. Curva de la Distribción Normal

  70

 

-3σ 

-2σ 

-1σ 

1σ 

µ

2σ 

3σ  Prof. C. A. Cornielle

Esta gráfica muestra tres formas diferente diferentess de medir el área bajo bajo la curva normal. Sin embargo, muy pocas de las aplicaciones que haremos de la distribución normal de probabilida probab ilidad d implican intervalos intervalos de exactamente exactamente (más (m ás o menos) 1, 2 ó 3 desviaciones estándar a partir de la media. m edia. Para estos es tos casos existen existen tablas estadístic estadísticas as que indican porciones del área bajo la curva normal que están contenidas dentro de cualquier número de desviaciones estándar (más o menos) a partir de la media. Propiedades de la distribucion distri bucion de probadilidad probadilidad norm nor mal:

No importa cuáles sean los valores de µ y σ ; para un distribución de probabilidad normal, el área total bajo la curva siempre es 1, de manera que podemos pensar en áreas bajo la curva c urva como si s i fueran probabili probabilidade dades. s. Matemáticamente atemáticam ente es verdad verdad que: *Aproximadamente el 68% de todos los valores de una población normalmente distribuida se encuentra dentro de ± 1 desviación estándar de la media. *Aproximadamente el 95.5% de todos los valores de una población normalmente distribuida se encuentra dentro dentro de ± 2 desviaciones estándar de la m media edia.. *Aproximadamente el 99.7% de todos los valores de una población normalmente distribuida se encuentra dentro de ± 3 desviaciones desviaciones es estánda tándarr de la media. Afortunadamente también podemos utilizar una distribución de probabilidad normal estándar para encontrar áreas bajo cualquier curva normal. Con esta tabla podemos determinar el área o la probabilidad de que la variable aleatoria distribuida normalmente esté dentro de ciertas distancias a partir de la media. Estas distancias están definidas en términos de desviaciones estándar y se concoce como regla empirica. Uso de la tabla tabla de distribuci distr ibución ón norlam nor lam de probabilidad pr obabilidad normal estándar estándar Para cualquier distr normalestándar de probabilidad, intervalos inter valos que contienen el mismo númerodistribución de ibución desviaciones a partirtodos de lalos media contendrán la misma fracción del área total bajo la curva para cualquier distribución de probabilidad normal. Esto hace que sea posible usar solamente una tabla (Apéndice Tabla 1) de la distribución de probabilidad normal estándar. El valor de z en la tabla es absoluto, es decir, z en la tabla no tiene signo; las areas que se muestran en la tabla son las areas bajo la curva de probabilidad normal estandar entre la media y los valores valores posiditivos posiditivos de z, y como com o la distrilbucion es simetrica s imetrica esta area le corresponde c orresponde a ambos lados de la curva.

  71

 

Prof. C. A. Cornielle

Aarea bajo la curva noral

El estadistilco de la Disribucion Dis ribucion Normal Normal

En la que: x = valor de la variable aleatoria que nos preocupa. µ = media de la distribución de la variable aleatoria. σ =desviación estándar de la distribución.  z = número de desviaciones estándar que hay desde x a la media de la distribución. (eluso de z es solamente un cambio de escala de medición del eje horizontal).

  72

 

Prof. C. A. Cornielle

Ejemplo: La glucemia basal de los diabéticos atendidos en un centro sanitario puede considerarse como una variable normalmente distribuida, con media 106 mg por 100 ml, y desviación típica 8 mg por 100 ml N(106; 8). Calcular: a) La proporción de diabéticos con una glucemia basal inferior a 120 mg por 100 ml, P(x110) = 0.5 – P(Z2)

X2=10.5 P(Z2)?

Z2 = 110.5-106 8

P(Z2)= 0.2123

= 0.56

P(x>110) = 0.5  – P(Z2) = 0.5 - 0.2123 =0.2877 La proporción proporción de diabéticos diabéticos con una glucemia basal mayo m ayorr de 120 mg por 100 ml. m l. Es de 28.77. 

d) El nivel de glucemia basal tal que por debajo de él están el 25% de los diabéticos, es decir, el primer cuartil

El area 0.25 tiene uunn uunn Z apro aproximado ximado de Z= + 0.67 y por órmula:

z = x-µ σ 

Sustituyendo Sustituyen do en la fórmul fórmulaa 0.67 = x-106 8 X= z  σ + µ 

Por lo tanto X= 0.67*8 +106 mg por por 100 ml. 

  75

 

Prof. C. A. Cornielle

c) La proporción proporción de diabéticos diabéticos con una glucemia glucemia basal mayor de 100 mg por 100 ml.

P(X>100) 0.5  – P(X1)

-z1 Z1 = 100-106 = -0.75

P(X1) = 0.2734 

8

P(X>100) 0.5 – P(X 1) = 0.5 -0.2738 = 0.2262 La proporción proporción de diabéticos diabéticos con una glucemia basal menor de de 100 mg por 100 ml. m l. Es de 22.62% 

Ejercicio . En una cciuda iudad d se estima estim a que la temperatura máxima en en el mes de junio junio sigue s igue una distribución normal, con media 23° y desviación típica 5°. Calcular el número de días días del mes en los que se espera alcanzar máximas entre 21 21°° y 27°

  76

 

Prof. C. A. Cornielle

  77

 

Prof. C. A. Cornielle

Literatura consultada.

1. Fundamento Fundamentoss de d e Bioesata Bio esatadist distica, ica, segunda segund a edicion. edici on. Marcello Pagano. Pagano. Kimberly Gauv Gauvreau. reau. Thomson Learning

2. BIOESTA BIOEST ADISTICA Base para el analisi analisiss de las ciencias cien cias de la salud, cuart cuarta a edicion. Daniel, Limusa EILEY.

3. Intr Intr oduccio odu ccion n a la BIOESATADI BIOESATADIA ATICA Sokal/rohlf, agapea.com

4. Bioestadisti Bio estadistica ca y Epimdemiologi Epimdemiologia, a, Segunda edicion. edicion . R. f. Morton, Mort on, J. R. Hebel. Inter maeri maericana cana..

5. Bioestadisti Bio estadistica ca , sexta edicion. edicio n. Stanton A. Glanz, MCGraw Hil

  78

 

  79

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF