Medidas de Tendencia Central

January 25, 2018 | Author: calin2875 | Category: Standard Deviation, Statistical Dispersion, Variance, Median, Quantile
Share Embed Donate


Short Description

Download Medidas de Tendencia Central...

Description

UNIVERSIDAD CATOLICA SANTO TORIBIO DE MOGROVEJO

ESCUELA DE MEDICINA SALUD PUBLICA II

Medidas de Tendencia Central Medidas de Frecuencia Prof: JULIO PATAZCA ULFE Especialista en Salud Pública CHICLAYO - 2010

Epidemiología: Medidas de Resumen Medidas Frecuencia Tendencia Central Dispersión

Orden E fecto o Asociación

Proporción; Razón; Tasa; Prevalencia; Incidencia Media, Moda, Mediana Rango, Rango intercuartílico, Desvío estándar

Percentiles, Cuartiles Riesgo Relativo (RR), Odds Ratio (OR), Riesgo Atribuible (RA)

A.- ME DIDAS DE TE NDE NCIA CE NTRAL • Resumen el comportamiento de un conjunto de datos • L as principales medidas de tendencia central son: media

aritmética. mediana, moda.

B.- ME DIDAS DE POSICIÓN • Permiten conocer otros puntos característicos de la distribución que no son los valores centrales • Cuartiles, deciles y percentiles

C.- ME DIDAS DE DISPE RSIÓN • E studia lo concentrada o dispersa que está la distribución de los datos con respecto a la media aritmética. • Rango o recorrido, desviación media, varianza y

desviación típica o estándar, y coeficiente de variación.

ME DIDAS DE TE NDE NCIA CE NTRAL . ME DIA ARITMÉ TICA E s la suma de todos los valores de una variable dividida por el número total de ellos.

-DATOS SIN AGRUPAR:

_ X = x1 + x2 + x3 + ....... + xn = N -DATOS AGRUPADOS:

Σxi N

_

X = Σxi . fi N

CARACTE RÍSTICAS: • E s sensible a la variación de las puntuaciones • Si hay intervalos de clase abiertos no se puede calcular • No es recomendable cuando hay valores muy extremos

Ejercicio 1 a) Encuentra el promedio de los siguientes datos: 7, 4, 5, 5, 8, 3, 2, 7, 4 X= b) Escribe con palabras lo que hiciste para encontrar el resultado.

8

Resultado correcto

5 1. 2.

Se suman todos los datos Se divide el total entre el número de datos

9

Propiedades • La media aritmética es la medida tendencia central que posee menor varianza. • Engloba en ella toda la información de la muestra; esto, con ser una ventaja, supone una cierta desventaja pues los valores muy extremos, en muestras pequeñas la afectan.

10

CÁL CUL O DE L A ME DIA. E JE MPL OS 1.- DATOS NO AGRUPADOS: Calcular la T.A. sistólica media de 5 pacientes en los que se han obtenido las siguientes cifras. 110, 118, 125, 136, 145

_ X = 110 + 118 + 125 + 136 + 145 = 634 = 126,8 5

5

2.- DATOS AGRUPADOS: xi fi xi . fi 1 2 3 4 5

3 4 6 5 2 ___ 20

3 8 18 20 10 ___ 59

_

X = Σxi . fi = 59 = 2,95 N 20

• E n un brote de hepatitis A, 6 personas iniciaron síntomas 24 a 31 días después de la exposición. Calcule el promedio del período de incubación en éste brote; los períodos de incubación para las i personas afectadas (X ) fueron: 29,31,24,29,30 y 25 1.- Para calcular el numerador sume las observaciones individuales x = 29+31+24+29+30+25= 168 2.- Para calcular el denominador cuente el número de las observaciones : n=6 3.- Para calcular la media divida el numerador sumatoría de las observaciones) entre el denominador (numero de las observaciones). media x = 29 31 24 29 30 25 = 168 = 28 días 6

6

• E ntonces: el promedio del período de incubación del brote es 28 días.

• E n una lista de 5 variables para 11 personas. Vamos a demostrar como se calcula la media de cada variable (A-E ) en el listado. Persona # Variable A Variable B Variable C Variable D Variable E 1 0 0 0 0 0

2 3 4 5 6 7 8 9 10 11

0 1 1 1 5 9 9 9 10 10

4 4 4 5 5 5 6 6 6 10

1 2 3 4 5 6 7 8 9 10

1 1 2 2 2 3 3 3 4 10

6 7 7 7 8 8 8 9 9 10

1. Para calcular el numerador, sume todas las observaciones individuales: A. ∑ i x = 0+0+1+1+1+5+9+9+9+10+10 = 55 B. ∑ i x = 0+4+4+4+5+5+5+6+6+6+10 = 55 C. ∑ i x = 0+1+2+3+4+5+6+7+8+9+10 = 55 D. ∑ i x = 0+1+1+2+2+2+3+3+3+4+10 = 31 E . ∑ i x = 0+6+7+7+7+8+8+8+9+9+10 = 79

2.- Para calcular el denominador cuente el número de observaciones (n=11) para cada variable. 3.- Para calcular la media, divida el numerador (suma de las observaciones) entre el denominador (número de las observaciones). » Media de la variable A= 55/11= 5 » Media de la variable B= 55/11= 5 » Media de la variable C= 55/11= 5 » Media de la variable D= 31/11= 2.82 » Media de la variable E = 79/11= 7.18

ME DIDAS DE TE NDE NCIA CE NTRAL : ME DIANA L a mediana de una serie de N datos ordenados en orden creciente o decreciente es la puntuación que ocupa el valor central de la distribución. - DATOS SIN AGRUPAR:

Rango mediano = (n+1) 2

a) Nº de datos impares: Valor central 7,4,2,5,9

2,4,5,7,9

X =5

b) Nº de datos pares: Media de los dos valores centrales: 7,4,2,5,9,6

2,4,5,6,7,9

X = 5 +6 = 5,5 2

Ejercicio 2 a) Los siguientes datos representan los pesos de 12 niños. Encuentra cuál es el peso mediano de estos niños : 12, 11, 15, 8, 15, 21, 18, 25, 16, 21, 22, 27 b) Escribe con palabras lo que hiciste para calcular el resultado.

16

Resultado correcto

17 1. 2. 3.

Se ordenan los datos Se busca cuál es el dato central Como el número de datos es par se calcula el promedio de los dos datos centrales

17

Propiedades • Es única. • Es más fácil de calcular que la media aritmética y apenas se afecta por observaciones extremas. • Sin embargo tiene mayor varianza que la media y sólo toma en cuenta la información de los valores centrales de la muestra.

18

ME DIDAS DE TE NDE NCIA CE NTRAL . ME DIANA - DATOS AGRUPADOS:

L a mediana es el valor de la variable que tiene la propiedad de que los valores menores que él son tan frecuentes como los mayores que él. X = L i + N/2 – fd fc

.i

Rango mediano = (n+1) 2

donde: L i =L ímite inferior del intervalo crítico N = Nº total de datos fd = Frecuencia acumulada por debajo del intervalo crítico fc = Frecuencia del intervalo crítico i = Amplitud del intervalo

INTE RVAL OS

fi

Fac.

151,5 – 172,5

5

5

172,5 – 193,5

7

12

193,5 – 214,5

9

21

214,5 – 235,5

6

27

235,5 – 256,5

3 ___ 30

30

X = L i + N/2 – fd fc

Rango mediano = (n+1) 2

. i = 193,5 + 30 /2 - 12 . 21 = 200,5 9

CARACTE RÍSTICAS DE L A ME DIANA • E s menos sensible que la media a la variación de las

puntuaciones.

Ejemplo: A 24,25,29,30,31 Media 28.0 mediana 29 B 24,25,29,30,131 Media 44.7 mediana 29

• Se puede calcular aunque existan algún intervalo abierto,

siempre que no sea ese el intervalo crítico. • E s más representativa cuando la distribución tiene puntuaciones muy extremas.

E jemplo A

0 0 1 1 1 5 9 9 9 10 10

B

0 4 4 4 5 5 5 6 6 6 10

C

0 1 2 3 4 5 6 7 8 9 10

D

0 1 1 2 2 2 3 3 3 4 10

E

0 6 7 7 7 8 8 8 9 9 10

1.- Organice las observaciones en orden creciente (ya está hecho)

2.- E ncuentre el rango medio de las observaciones (11 observaciones + 1) /2 = 12/2 = 6 3.- Identifique el valor de la mediana que es el de la 6a observación:

L a mediana para las variables A, B y C es 5; L a mediana para la variable D es 2; L a mediana para la variable E es 8;

MEDIDAS DE TENDENCIA CENTRAL. MODA E s el valor de la variable a la que corresponde la máxima frecuencia. Si los datos están agrupados en intervalos, la moda es la marca de clase del intervalo con mayor frecuencia.

CARACTE RÍSTICAS:

• E s muy sencilla de obtener. • Se puede calcular aunque existan intervalos abiertos, siempre que no esté incluida en él. • E s poco representativa. •Es el estadístico de mayor varianza

La moda (continuación) • La moda puede no existir y cuando existe no es necesariamente única. – Ejemplo, en los valores: 10, 21, 33, 53 y 54 no hay moda porque todos los valores son diferentes

• No tiene sentido en muestras pequeñas en las que la aparición de coincidencias en los valores es con gran frecuencia más producto del azar que de otra cosa.

24

Ejercicio 3 • Un laboratorio tiene 10 empleados, cuyas edades son: 20, 21, 20, 20, 34, 22, 24, 27, 27, 27 a) ¿Cuál es la edad modal de estos individuos? b) Explica con tus propias palabras lo que hiciste para calcularla

25

Resultado Hay 2 modas : 27 (se repite 3 veces) y 20 (que se repite también 3 veces). 1. Se observa en los datos cuál o cuáles se repiten más. 2. Si ninguno se repite no hay moda y si son varios los que se repiten hay varias modas.

26

Ejercicio 4 • Los siguientes datos representan edades de personas con cardiopatía en una muestra :

6, 16, 18, 19, 22, 23, 23, 23, 24, 26, 26 – ¿Cuál es la edad promedio de estas personas?___________________ – ¿Cuál es la mediana?_________________ – ¿Cuál es la moda?________________ 27

Ejercicio 5 • Un grupo de pacientes acudió a su valoración preoperatoria, sus resultados de hemoglobina fueron los siguientes:

17.2, 14.1, 16.4, 14.9, 16.9, 14.2, 20, 16.7, 14.9, 15.7, 15.1, 14.9, 15, 13, 15. – La media del valor de hemoglobina en estos pacientes fue de______________ – La mediana fue de_______________ – Y ¿Cuál es la moda?__________________

28

Ejercicios 4 y 5 •

Los siguientes datos representan edades de personas con cardiopatía en una muestra :

6, 16, 18, 19, 22, 23, 23, 23, 24, 26, 26



– ¿Cuál es la edad promedio de estas personas?_____20.55____ – ¿Cuál es la mediana?___23______________ – ¿Cuál es la moda?_____23___________ Un grupo de pacientes acudió a su valoración preoperatoria, sus resultados de hemoglobina fueron los siguientes:

17.2, 14.1, 16.4, 14.9, 16.9, 14.2, 20, 16.7, 14.9, 15.7, 15.1, 14.9, 15, 13, 15. – La media del valor de hemoglobina en estos pacientes fue de___15.6____ – La mediana fue de___15____________ – Y ¿Cuál es la moda?_14.9__________

29

Estadística

-Media Aritmética (Promedio) -Mediana -Moda

ME DIDAS DE TE NDE NCIA CE NTRAL

Datos Cuantitativos

x x1 x2  xn

Datos Cuantitativos ordenados de menor a mayor

Media Aritmética o Promedio n

xi x

i 1

n

Datos Cualitativos y Cuantitativos

x x(1)

Mediana

ME

x ( 2) ME

 x ( n)

x( k )

x( k ) x( k )

Si n es impar

x( k

1)

Si n es par

2

dato del centro

Moda

M o " el dato que más se repite" 30

ÍNDICES DE POSICIÓN • PE RCE NTIL E S (P): E s el valor de la variable por debajo del cual se encuentra un porcentaje determinado de observaciones.

• CUARTIL E S (Q): Son los valores de la variable que dejan por debajo el 25% de los datos ............... Primer cuartil Q1 (25%) 50% de los datos................ Segundo cuartil Q2 (50%) 75% de los datos................ Tercer cuartil Q3 (75%)

Estadística

Percentiles, Deciles o Cuartiles

-Percentil (ejemplo: 25, 50, 75) -Decil (ejemplo: 4, 5, 8) -Cuartil (ejemplo: 1, 2, 3)

Percentil, Decil o Cuartil: corresponde al valor que toma la variable (cuantitativa), cuando los n datos están ordenados de Menor a Mayor E l Percentil va de 1 a 100 E l percentil 25 (25/100): es el valor de la variable que reúne al menos el 25% de los datos E jemplo: Si N=80, el 25% de 80 es 20; por lo tanto, se busca el dato que este en la posición 20. Si N=85, el 25% de 85 es 21,25; por lo tanto se busca el dato que este en la posición 22.

E l Decil va de 1 a 10 E l Decil 4 (4/10): es el valor de la variable que reúne al menos el 40% de los datos E jemplo: Si N=80, el 40% de 80 es 32; por lo tanto, se busca el dato que este en la posición 32. Si N=85, el 40% de 85 es 34; por lo tanto se busca el dato que este en la posición 34.

E l Cuartil va de 1 a 4 E l Cuartil 3 (3/4): es el valor de la variable que reúne al menos el 75% de los datos E jemplo: Si N=80, el 75% de 80 es 60; por lo tanto, se busca el dato que este en la posición 60. Si N=85, el 75% de 85 es 63,75; por lo tanto se busca el dato que este en la posición 64. 32

MEDIDAS DE DISPERSIÓN • VARIANZA: E s la media de los cuadrados de las diferencias entre cada valor de la variable y la media aritmética. _ S² = Σ (xi - X )² o bien S² = 1 Σxi ² - (Σxi )² _ N N N S² =Σxi ² - X ² También: N Para datos agrupados:

_

S² = Σfi (xi - X )² o bien S² = 1 Σfi . xi ² - (Σfi . xi )² N N N _ También: S² = Σfixi ² - X ² N • DE SVIACIÓN TÍPICA: E s la raíz cuadrada de la varianza

ME DIDAS DE DISPE RSIÓN • COE FICIE NTE DE VARIACIÓN DE PE ARSON: E s la «desviación típica medida en unidades de media» y se mide en %; o lo que es lo mismo, indica el tanto por ciento de la media que representa la desviación típica. Así:

_

CV = S / X . 100 • RANGO, RE CORRIDO O AMPL ITUD: E s la diferencia entre los valores más grande y más pequeño de la distribución. • RANGO INTE RCUARTÍL ICO: E s la diferencia entre el tercer cuartil y el primero (Q3 – Q1).

Estadística

-Rango -Varianza -Desviación E stándar

ME DIDAS DE DISPE RSIÓN

Datos Cuantitativos

x x1 x2

Varianza Rango

R

max( xi ) min( xi ) s 2

n

n

( xi

x)

2

i 1

2 i

x i 1

n

 xn

Se refiere al comportamiento de las variables cuantitativas en un grupo. Por ejemplo: Si se tiene un conjunto de personas a las que se les mide E statura, Peso, E dad: E ntre estas variables ¿cuál presenta mayor variación?

1 n 2 xi x 2 ni1

Desviación Típica o E stándar

s Comparación entre Variables

1 n ( xi ) 2 n i1 n

s2

Coeficiente de Variación

cv

s x 35

E jemplo:

E n éste ejemplo se demuestra cómo se encuentran los valores mínimo y máximo y el rango de los siguientes datos: 29,31,24,29,30,25. 1.- Organice los datos de menor a mayor: 24,25,29,29,29,30,31; 2.- Identifique los valores mínimo y máximo: mínimo=24 y máximo=31 3.- Calcule el rango: rango = máximo - mínimo =31-24=7; entonces el rango es igual a 7.

RANGO INTE RCUARTÍL ICO: 1. Organice las observaciones en orden ascendente. Dados estos datos: 13, 7, 9, 15, 11, 5, 8, 4, hay que organizarlos así: 4, 5, 7, 8, 9, 11, 13, 15. 2. E ncuentre la posición del primer y el tercer cuartil. Dado que hay 8 observaciones, n = 8.

posición del primer cuartil (Q1) = (n + 1) / 4 = (8 + 1) / 4 = 2.25 posición del tercer cuartil (Q3) = 3(n + 1) / 4 = 3 x Q1

3(8 + 1) / 4 = 6.75 Así, se encuentra Q1 (1/4) de las observaciones entre 2 y 3 y Q3 (3/4) entre las observaciones entre 6 y 7.

3. Identifique el valor del primer y el tercer cuartil. Valor de Q1: L a posición de Q1 es 2 1/4; así, el valor de Q1 es el valor de la observación 2 más 1/4 de la diferencia entre los valores de

las observaciones 2 y 3. Valor de la observación 3 (ver paso 1) : 7 Valor de la observación 2: 5 Q1 = 5 + 1/4( 7-5 ) = 5 + 1/4(2) = 5 + 0,5 = 5.5

Valor de Q3: L a posición de Q1 es 6 3/4; así, el valor de Q3 es el valor de la observación 6 más 3/4 de la diferencia entre los valores de las observaciones 6 y 7.

Valor de la observación 7 (ver paso 1) : 13 Valor de la observación 6: 11 Q3 = 11 + 3/4( 13-11 ) = 11 + 3/4 (2) = 11 + 1.5 = 12.5

4. Calcule el rango intercuartílico como Q3 menos Q1. Q3 = 12,5 (ver paso 3) Q1 = 5,5 Rango intercuartílico = 12,5 - 5,5 = 7 • E n general, se usan los cuartiles y el rango intercuartílico para describir la variabilidad cuando se está usando la mediana como la medida de tendencia central. • Cuando se está usando la media aritmética, hay que usar la desviación típica.

VARIANZA y DE SV IACIÓN TIPICA • Si se resta la media aritmética de cada observación, la suma de las diferencias es cero. • E ste concepto de restar la media de cada observación es la base para dos medidas de dispersión: la varianza y la desviación típica o estándar. • Para estas medidas, hay que elevar al cuadrado las diferencias para eliminar los números negativos.

VARIANZA y DE SV IACIÓN TIPICA • Después, se suma el cuadrado de las diferencias y se divide por n-1 para encontrar la "media" de las diferencias al cuadrado. • E sta "media" es la VARIANZA • Para convertir la varianza a las unidades originales, hay que obtener la raíz cuadrada. Se denomina DE SVIACIÓN TIPICA Ó E STANDAR .

Valor menos la media

Diferencia

Diferencias al cuadrado

24-28

-4

16

25-28

-3

9

29-28

+1.0

1

29-28

+1.0

1

30-28

+2.0

4

31-28

+3.0

9

-7+7=0

40

168-168.0=0

Varianza = ∑ diferencias cuadráticas = 40 = 8 n-1 5 Desvío estándar= √8 = 2.83 • L a varianza y la desviación estándar son medidas de la desviación o dispersión de las observaciones alrededor de la media de la distribución. • L a varianza es la media de las diferencias cuadradas de las observaciones alrededor de la media. Se representa como "S 2 " en las fórmulas. • L a desviación estándar es la raíz cuadrada de la varianza; se representa con "s"

CUARTILES

PERCENTILES

Q1= n + 1 x 1 4

P(p)= n + 1 (p) 100

Q2= n + 1 x 2 4

P(25)=n + 1 (25) 100

RANGO

R = V M - Vm

S² = Σ(xi - X)² n -1

R / 6 = DS

δ² = Σ(xi - μ)² N

Q3= n + 1 x 3 4 COEFICIENTE DE VARIACIÓN

CV = S x 100 X

VARIANZA

DESV. STANDART

DS = √ S²

δ² = R / 4 AMPLITUD

A=R/K A = VM – Vm K

MEDIA

MEDIANA

X = Σ Xi / n

Me = n + 1 2 Me = n 2

MEDIDAS DE FRECUENCIA

TASA, RAZONES Y PROPORCIONES INCIDENCIA - PREVALENCIA

CÁLCULO DE PROPORCIONES, TASAS Y RAZONES La construcción de estas medidas se realiza por medio de operaciones aritméticas simples y de los instrumentos matemáticos conocidos como

razones, proporciones y tasas.

Proporciones Son medidas que expresan la frecuencia con la que ocurre un evento en relación con la población total en la cual éste puede ocurrir. Se calcula dividiendo el número de eventos ocurridos entre la población en la que ocurrieron.

P=

A A+B

Proporciones El resultado no puede ser mayor que la unidad y oscila siempre entre cero y uno.

A menudo las proporciones se expresan en forma de porcentaje, y en tal caso los resultados oscilan entre cero y 100. Las proporciones expresan únicamente la relación que existe entre el número de veces en las que se presenta un evento y el número total de ocasiones en las que se pudo presentar.

El denominador no incluye el tiempo.

• Proporción de hombres / Población total • Proporción de Viviendas positivas para Aedes / Total de viviendas inspeccionadas • Proporción de casos P. Vivax Dengue / Total de casos de Malaria • Proporción de casos vacunados contra ASA / Población programada

• Proporción de hombres: N° hombres/Pob.General • Proporción de Cá de mama: N° mujeres con Cá de mama/Pob. de MEF • Proporción de TB MDR : N° de enfermos con TB MDR/Total de

enfermos con TBC

Razones Las razones pueden definirse como magnitudes que expresan la

relación aritmética existente entre dos eventos en una misma población, o un solo evento en dos poblaciones.

Razón hombre/mujer =

A B

RAZONES • Forma más común de expresar la frecuencia de un evento.

• A /B • La naturaleza de cada una de estas dos cifras cambia según la medida de frecuencia ó de asociación específica, como ocurre en las proporciones,

los porcentajes, las tasas etc.. • En algunos casos el numerador esta incluido dentro del denominador (Ej: proporciones, porcentajes) en otras razones no.

• Muchas veces no tiene dimensiones Ej las proporciones • En otras corresponden a la adición algebraica de las dimensiones del numerador y del denominador

• Índice de peso talla= Kg/cm • Índice de masculinidad= N° hombres/N° mujeres • Índice de Femineidad = N° mujeres/N° hombres • Tasa de desocupación= Pob. desocupada/PEA

Tasas Expresan la dinámica de un suceso en una población a lo largo del tiempo. Se pueden definir como la magnitud del cambio de una variable

(enfermedad o muerte) por unidad de cambio de otra (usualmente el tiempo) en relación con el tamaño de la población que se encuentra en riesgo de experimentar el suceso.

El denominador de una tasa no expresa el número de sujetos en observación sino el tiempo durante el cual tales sujetos estuvieron en riesgo de sufrir el evento. La unidad de medida empleada se conoce como tiempo-persona de

seguimiento

Tasas Las unidades de tiempo pueden ser horas, días, meses o años,

dependiendo de la naturaleza del evento que se estudia.

Número de eventos ocurridos en una población en un periodo t

XF Sumatoria de los períodos durante los cuales los sujetos de la población libres del evento estuvieron expuestos al riesgo de presentarlo en el mismo período.

Algunas tasas • Tasa bruta de mortalidad = N° de defunciones / Población total • Tasa Bruta de natalidad = N° de RN vivos / Población total • Tasa Global de fecundidad= N° total de nacimientos/ Pob MEF

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF