Medidas de Dispersión

August 28, 2022 | Author: Anonymous | Category: N/A
Share Embed Donate


Short Description

Download Medidas de Dispersión...

Description

 

Introducción MAT--213 MAT -213 Estadística I Tema 5: Medidas de Dispersión

Las medidas de tendencia central son indicadores estadísticos que resumen con un solo valor el conjunto de datos u



observaciones estudiados. Sin embargo, no dan información sobre que tan homogénea es una población sobre una característica específica.

Facilitador:

Félix Rondón, MS 

Instituto Especializado de Estudios Superiores Loyola

Ejemplo

Ejemplo 70

70 60

La figura muestra dos distribuciones correspondientes a los pesos (kg) de dos poblaciones de cerdos.



60

Población 1 50

Población 2

45

40

      a        i       c       n       e      u       c       e      r        F

35

35

25

25

60 60



Población 1 50

Población 2

45 

40

      a        i       c       n       e      u       c       e      r        F

35

35

25

25

30

30 25

25

25

25

20

20 15

15

15 10

10

10

15 10

10

10

10

 Ambas distribuciones tienen Media, Mediana y Moda igual a 35. En la población 2, algunos cerdos tienen peso muy bajo (10kg) y otros pesos muy alto (60kg) 10

10

10 5

5

5

0

0

0

5

0

0

0

0

0

0

0 5

10

15

20

25

30

35

40

45

50

55

60

5

65

10

15

20

25

30

35

40

45

50

55

60

65

Pesos en Kilogramos

Pesos en Kilogramos

Ejemplo

Ejemplo 70

70 60 60

Los cerdos de la población 1 están menos distantes de su valor central que los de la población 2.



Población 1 50

Población 2

45

40

      a        i       c       n       e      u       c       e      r        F

35

35

60 60

Según esto, los cerdos de la distribución 1 son menos variables (más homogéneos) que los cerdos de la distribución 2.



Población 1 50

Población 2

45

40

      a        i       c       n       e      u       c       e      r        F

35

35

25

25

30

30 25

25

25

25

25

25

20

20 15

15

15 10

10

10

15 10

10

10

10

10

10

10 5

5

5

0

0

0

5

0

0

0

0

0

0

0 5

10

15

20

25

30

35

40

Pesos en Kilogramos

45

50

55

60

65

5

10

15

20

25

30

35

40

Pesos en Kilogramos

45

50

55

60

65

1  

Rango

Medidas de Dispersión



Son indicadores que miden la variación o dispersión de los datos con respecto a una medida de tendencia central o promedio. Complementan a las medidas de tendencia central y



muestran que tanto se alejan los datos del promedio. Las más usadas son:



    



El Rango La Desviación media La Varianza La Desviación Estándar o Típica El Coeficiente de Variación

Es el promedio de los valores absolutos de las desviaciones de un conjunto de datos con respecto a su media aritmética. aritmética. DM =

Valor o Marca de clase (Xi)

53 – 57 58 – 62 63 – 67 68 – 72 73 – 77 78 - 82

55 60 65 70 75 80





Desviación Media 

Categoría

∑  Xi − X N

=

Es la diferencia entre el valor más alto y el más bajo en un serie de datos. El rango de datos agrupados es la diferencia que hay entre el límite superior de la clase más alta y el límite inferior de la clase más baja. R= 82 – – 53 = 29

Desviación Media 



∑  x

La anterior es la Desviación Media para la población. Usualmente lo que se calcula es la DM de la muestra:

i

 N 

DM =

∑ X  − X

Xi = Observación N = Total de datos

 

i

n -1

=

∑  x

i

n −1

Xi = Observación N = Total de datos

Desviación Media

Desviación Media 

Ejemplo: ¿Cuál es la desviación media de los siguientes datos? 9, 4, 7, 5, 3.  X  =

9+ 4+ 7+5+3

DM = DM = DM =

5 9 − 5.6

+

=

5.6

4 − 5.6

+

− 1.6 +

1.4 +

7 − 5.6

+

5 − 5.6 + 3 − 5.6

− 0.6 + − 2.6

5 3.4 + 1.6 + 1.4 + 0.6 + 2.6 5

Para datos agrupados:

DM = 5

3.4 +



= 1.92

∑ Xi − X   f i N

=

∑ x i f i N

Xi = Marca o punto medio de cada clase. f i = Frecuencia de la cada clase N = Total de datos

2  

Desviación Media 

Desviación Media

La DM de la muestra para datos agrupados: X DM =



− X f  i

 

n -1

 



Ejemplo: sabiendo que el promedio es 62.67 Clase

x f  =

i

∑n -1 i

53 – 57 58 – 62 63 – 67 68 – 72 73 – 77 78 - 82

i

Xi = Marca o punto medio de cad a clase. f i = Frecuencia de la cada clase N = Total de datos

Mar ca (Xi)

Frec.( f)

55 60 65 70 75 80

8 9 6 4 2 1

|Xi-X|

|Xi-X|fi 

DM = 7.67 2.67 2.33 7.33 12.33 17.33

30

61.36 24.03 13.98 29.32 24.66 17.33

∑ X  i − X f i N

DM =

170.68 30

170.68

DM = 5.69

 Varianza

 Varianza 

Es el promedio de los cuadrados de las desviaciones de un conjunto de datos con respecto a su media aritmética. 2

2 σ  

=

 



2

2

∑ (X   − X ) =  ∑ (x ) i

i

N

2

S  =

N

Ejemplo: Hallar la varianza de los siguientes datos: 9, 4, 7, 5, 3.  X  =

2 σ  

2 σ  

2 σ  

=

=

=

9+ 4+ 7+5+3 5

(9 − 5.6)

2





=

5.6 2

2

2

+ ( 4 − 5.6) + (7 − 5.6) + (5 − 5.6) + (3 − 5.6)

2

5 (3.4)

2

2

2

5 23.2 5

2

+ (−1.6) + (1.4) + (−0.6) + ( −2. 6)

=

4.64

 

2

∑ (X   − X ) =  ∑ (x ) i

n -1

i

n -1

 Varianza

 Varianza 

En realidad lo que usualmente se calcula es la varianza de la muestra (S 2)

2



La varianza se da en unidades que son los cuadrados de los unidades originales. Para tener una medida de dispersión que esté expresada en las mismas unidades que las originales se hace necesario sacar la raíz cuadrada de la varianza. El indicador que se obtiene al sacar la raíz cuadrada de la varianza es la Desviación Estándar.

3  

Desviación Estándar  



Es la raíz cuadrada de la varianza. Es la medida de dispersión más utilizada en estadística.



La fórmula para calcular la desviación estándar de la muestra (S) es:

Su fórmula es: σ  

=

i −X



2

 

2

  ∑ (x i ) =

N

S  =

Para Datos Agrupados

∑ (Xi  − X) f i = ∑ ( x i ) f i =

2



n -1

N

Desviación Estándar:

∑ (X i − X)  f i N

∑ ( x i ) f i N

Ejemplo: sabiendo que el promedio es 62.67

55 60 65 70 75 80

8 9 6 4 2 1 30

2

n -1

Xi-X -7.67 -2.67 2.33 7.33 12.33 17.33

(Xi-X)2 58.83 7.13 5.43 53.73 152.03 300.33

(Xi-X)2f i 470.63 64.16 32.57 214.92 304.06 300.33 1,386.67

∑ (Xi − X)  f i 2

2

=

Para Datos Agrupados

Marc Frec.( a (Xi) f)

∑ ( x i ) f i =

Desviación Estándar de la muestra: 2

=

∑ (X i  − X) f i = 2

2

N

53 – 57 58 – 62 63 – 67 68 – 72 73 – 77 78 - 82

n -1

 Varianza de la muestra: 2

Clase

2

  ∑ (x i )

4.64  = 2.15

σ   =

 Varianza:

σ  

=

n -1

N

Para Datos Agrupados

2 σ  

 

∑ (X i − X ) 

2

∑ (X

En el ejemplo anterior, la desviación estándar es igual a:



Desviación Estándar

S  =

n -1

∑ ( x i ) f i 2

=

n -1

Para Datos Agrupados  Varianza: 2 σ  

=

1,386.67 30

=

46.22

Desviación Estándar: σ  

=

46.22  

=

6.80

4  

 Varianza y/o Desviación Estándar (Fórmula de Computación) 

Las fórmulas anteriores para varianza y desviación estándar tienen algún inconveniente en la práctica cuando se trabaja con muchos números o con decimales.

 Varianza y/o Desviación Estándar (Fórmula de Computación) 

En caso de una muestra:

2 

Para facilitar los cálculos, especialmente con el uso de calculadoras, se utiliza la siguiente fórmula:

2 σ  

∑ Xi

  − (∑ X i )

2

S  =

2

2

N

=

N

 Varianza y/o Desviación Estándar

 Varianza y/o Desviación Estándar (Fórmula de Computación)

(Fórmula de Computación)



2 i ∑ X i   − (∑nX ) n -1

Ejemplo: Hallar la varianza y la desviación estándar de los siguientes datos: 9, 4, 7, 5, 3.



Para datos agrupados:

2

∑ X i = 9 + 4 + 7 + 5 + 3 = 28 ∑ Xi

2

2

σ  

=

=

2

2

(28) 2 5

=

5 4.64

=

4.64

2

53 – 57 58 – 62 63 – 67 68 – 72 73 – 77 78 - 82

(∑ X i f i )

2

N

N

∑ Xi

2

  (∑ X if i ) f  − i

S  =

2

n

n -1

2.15

Ejemplo para datos agrupados. Clase

=

2

 Varianza y/o Desviación Estándar (Fórmula de Computación) 



= 9 + 4 + 7 + 5 + 3 = 180

180 − 2 σ  

2

2 σ  

 

∑ Xi f i

Xi2

 Varianza y/o Desviación Estándar (Fórmula de Computación) 

Xi f i

Para datos agrupados:

Xi2 f i

Marca (Xi)

Frec. (f)

55 60 65 70 75 80

8 9 6 4 2 1

3,025 3,600 4,225 4,900 5,625 6,400

440 540 390 280 150 80

24,200 32,400 25,350 19,600 11,250 6,400

30

27,775

1,880

119,200

119, 200 − 2 σ  

σ  

=

=

(1,880) 30

30 46.22

=

6.80

2

=

46.22

5  

Propiedades de la Desviación Estándar

Propiedades de la Desviación Estándar 

En estadística, se considera que una población tiene distribución normal cuando cumple con las siguientes condiciones: 





68.27% ⇒ X − σ ≤ X ≤ X + σ

68.27% de los datos están comprendidos a una desviación estándar de la media. 95.45% están comprendidos a dos desviaciones de la media. 99.73% están comprendidos a tres desviaciones de la media.

95.45% ⇒ X − 2σ ≤ X ≤ X + 2σ 99.73% ⇒ X − 3σ ≤ X ≤ X + 3σ

Propiedades de la Desviación

Propiedades de la Desviación

Estándar

45% 40%

Estándar



35% 30% 

25%

Tomemos como ejemplo los promedios de notas de 20%. Sabiendo que la media es 13.3 y la desviación estándar es 2.3.

20% 15% 10% 5% 0% 50515253545556 5758596061626364 65666768697071 72737475767778 798081828384858687 88

 x − σ    x − 2σ    x − 3σ  

 x

68.27% 95.45%

 

 x + σ  

k

X-kσ

X+kσ

n

%

1

11.0

15.5

23

62.2%

2

8.7

17.8

35

94.6%

3

6.5

20.0

37

100.0%

 x + 2σ    x + 3σ  

99.73%

Coeficiente de Variación o de Pearson 



Es una medida de dispersión útil para comparar dispersiones de dos o más variables expresadas en distintas escalas. Permite comparar 



la dispersión de una variable entre dos poblaciones distintas. La dispersión de dos variables diferentes dentro de una misma población.

Coeficiente de Variación (CV) o de Pearson 



El CV es la relación entre la desviación estándar y la media aritmética (promedio). Se expresa de la siguiente manera: CV  =

S   x

× 100

6  

Coeficiente de Variación (CV) o de Pearson

Coeficiente de Variación (CV) o de Pearson 

Ejemplo: Sabiendo que el promedio es 62.67 y la desviación estándar es 6.80, entonces: CV  =

6.80

× 100

62.67 CV  = 10.85%

Bibliografía 

Caballero, W (1985). Introducción a la San José: IICA. Rivera, N. (2007). Apuntes de estadística para el curso propedéutico de la maestría en administración de empresas [folleto]. Santo Domingo: UASD. Sp Spielgel Spie ielg lgel el (sf  (sf  sf). ). Estadística (2da ed ed). ). estadística.







 Algunas propiedades del CV:  



Típicamente menor que uno. Para su mejor interpretación se expresa como porcentaje. Cuando el promedio es 0 o muy próximo a este valor el C.V. pierde significado ya que puede dar valores muy grandes que no necesariamente implican dispersión de datos.

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF