Guia Indice de Gini y Curva de Lorenz
Short Description
Download Guia Indice de Gini y Curva de Lorenz...
Description
CATEDRA DE ESTADÍSTICA SOCIAL I - TEÓRICOS. UDELAR - FCS.
Curva de Lorenz e Indice de Gini Curva de Lorenz La curva de Lorenz es útil para demostrar la diferencia entre dos distribuciones: por ejemplo quantiles de población contra quantiles de ingresos. También es útil para comparar una distribución con relación a alguna distribución base (referencia), por ejemplo observado contra frecuencias esperadas.
Ejemplo Grupo Los mas ricos
Los mas pobres
1 2 3 4 5 6 7 8 9 10
POBLACION Porcentaj Porcentaje e (decil) Acumulado 10 10 10 20 10 30 10 40 10 50 10 60 10 70 10 80 10 90 10 100
INGRESO Porcentaj Porcentaje e Acumulado 30 30 20 50 10 60 10 70 10 80 5 85 5 90 4 94 3 97 3 100 Source: Griffith & Amrhein
Gráfico de los Datos de la Tabla Source: Griffith and Amrhein
1
CATEDRA DE ESTADÍSTICA SOCIAL I - TEÓRICOS. UDELAR - FCS.
Interpretación de la Diagonal Cuándo la proporción de observaciones en cada quartil para la distribución 1 es igual a la proporción de observaciones en cada quartil para la distribución 2, los valores trazan una línea recta que forma una diagonal (por ejemplo. % población). Es decir, las distribuciones son proporcionalmente iguales.
Interpretación de la Curva de Lorenz La curva de Lorenz es el resultado de cuando las proporciones difieren. El grado de la curvatura nos dice cuan diferentes las dos distribuciones son. El grado de la diferencia se puede medir directamente del gráfico: es la distancia vertical entre la diagonal y la curva de Lorenz.
Como Crear la Curva Lorenz 1. 2. 3. 4.
Calcule la frecuencia relativa para cada variable - es decir el porcentaje del total. Sitúe las observaciones de acuerdo a la proporción de las variables - es decir Y/X. Construya una tabla de frecuencias acumuladas para cada variable de las observaciones clasificadas. Trace las frecuencias relativas acumulativas y la diagonal.
Otro Ejemplo Empleo de las Herramientas Maquinarias vs. Industria Automovilística
Datos Originales X Region A 30 Region B 20 Region C 10 Region D 10 Region E 20 Region F 30
Y 30 15 8 5 19 23
Procedimiento para la Curva de Lorenz
D B F C E A
1. Rank by Ratio Y/X 0.50 0.75 0.77 0.80 0.95 1.00
2. Conversión a Porcentajes X% Y% 8.30 5.00 16.70 15.00 25.00 23.00 8.30 8.00 16.70 19.00 25.00 30.00
3. Acumulado Cx Cy 8.3 5 25 20 50 43 58 51 75 70 100 100
2
CATEDRA DE ESTADÍSTICA SOCIAL I - TEÓRICOS. UDELAR - FCS.
Rango de la Curva de Lorenz En el caso más extremo, el 100 por ciento de la primera distribución se asocia con el 0 por ciento de la segunda distribución. Es decir, cuándo una variable es presente la otra está ausente. En este caso la curva de Lorenz sigue el eje X hacia la derecha del gráfico, es decir, tomando la forma de un triángulo. El rango se encuentra entre 0% y 100%
El Coeficiente o Indice de Gini El Coeficiente de Gini es una medida de resumen que captura la desviación mostrada en la curva de Lorenz. Se aplica a: VARIABLES QUE SIGNIFICAN UN RECURSO QUE SE DISTRIBUYE ENTRE UNOS ELEMENTOS EJEMPLOS DE VARIABLES RENTA PRODUCCIÓN SALARIO HERENCIA
Uso: MEDIR SI LA DISTRIBUCIÓN TOTAL DEL RECURSO ENTRE LOS ELEMENTOS ES EQUITATIVA O NO Será equitativa si se reparte de forma equilibrada entre todos los elementos No será equitativa cuando unos pocos elementos acaparen la mayor parte del recurso
Compara: LAS PROPORCIONES DE RECURSO REPARTIDAS HASTA UNA CANTIDAD (Qi) CON LAS PROPORCIONES DE INDIVIDUOS QUE SE LO HAN REPARTIDO HASTA ESA CANTIDAD (Pi)
Obtención de Qi y Pi Las medidas de forma permiten conocer que forma tiene la curva que representa la serie de datos de la muestra. En concreto, podemos estudiar las siguientes características de la curva:
3
CATEDRA DE ESTADÍSTICA SOCIAL I - TEÓRICOS. UDELAR - FCS.
a) Concentración: mide si los valores de la variable están más o menos uniformemente repartidos a lo largo de la muestra. b) Asimetría: mide si la curva tiene una forma simétrica, es decir, si respecto al centro de la misma (centro de simetría) los segmentos de curva que quedan a derecha e izquierda son similares. c) Curtosis: mide si los valores de la distribución están más o menos concentrados alrededor de los valores medios de la muestra. a) Concentración Para medir el nivel de concentración de una distribucón de frecuencia se pueden utilizar distintos indicadores, entre ellos el Indice de Gini. Este índice se calcula aplicando la siguiente fórmula: Σ (pi - qi) IG =
---------------------------Σ
pi
(i toma valores entre 1 y n-1)
En donde pi mide el porcentaje de individuos de la muestra que presentan un valor igual o inferior al de xi. n1 + n2 + n3 + ... + ni pi =
----------------------------
x 100
n Mientras que qi se calcula aplicando la siguiente fórmula: (X1*n1) + (X2*n2) + ... + (Xi*ni)
qi = ----------------------------------------------------- x 100 ∑(X1*n1) + (X2*n2) + ... + (Xn*nn)
El Índice Gini (IG) puede tomar valores entre 0 y 1: IG = 0: concentración mínima. La muestra está uniformemente repartida a lo largo de todo su rango. IG = 1: concentración máxima. Un sólo valor de la muestra acumula el 100% de los resultados.
Interpretación El coeficiente de Gini a menudo es referido como un índice de desigualdad dado que mide el grado de asociación entre dos variables: • Coeficiente de variables de asociación geográfica. • Coeficiente de mercadotecnia • Concentración de la Población • Coeficiente del área de localización • Segregación Residencial • Tendencia del Genero en el Empleo 4
CATEDRA DE ESTADÍSTICA SOCIAL I - TEÓRICOS. UDELAR - FCS.
Limitaciones del Coeficiente de Gini • • • •
Debe ser capaz de expresar los datos como una frecuencia. No puede tener los valores negativos de los datos. No pueden estudiar las variables espaciales continuas - es decir, usted necesita las categorías. El valor de G depende de la distribución base (por ejemplo. Área). Como la base aumenta el valor de G (Gini) desde el cero. • Definición delas fronteras espaciales: Se superpone (sensible a la definición de la frontera), el nuevo arreglo (insensible a la distribución entre áreas).
Trazo de la Probabilidad Normal Prueba de la normalidad: El trazo o ploteo observó la probabilidad acumulada contra la probabilidad acumulada esperada (derivada de la tabla normal).
En Resumen: El coeficiente Gini data de 1912, y mide el grado en que la distribución del ingreso se desvia de una distribución proporcional (igualitaria aunque algunos autores dicen equitativa).
5
CATEDRA DE ESTADÍSTICA SOCIAL I - TEÓRICOS. UDELAR - FCS.
Se basa en la curva de Lorenz. En el semieje de las abscisas se indica la población en percentiles o quintiles o porcentajes (desde los mas pobres a los mas ricos). En el semieje positivo de las ordenadas se colocan los porcentajes de la renta de 0 a 100, en fracciones de 20. Si marcamos con un punto la relación población - ingreso, obtenemos la curva de Lorenz. Una distribución igualitaria seria: al 20% de la población le corresponde el 20% del ingreso, al 40% el 40% de los ingresos. Lo cual daría una recta con pendiente de 45 grados. En la realidad se obtiene una curva cuya concavidad mira hacia el semieje positivo de las ordenadas (el segmento de la torta que le corresponde a los ricos es proporcionalmente mas grande). El coeficiente de Gini indica la relación entre el área bajo la curva teórica (un triangulo) y el área bajo la curva de Lorenz. Va entre 0 y 1, valores teóricos. El valor 0 correspondería a una distribución igualitaria y el 1 a una distribución en la situación de desigualdad absoluta (el hogar mas rico se lleva todo y el resto nada). Ejemplo: vamos a calcular el Índice Gini de una serie de datos con los sueldos de los empleados de una empresa (millones pesetas). Sueldos (Miles de Pesos)
Empleados (Frecuencias absolutas) Simple Acumulada
Frecuencias relativas Simple Acumulada
3,5
10
10
25,0%
25,0%
4,5 6,0
12 8
22 30
30,0% 20,0%
55,0% 75,0%
8,0
5
35
12,5%
87,5%
10,0 15,0 20,0
3 1 1
38 39 40
7,5% 2,5% 2,5%
95,0% 97,5% 100,0%
Calculamos los valores que necesitamos para aplicar la fórmula del Índice de Gini: Xi
ni
Σ ni
pi
Σ Xi * ni
qi
pi - qi
3,5
10
10
25,0
35,0
35,0
14,1
10,9
4,5
12
22
55,0
54,0
89,0
36,0
19,0
6,0
8
30
75,0
48,0
137,0
55,4
19,6
8,0
5
35
87,5
40,0
177,0
71,6
15,9
10,0 15,0
3 1
38 39
95,0 97,5
30,0 15,0
207,0 222,0
83,8 89,8
11,2 7,7
25,0
1
40
100,0
25,0
247,0
100,0
0
435,0
x
Σ pi (entre 1 y n-1) =
Xi *
ni
Σ (pi - qi) (entre 1 y n-1 ) =
84,3
Por lo tanto: IG = 84,3 / 435,0 = 0,19
Un Índice Gini de 0,19 indica que la muestra está bastante uniformemente repartida, es decir, su nivel de concentración no es excesivamente alto. Ejemplo: Ahora vamos a analizar nuevamente la muestra anterior, pero considerando que hay más personal de la empresa que cobra el sueldo máximo, lo que conlleva mayor concentración de renta en unas pocas personas.
6
CATEDRA DE ESTADÍSTICA SOCIAL I - TEÓRICOS. UDELAR - FCS. Sueldos (Miles de Pesos)
Empleados (Frecuencias absolutas) Simple Acumulada
Frecuencias relativas Simple Acumulada
3,5
10
10
25,0%
25,0%
4,5 6,0
10 8
20 28
25,0% 20,0%
50,0% 70,0%
8,0
5
33
12,5%
82,5%
10,0 15,0 20,0
3 0 4
36 36 40
7,5% 0,0% 10,0%
90,0% 90,0% 100,0%
En este caso obtendríamos los siguientes datos: Xi
ni
Σ ni
pi
Σ Xi * ni
qi
pi - qi
3,5
10
10
25,0
35
35
11,7
13,26
4,5
10
20
50,0
45
80
26,8
23,15
6,0
8
28
70,0
48
128
43,0
27,05
8,0
5
33
82,5
40
168
56,4
26,12
10,0 15,0 25,0
3 0 4
36 36 40
90,0 90,0 100,0
30 0 100
198 198 298
66,4 66,4 100,0
23,56 23,56 0,00
407,5
x
Σ pi (entre 1 y n-1) =
Xi *
ni
Σ (pi - qi) (entre 1 y n-1 ) =
136,69
El Índice Gini sería: IG = 136,69 / 407,5 = 0,34
El Índice Gini se ha elevado considerablemente, reflejando la mayor concentración de rentas que hemos comentado. A continuación un ejemplo para Datos Agrupados: Frecuencia Li-1 - Li 0 - 50 50 - 100 100 - 150 150 - 200 200 - 250 250 - 300 300 - 350 350 - 400 400 - 450 450 - 500
marca xi 25 75 125 175 225 275 325 375 425 475
ni 23 72 62 48 19 8 14 7 5 2 260
Ni 23 95 157 205 224 232 246 253 258 260
xini
ui
qi = (ui/un) 100
pi = (Ni/n) 100
pi - qi
575 5400 7750 8400 4275 2200 4550 2625 2125 950
575 5975 13725 22125 26400 28600 33150 35775 37900 38850
1,48 15,38 35,33 56,95 67,95 73,62 85,33 92,08 97,55 100,00
8,85 36,54 60,38 78,85 86,15 89,23 94,62 97,31 99,23 100,00
7,37 21,16 25,06 21,90 18,20 15,61 9,29 5,22 1,68 0,00
Σ pi= 651,15
Σ (pi - qi)= 125,48
Σ xini= un= 38850
El Índice Gini sería: IG = 125,48 / 651,15 = 0,19
7
View more...
Comments