Trabajo Colaborativo 2
Short Description
Descripción: Estadistica descriptiva paso 3 fase intermedia...
Description
UNIVERSIDAD NACIONAL ABIERTA Y DISTANCIA UNAD Escuela de ciencias básicas Tecnología e ingeniería
ESTADISTICA DESCRIPTIVA Código 100105
Presentado por ROBINSON FERNANDO ARDILA GARCES Código: 1095510992 RHONAL EDUARDO TORRES CAMPOS
Presentado a Tutor(a) FRANSISCO CABRERA DIAZ
Actividad PASO 3. (TRABAJO COLABORATIVO 2)
16 ABRIL DE 2017
INTRODUCCION La estadística se centra en el trabajo de estudio de datos, resultando fundamental para conocer el comportamiento de ciertos hechos la evolución de la estadística ha hecho que sea de gran importancia para el desarrollo y evolución en todos los aspectos de la vida humana. El curso de estadística descriptiva mediante la realización del trabajo colaborativo número dos tiene por estrategia el plantear un problema el cual se ha desarrollado mediante el estudio de las principales causas que han incidido en el crecimiento del conflicto armado armado, el cual lleva consigo una serie de variables que sirven como objeto de estudio del presente trabajo En este trabajo se aborda el estudio realizado por la Revista noche y niebla, y el Banco de derechos humanos, realizando el estudio en algunas zonas del país donde más se han presentado víctimas del conflicto armado. El estudio de este caso también permite identificar los elementos que se encuentran en la estadística, así como las medidas de tendencia central, entre las cuales podemos encontrar la media, mediana, moda, cuartiles, deciles y porcentiles. También encontramos las medidas universitarias de dispersión, así como; Asimetría, rango, varianza, desviación típica etc, las cuales nos ayudaran a comprender mas a fondo el propósito y la importancia de la estadística a la hora de realizar el estudio de un determinado caso.
JUSTIFICACION A lo largo de la historia los seres humanos necesitaron conocer y analizar ciertos hechos o eventos, que han permitido la evolución de la sociedad, dándole solución a ciertas problemáticas. La estadística se dedica a recolectar, organizar y analizar la información de un grupo de datos con el fin de extraer conclusiones sobre el comportamiento de ciertas variables. El conflicto armado en nuestro país ha sido una problemática constante desde hace mucho tiempo en nuestra sociedad, dejando un sin número de víctimas mortales y traumáticas, además de la generación de crisis en muchos sectores y sectores de nuestro país La falta de conciencia de los grupos fuertemente armados, la falta de búsqueda de soluciones viables a este conflicto, la corrupción y desigualdad de derechos en nuestro país, son factores que influyen al incremento de la problemática, y a llevarnos lejos de una posible solución. Para describir la situación y plantear posibles soluciones, el DANE realizo un estudio con información obtenida en 802 mujeres hombres y niños afectados por los constantes ataques e imprudencias de los grupos armados en el trascurso de tiempo del 2005 al 2012, cuyo estudio nos permitirá conocer más sobre la estadística y su funcionamiento en general. OBJETIVOS
Objetivo general:
Generar situaciones que confronten los conocimientos previos del estudiante con los nuevos significados o conceptos que construyan un trabajo colaborativo.
Objetivos específicos:
Plantear un esquema de trabajo que permita trabajar en grupo equitativamente para la solución del problema.
Realizar el análisis de la información que permita desarrollar la guía de actividades. Comprender los conceptos básicos para desarrollar el análisis estadístico de los impactos del conflicto armado. Comprender y analizar la información detalladamente para lograr desarrollar los problemas propuestos
1. MEDIDAS UNIVARIANTES DE TENDENCIA CENTRAL Identificar las variables discretas dentro del problema de estudio y calcular las medidas univariantes de tendencia central más adecuadas, a aquellas que consideren sean relevantes para el problema de estudio.
CLASIFICACION Variables cuantitativas
VARIABLE víctimas de asesinatos selectivos,
(discreta).
victimas mortales en masacres, secuestrados, civiles muertos en acciones bélicas, combatientes muertos en acciones bélicas, muertos en atentados terroristas, lesionados en atentados terroristas, minas anti persona, efectivos de fuerza pública disponibles Colombia, gasto en defensa y seguridad Colombia, gasto en defensa y seguridad Colombia per cápita.
víctimas de asesinatos selectivos 1,770833 Media 333 Mediana 1,00 Moda 0
victimas mortales en masacres 0,229166 Media 667 Mediana 0,00 Moda 0 secuestrados Media Mediana Moda
5,041666 667 4,00 2
civiles muertos en acciones bélicas 0,291666 Media 667 Mediana 0,00 Moda 0 Combatientes muertos en acciones bélicas 0,083333 Media 333 Mediana 0,00 Moda 0 muertos en atentados terroristas 0,135416 Media 667 Mediana 0,00 Moda 0
lesionados en atentados terroristas Media 0,8125 Mediana 0,00 Moda 0
1.1 Elegir una variable discreta que sea representativa y elaborar una tabla de frecuencias para datos no agrupados, representarla gráficamente, calcular las medidas de tendencia central: media, mediana, moda, los cuartiles, deciles 5 y 7 ; percentiles 30 , 50 e interpretar sus resultados. Variable discreta: Secuestrados
SECUESTRAD Frecuenc OS ia 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 TOTAL
1 10 21 9 8 7 8 7 9 6 4 1 3 1 0 1 96
Frecuencia Acumulada
Frecuenci a Relativa
1 11 32 41 49 56 64 71 80 86 90 91 94 95 95 96
0,010 0,104 0,219 0,094 0,083 0,073 0,083 0,073 0,094 0,063 0,042 0,010 0,031 0,010 0,000 0,010
Frecuencia relativa acumulada 0,01042 0,11458 0,33333 0,42708 0,51042 0,58333 0,66667 0,73958 0,83333 0,89583 0,93750 0,94792 0,97917 0,98958 0,98958 1
REPRESENTACION GRAFICA
Total SECUESTRADOS 25 20 Total
15 10 5 0
0
1
2
3
4
5
6
7
8
9
10
11
MEDIA ARITMÉTICA ´x =
0∗1+1∗10+2∗21+3∗9+ 4∗8+5∗7+6∗8+ 7∗7 +8∗9 96
9∗6+ 10∗4+11∗1+12∗3+13∗1+14∗0+ 15 =5.041 96
´x ≈ 5
POR LO QUE la media de secuestros es 5
MEDIANA n 96 L= = =48→ entero 2 2 Dato 4
Posición 48
4
M e=
49 4+ 4 =4 2
12
13
14
15
Se puede concluir que la mediana es 4. MODA La moda se trata del valor más frecuente en un conjunto de datos. Por tanto la moda en este caso es 2 ya que es el dato más repetido en la muestra. CUARTILES Primer cuartil. n 96 L= = =24 → entero 4 4 De acuerdo a los datos anteriores, se busca en los datos ordenados el dato número 24 Dato 2 2
Posición 24 25
Luego Q1=0 Segundo cuartil. El segundo cuartil es la misma mediana: M e =4=Q2 Tercer cuartil L=
3∗n 3∗96 = =72→ entero 4 4
Se busca en los datos ordenados el dato número 90 Dato 8 8
Posición 72 73
Luego Q 3=
8+8 =8 2
DECILES Quinto decil L=
5 n 5∗96 = =48 → entero 10 10
Datos del centro 4 4
Posició n 48 49
El quinto decil es la misma mediana: M e =D5=
4 +4 =4 2
Séptimo decil L=
7 n 7∗96 = =67 → impar 10 10
Datos 7 7
D 7=
Posició n 67 68
7+7 =7 2
PERCENTILES Percentil treinta L=
30∗n 30∗96 = =28→ entero 100 100
Datos 2 2 P30=
Posició n 28 29
2+ 2 =2 2
Percentil cincuenta L=
50∗n 50∗96 = =48 100 100
Dato 4 4
Posición 48 49
El percentil 50 es la misma mediana: M e =P5=
4+ 4 =4 2
1.2 Elegir una variable Continua que sea representativa y siguiendo los lineamientos, diseñar una tabla de frecuencia para datos agrupados, representarla gráficamente por medio de un histograma de frecuencias, un polígono de frecuencias, calcular las medidas de tendencia central, determinar el tipo de asimetría, los cuartiles, deciles 5 y 7 ; percentiles 25, 50 ( Interpretar sus resultados). Variable continua: Efectivo por km2 en Colombia 1.3 Tabla de frecuencias CLASE 1 2 3 4 5 6 7 8
LIM If 0,159 0,165 0,171 0,178 0,184 0,190 0,197 0,203
L sup 0,165 0,171 0,178 0,184 0,190 0,197 0,203 0,209
mi 0,162 0,168 0,174 0,181 0,187 0,193 0,200 0,206
1.4 Histograma de frecuencias
Ni 14 12 11 12 14 14 9 10
Ni 14 26 37 49 63 77 86 96
fi 0,146 0,125 0,115 0,125 0,146 0,146 0,094 0,104
Fi 0,146 0,271 0,385 0,510 0,656 0,802 0,896 1,000
Histograma de frecuencias 0.160 0.140 0.120 0.100 0.080 0.060 0.040 0.020 0.000
0,162
0,168
0,174
0,181
0,187
0,193
0,200
0,206
1.5 Polígono de frecuencias
Polígono de frecuencias 0.160 0.140 0.120 0.100 0.080 0.060 0.040 0.020 0.000
0,162
0,168
0,174
0,181
0,187
0,193
0,200
0,206
1.6 Tipo de Asimetría As=
δ −MO 0,18−0,19 = =−0,71 S 0,014
Como podemos ver esta variable presenta una asimetría negativa, ya que la media es menor que la moda y por lo tanto la columna en la tabla de datos se inclina hacia la izquierda.
MEDIA MEDIANA MODA
0,1827 0,1828 0,19
Cuartiles CUARTIL Q1 Q2 Q3 Q4
POSICION 24 48 72 96
VALOR 0,170 0,183 0,195 0,209
Deciles DECIL
POSICION
VALOR
5
48
0,183
7
67
0,192
POSICION 24 48
VALOR 0,170 0,183
Porcentiles PORCENTIL 25 50
Paso 2. MEDIDAS UNIVARIANTES DE DISPERSION. -Identificar las variables discretas dentro del problema de estudio y calcular las medidas invariantes de dispersión más adecuadas, a aquellas que consideren sean relevantes para el problema de estudio. 2.1 Variables discretas Victimas de asesinato selectivo Victimas mortales en masacres Secuestrados Civiles muertos en acciones bélicas Combatientes muertos en acciones bélicas
Muertos en atentados terroristas Lesionados en atentados terroristas Minas antipersona
Variable discreta (Victimas de asesinato selectivo) n x min x Max Rango NC Amplit ud
96 0 8 8 8 1
2.2 Tabla de frecuencias Clase
L inf 1 2 3 4 5 6 7 8
L sup 0 1 2 3 4 5 6 7
mi 1 2 3 4 5 6 7 8
2.3 Histograma de frecuencia
ni 0,5 1,5 2,5 3,5 4,5 5,5 6,5 7,5
Ni 55 13 11 7 4 2 2 2
fi 55 68 79 86 90 92 94 96
Fi 0,573 0,135 0,115 0,073 0,042 0,021 0,021 0,021
0,573 0,708 0,823 0,896 0,938 0,958 0,979 1,000
Histograma 0.600 0.500 0.400 % DE FRECUENCIA
0.300 0.200 0.100 0.000
0.5
1.5
2.5
3.5
4.5
5.5
6.5
marca de clase (vic, acesinato selectivo)
2.4 Aplicación de medidas de dispersión
MEDIA=
X 1+ X 2+ X 3+ X 4+ X 5+ X 6 … … N Datos
MEDIA=
2+1+2+3+ 0+2 … =1,77 96
MEDIANA=1 MODA=0
es el valor que más se repite
CUARTILES CUARTIL Q1 Q2 Q3 Q4
POSICION 24 48 72 96
VALOR 0 1 3 8
De acuerdo a la representación de datos significa que: 0 = 25% de los datos
7.5
1 = 50% de los datos 3 = 75% de los datos 8 = 100% de los datos. PORCENTILES 25, 50 Y 75 PORCENTIL 25 50 75
POSICION 24 48 72
VALOR 0 1 3
POSICION 29 48 67
VALOR 0 1 2
DECILES 3, 5 Y 7 DECIL 3 5 7
Variable (secuestrados) MEDIA=
X 1+ X 2+ X 3+ X 4+ X 5+ X 6 … … N Datos
MEDIA=
11+ 7+2+3+3+1 … =4,93 96
MEDIANA=4 MODA=2
es el valor que más se repite
CUARTILES CUARTIL Q1 Q2 Q3 Q4
POSICION 24 48 72 96
VALOR 2 4 8 15
De acuerdo a la representación de datos significa que:
2 = 25% de los datos 4 = 50% de los datos 8 = 75% de los datos 15 = 100% de los datos. PORCENTILES 25, 50 Y 75 PORCENTIL 25 50 75
POSICION 24 48 72
VALOR 2 4 8
POSICION 29 48 67
VALOR 2 4 7
DECILES 3, 5 Y 7 DECIL 3 5 7
2.5 Con la variable Discreta elegida calcular: rango, varianza, desviación típica y coeficiente de variación. Interpretar los resultados obtenidos y asociarlos con el problema objeto de estudio. Variable discreta (Victimas de asesinato selectivo) Para realizar los cálculos debemos contar con los siguientes insumos; n x Min x Max Amplit ud
96 0 8 1
Rango R=x Max−x Min R=8−0 R=8
Varianza. 2
S 2=
∑ ( x−x ) ∑ ( xi−x 1, xi−x 2, xi−x 3, xi−x 4 … . ) = n−1 96−1
S 2=
∑ ( 0−1,77,1−1,77, 0−1,77,3−1,77 … . ) 96−1
2
S=
2
2
380,96 95
S 2=4,01
Desviación típica S= √ S2 S= √ 4,01 S=0,02 Coeficiente de variación. 2
V=
S 4,01 = mediana 1
V =4,01 Con los cálculos realizados anteriormente podemos ver que en la variable discreta (victimas de asesinato selectivo) el rango es alto, lo cual quiere decir que los porcentajes de asesinatos selectivos son bastante dispersos, en tiempos se frecuenta más que en otros, así como también nos lo muestra la varianza, ya que por medio de ella también podemos ver la dispersión en un conjunto de datos. Variable discreta (Minas antipersona) MINAS ANTI PERSONA DISCRETA 1
-11,7657335
2
1
-11,7657335
2
10,76573 35 -
4 4
8,765733 51 -
1 1 1 1 1 1 1 1 1 1 1 2 2 2
MINAS ANTI PERSONA 10,76573 35 -11,7657335 2 10,76573 35 -11,7657335 2 10,76573 35 -11,7657335 2 10,76573 35 -11,7657335 2 10,76573 35 -11,7657335 2 10,76573 35 -11,7657335 2 10,76573 35 -11,7657335 2 10,76573 35 -11,7657335 2 10,76573 35 -11,7657335 3 9,765733 51 -11,7657335 3 9,765733 51 -11,7657335 3 9,765733 51 -10,7657335 3 9,765733 51 -10,7657335 3 9,765733 51 -10,7657335 3 9,765733 51
4 4 4 4 4 4 4 4 4 4 4 4 5 5
8,765733 51 8,765733 51 8,765733 51 8,765733 51 8,765733 51 8,765733 51 8,765733 51 8,765733 51 8,765733 51 8,765733 51 8,765733 51 8,765733 51 8,765733 51 7,765733 51 7,765733 51
MINAS ANTI PERSONA 2
-10,7657335
3
2
-10,7657335
3
2
-10,7657335
3
2
-10,7657335
3
2
-10,7657335
3
2
-10,7657335
3
2
-10,7657335
3
2
-10,7657335
3
2
-10,7657335
3
2
-10,7657335
3
2
-10,7657335
3
2
-10,7657335
3
2
-10,7657335
4
2
-10,7657335
4
2
-10,7657335
4
9,765733 51 9,765733 51 9,765733 51 9,765733 51 9,765733 51 9,765733 51 9,765733 51 9,765733 51 9,765733 51 9,765733 51 9,765733 51 9,765733 51 8,765733 51 8,765733 51 8,765733
5 5 5 6 6 6 7 7 8 8 9 9 11 14 15
7,765733 51 7,765733 51 7,765733 51 6,765733 51 6,765733 51 6,765733 51 5,765733 51 5,765733 51 4,765733 51 4,765733 51 3,765733 51 3,765733 51 1,765733 51 1,234266 49 2,234266 49
MINAS ANTI PERSONA
2
-10,7657335
4
51 8,765733 51
15
2,234266 49
Rango=14 Media=3,572916667 Varianza=-9,27905702 Desviación estandar=3,046154464 Coeficiente de variación=85% Teniendo en cuenta lo interpretado por las medidas de dispersión realizadas, podemos concluir que, no hay una diferencia significativa entre los 96 secuestros realizados durante el periodo 2002-2015, sumando que el número de secuestros provienen de una distribución homogénea, por esta razón el promedio de 3,5 secuestros por año es representativo.
2.6 Con la variable Continua elegida calcular: rango, varianza, desviación típica y coeficiente de variación. Interpretar los resultados obtenidos y asociarlos con el problema objeto de estudio. Variable continua (gastos en defensa y seguridad en Colombia percapita) Rango R=x Max−x Min R=41679−21432 R=20247
Varianza.
2
2
S 2=
∑ ( x−x ) ∑ ( xi−x 1, xi−x 2, xi−x 3, xi−x 4 … . ) = n−1 96−1
S 2=
∑ ( 22407−32516, 22419−32516,22318−32516,22888−32516 … . )2 96−1
2
S=
4171533690 95
S 2=43910880,9
Desviación típica S= √ S2 S= √ 43910880,9 S=6626,5
Coeficiente de variación. V=
S2 43910880,9 = mediana 34653
V =126716
0,158613 0,159608 0,160127 0,160328 0,16043 0,161255 0,161735 0,162107 0,162435 0,163243
efectivos por km cuadrado Colombia CONTINUA 0,12522693 0,174506 0,14111989 0,190995 0,12622141 0,174559 0,14117248 0,191204 0,12674072 0,175482 0,14209559 0,191963 0,12694215 0,175623 0,14223645 0,192308 0,12704404 0,177478 0,14409207 0,192894 0,12786902 0,177848 0,1444616 0,193708 0,12834889 0,178115 0,1447283 0,193954 0,12872077 0,178157 0,14477102 0,194423 0,12904851 0,178272 0,14488559 0,194972 0,12985705 0,179741 0,14635431 0,195072
0,15760869 0,15781811 0,15857688 0,15892152 0,15950751 0,16032216 0,16056773 0,1610368 0,16158616 0,16168617
0,163645 0,164025 0,164568 0,164869 0,165358 0,167006 0,167679 0,167725 0,16791 0,16811 0,168265 0,168289 0,16831 0,16951 0,170499 0,170719 0,172729 0,172857 0,172966 0,17357 0,173598 0,174457
efectivos por km 0,13025851 0,180537 0,13063883 0,181073 0,13118162 0,181197 0,1314826 0,18154 0,13197186 0,181712 0,13361994 0,181818 0,13429232 0,183784 0,13433927 0,184053 0,1345238 0,184574 0,13472429 0,185124 0,13487924 0,185805 0,13490319 0,187014 0,13492385 0,187041 0,13612352 0,187189 0,13711237 0,187578 0,13733305 0,187582 0,13934268 0,187588 0,1394704 0,18808 0,1395798 0,189521 0,1401841 0,189659 0,14021133 0,190115 0,14107059 0,190556
cuadrado Colombia 0,14715065 0,195327 0,14768686 0,195413 0,14781082 0,19564 0,14815358 0,196909 0,14832543 0,196982 0,14843155 0,197028 0,15039798 0,197409 0,15066656 0,198061 0,15118821 0,198082 0,15173758 0,198427 0,15241841 0,198995 0,15362794 0,201336 0,15365517 0,203259 0,15380261 0,203993 0,15419139 0,20469 0,15419561 0,205069 0,15420219 0,205261 0,15469332 0,206883 0,15613481 0,206901 0,15627238 0,207065 0,15672925 0,208118 0,15717014 0,20921
0,16194066 0,16202706 0,16225384 0,16352254 0,16359626 0,16364227 0,16402307 0,16467432 0,16469545 0,16504103 0,16560917 0,16795029 0,16987258 0,17060647 0,17130421 0,17168266 0,1718747 0,17349649 0,1735148 0,17367914 0,17473184 0,17582399
Rango=0,050597066 Media=0,182718923 Varianza=0,15090464 Desviación Estandar=0,38846447 Coeficiente de variación=213% Teniendo en cuenta las medidas de dispersión realizadas, se concluye qué, no hay una diferencia tan significativa en los efectivos realizados por km2 por año en Antioquia 2002-2015, al fin y al cabo el número de efectivos por km2 vienen de un distribución donde no hay diferencias
significativas, de ahí que, el promedio de 0,182718923 de efectivos por km2 sea representativo.
CONCLUCIONES
La Estadística es una ciencia matemática que se utiliza para describir, analizar e interpretar ciertas características de un conjunto de individuos llamado población. Cuando nos referimos a muestra y población hablamos de conceptos relativos pero estrechamente ligados. Una población es un todo y una muestra es una fracción o segmento de ese todo.
Con la realización de este trabajo se logró comprender y aplicar satisfactoriamente las medidas de tendencia central y las medidas u univariantes de dispersión. Estas se presentan como medidas muy significativas en los problemas estadísticos ya que por medio de ellas logramos calcular las diferentes cantidades, porcentajes y desviaciones que tiene una serie de datos, y hacerlos más comprensivos a la hora de entrar en análisis.
BIBLIOGRAFIA Montero, J. M. (2007). Conceptos Generales Estadística descriptiva. Madrid: Paraninfo. Página 3 - 16 Recuperado de : http://go.galegroup.com/ps/i.do?id=GALE %7CCX4052100007&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=0a73 32df0d4700de0bd272caa41e1718 Ortegón, P. M. (2013). Universidad Unad. Ibagué. Medidas Univariantes de dispersión y apuntamiento. Recuperado de: http://www.unadzsurlab.com/ovas_ibague/medidas_univariantes/pag4.ht m
Montero, J. M. (2007). Características de Una Distribución de Frecuencias. Statistical Descriptive. Cengage Learning Paraninfo, S.A. Página 4 – 10 Recuperado de: http://go.galegroup.com/ps/i.do?id=GALE %7CCX4052900008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=84a8 4913a25d9dfd21d0a0d3deb41dea universidad nacional abierta y a distancia – unad escuela de ciencias básicas, tecnología e ingeniería disponible en línea: http://datateca.unad.edu.co/contenidos/401533/20141/modulo2014/lecci n_2_anlisis_univariado.html estadística 1; administración de empresas; análisis de datos univariados http://halweb.uc3m.es/esp/personal/personas/aarribas/esp/docs/esti_gra do/estig_tema1.pdf
View more...
Comments