Paso 3– Análisis de La Información.

March 19, 2018 | Author: MiguelBotero | Category: Statistical Dispersion, Quantile, Standard Deviation, Statistics, Descriptive Statistics
Share Embed Donate


Short Description

Descripción: Estadística Descriptiva UNAD...

Description

1

Paso 3– Análisis de la Información.

Tutor: Astrid Segura

Luis Miguel Botero Vélez Christian Alexander Rebellon Brayan Armando Sanchez

Universidad Abierta y a Distancia (UNAD) Ingeniería de Sistemas Estadística Descriptiva Bogotá

2 Introducción En este trabajo propuesto por la UNAD, específicamente por el curso Estadística Descriptiva, nos establece los temas más avanzados en cuento a la estadística se refiere y desarrollar mediante una serie de lineamientos las temáticas de Medidas Univariantes de tendencia central y Medidas Univariantes de Dispersión. La actividad parte de forma individual, para posteriormente pasar a ser colaborativa realizando un aporte grupal donde se reportan y analizan ciertos factores mediante una base de datos que da el curso para revisar y así consolidar el trabajo final.

3 Justificación Este trabajo nos brinda la posibilidad de empezar hacer cuestionamientos, analizar, proceder y categorizar ciertos temas de manera que podamos clasificarlos y podamos debatirlo de forma clara y precisa. En este contexto, las actividades propuestas servirán para aprender de diferentes maneras de representar y hacer estadísticas, además de que nos pueden servir para nuestra vida cotidiana.

4 Objetivos

El objetivo principal de esta actividad consiste relacionar nociones básicas, clasificar, tabular, presentar la información y describir la problemática planteada.

Objetivos específicos: -Coordinarse específicamente entre los miembros del grupo para elaborar un buen informe. -Realizar satisfactoriamente la elección de una variable discreta que sea representativa y elaborar una tabla de frecuencias para datos NO agrupados, representarla gráficamente, calcular las medidas de tendencia central: media, mediana, moda, los cuartiles, deciles 5 y 7 ; percentiles 30 , 50 e interpretar sus resultados. -Poder elegir una variable Continua que sea representativa y siguiendo los lineamientos, diseñar una tabla de frecuencia para datos agrupados, representarla gráficamente por medio de un histograma de frecuencias, un polígono de frecuencias, calcular las medidas de tendencia central, determinar el tipo de asimetría, los cuartiles , deciles 5 y 7 ; percentiles 25, 50 ( Interpretar sus resultados).

5 -A partir de la base de datos suministrada, lograr elegir como mínimo, una variable discreta y calcular las medidas univariantes de dispersión más adecuadas, a aquellas que consideremos sean relevantes para el problema de estudio. Con la variable Discreta elegida debemos calcular: rango, varianza, desviación típica y coeficiente de variación. Interpretar los resultados obtenidos y asociarlos con el problema objeto de estudio. Con la variable Continúa elegida debemos calcular: rango, varianza, desviación típica y coeficiente de variación. Interpretar los resultados obtenidos y asociarlos con el problema objeto de estudio.

6

Desarrollo de la actividad

Medidas De Tendencia Central y Dispersión para la variable discreta



Variable Personas sin Empleo

Histográma de Frecuencia 35

Frecuencia

30 25 20 15 10 5 0

Personas sin empleo

7

Polígino de Frecuencias 35

Frecuencia

30 25 20 15 10 5 0

Personas sin empleo

Clase 2282952.576 2713048.873 3143145.17 3573241.466 4003337.763 4433434.06 4863530.356 5293626.653 5723722.949 6153819.246 6583915.543 7014011.839 7444108.136 y mayor...

Frecuencia 1 1 8 5 14 20 27 29 31 21 18 11 4 5

Para esta variable las medidas de tendencia central se hallaron los siguientes resultados en los cuales, de 195 datos, que son los meses transcurridos entre enero de 2001 y marzo de 2017, se halló que:

8 -La media de la variable son en promedio 5.148.582 personas que estuvieron sin empleo en este periodo de tiempo que fue establecido por la base de datos brindada. -La mediana de la variable: *Explicación de datos: -Dato mínimo: 2.282.953 -Mediana: 5.193.946 -Dato máximo: 7.874.204

En conclusión, entre 2.282.953 y 5.193.946 de personas estuvieron sin empleo entre el 50% de los 195 meses de la muestra. El otro 50% se interpreta que hubo entre 5.193.946 y 7.874.204 de personas sin empleo. -La moda para esta variable no aplica, puesto que ningún valor se repite, es por esto que tampoco aplica la tabla de frecuencias. -Los cuartiles de la variable, es decir la división de la variable en 4 partes iguales, dándonos 3 cuartiles, que serían los puntos de división y en el cual también uno de los cuartiles es la mediana o la mitad de los datos de la variable siendo en este caso y en todos los casos estadísticos el cuartil número 2, se establece rangos en este caso de personas que estuvieron desempleadas en un periodo de tiempo que se expondrá a continuación: Las interpretaciones de datos comprenden valores entre 25%, 50%, 75% y 100% *Explicación de datos: -Dato mínimo: 2.282.953

9 -Cuartil 1: 4.411.976 -Mediana y cuartil número 2: 5.193.946 -Cuartil 3: 5.890.311 -Dato máximo: 7.874.204

En el cuartil número 1 es decir, entre el dato mínimo de la variable y el primer punto de división, podemos indicar, tras la explicación de datos anterior, hubo entre 2.282.953 y 4.411.976 de personas sin empleo. Representando lo anterior el 25% de la interpretación mediante los 195 meses de la muestra. El otro 75% restante se interpreta que hubo entre 4.411.976 y 7.874.204 de personas sin empleo. En el cuartil número 2, que a su vez es el decil número 5 que es también el percentil número 50, y la mediana de la variable, representa que entre: 2.282.953 de personas (siendo este el dato mínimo de la variable) y 5.193.946 de personas, (siendo este las demás medidas de posición antes mencionadas), estuvieron sin empleo. En esta interpretación de los datos sería el 50% de la variable. El otro 50% se interpreta que hubo entre 5.193.946 y 7.874.204 (siendo este último valor el máximo de la variable) de personas que estuvieron sin empleo. En el cuartil número 3, representa que hubo entre 2.282.953 (siendo este el dato mínimo de la variable) y 5.890.311 (siendo este el cuartil número 3), de personas que estuvieron sin empleo. Lo anterior representando el 75% en esta interpretación de datos de la variable. El otro 25% se interpreta que hubo entre 5.890.311 y 7.874.204 de personas sin empleo.

10 El decil número 7 que significa la división en 10 partes iguales nuestra muestra, significando que cada parte representa el 10% y en ese porcentaje hubo 5.749.360 de personas que estuvieron sin empleo. El percentil que significa la división de nuestra muestra en 100 partes iguales, donde cada una representa el 1% y en ese porcentaje hubo 4.601.425 de personas que estuvieron sin empleo. Dispersión -El rango de la variable establece que es el intervalo entre el valor máximo y el valor mínimo; por ello, se halló que ese intervalo es de 5,591,252 de personas. La varianza de la variable es de 1,245,273,304,148 La desviación típica de la variable que nos indica cuánto pueden alejarse los valores respecto al promedio (media) es de 1,115,918 de personas El coeficiente de evaluación es de 0.22%

Lo anterior concluye que los datos de la variable y la muestra de ellos nos indica que los valores no tienen una dispersión considerable del promedio/media.

11

Medidas De Tendencia Central y Dispersión para la variable continua  Variable Tasa de Desempleo 

Tabla de frecuencias

Número de clases ( Intervalos)

Límite inferior

Límite superior

Marca de clase

Frecuencia absoluta

1 2 3 4 5 6 7 8 9

7,27 8,45 9,63 10,80 11,98 13,16 14,34 15,52 16,69

8,45 9,63 10,80 11,98 13,16 14,34 15,52 16,69 17,87

7,9 9,0 10,2 11,4 12,6 13,7 14,9 16,1 17,3

10 30 32 44 34 16 16 9 4

*Todos los procedimientos se encuentran en el archivo excel

Frecuencia absoluta acumulada 10 40 72 116 150 166 182 191 195

12

Frecuencia

Histograma de Frecuencias 35 30 25 20 15 10 5 0

Tasa de Desempleo

Frecuencia

Polígono de Frecuencias 40 35 30 25 20 15 10 5 0

Tasa de Desempleo

13



Media de la variable

La media de la variable indica un promedio de 11,68 en la tasa de desempleo en el periodo comprendido entre enero de 2001 y marzo de 2017.



Moda de la variable

La moda de la variable indica que la tasa de desempleo que más se repitió fue de 11,4 % ya que después de hacer el cálculo y el uso de las diversas fórmulas fue el dato que más se repitió siendo este 44 veces interpretados en meses. 

La Mediana de la variable

*Explicación de datos: -Dato mínimo: 7,27 -Mediana: 11,48 -Dato máximo: 17,87

En conclusión, hubo una tasa de desempleo entre el 7,27% y el 11,48% entre el 50% de los 195 meses comprendiendo entre enero de 2001 y marzo de 2017. El otro 50% indicó que hubo una tasa de desempleo entre el 11,48 % y el 17,87%.

14 

Cuartiles, deciles y percentiles de la variable

En el cuartil número 1 es decir, entre el dato mínimo de la variable y el primer punto de división, podemos indicar, tras la explicación de datos anterior, hubo una tasa de desempleo entre 7,27% y 9,95% Representando lo anterior el 25% de la interpretación mediante los 195 meses de la muestra. El otro 75% restante se interpreta que hubo una tabla de desempleo entre el 9,95% y el 17,87.

En el cuartil número 2, que a su vez es el decil número 5 que es también el percentil número 50, y la mediana de la variable, representa que hubo una tasa de desempleo entre 7,27% y el 15,89%. En esta interpretación de los datos sería el 50% de la variable. El otro 50% se interpreta que hubo una tasa de desempleo entre el 15,89% y el 17,87%. El tipo de asimetría de la variable es una asimetría negativa ya que el valor de la media tuvo una tendencia hacia la derecha a pesar de que el caso de estudio casi arroja una simetría. En el cuartil número 3 es decir podemos indicar, tras la explicación de datos anterior, hubo una tasa de desempleo entre 7,27% y 13,03% Representando lo anterior el 75% de la interpretación mediante los 195 meses de la muestra. El otro 25% restante se interpreta que hubo una tabla de desempleo entre el 13,03% y el 17,87%.

15 El decil número 7 que significa la división en 10 partes iguales nuestra muestra, significando que cada parte representa el 10% y en ese porcentaje hubo una tasa de desempleo de 12,69%. El percentil que significa la división de nuestra muestra en 100 partes iguales, donde cada una representa el 1% y en ese porcentaje hubo una tasa de desempleo del 10,31%. Dispersión El Rango de la variable establece que es el intervalo entre el valor máximo y el valor mínimo; por ello, se halló que ese intervalo es de un porcentaje del 10.60% La varianza de la variable es 5.10% La desviación típica de la variable que nos indica cuánto pueden alejarse los valores respecto al promedio (media) es de solo el 2.3% El coeficiente de evaluación es de 0.2% Lo anterior concluye que los datos y la muestra de ellos no tienden alejarse entre sí y por lo tanto la tasa de desempleo calculada no tiene una dispersión severa sobre el promedio/media.

16

Conclusiones En síntesis, este trabajo primero que todo, sirvió para elaborar mejor un esquema organizado de trabajo en nuestro inicio. A su vez, mediante este curso y sus temáticas podemos empezar a estudiar los métodos de recolección, descripción, visualización y resumen de datos originados a partir de los fenómenos en estudio y así poder acercanos a la estadística como tal. Además, ahora sumarle las temáticas propuestas como lo son las Medidas Univariantes de tendencia central y las Medidas Univariantes de Dispersión. Seguido de esto, resulta enriquecedor para nuestro proyecto de trabajo y de vida, si se quiere, ya que la estadística es una disciplina aplicada en todos los campos de la actividad humana. Ya que como es bien sabido, se utiliza para describir, analizar e interpretar ciertas características de un conjunto de individuos llamado población y demás conceptos acuñados a la estadística como tal.

17

Bibliografía Conceptos Básicos. (31 de Marzo de 2013). Obtenido de población,muestra,dato y variable estadística descriptiva: https://www.youtube.com/watch?v=FKcb16juO9c Lorenzo, J. M. (2007). Conceptos Generales. Madrid: Paraninfo. Obtenido de http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100007&v= 2.1&u=unad&it=r&p=GVRL&sw=w&asid=0a7332df0d4700de0bd2 72caa41e1718 Pava, M. F. (1 de Julio de 2015). ESTADÍSTICA DESCRIPTIVA. Obtenido de http://estadisticadescriptivaunad100105.blogspot.com.co/2015/07 /tablas-de-contingencia-doble-entrada.html Pava, M. F. (12 de Septiembre de 2017). Adobe Connect UNAD. Obtenido de Webconference 2 Estadistica Descriptiva: https://goo.gl/xmHJnf

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF