Inicial Estadistica Desciptiva

February 6, 2019 | Author: Erika Urrea | Category: Median, Variance, Sampling (Statistics), Quantile, Statistics
Share Embed Donate


Short Description

trabajp...

Description

ESTADÍSTICA DESCRIPTIVA ACTIVIDAD INICIAL DESARROLLO DE EJERCICIOS

DANIEL OSORIO JORELY GUZMAN WILSON DANOVIS CANO MILTON JHON JAIRO GARZON ERIKA URREA BERMUDEZ

MARIA CAMILA GONZALES TUTORA

GACHETÁ, 2018

DESARROLLO DEL TALLE 1. Definir que es la estadística y dar un ejemplo de ella. La estadística: Es una rama matemática que consiste en el estudio de análisis de una determinada muestra de datos con el fin d buscar correlaciones, dependencias y conclusiones a  partir de observaciones hechas. También a su vez se encarga de la recolección, agrupación, presentación, análisis e interpretación de datos. Para hacer una estadística es necesario tener en cuenta los siguientes conceptos: Población: son los elementos a los que se le realizara un estudio. Muestra: Es una parte representativa de la población. Individuo: Cada uno de los elementos de la población. Valor: es el resultado que puede tener cada uno de los datos. Dato: es el valor que puede tener cada uno de los individuos del estudio. Muestreo: es el conjunto de datos obtenidos de la muestra.      

Teniendo claro lo anterior observaremos el siguiente ejemplo: ¿Cuántos estudiantes aprobaron el año? Población: La población será de 350 estudiantes. Muestra: se escogieron 50 estudiantes. Individuo: Es cada uno de los estudiantes de la población. Valor: Consta de dos valores: - Aprobó -  No aprobó Dato: es cada valor que toma cada individuo. Muestreo:  N° Estudiantes Aprobó No aprobó 50 35 15 2. Escribir con sus propias palabras las siguientes definiciones de muestra y dar un ejemplo de cada una de ellas:

a. Muestra aleatoria: Es una técnica de muestreo que qu e se caracteriza por que cada elemento de una población tiene la misma posibilidad de ser escogidos al azar. Ejemplo: Carla necesita escoger 15 individuos que harán har án parte de la muestra en la que soportara su investigación, para esto sortea 30 números del 1 al 30, los cuales tengan los 15 números pares serán parte de la muestra que necesita.

b. Muestra estratificada: Técnica de muestreo que consiste en separar la población en diferentes grupos los cuales cuentan con características similares a estudiar. Ejemplo: En una población de animales como tema general se puede estratificar o dividir en diferentes grupos con ciertas características de similitud como son:        

Animales de 4 patas Animales de 2 patas Animales sin patas Animales vertebrados Animales invertebrados Animales reptiles Animales anfibios Animales mamíferos

Y demás características que podrían componer una muestra para el desarrollo de un estudio.

c. Muestra sistemática Técnica de muestreo en el que se ordena cada uno de los individuos por medio de una regla determinada que se centra necesariamente que se centra necesariamente en la cantidad de la muestra. Ejemplo: Se enumera los estudiantes del 1 al 140, luego se calcula el intervalo constante entre cada individuo:

ó  14020  7 

Se sortea en número del 1 al 4 y el número que salga se les sumara la misma cantidad hasta llegar a 20.

d. Muestra por conglomerados: Técnica que consiste en formar agrupamientos los cuales responden con las características que se desean de la muestra o del estudio investigativo.

Ejemplo: La empresa codensa pretende hacer un estudio sobre el consumo de energía que hay en la ciudad de México por esta razón es necesario realizar una muestra de conglomerado lo cual se determina el número de manzanas por barrio el cual se va hacer el estudio.

e. Muestra por conveniencia: Como su nombre lo dice es una técnica de muestreo de forma no probabilística que  permite seleccionar los individuos según su proximidad prox imidad y accesibilidad. Ejemplo: Una institución pretende hacer un estudio de que alimentos son consumidos diariamente en la hora de descanso para esto deciden escoger como población los estudiantes de su mismo establecimiento del cual después realizaran un muestro aleatorio para determinar estos resultados. 3. Describir cuales son las medidas de posición y medidas de dispersión y explicar cada una de ellas

MEDIDAS DE POSICION: Ofrecen resumen de la información que se incluye en la distribución de frecuencias. Cuando se calcula una medida de posición se está buscando un valor único que ofrezca información relevante sobre la distribución, siendo esta relevante siempre y cuando tenga utilidad práctica. Para que una medida de posición resulte ser representativa de la distribución de frecuencias de la que proviene y de igual manera se a útil para su interpretación debe  poseer las siguientes características: 1. Que se pueda calcular siempre; no todas las medidas de posición son siempre calculables. 2. Que considere todo y cada de los valores que toma la variable 3. Que sea única, al momento de ser calculada se obtenga siempre un único valor Las medidas de posición pueden ser centrales llamadas así ya que indican la ubicación del centro de conjunto de datos, buscan de un modo u otro el centro de la distribución; o no centrales ya que estas buscan otras posiciones dentro de la distribución. MEDIDAS DE POSICION CENTRALES: 

̅

MEDIA ARITMÉTICA ( ): ): Es la medida de posición más importante y de uso más extendido, está indica el valor que tomaría la variable. La media aritmética se obtiene sumando todos los valores de la muestra y dividiendo el valor obtenido por el número de valores sumados.

 ∑       ⋯         = ̅    

(Letra sigma mayúscula): significa que todos los valores para la variable se suman desde el primero (i=1) hasta el último (i=n) Xi es cada dato, el subíndice “i” varia de 1 a n, cantidad de datos de la muestra

  

Propiedades de la Media Aritmética: Aritmética: La media aritmética tiene, entre otras, las siguientes propiedades: Para un conjunto de datos hay una y sólo una media aritmética. Su cálculo es sencillo. Es sensible a los valores extremos porque en su cálculo se utilizan todos los valores de la muestra La media aritmética presenta las siguientes ventajas:

1. Tiene en cuenta todos los valores de la distribución, ya que cuando la calculamos hacemos uso de todos ellos. 2. Casi siempre que se tienen valores numéricos se puede calcular y da como resultado un valor único. Se debe tener en cuenta que si se tienen distribuciones agrupadas con intervalos abiertos, no se puede calcular la media. 3. Es lo que se denomina centro de gravedad de la distribución. Es decir que q ue si se calcula la distancia de cada valor de la media y se suman todas, el resultado es igual a cero.

=   ̅ ∙   0

4. Se cumple el denominado Teorema de König, el cual si se calculó el cuadrado de las distancias de todos los valores de la variable respecto a una constante cualquiera, esa distancia se hace mínima cuando la constante es la media aritmética. 5. La media aritmética se comporta del mismo modo que el resto de valores ante transformaciones lineales, es decir si se multiplican todos los valores de la distribución por una constante, la media quedara multiplicada por dicha constante, y si se suman a todos una constante, la media se verá afectada en transformación del mismo modo:

      , ,     ̅    

 

La media aritmética también tiene algunas desventajas: 1. La media aritmética no se puede calcular cuando la variable no es numérica o esta agrupada presentando intervalos abiertos. 2. La media aritmética se ve afectada por los valores anormalmente extremos. 

̃

MEDIANA : es el valor de la variable que divide al conjunto de datos, estando ordenado de forma creciente, en dos partes iguales. De tal manera que el número de

 



datos mayor o igual a la mediana es igual al número de datos menores o iguales a esta. Si el número de valores es impar, la mediana es el valor ubicado en el centro Si el número de valores es par, entonces la mediana corresponde correspon de a la media aritmética de los dos valores centrales. MODO (Mo o ): Es el valor de la variable que ocurre con mayor frecuencia. Si todos los valores son diferentes, se dice que la serie no tiene modo. De igual manera también puede ocurrir que haya más de un modo.

̂

OTRAS MEDIDAS DE POSICION: 

CUARTILES: los cuartiles son 3 valores.



Q1: PRIMER CUARTIL Q2: SEGUNDO CUARTIL Q3: TERCER CUARTIL Estos tres valores dividen el conjunto de datos, después de haber sido ordenados de forma creciente, en 4 partes iguales de tal manera que: Por debajo de Q1 se encuentre el 25% de los datos y por arriba del mismo el 75% de la serie. Por debajo de Q2 se encuentre el 50% de los datos y por arriba el otro 50% de la serie, de tal manera Q2 coincide con la mediana. Q3 deja por debajo del mismo el 75% de los datos y por arriba de este queda el 25% de la serie.

 

Cuando se quiere calcular los cuartiles de alguna serie de datos primero se calculan las respectivas posiciones o ubicaciones. 1. Se ordenan los datos de manera creciente y se utiliza las siguientes formulas: Posición de Q1: ésima observación ordenada

+ + + Posición de Q :    ésima observación ordenada + Posición de Q :  ésima observación ordenada Se identifica en la serie de datos ordenados que valor corresponde a cada uno de ellos. 2 3

2. 

DECILES: Son nueve valore y dividen la serie en 10 partes iguales. Se denotan de la siguiente manera:

, , , , , , , , 



Se interpretan de la siguiente manera: D1 es un valor que la variable deja por debajo de él, el 10% de los datos y por encima el 90% de la serie.







D2 es un valor de la variable que deja por debajo de él, el 20% de los datos y por encima el 80% de la serie. Así Así sucesivamente con los siguientes siguientes deciles. De esta forma el D5 coincide con la mediana. PERCENTILES: Son 99 y dividen a la serie de datos en 100 partes iguales. Se denotan como Pi , con i = 1, 2, 3,…99. La interpretación de estos es semejante a la de los deciles. P1 es un valor variable que debajo deb ajo de él se encuentra el 1% de los datos y por encima el 99% de la serie.

 … 

P50 es un valor de la variable que debajo de él se encuentra el 50% de los datos y por encima el 50% de la serie. Este valor coincide con Q2, que corresponde a la mediana.

MEDIDAS DE DISPERSION: La dispersión de un conjunto de observaciones se refiere a la variabilidad que muestras estos valores. La magnitud de la dispersión es “pequeña” cuando los valores son cercanos entre sí.

Al contrario si los valores están ampliamente esparcidos, decimos que la dispersión es “grande”.

Como medidas de dispersión se tienen las siguientes: 

RANGO O AMPLITUD (R): Esta medida se calcula como la diferencia entre e valor más grande y el valor más pequeño de una serie de datos.

      ñ     

Representando:

La utilidad de esta medida es limitada debido a que solamente depende de valores extremos y, se pueden tener dos series de datos con el mismo rango pero diferente variabilidad ya que en el centro de la serie de los datos se comporta de diferente manera. La ventaja de este se ve reflejada en la simplicidad del cálculo de está. 



VARIANZA : Cuando los valores de un grupo de datos se encuentran ubicados cerca de la media, la dispersión es menor que cuando están más alejados de la media. Esta idea permite considerar una medida de dispersión que tenga en cuenta la variabilidad alrededor de la media. Esta medida se s e conoce como varianza o variancia. El cálculo de esta es de la siguiente manera, se resta la media de cada uno de los valores individuales y a estas diferencias se elevan al cuadrado y se suman. Luego a esta suma se la divide por la cantidad de datos menos 1. Lo anterior se refleja en la siguiente formula:

̅1     ∑=  





La varianza se puede calcular con calculadora científica. DESVIACION ESTANDAR (S): Es la raíz cuadrada de la varianza,

 ∑ =          1 

COEFICIENTE DE VARIACIÓN (CV): Cuando queremos comparar la variabilidad de dos conjuntos de datos, la comparación directa de las dos desviaciones estándar  puede dar resultados equivocados. Esto ocurre si las dos variables involucradas tienen medidas en diferentes unidades (por ejemplo si comparamos estatura y peso) o si utilizando las mismas unidades de medición, las dos medias pueden ser diferentes (por ejemplo si comparamos pesos de niños y de adultos). En estos casos necesitamos una medida que exprese la desviación estándar como porcentaje de la media. La expresión es: La desviación estándar y la media se expresan en las mismas unidades y por lo tanto obtenemos una medida adimensional que al multiplicarla por cien da el valor en  porcentaje

. .  100

4. Explicar el coeficiente de variación y los diferentes cuartiles que existen. 5. Los siguientes datos representa el número de hijos que tiene los funcionarios de una empresa. 6. 1,2,4,1,0,0,4,2,1,3,4,1,0,0,0,0,4,3,2,4,5,1,0,3,2,3,1,0,1,0,2,3,0,2,1,4,0,1,1,2. Con base a la información anterior, halla: a. la tabla de frecuencia  b. media c. moda d. histograma e. quantiles 7. Efectuar las siguientes operaciones: a.

  +    +  b.  −  8. Hallar la solución o soluciones de las siguientes ecuaciones: a. 2  1387 − +  b.     √  9. Describa los diferentes tipos de soluciones para una un a ecuación cuadrática de la forma  0. Solución:

 0

Los tipos de solución para una ecuación cuadrática de la forma  son tres por factorización, por completación de trinomio cuadrado perfecto o por la fórmula cuadrática, por ejemplo:

3  5  2  0         31 31   x  2 3x10 x20 3x11 x2 x3  ±√  ó á  2 4 3 5 2            5 ± 5  4 3 2    2 3 5 ±  254 26546 6  5± 5 ± √ 62524 2 524  5± 5 ±6√ 4949  5± 5±7  6 57   57   6 6 12 2  6   16 2  3  5  2   ó     3 2  0 ó               3 23  2536   553    252536  2425   53    2536  49 36   3    36  36 ( (  56)  4936   (  56)   493649

56|  76 |     56   76 7 5   56  76 7 5  612 6   62 6  6   16 2  3 10. Hallar los valores de las variables de las siguientes ecuaciones: a.  b.

2410 42518 12826 4 324 351    148220  3, 2   ó 12826 86 4     2410 1  2, 2,    2   841036 101146 5  881166 11   ó 4 101146 7820   20 78 ,   68          ó  4  ℎ       68 0, 2 564 564 . 

2410 4102   4102 4102 0, 2 564 564  3. 9 48   5.54392 , 

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF