Graficos de excel |
Short Description
Descripción: tutorial para generar algunas funciones estadísticas...
Description
Introducción
El presente documento titulado: “Aplicaciones estadísticas con EXCEL 2010”, se ha elaborado con la finalidad de apoyar a los alumnos en el uso correcto de las funciones entre otras, la de estadística contenida en este software aplicativo, por lo que se ha explicado en un lenguaje claro y conciso el desarrollo de los diversos temas. Se ha elaborado en base al documento titulado “Guía de Excel con Aplicaciones Estadísticas” desarrollado con Excel 2003. El uso tanto de las funciones como de las herramientas estadísticas del Excel 2010 facilita el aprendizaje de los contenidos teóricos del curso de Estadística a todo nivel. La secuencia de los temas que se tocan en el documento va desde la estadística descriptiva, tabla de contingencia, diversos diagramas para la representación visual del comportamiento de la variable a estudiar, entre otros. Esperemos que el documento sea aprovechado en toda su magnitud por todo aquel que ve en la estadística, una herramienta indispensable en la adecuada toma de decisiones.
Los autores Estadística en Excel
3
Estadística en Excel
1
Estadística en Excel
¢&yPRKDFHUFiOFXORVHVWDGtVWLFRVHQ([FHO"
)XQFLRQHVHVWDGtVWLFDV
8VRGHXQDIXQFLyQHVWDGtVWLFDV
8VRGHOFXDGURGHGLiORJR,QVHUWDUIXQFLyQ
)XQFLRQHVHVWDGtVWLFDV
+HUUDPLHQWDVGH$QiOLVLV(VWDGtVWLFR
4
1.1 Estadística en Excel ¿Cómo hacer cálculos estadísticos en Excel? Para hacer cálculos estadísticos en Excel hay dos posibilidades: Usar las funciones estadísticas. Usar el cuadro de diálogo análisis de datos
1.2 Funciones estadísticas ¿Cómo usar una función estadística? En Excel tenemos muchas funciones como Matemática y Trigonométrica, Financiera, Estadísticas etc. Para poder usarlas debemos tener en cuenta lo siguiente: 1. Siempre comienzan por el signo igual (=). 2. Se escribe el nombre de la función. La ventaja de esta versión 2010, es que al empezar a escribir el nombre de la función, el Excel nos brinda el nombre de todas las que comienzan con esas iniciales:
3. Se añaden los argumentos entre paréntesis. En el caso de las fórmulas estadísticas, es frecuente que los argumentos sean rangos.
El cuadro de diálogo Insertar función Abra el cuadro de diálogo Insertar función haciendo clic en Función, en el menú Insertar. A continuación: Elija la categoría Estadísticas Busque el nombre de la función en la lista. Puede ver la descripción de la función para asegurarse de que ha elegido la adecuada. Puede obtener más información en Ayuda Si no encuentra la función que está buscando en las funciones estadísticas, pruebe en una categoría relacionada. Por ejemplo, la función de número aleatorio (ALEAT) aparece en la categoría “Matemática y trigonométrica”.
Estadística en Excel
5
Problemas habituales Algunos de los errores que se cometen con mayor frecuencia al escribir fórmulas son: Olvidar poner el signo igual (=) al principio de la fórmula. Insertar un espacio antes del signo igual (=). Escribir los datos en un formato incorrecto (por ejemplo, como texto en lugar de números). Seleccionar un rango de datos incorrecto.
Funciones estadísticas Función
Descripción
Frecuencias CONTAR
Cuenta cuántos números hay en la lista de argumentos
CONTAR.BLANCO
Cuenta el número de celdas en blanco dentro de un rango
CONTAR.SI
Cuenta el número de celdas que no están en blanco dentro de un rango que coincida con los criterios especificados
CONTARA
Cuenta cuántos valores hay en la lista de argumentos
FRECUENCIA
Devuelve una distribución de frecuencia como una matriz vertical
PERMUTACIONES
Devuelve el número de permutaciones para un número determinado de objetos
COMBINAT
Devuelve el número de combinaciones para un número determinado de objetos. (Categoría Matemáticas)
PROBABILIDAD
Devuelve la probabilidad de que los valores de un rango se encuentren entre dos límites
Promedios MEDIA.ACOTADA
Devuelve la media del interior de un conjunto de datos
MEDIA.ARMO
Devuelve la media armónica
MEDIA.GEOM
Devuelve la media geométrica
MEDIANA
Devuelve la mediana de los números dados
MODA.UNO
Devuelve el valor más frecuente en un conjunto de datos
PROMEDIO
Devuelve la media aritmética de los argumentos
PROMEDIOA
Devuelve la media aritmética de los argumentos, incluidos números, texto y valores lógicos
Estadística en Excel
6
Medidas de dispersión COVAR
Devuelve la covarianza, el promedio de los productos de las desviaciones pareadas
DESVEST.M
Calcula la desviación estándar basada en una muestra
DESVESTA
Calcula la desviación estándar de una muestra, incluidos números, texto y valores lógicos
DESVEST.P
Calcula la desviación estándar de la población total
DESVESTPA
Calcula la desviación estándar de la población total, incluidos números, texto y valores lógicos
DESVIA2
Devuelve la suma de los cuadrados de las desviaciones
DESVPROM
Devuelve el promedio de las desviaciones absolutas de la media de los puntos de datos
VAR.S
Calcula la varianza de una muestra
VARA
Calcula la varianza de una muestra, incluidos números, texto y valores lógicos
VAR.P
Calcula la varianza en función de toda la población
VARPA
Calcula la varianza de la población total, incluidos números, texto y valores lógicos
Función
Descripción
Medidas de posición , asimetría y curtosis COEFICIENTE.ASIMETRIA
Devuelve la asimetría de una distribución
CUARTIL
Devuelve el cuartil de un conjunto de datos
CURTOSIS
Devuelve la curtosis de un conjunto de datos
JERARQUIA
Devuelve la jerarquía de un número en una lista de números
K.ESIMO.MAYOR
Devuelve el k-ésimo mayor valor de un conjunto de datos
K.ESIMO.MENOR
Devuelve el k-ésimo menor valor de un conjunto de datos
MAX
Devuelve el valor máximo de una lista de argumentos
MAXA
Devuelve el valor máximo de una lista de argumentos, incluidos números, texto y valores lógicos
MIN
Devuelve el valor mínimo de una lista de argumentos
MINA
Devuelve el valor mínimo de una lista de argumentos, incluidos números, texto y valores lógicos
PERCENTIL
Devuelve el k-ésimo percentil de los valores de un rango
RANGO.PERCENTIL
Devuelve el rango de un valor en un conjunto de datos como porcentaje del conjunto
Distribuciones discretas INV.BINOM
Devuelve el valor menor cuya desviación binomial acumulativa es menor o igual que un valor de un criterio
DISTR.BINOM.N
Devuelve la probabilidad de una variable aleatoria discreta siguiendo una distribución binomial
Estadística en Excel
7
DISTR.HIPERGEOM.N
Devuelve la probabilidad para una variable aleatoria discreta siguiendo una distribución hipergeométrica
NEGBINOM.DIST
Devuelve la distribución binomial negativa o Pascal
POISSON.DIST
Devuelve la distribución de Poisson
Distribuciones continuas ALEATORIO
Devuelve un número aleatorio mayor o igual que 0 y menor que 1 distribuido uniformemente. Es volátil.
ALEATORIO.ENTRE
Devuelve un número aleatorio entero distribuido uniformemente entre los límites que se especifique
DISTR.CHICUAD
Devuelve la probabilidad de una variable aleatoria continua siguiendo una distribución chi cuadrado de cola izquierda.
DISTR.CHICUAD.CD
Devuelve la probabilidad de una variable aleatoria continua siguiendo una distribución chi cuadrado de cola derecha.
DISTR.BETA.N
Devuelve la función de distribución beta acumulativa
INV.BETA.N
Devuelve la inversa de la función de distribución acumulativa para una distribución beta especificada
DISTR.EXP.N
Devuelve la probabilidad de una variable aleatoria continua siguiendo una distribución exponencial acumulativa (cola izquierda).
DISTR.F.CD
Devuelve la probabilidad de una variable aleatoria continua siguiendo una distribución F de cola derecha.
DISTR.F.N
Devuelve la probabilidad de una variable aleatoria continua siguiendo una distribución F acumulativa (cola izquierda).
INV.F INV.F.CD
Devuelve el inverso de una distribución de probabilidad F de cola izquierda. Devuelve el inverso de una distribución de probabilidad F de cola derecha
DISTR.GAMMA.N
Devuelve la probabilidad de una variable aleatoria siguiendo una distribución gamma acumulativa (cola izquierda).
INV.GAMMA
Devuelve el inverso de la función gamma.
DISTR.NORM.N
Devuelve la probabilidad de una variable aleatoria continua siguiendo una distribución normal acumulativa (cola izquierda). Con una madia y desviación estándar específicos.
DISTR.NORM.ESTAND.N
Devuelve la probabilidad de una variable aleatoria continua siguiendo una distribución normal estándar acumulativa.
INV.NORM.ESTAND
Devuelve el inverso de la distribución normal estándar acumulativa.
INV.NORM
Devuelve el inverso de la distribución normal acumulativa. Con una media y desviación estándar específicas.
DISTR.T.2C
Devuelve la probabilidad de una variable siguiendo una distribución t de Student de Devuelve la probabilidad de una variable siguiendo una distribución t de Student de Devuelve la probabilidad de una variable siguiendo una distribución t de Student de
DISTR.T.N DISTR.T.CD
Estadística en Excel
aleatoria continua dos colas. aleatoria continua cola izquierda. aleatoria continua cola derecha.
8
INV.T INV.T.2C
Devuelve el inverso de cola izquierda de la distribución t de Student. Devuelve el inverso de dos colas de la distribución t de Student.
DIST.WEIBULL
Devuelve la probabilidad de una variable aleatoria continua siguiendo una distribución de Weibull acumulativa (cola izquierda).
NORMALIZACION
Devuelve un valor normalizado
Regresión COEF.DE.CORREL
Devuelve el coeficiente de correlación de dos conjuntos de datos
COEFICIENTE.R2
Devuelve el cuadrado del coeficiente de correlación del momento del producto Pearson
CRECIMIENTO
Devuelve valores en una tendencia exponencial
ERROR.TIPICO.XY
Devuelve el error típico del valor de y previsto para cada x de la regresión
ESTIMACION.LINEAL
Devuelve los parámetros de una tendencia lineal
ESTIMACION.LOGARITMICA
Devuelve los parámetros de una tendencia exponencial
INTERSECCION.EJE
Devuelve la intersección de la línea de regresión lineal
PENDIENTE
Devuelve la pendiente de la línea de regresión lineal
PRONOSTICO
Devuelve un valor en una tendencia lineal
TENDENCIA
Devuelve valores en una tendencia lineal
Pruebas INTERVALO.CONFIANZA.NORM Devuelve el intervalo de confianza para la media de una población usando la distribución normal. INTERVALO.CONFIANZA.T
Devuelve el intervalo de confianza para la media de una población usando la distribución t Student.
PRUEBA.CHICUAD
Devuelve una probabilidad llamada “p-valor” de las pruebas de aplicaciones de la chi cuadrado.
INV.CHICUAD
Devuelve el inverso de una probabilidad dada, de cola izquierda, en una distribución chi cuadrado. Devuelve el inverso de una probabilidad dada, de cola derecha, en una distribución chi cuadrado.
INV.CHICUAD.CD PRUEBA.F.N
Devuelve una probabilidad llamada “p-valor” del resultado de una prueba F de dos colas para homogeneidad de varianzas.
PRUEBA.FISHER.INV
Devuelve el inverso de la transformación Fisher
PRUEBA.T
Devuelve una probabilidad llamada “p-valor” asociada con la prueba t de Student para dos medias: pareadas, varianzas desconocidas pero homogéneas o varianzas desconocidas pero heterogéneas.
PRUEBA.Z
Devuelve una probabilidad llamada “p-valor” asociada a una prueba Z de una cola para una media.
Estadística en Excel
9
1.3 Herramientas para análisis estadístico La Herramienta de análisis estadístico es un programa de complemento de Excel que está disponible al instalar Excel., para usarlo es necesario cargarlo primero. Si el comando Análisis de datos no está disponible, deberá cargar el programa de complemento Herramientas para análisis En Excel ir a Opciones
Dentro de opciones ir a Complemento y buscar Herramienta para análisis
Haga clic en Ir
Estadística en Excel
10
Marcar con un check Herramientas para análisis y luego haga clic en Aceptar
Ahora ya se activó Análisis de datos en Datos
Las Herramientas para análisis incluyen las herramientas que se describen a continuación. Para tener acceso a estas herramientas, haga clic en Análisis de datos en el grupo Análisis de la ficha Datos.
Análisis de varianza de un factor Proporciona la prueba de hipótesis de que las medias de k poblaciones son iguales vrs que al menos una sea diferente. Se usa para el análisis de varianza del Diseño Completo al azar. Si sólo existieran dos muestras, la función PRUEBA.T hace lo mismo.
Análisis de varianza de dos factores con varias muestras por grupo Se usa cuando los datos se pueden clasificar de acuerdo con dos dimensiones diferentes y varias mediciones por cada grupo. Es usado para el análisis de varianza del experimento factorial.
Análisis de varianza de varianza de dos factores con una sola muestra por grupo Se usa cuando los datos se clasifican en dos dimensiones diferentes, pero suponemos que existe una única observación para cada par. Es usado para el análisis de varianza del Diseño Bloque Completo al Azar.
Coeficiente de Correlación Calcula una matriz de correlación que muestra el valor del coeficiente de correlación para cada uno de los pares de variables en estudio. Las funciones COEF.DE.CORREL y PEARSON hacen lo mismo para dos variables.
Covarianza Calcula una matriz de correlación que muestra el valor de la covarianza para cada uno de los pares de variables en estudio. La función COVAR hace lo mismo para dos variables.
Estadística descriptiva Genera un informe estadístico de una sola variable para los datos del rango de entrada, y proporciona información acerca de la tendencia central y dispersión de los datos. Estadística en Excel
11
Suavización exponencial Predice un valor basándose en el pronóstico del período anterior, ajustándose al error en ese pronóstico anterior. La herramienta utiliza la constante de suavización a, cuya magnitud determina la exactitud con la que los pronósticos responden a los errores en el pronóstico anterior. Los valores de 0,2 a 0,3 son constantes de suavización adecuadas. Estos valores indican que el pronóstico actual debe ajustarse entre un 20% y un 30% del error en el pronóstico anterior. Las constantes mayores generan una respuesta más rápida, pero pueden producir proyecciones erróneas. Las constantes más pequeñas pueden dar como resultado retrasos prolongados en los valores pronosticados.
Prueba F para varianzas de dos muestras Ejecuta una prueba F de dos muestras para comparar dos varianzas poblacionales. La herramienta nos proporciona el valor de la estadística de prueba Fcal. También proporciona el p-valor de una cola.
Histograma Calcula las frecuencias individuales y acumulativas de rangos de celdas de datos y de clases de datos. Esa herramienta genera datos acerca del número de apariciones de un valor en un conjunto de datos.
Media móvil Proyecta valores en el período de pronósticos, basándose en el valor promedio de la variable calculada durante un número específico de períodos anteriores. Una media móvil proporciona información de tendencias que se vería enmascarada por una simple media de todos los datos históricos. Utilice esta herramienta para pronosticar ventas, inventario u otras tendencias. Todos los valores de pronóstico están basados en la siguiente fórmula: donde: N es el número de períodos anteriores que se incluyen en la media móvil Aj es el valor real en la hora j Fj es el valor pronosticado en la hora j
Generación de números aleatorios Genera números aleatorios de acuerdo con una de varias distribuciones. Puede utilizar esta herramienta para caracterizar a los sujetos de una población con una distribución de probabilidades.
Jerarquía y percentil Crea una tabla que contiene los rangos ordinales y porcentuales de cada valor de un conjunto de datos. Puede analizar la importancia relativa de los valores en un conjunto de datos. Esta herramienta utiliza las funciones JERARQUÍA y RANGO.PERCENTIL
Regresión Realiza un análisis de regresión lineal utilizando el método de los "mínimos cuadrados" para ajustar una línea a una serie de observaciones. Puede utilizar esta herramienta para analizar la forma en que los valores de una o más variables independientes afectan a una variable dependiente. Usa a función ESTIMACION.LINEAL de la hoja de cálculo.
Estadística en Excel
12
Muestras Crea una muestra de población tratando el rango de entrada como una población. Cuando la población sea demasiado grande para procesarla o para presentarla gráficamente, puede utilizarse una muestra representativa. Además, si cree que los datos de entrada son periódicos, puede crear una muestra que contenga únicamente los valores de una parte determinada de un ciclo.
Prueba t para medias de dos muestras emparejadas Puede utilizar una prueba emparejada cuando existe un par natural de observaciones en las muestras, como cuando un grupo de muestras se somete a prueba dos veces, antes y después de un experimento. Esta herramienta de análisis y su fórmula ejecutan una prueba t de Student de dos muestras emparejadas para determinar si las observaciones realizadas antes y después de un tratamiento proceden de distribuciones con medias de población iguales. En este tipo de prueba no se supone que las varianzas de ambas poblaciones sean iguales.
Prueba t para dos muestras suponiendo varianzas iguales Ejecuta una prueba t de Student en dos muestras. En este tipo de prueba se supone que los dos conjuntos de datos proceden de distribuciones con las mismas varianzas. Se conoce con el nombre de prueba t homoscedástica. Puede utilizar este tipo de prueba para determinar si es probable que las dos muestras procedan de distribuciones con medias de población iguales.
Prueba t para dos muestras suponiendo varianzas desiguales Ejecuta una prueba t de Student en dos muestras. En este tipo de prueba se supone que los dos conjuntos de datos proceden de distribuciones con varianzas desiguales. Se conoce con el nombre de prueba t heteroscedástica. Al igual que en el caso anterior, este tipo de prueba puede utilizarse para determinar si es probable que las dos muestras procedan de distribuciones con medias de población iguales. Utilice esta prueba cuando haya sujetos distintos También puede utilizarse para el caso en que la hipótesis nula sea que existe un valor distinto de cero específico para la diferencia entre las dos medias de población.
Prueba z para medias de dos muestras Realiza una prueba z para comparar las medias con varianzas conocidas. Esta herramienta se utiliza para comprobar las hipótesis nulas relativas a que no existen diferencias entre dos medias de población frente a las hipótesis alternativas en uno u otro sentido. También puede utilizarse para el caso en que la hipótesis nula sea que existe un valor distinto de cero específico para la diferencia entre las dos medias de población.
Estadística en Excel
13
Estadística Descriptiva
Ejercicio 1 - Distribución de frecuencia y gráfico de columnas.
Ejercicio 2 - Tabla de contingencia o de doble entrada.
Ejercicio 3 – Gráfico de Pareto.
Ejercicio 4 - Distribución de frecuencias de datos discretos y gráfico
Ejercicio 5- Distribución de frecuencia con intervalos y gráfico.
Ejercicio 6 - Medidas descriptivas par datos no agrupados Ejercicio 7 - Medidas descriptivas para datos no agrupados de acuerdo a las categorías de una variable cualitativa. Ejercicio 8.- Diagrama de cajas Ejercicio 9.- Diagrama de dispersión y coeficienteGHFRUUHODFLyQ
Estadística en Excel
14
Estadística descriptiva El presente capítulo tiene como objetivo mostrar, partiendo de una base de datos, el uso de Excel para organizar y presentar las variables en cuadros de resumen, en gráficas y calcular las principales medidas descriptivas. Los ejercicios están diseñados para que el estudiante pueda manejar con propiedad las variables cualitativas y cuantitativas.
Caso 1: Enigma S.A., fabricante de productos lácteos, cuenta actualmente con 3257 trabajadores. Para la aplicación efectiva de una filosofía de administración para la calidad total (TQM) en toda la compañía e incrementar así la productividad, el consejo de directores de la empresa ha puesto en marcha un estudio del perfil de los trabajadores para medir su satisfacción con el trabajo. Como parte del estudio se tomó una encuesta a 185 empleados elegidos al azar. El modelo de encuesta tomado se presenta a continuación: En las preguntas indique el valor o marque la opción según sea apropiado. ͔ 1. Femenino
1.
Género:
2.
Posición o función en la empresa: ͔ 1. Gerencial ͔ 2. Profesional ͔ 4. Apoyo adm.
͔ 5. Servicios
͔ 2. Masculino
͔ 3. Técnico/ventas ͔ 6. Producción
͔
7. Obrero
3.
Edad:
________
4.
Años en la empresa:
5.
Ingresos anuales personales netos (en soles) el año pasado: _______________
6.
Ingresos anuales familiares totales netos (en soles) el año pasado: _______________
7.
¿Cuántas veces ha sido promovido en la empresa?
8.
En los siguientes 5 años, ¿qué tan probable es que sea promovido?
________
͔ 1. Muy probable ͔ 4. Improbable 9.
__________
2. Probable ͔
͔ 3. No está seguro
5. Muy improbable
Las oportunidades de ser promovido a un puesto superior, ¿son mejores o peores para personas de su género? ͔ 1. Mejores ͔ 2. Peores ͔ 3. El género no influye
10. ¿Cuántas veces que ha sido capacitado formalmente por la empresa? _________ 11. ¿Rechazaría otro trabajo de más paga para poder quedarse en Enigma S.A.? ͔ 1. Muy probable ͔ 4. Improbable
2. Probable ͔
͔ 3. No está seguro
5. Muy improbable
12. ¿Cómo son las relaciones en su lugar de trabajo entre la gerencia y los trabajadores? ͔ 1. Muy buenas ͔ 2. Buenas ͔ 3. Regulares ͔ 4. Malas
5. Muy malas
En el archivo BaseDatos_1.xlsx se muestran las respuestas obtenidas en la encuesta. Para cada una de las pregunta se ha definido una variable. Estadística en Excel
15
Ejercicio 1- Distribución de frecuencia y gráfico de columnas El presente ejercicio tiene como objetivo lograr que el alumno se familiarice con las herramientas del Excel en la elaboración de cuadros o tablas, así como la de gráfico de columnas. En la hoja Ejercicio 1, copie los datos de la variable Rech-trab (11) y elabore: a. La tabla de distribución de frecuencias. b. El gráfico de columnas. Solución a. La tabla de distribución de frecuencias. Seleccione Insertar y luego tabla dinámica
Seleccione el rango de datos A1:B186 y active en la opción Hoja de cálculo existente la celda D11 (o la opción Hoja de cálculo nueva según dónde se desee situar la tabla dinámica).
Estadística en Excel
16
Hacer clic en Aceptar y arrastrando el recuadro tipo de errores a la zona de fila y a la zona de campos de campos de valor nos da lo siguiente.
Ordene las categorías de la tabla según la frecuencia en orden descendente.
Copie la tabla a partir de la celda D21. Calcule la frecuencia relativa (h) y la frecuencia relativa acumulada (H).
b. El gráfico de columnas.
Estadística en Excel
17
Para seleccionar dos columnas no contiguas se procede de la siguiente manera: Seleccione el rango de datos: D21:D26, luego presione Crtl y el rango F21:F26 Clic en la opción Insertar de la barra de menú y active el icono Columnas
•
Seleccione la opción columna
• •
Y luego aceptar. Aparece la siguiente ventana.
Doble clic en el área del gráfico, aparecerá una pestaña de Herramientas de gráficos con las opciones: Diseño, Presentación y formato. Seleccionar Presentación, y de ahí escogemos el botón Título de gráfico, rótulo del eje y etiqueta de datos. Estadística en Excel
18
En el botón título de gráfico, seleccionamos la ubicación del título encima del gráfico y escribimos: Distribución porcentual de trabajadores según opinión si rechazaría propuesta de trabajo por quedarse en la empresa.
•
En rótulos del eje, escogeremos Eje X y eje Y, según corresponda y escribiremos su etiqueta.
Estadística en Excel
19
En el botón etiquetas de datos, activa la posición donde irán los valores de cada barra.
Para cambiar a porcentaje los valores del eje Y y las etiquetas de valor : Doble clic en la columna de los valores del eje Y, aparecerá la siguiente ventana: Estadística en Excel
20
Asi quedará: ŝƐƚƌŝďƵĐŝſŶƉŽƌĐĞŶƚƵĂůĚĞƚƌĂďĂũĂĚŽƌĞƐƐĞŐƷŶŽƉŝŶŝſŶ ƐŝƌĞĐŚĂnjĂƌşĂƉƌŽƉƵĞƐƚĂĚĞƚƌĂďĂũŽƉŽƌƋƵĞĚĂƌƐĞĞŶůĂ ĞŵƉƌĞƐĂ Ϭ͘Ϯϱϵϱ
WŽƌĐĞŶƚũĂĞ
ϯϬй ϮϬй
Ϭ͘ϭϵϰϲ
Ϭ͘ϮϬϬϬ
Ϭ͘ϮϬϱϰ
/ŵƉƌŽďĂďůĞ
EŽĞƐƚĄ ƐĞŐƵƌŽ
WƌŽďĂďůĞ
Ϭ͘ϭϰϬϱ
ϭϬй Ϭй DƵLJ ŝŵƉƌŽďĂďůĞ
DƵLJƉƌŽďĂďůĞ
KƉŝŶŝſŶ
•
Igual, las etiquetas de valor lo cambiamos a porcentaje, con dos decimales: doble clic sobre los valores y nos muestra:
El gráfico finalmente quedará como se muestra a continuación:
Estadística en Excel
21
WŽƌĐĞŶƚũĂĞ
ŝƐƚƌŝďƵĐŝſŶƉŽƌĐĞŶƚƵĂůĚĞŽƉŝŶŝſŶƐŝƌĞĐŚĂnjĂƌşĂ ƉƌŽƉƵĞƐƚĂĚĞƚƌĂďĂũŽƉŽƌƋƵĞĚĂƌƐĞĞŶůĂ ĞŵƉƌĞƐĂ ϯϬй Ϯϱй ϮϬй ϭϱй ϭϬй ϱй Ϭй
Ϯϱ͘ϵϱй ϭϵ͘ϰϲй
ϮϬ͘ϬϬй
ϮϬ͘ϱϰй
/ŵƉƌŽďĂďůĞ
EŽĞƐƚĄ ƐĞŐƵƌŽ
WƌŽďĂďůĞ
ϭϰ͘Ϭϱй
DƵLJ ŝŵƉƌŽďĂďůĞ
DƵLJƉƌŽďĂďůĞ
KƉŝŶŝſŶ
Estadística en Excel
22
Ejercicio 2 - Tabla de contingencia o de doble entrada El presente ejercicio tiene como finalidad que el alumno maneje los procedimientos para la elaboración de una tabla de contingencia o de doble entrada. Las tablas de contingencia se emplean para registrar y analizar la relación entre dos o más variables. Se utilizan para representar gráficamente variables nominales u ordinales. En la hoja Ejercicio 2, copie los datos de las variables Genero (1) y Prom-gen (9) y elabore: a. Las tablas de contingencia de frecuencias absolutas y porcentual respecto a cada género. b. Tomando como base la tabla de frecuencias porcentual obtenida en el punto anterior, elabore el diagrama de columnas de la variable Genero por Prom-gen. Solución a.
La tabla de contingencia de frecuencias absolutas y porcentuales respecto a cada género. Seleccione el rango de datos B1:C186 y active en la barra de menú la opción Insertar y luego tabla dinámica
Clic en Aceptar. Aparecerá:
Estadística en Excel
23
Arrastre el recuadro Prom-gen que aparece en el lado superior derecho a la zona de campos de fila y Género va al encabezado de columna.
Luego arrastre cualquiera de las variables, al campo de valor, aparecerá la tabla dinámica:
Copie la tabla y péguela a partir de la celda E13.
Estadística en Excel
24
Ubique el cursor del mouse sobre la celda Cuenta de Prom-gen y dé doble clic. Aparecerá el siguiente cuadro:
Activar pestaña de mostrar datos como y seleccionar de las opciones el % del total general
La tabla de contingencia mostrará las frecuencias porcentuales. Copiar la tabla a partir de la celda E18
Estadística en Excel
25
Nota: De manera similar se pueden obtener las frecuencias porcentuales respecto al total columnas o de filas seleccionando la opción: % del total de columna o % del total de fila según sea el caso b.
Tomando como base la tabla de frecuencias relativas obtenida en el punto anterior, elabore el diagrama de columnas de la variable Género por Prom-gen. Seleccione el rango de datos: E18:G21 Clic en la opción Insertar de la barra de menú. Active el icono Columnas agrupadas.
Hacer doble clic en el área del gráfico y aparecerá una pestaña de Herramientas de gráficos con las opciones: Diseño, Presentación y formato. Seleccionar Presentación, y de ahí escogemos botón Título de gráfico, rótulo del eje y etiqueta de datos. En título del gráfico escriba: Opinión de oportunidades de ser promovidos en el trabajo y género. En rótulos del eje X escriba: Opinión En rótulos del eje Y escriba: Porcentaje
Estadística en Excel
26
WŽƌĐĞŶƚĂũĞ
KƉŝŶŝſŶĚĞŽƉŽƌƚƵŶŝĚĂĚĞƐĚĞƐĞƌƉƌŽŵŽǀŝĚŽƐĞŶĞů ƚƌĂďĂũŽLJŐĠŶĞƌŽ ϲϬ͘ϬϬй ϱϬ͘ϬϬй ϰϬ͘ϬϬй ϯϬ͘ϬϬй ϮϬ͘ϬϬй ϭϬ͘ϬϬй Ϭ͘ϬϬй
&ĞŵĞŶŝŶŽ DĂƐĐƵůŝŶŽ
DĞũŽƌĞƐ
EŽŝŶĨůƵLJĞ
WĞŽƌĞƐ
KƉŝŶŝſŶ
•
En el botón etiquetas de datos, seleccionar la posición donde irán los valores de cada barra.
El gráfico finalmente quedará como se muestra a continuación:
Ejercicio 3 - Gráfico de Pareto Estadística en Excel
27
El ejercicio 3 tiene como objetivo elaborar el gráfico de Pareto el cual es un gráfico de barras ordenado por frecuencias por medio del cual se puede detectar e identificar los problemas que tienen más relevancia, por lo que este tipo de gráfico es utilizado para separar los aspectos significativos de un problema y dirigir adecuadamente los esfuerzos de mejora. Caso 2. CBT Co es un distribuidor de productos de automatización eléctricos y transmisiones de poder. Últimamente se ha observado un constante retraso en las entregas por lo que el gerente desea saber cuáles son los errores más frecuentes para tomar una acción de mejora. Por lo tanto diseñó un formato donde se registran los errores de cada orden que no se entregan a tiempo. Los datos se encuentran en la base de datos ÓRDENES. Realice un análisis de los tipos de errores que se presentan en la entrega a destiempo de los pedidos y ayude al gerente a decidir cuáles son las causas principales de este problema. Utilice la hoja ÓRDENES.xlsx y elabore el diagrama de Pareto. Solución Seleccione la pestaña Insertar luego active la opción tabla dinámica. Seleccione el rango de datos B1:B101 y la ubicación de salida del cuadro en la celda D4. Arrastre el recuadro Tipo de errores que aparece en el lado superior derecho, a la zona de FILA y a la zona de DATOS. Luego presione Aceptar y Finalizar para obtener la tabla dinámica.
Copie la tabla a partir de la celda D19. Ordene las categorías de la tabla según la frecuencia en orden descendente.
Estadística en Excel
28
Clic en aceptar y resultará:
Calcule la frecuencia relativa (h), la frecuencia relativa acumulada (H) y la frecuencia porcentual acumulada.
Estadística en Excel
29
Como las dos últimas categorías tienen una cantidad muy baja podemos unirlos en otro rubro denominado “otros”. Crear nueva tabla en D29.
Seleccionar las celdas D29:E34 y I29:I34. Elegimos como tipo de gráficos “columnas”, el cual está marcado por defecto.
Ahora pulsamos con el botón derecho del mouse en cualquiera de las barras Pi. Clic en cambiar tipo de gráfico en serie y elegimos tipo de gráfico Líneas
y aceptar. Nos dará el siguiente gráfico. Estadística en Excel
30
En él hay que hacer varias modificaciones: En primer lugar, la escala de valores de la izquierda, cuyo valor máximo es 100. Para ello, clic con el botón derecho del mouse sobre la línea del eje Y. Seleccionar dar formato a ejes Seleccionar opciones del eje y dar el valor máxima 100, como se muestra a continuación.
Clic en cerrar. Aparecerá
En segundo lugar, pulsamos con el botón derecho del mouse sobre cualquiera de los puntos de la línea y elegimos la opción Dar Formato de serie de datos.
Estadística en Excel
31
En el recuadro Opciones de serie, seleccionar Eje secundario.
Y luego cerrar.
Igual se hace para modificar los valores del eje de la derecha que está entre 0 y 100.
Ahora, colocaremos los valores sobre los puntos de la línea. Hacer clic sobre la línea y seleccionamos agregar etiquetas de datos y automáticamente aparecen los valores.
Estadística en Excel
32
Y para terminar en la barra de menú escoger Insertar y seleccionar la pestaña Presentación. Escoger botón Título de gráfico, rótulo del eje y etiqueta de datos para completar todo el gráfico y finalmente quedará como se muestra a continuación.
Estadística en Excel
33
Ejercicio 4 – Distribución de frecuencias discretos y gráfico.
de datos
Con el desarrollo del ejercicio 4, se espera lograr en el alumno elabore tablas y gráfico para datos discretos. Para este ejercicio trabajaremos con el archivo Base de datos.xls con la hoja Ejercicio 4. Copie los datos de la variable No-Capac (10) y elabore: a. La tabla de distribución de frecuencias. b. El diagrama de bastones. Solución a. La tabla de distribución de frecuencias. Halle el rango de valores mínimo y máximo del número de capacitaciones (No-Capac). Puede utilizar las funciones Max para el valor máximo y Min para el valor mínimo. A partir de la celda D6 coloque los valores posibles de la variable. Tome en cuenta los valores máximo y mínimo de la variable y que es entera. Seleccione el rango E6:E11. en el cual aparecerán las frecuencias respectivas.
Active el icono de Insertar función. Seleccione FRECUENCIA y dé Aceptar.
Estadística en Excel
34
En la ventana de FRECUENCIA, ingrese en Datos el rango de los datos que se desea contar B2:B186. En Grupos, ingrese el rango de celdas de las categorías de la variable D6:D11.
Finalmente, manteniendo presionado CONTROL + SHIFT presione ENTER. Aparece la siguiente tabla de frecuencia.
•
Complete la tabla calculando la frecuencia relativa (h)
Nota.- Una manera alternativa de obtener la tabla de frecuencias es con la función contar o con el uso de la tabla dinámica. b. El diagrama de bastones.
Estadística en Excel
35
•
Seleccione las celdas F6:F11
En la barra de menú, la opción insertar, seleccionado el tipo línea-línea con marcadores, se muestra lo siguiente
•
El gráfico obtenido es:
• Para presentar el gráfico de bastones, se seguirá los siguientes pasos Ubicarse en el gráfico, eliminar la leyenda, asignar los ejes con los valores respectivos, agregar título, etiquetas a los ejes. Para cambiar los valores del eje X dar click derechoSeleccionar origen de datos –Editar
Estadística en Excel
36
Se muestra la siguiente tabla para designar el rango de rotulo de datos
Marcar la serie derecha, click derecho –Formato de serie de datos-color de línea-sin línea
Para hacer los bastones, seleccionar el área de gráfico, y en herramientas de gráfico, la opción Líneas-Líneas de unión Estadística en Excel
37
Tener en cuenta que en opciones del eje, el eje vertical cruza en categoría 1, se han agregado etiquetas en formato porcentaje.
Finalmente el gráfico queda así:
Estadística en Excel
38
Ejercicio 5 - Distribución de frecuencias con intervalos y gráficos. En el siguiente ejercicio tiene como objetivo mostrar paso a paso la herramienta proporcionada por Excel para la elaboración de tablas de frecuencia para datos agrupados en intervalos, así como sus gráficas respectivas. En la hoja Ejercicio 5 del archivo BaseDatos_1.xlsx, copie los datos de la variable Ing-pers (5) y elabore: a. La tabla de frecuencias con los datos agrupados en intervalos. Utilice la regla de Sturges. b. El histograma, el polígono de frecuencias y la ojiva. Solución a. La tabla de frecuencias con los datos agrupados en intervalos. Utilice la regla de Sturges. En la celda E3 obtenga el número de datos. =CONTAR(B2:B186) En la celda E4 obtenga el valor máximo de los datos: =MAX(B2:B186) En la celda E5 obtenga el valor mínimo de los datos: =MIN(B2:B186) En la celda E7 calcule el rango: =E4 – E5 En la celda E8 calcule el número de intervalos (k). Recuerde que el número de intervalos es entero redondeado al valor más cercano, es decir: =REDONDEAR(1+3.322*LOG10(E3),0) En la celda E9 calcule la amplitud del intervalo (w). Recuerde que la amplitud del intervalo se redondea por exceso usando la misma precisión (cantidad de decimales) que los utilizados por los datos, es decir: =REDONDEAR.MAS(E7/E8,0)
Genere los límites de cada uno de los intervalos. En la celda H5 elija como el límite inferior del primer intervalo el valor mínimo. A partir de este valor genere los demás límites. En la celda H6, sume la amplitud del intervalo para determinar el segundo límite inferior de clase. Continúe en las celdas siguientes verticalmente hasta completar los límites inferiores de las clases restantes. Obtenga los límites superiores correspondientes a cada clase. A partir de la celda K5 obtenga la marca de clase de cada intervalo que es el promedio de los respectivos límites.
Estadística en Excel
39
Obtenga las frecuencias utilizando la metodología vista en el ejercicio 4, considerando como GRUPOS los límites superiores de los intervalos.
Complete la tabla de distribución de frecuencias calculando las frecuencias faltantes. La tabla generada será la siguiente:
Estadística en Excel
40
b. El histograma, el polígono de frecuencias y la ojiva. Seleccionar H5:H13, luego en barra de menú la opción Insertar, columna, columna agrupada
Para que se junten los rectángulos: hacer clic en una barra, y elegir dar formato a serie de datos, luego en ancho del intervalo 0%
Para que aparezca los límites de cada clase, se procede de la siguiente manera. Clic con el botón derecho en una barra y seleccionar datos.
Estadística en Excel
41
Clic en editar e indicar posición de los rótulos del eje
Dé aceptar y mostrará lo siguiente.
Y para finalizar colocar el eje Y en porcentaje, el título del gráfico y los rótulos del eje Y e X.
De una manera similar debe construirse el polígono de frecuencias y la ojiva, tal como se muestra a continuación. Estadística en Excel
42
Estadística en Excel
43
Ejercicio 6 - Medidas descriptivas para datos no agrupados o simples En el siguiente ejercicio tiene como objetivo mostrar paso a paso la herramienta proporcionada por Excel para el cálculo de las medidas descriptivas para datos agrupados en intervalos. En la hoja de ejercicios 6 copie los datos de la variable No-Capac (10) y calcule las medidas descriptivas. Solución En la celda E15 active el ícono Insertar función. En el cuadro de diálogo O seleccionar una categoría: seleccione Estadísticas y seleccionar una función PROMEDIO
En Número1 digite el rango correspondiente a los datos y luego dé aceptar.
Estadística en Excel
44
El mismo procedimiento debe seguir para el cálculo de las otras medidas descriptivas. Digite las siguientes fórmulas a partir de la celda E16. MEDIANA
=MEDIANA(B2:B186)
MODA
=MODA.UNO(B2:B186)
VARIANZA MUESTRAL
=VAR.S(B2:B186)
DESVIACIÓN ESTANDAR MUESTRAL
=DESVEST.M(B2:B186)
Otra opción fácil de emplear para calcular las principales medidas descriptivas es usando la barra de menú. Active Datos, luego Análisis de datos y estadística descriptiva.
Luego dé aceptar. En la ventana de Estadística descriptiva, en Rango de entrada: ingrese el rango de las celdas donde están los datos B2:B186. La opción Rótulos de la primera fila selecciónela sólo si la primera fila del rango de datos corresponde al nombre de la variable. Active la opción Resumen de estadísticas y en Rango de salida elija una celda en especial (también puede elegir una hoja nueva o un libro nuevo).
Estadística en Excel
45
Se visualizará lo siguiente, luego de dar aceptar a la ventana anterior. No-capac Media Error típico Mediana Moda
0.09321301 1 1
Desviación estándar
1.267834001
Varianza de la muestra
1.607403055
Curtosis
0.446737249
Coeficiente de asimetría
0.852503002
Rango
Estadística en Excel
1.448648649
5
Mínimo
0
Máximo
5
Suma
268
Cuenta
185
46
Ejercicio 7 – Medidas descriptivas para datos no agrupadas de acuerdo a las categorías de una variable cualitativa. En el siguiente ejercicio tiene como objetivo mostrar paso a paso la herramienta proporcionada por Excel para el cálculo de medidas descriptivas para datos no agrupados de variables cualitativas. En la hoja de ejercicio 7 copie los datos de las variables Función (2) e Ing-pers (5) y calcule la media, la desviación estándar y el coeficiente de variación del ingreso personal de los trabajadores (Ing-pers) para cada tipo de función de trabajador (Función). Solución En la celda E1, seleccionar Insertar, tabla dinámica.
Arrastre la variable Función a fila e Ing-pers a columna y nos mostrará:
Estadística en Excel
47
Ubique el cursor del mouse sobre la celda Suma de Ing-pers y dé doble clic. Aparecerá el cuadro la configuración de campo de valor.
En el grupo de opciones Resumir valores por: Promedio y dé aceptar.
Los datos de la tabla dinámica cambian presentando los promedios de los ingresos personales por categoría de la variable Función. A partir de la celda E15 elabore una tabla copiando los resultados obtenidos en la tabla dinámica.
Estadística en Excel
48
Nuevamente ubique el cursor del mouse esta vez sobre la celda Promedio de Ing-pers y dé doble clic. Aparecerá el cuadro Configuración de campo de valor. En el grupo de opciones Resumir campo de valor por, seleccionar la opción Desvest y dé Aceptar.
Copie los valores de las desviaciones estándar de las categorías de función en la tabla inferior, al lado de los respectivos valores del promedio.
Finalmente obtenga los valores del coeficiente de variación (CV) de cada categoría de función dividiendo la desviación estándar entre el promedio y expresando el resultado en porcentaje.
Estadística en Excel
49
Estadística en Excel
50
Ejercicio 8 – Diagrama de cajas El siguiente ejercicio tiene como objetivo mostrar paso a paso la herramienta proporcionada por Excel para la construcción de los diagramas de cajas. Haga un diagrama de cajas que permita comparar las notas del parcial por horario Calcule los percentiles de cada sección y escríbalos de la siguiente manera: (VWDGtVWLFD
.
-
/
3HUFHQWLO
0tQLPR
3HUFHQWLO
0i[LPR
3HUFHQWLO
Seleccione el cuadro anterior, e ingrese a Insertar y elija Líneas
Luego seleccione la opción Lineas con marcadores
Estadística en Excel
51
En la barra de menú, escoger insertar luego diseño y finalmente cambiar entre filas y columnas.
Marque cualquiera de las líneas horizontales y dé botón derecho. Elija la opción Formato de serie de datos. Luego aparece la siguiente ventana. Escoger:
Con esto se eliminará la línea horizontal. Hay que repetir el proceso hasta eliminar todas las líneas.
Estadística en Excel
52
Dé clic en el gráfico y elija la opción Análisis, Barras ascendentes o descendentes y nos dará:
Luego para hacer los bigotes de las cajas, se procederá a : Análisis, líneas y luego líneas de máximos y mínimos.
Y finalmente se pondrá título y rótulos a los ejes, quedando finalmente el gráfico de la siguiente manera:
Estadística en Excel
53
Ejercicio 9. Diagrama de dispersión y coeficiente de correlación El siguiente ejercicio tiene por objetivo mostrar paso a paso las herramientas proporcionada por Excel para la construcción de los diagramas de dispersión y el cálculo del coeficiente de correlación. Un curso de estadística tiene tres horarios y el coordinador del curso y los profesores están interesados en construir gráficos que le permita analizar las notas de las distintas evaluaciones y en los distintos horarios. Los datos se encuentran en el archivo: Base_Datos_2.xlsx. Realice un diagrama de dispersión y calcule el coeficiente de correlación entre las variables notas de la primera práctica y notas del parcial. Solución Elaborando el diagrama de dispersión. Seleccione los datos, active Insertar y elija Dispersión
Seleccione la primera opción y aparecerá el siguiente gráfico.
Estadística en Excel
54
Añadir el título y rotular los ejes
Marque cualquiera de los puntos azules y de botón derecho. Marque la opción Agregar línea de tendencia… del menú desplegable.
Y luego cerrar. Aparecerá de la siguiente forma:
•
Calculando el coeficiente de correlación.
Estadística en Excel
55
Insertar la función : COEF.DE.CORREL.
Dé aceptar. Ingrese los datos de las dos variables que quiere relacionar:
Dé aceptar. Y aparecerá el valor del coeficiente de correlación, 0.8286
Estadística en Excel
56
Distribución de probabilidades
Estadística en Excel
Ejercicio 1 - Distribución Binomial
Ejercicio 2 - Distribución Hipergeométrica
Ejercicio 3 - Comparación entre distribuciones Binomial e Hipergeométrica
Ejercicio 4 - Distribución de Poisson
Ejercicio 5 - Distribución Exponencial
Ejercicio 6 - Distribución Normal
57
Ejercicio 1 – Distribución Binomial Se sabe que el 12% de las personas que son atendidas en un centro de telefonía móvil se quejan de la atención. Se eligen aleatoriamente a 180 personas que son atendidas en dicho centro de atenciones. a. ¿Cuál es la probabilidad de que a lo más 45 personas reporten quejas por la atención? b. ¿Cuál es la probabilidad de que el número de quejas este comprendido entre 28 y 50, sin incluir estos valores? c. Elabore el gráfico de la función de probabilidades. Solución a. Sea X: la cantidad de personas que se quejan de la atención del centro de telefonía. X ∼B (180; 0,12) y la probabilidad que nos piden es: P(x 45) Trabaje en una hoja nueva. En la celda B2 ingrese el número de ensayos: 180. En la celda B3 ingrese la probabilidad de éxito: 0,12. A partir de la celda A6, construya una tabla con los valores de x de 0 a 180.
Ubicarse en la celda B6, Ir a Funciones, elegir Categoría Estadística y en función: DISTR.BINOM.N Hacer clic en aceptar y aparecerá un cuadro de diálogo. Colocar la siguiente información:
Estadística en Excel
58
NOTA 1: Recuerda que debes fijar con la tecla de función F4 los valores de: Ensayos (180) y Prob_éxito (0,12) y en Acumulado escribir cero o falso (para que te arroje la probabilidad simple y no acumulada). Luego dar clic en aceptar y se obtendrá la probabilidad cuando X es igual 0 NOTA 2: Los otros valores de la probabilidad de x (P(X=x) serán obtenidos realizando un arrastre.
En una escriba rango de B6:B51
Estadística en Excel
celda vacía =suma y seleccione el celdas siguiente:
59
La respuesta es: P(X< = 45)
=
0.99999953
b. Nos piden: P (28< X < 50) Elija una celda vacía cualquiera y escriba =suma (B35:B55) La respuesta es: P (28 < x < 50) = 0.06106448 c. Para graficar la función de probabilidad De la tabla de distribución de probabilidades, seleccione las dos columnas x y P(x). Ingrese a Insertar y luego a Dispersión
Hacer clic donde dice dispersión (el primer icono) y automáticamente te presentara el siguiente gráfico:
Estadística en Excel
60
Este gráfico nos muestra el comportamiento de una variable que tiene distribución Binomial con los parámetros n=180 y p=0,12. Nota: Si se desea dar formato al gráfico (es decir, agregarle título, indicar los subtítulos en los ejes, etc.) hacer clic en un lugar dentro del mismo y automáticamente en la parte superior de la hoja de cálculo aparecerán las opciones y elegir uno de los iconos donde dice diseño de gráfico. Si se elige el primero, con un solo clic Excel te dará la opción que se observa en el gráfico siguiente:
Ahora con un solo clic en cada uno de los títulos podrás cambiarlos.
Estadística en Excel
61
También puedes usar el gráfico de bastones visto en el capítulo 2 para obtener algo así:
Estadística en Excel
62
Ejercicio 2 – Distribución hipergeométrica En un lote de 150 computadoras de la marca Compacto, existen 40 computadoras con el disco duro dañado. Un comprador desea adquirir todo el lote, pero lo hará siempre y cuando, al elegir 60 computadoras al azar, al probarlas a lo más 3 de ellas estén dañadas. a. Elabore la tabla de distribución de probabilidades del número de computadoras con disco duro dañado. b. Halle la probabilidad de seleccionar más de 20 pero menos de 33 computadoras con el disco duro dañado. c. Halle la probabilidad que el comprador no adquiera el lote. Solución a.
Sea X: número de computadoras con disco dañado, entonces X ∼ H(150,60,40) En una hoja de cálculo, a partir de la celda A1 defina los parámetros de la distribución hipergeométrica y elabore la tabla con valores de la variable de 0 a 40.
Ubicarse en la celda C6, ir a Funciones, seleccione la categoría Estadística y en ella la función Distr.Hipergeom.N
Estadística en Excel
63
Hacer clic en aceptar y aparecerá la siguiente ventana:
Ingresar los valores de la variable y los parámetros de la distribución. Como la función se copiará en las celdas inferiores, no olvidar fijar las celdas con F4. A continuación ubicar el cursor en la esquina del extremo inferior izquierdo de la celda C6 y hacer un arrastre para obtener los demás valores.
Estadística en Excel
64
b. Para el cálculo del valor P (20 < X < 33), de la tabla sume los valores de probabilidad de X = 21 a X = 32; para esto ubicar el cursor en una celda vacía y escribir: =SUMA (C21:C32)
El valor de P (20 < X < 33) es 0.04560813 c. Para no aceptar el lote se debe cumplir que X > 3. La probabilidad de que eso suceda es P(X > 3). De la tabla, sumar los valores de probabilidad de X = 4 a X = 40. O si prefiere podría usar la siguiente equivalencia: P(X > 3) = 1 – P( X < = 3) = 1 - SUMA(C6:C9)
La respuesta es: 0.99999979
Ejercicio 3 – Comparación entre distribuciones Binomial e Hipergeométrica Considere una población de N solicitantes de trabajo en la que sólo 1/3 son aptos. De la población se eligen al azar una muestra de 4 solicitantes y se define la variable aleatoria X como el número de solicitantes aptos en la muestra. a. Elabore las tablas de distribución de probabilidades para los casos: N = 12; 24; 60; 120 y 1 200. b. Considere que X sigue una distribución binomial con parámetros n = 4 y p = 1/3 y elabore la tabla de distribución de probabilidades. c. Compare gráficamente los valores de las tablas obtenidos en los incisos a y b. d. Con los resultados obtenidos en el punto anterior, ¿a qué conclusiones se puede llegar sobre la distribución de X en relación al valor de N? Sustente claramente su respuesta. Solución a. La variable sigue una distribución hipergeométrica con parámetros N, M, n = 4 En una hoja de cálculo defina los valores de los parámetros de la distribución tal como se muestra a continuación: Estadística en Excel
65
Para cada serie de parámetros generar una tabla de distribución de probabilidades, la variable aleatoria variará en este caso de 0 a 4.
b. Generar una tabla de distribución de probabilidades de la variable binomial con n=4 y p=1/3.
De las dos tablas anteriores, se observa que las probabilidades obtenidas con la distribución hipergeométrica con N=1200, M=400, n=4, se asemejan a las probabilidades obtenidas con la distribución binomial con n=4 y p=1/3. c. Los valores de las tablas se presentan en un solo gráfico, tal como se muestra a continuación:
Estadística en Excel
66
Comparación de las distribuciones hipergeométrica y binomial 0.50 0.45 0.40 0.35
12 24 60 120 1200 Binomial
P(x)
0.30 0.25 0.20 0.15 0.10 0.05 0.00 0
1
2
3
4
X
El gráfico muestra que a medida que el tamaño de la población es más grande respecto del tamaño de la muestra, la distribución hipergeométrica tiende a comportarse como una distribución binomial, es decir que la proporción de éxitos en la población se puede considerar aproximadamente constante. En la gráfica, las curvas correspondientes a la distribución binomial y e la hipergeométrica con N = 1200 están prácticamente superpuestas.
Estadística en Excel
67
Ejercicio 4 - Distribución de Poisson El número de pacientes por día que llegan al consultorio de la doctora Carla sigue una distribución de Poisson con un promedio de 10 clientes por día. Por lo complicado de su horario, dado que trabaja también en otros hospitales, ella solo puede atender un máximo de 20 clientes. Si llegan más de 20 clientes, al exceso los atenderá al día siguiente en estricto orden de llegada. a. Elabore la tabla de distribución de probabilidades de la variable X: número de pacientes que llegan al consultorio de la doctora al día. b. ¿Cuál es la probabilidad de que lleguen más de 10pacientes pero a lo más 19 en un día cualquiera? c. ¿Cuál es la probabilidad de atender pacientes al día siguiente? Solución a.
Sea X: número de pacientes que llegan al consultorio al día. Por dato X ∼ Poisson con promedio de 10 En una hoja de cálculo, a partir de la celda A1 definir el parámetro de la distribución Poisson y elaborar la tabla con valores de la variable de 0 a 20 (o más). Ubicarse en la celda B4, ir a Funciones, seleccionar la categoría Estadística y en ella la función POISSON.DIST
Dar clic en aceptar y aparecerá la siguiente ventana:
Estadística en Excel
68
Ingresar los valores de la variable y los parámetros de la distribución. Como la función se copiará en las celdas inferiores, no olvidar fijar las celdas con F4. A continuación ubicar el cursor en la esquina del extremo inferior izquierdo de la celda C4 y hacer un arrastre para obtener los demás valores.
b. Para encontrar P(10 < X < = 19) se debe ubicar el cursor en una celda vacía cualquiera y escribir: =SUMA(C14:C23) la respuesta es: 0.53861594 d. Para que los pacientes sean atendidos al día siguiente calcular: P(X > 20) = 1 – P( X 20). Ubicar el cursor en una celda vacía cualquiera y escribir: =1 -SUMA(C4:C24) la respuesta es: 0.00158826
Estadística en Excel
69
Ejercicio 5 – Distribución Exponencial Una empresa brinda un servicio a su público mediante el uso de una ventanilla de atención. El tiempo que transcurre entre llegadas de clientes sigue una distribución exponencial con un tiempo promedio entre llegadas de 4 minutos. Si se define X como el tiempo que transcurre desde la llegada del último cliente: a. ¿Cuál es la probabilidad de que deba esperarse máximo 15 minutos para que llegue un cliente? b. ¿Cuál es la probabilidad de que deba esperarse más de 10 minutos para que llegue un cliente? c. ¿Cuál es la probabilidad de que deba esperarse más de 10 minutos pero menos de 20 minutos para que llegue un cliente?
Solución a.
La variable X∼Exp(1/4), donde: parámetro = 1/ ȕ = 1/4 = 0,25. En una hoja de cálculo definir el parámetro y el valor de la probabilidad solicitada.
Ubicarse en la celda C4, ir a Funciones, seleccione la categoría Estadística y en ella la función DISTR.EXP.N.
Luego dar clic en aceptar y se mostrará la siguiente ventana:
Estadística en Excel
70
El valor encontrado es: P(X 15) = 0.976482254 Note que en este caso en Acum se DEBERÁ escribir 1, ya que se está calculando una probabilidad acumulada. b. Para obtener P(X > 10) = 1 - P(X 10), en una celda vacía escribir: =1-DISTR.EXP.N(10,0.25,1) y la respuesta es: 0.08208 c. Para obtener P(10 < X < 20) = P(X 230) = 1 – P(X 230) = 1 – DISTR.NORM.N(230,200,15,1) = 1 - 0,97725 = 0,02275 d. El cálculo requiere utilizar la función inversa dado que el dato es la probabilidad y la incógnita es el valor de la variable. En una celda vacía ingresar el valor 0,25 que corresponde a la proporción de contenidos de menos valor. Ubicarse en otra celda vacía, ir a función, seleccionar la categoría Estadística y en ella la función INV.NORM
Estadística en Excel
73
Ingrese los valores de los parámetros de la distribución y de la probabilidad. Obtendrá el valor de la variable: X = 189,882654
Estadística en Excel
74
View more...
Comments