Bioestadística Actualizada. 2022-2
January 24, 2024 | Author: Anonymous | Category: N/A
Short Description
Download Bioestadística Actualizada. 2022-2...
Description
UNIVERSIDAD AUTÓNOMA DE SANTO DOMINGO FACULTAD DE CIENCIAS ECONÓMICAS Y SOCIALES ESCUELA DE ESTADÍSTICA
GUÍA DIDÁCTICA BIOESTADÍSTICA
NOMBRE DEL/LA ESTUDIANTE _______________________________________________________________________________________
NÚMERO EN LA LISTA_________ SECCIÓN________ CARRERA___________________________ Autor: Leonido Rosario Peña, MA
ii
PRÓLOGO Este material didáctico se ha escrito para satisfacer la necesidad de tener una guía que sirva no solo para tener las ideas principales de la estadística, sino además que facilite el trabajo al estudiante en el sentido que pueda trabajar directamente, sin tener que perder tiempo copiando ejercicios. Esta guía no pretende sustituir ningún libro de texto formal, sino más bien es la compilación de ejercicios y ejemplos de diferentes libros.
En este material se puede trabajar los ejemplos y ejercicios directamente, además las gráficas tienen los espacios correspondientes para realizarlas en el mismo. Esta guía tiene seis capítulos desarrolladas conforme a las unidades del programa de la asignatura Fundamento de Estadística (EST-1100). Después de cada unidad se encuentra una práctica que ayudará al estudiante a afianzar los conocimientos adquiridos, conceptuales, procedimentales y actitudinales.
Los contenidos desarrollados en esta guía pueden ser trabajados con el programa Excel, además se usarán calculadoras científicas y aplicaciones informáticas como herramientas para el manejo de cálculo numérico, pero se hará énfasis en el análisis estadístico.
iii
ÍNDICE GENERAL PRÓLOGO
ii
CAPÍTULO 1. Conceptos fundamentales de la Estadística 1.1 Introducción 1.2 Estadística y sus divisiones 1.3 Conceptos básicos 1.4 Variables y sus clasificaciones 1.5 Niveles de medición de las variables 1.6 Tipos de fuentes 1.7 Pasos del método estadístico
1 2 3 3 4 7 8 10
PRÁCTICA 1. Conceptos fundamentales de la Estadística
11
CAPÍTULO 2. Organización de los Datos 2.1 Introducción 2.2 Organización de los datos 2.3 Presentación de los datos 2.4 Tablas y gráficos para describir relaciones entre variables
19 20 20 31 46
PRÁCTICA 2. Organización de los Datos
52
CAPÍTULO 3. Medidas de Tendencias Céntricas 3.1 Introducción 3.2 Notación sumatoria 3.3 Media aritmética para datos sueltos 3.4 Características de la media aritmética 3.5 Mediana para datos sueltos 3.6 Características de la mediana 3.7 Moda para datos sueltos 3.8 Características de la moda 3.9 Comparación de la media, mediana y la moda 3.10 Media, mediana y moda para datos agrupados 3.13 Media geométrica 3.14 Tasa de incremento porcentual promedio durante el tiempo 3.15 Características y aplicaciones de la media geométrica 3.16 Media armónica 3.17 Características y aplicaciones de la media armónica 3.18 Media cuadrática 3.19 Características y aplicaciones de la media cuadrática
75 76 76 78 79 80 80 81 81 82 83 87 89 90 90 91 91 91
PRÁCTICA 3. Medidas de Tendencias Céntricas
93
iv
CAPÍTULO 4. Medidas de Posición 4.1 Introducción 4.2 Percentiles 4.3 Deciles 4.4 Cuartiles 4.5 Uso de Excel para encontrar percentiles 4.6 Percentiles, deciles y cuartiles para datos agrupados
103 104 104 106 108 110 111
PRÁCTICA 4. Medidas de Posición
112
CAPÍTULO 5. Medidas de Dispersión
120
5.1 5.2 5.3 5.4 5.5 5.6 5.7
Introducción Rango Rango intercuartil Rango semi-intercuartil o Desviación intercuartílica Desviación media absoluta Varianza Desviación estándar
121 122 122 122 122 122 122
5.8 Uso de la calculadora científica para calcular x / ó s / para datos sueltos
126
5.9 Varianza para datos agrupados 5.10 Desviación estándar para datos agrupados 5.11 Importancia de la desviación estándar 5.12 Coeficientes de variación
129 129 130 131
PRÁCTICA 5. Medidas de Dispersión
133
CAPÍTULO 6.
Concepto, Principios y Cálculo de Probabilidad
143
6.1 Introducción 6.2 Concepto de probabilidad 6.3 Enfoque clásico 6.4 Enfoque De Frecuencia Relativa 6.5 Enfoque Subjetivo 6.6 Reglas de la probabilidad 6.7 Unión de conjuntos A y B 6.8 Intersección de conjuntos A y B 6.9 Eventos Mutuamente Excluyentes 6.10 Eventos No Mutuamente Excluyentes 6.11 Eventos independientes 6.12 Probabilidad Condicionada 6.13 Eventos Dependientes 6.14 Ejemplos complementarios de probabilidades
143 146 146 150 151 151 152 152 153 154 155 157 158 159
PRÁCTICA 6. Concepto, Principios y Cálculo de Probabilidad
162
CAPÍTULO
1
Conceptos Fundamentales de la Estadística Competencias Específicas ✓ Razona y argumenta. Reconoce el origen, concepto y uso de la estadística. Establece diferencia y similitud entre conceptos básicos estadísticos. Identifica el nivel de medición de una variable. Reconoce los pasos del método estadístico para la investigación científica.
✓ Comunica Fuente: Ministerio de Educación
Se expresa utilizando los conceptos básicos estadísticos.
En el mundo en que vivimos, donde las personas somos diferentes, ✓ Modela y Representa pensamos diferentes y nos comportamos de manera distinta, son Modela e interpreta situaciones de diversas las variables que confluyen, estando muchas de ellas la vida diaria a través de la relacionadas entre sí. estadística. El universo como tal es sumamente cambiante y son diversas las ✓ Conecta Utiliza los conceptos básicos de variables que podemos observar y medir. El calentamiento global y estadística y lo relaciona con la los fenómenos naturales, la velocidad y el tiempo, densidad y el ciencia de la educación. volumen de un cuerpo, la privación del sueño y el comportamiento agresivo, entre otras muchas interactúan, de manera simple o ✓ Resuelve problemas compleja. Usa la estadística como una herramienta poderosa para la
Las ciencias estudian las relaciones entre distintas variables, para investigación científica. hacer esto, luego de recoger datos, necesita clasificarlos y organizarlos. Una vez los datos han sido recolectados, ¿cómo se ✓ Utiliza herramientas tecnológicas pueden clasificar? Esta unidad muestra los tipos de datos con que se cuenta en un análisis estadístico, además se da una panorámica de los conceptos básicos que nos servirán como zapata para la construcción del edificio llamado conocimiento científico.
Usa las Tics para solucionar problemas estadísticos.
2 Estadística Básica
1.1 Introducción El vocablo statistik proviene de la palabra italiana estatista que significa “estadista”. Fue utilizada por primera vez por Gottfried Achenwall (17191772), un profesor alemán. Prehistoria
Reseña histórica de la estadística Censo Bíblico en el AT
Rey Enrrique VII
Aplicaciones de la estadística a la ciencia de la educación: La estadística está presente en todas las ramas del saber. En la ciencia de la educación tiene una gama de aplicaciones, veamos: En el ambiente educativo, normalmente se escucha a profesores/as, a directores/as de centros, de distritos, de direcciones regionales, etc., hablar del plan de clases, de programación de actividades, en fin, se les escucha hablar de planificar las cuestiones educativas propias de su desempeño. Estos planes y programas oscilan en torno a un grupo de estudiantes, a un contenido educativo, a un centro docente, una comunidad educativa o una sociedad de padres y amigos de la escuela, entre otras. Cuando se habla de planificación ésta puede ser considerada a nivel micro o a nivel macro, todo depende de si se refiere a una parte pequeña o una parte grande, si es una unidad de un conglomerado o es el conglomerado completo. No importa si se habla de una cosa o de la otra, en cualquier caso, se está hablando de planificación e ineludiblemente al hablar de ésta, se está hablando de Estadística. La estadística es la base de la planificación. Para planificar y obtener resultados acertados hay que disponer de estadísticas confíales y oportunas. Confiable significa que respondan a la realidad y que sean de cobertura total y lo de la oportunidad guarda referencia con el momento; un dato estadístico deja de ser bueno cuando pierde oportunidad, es decir si no se tiene en el momento que se necesita. El profesor/a, el director del centro y de los estamentos de dirección, no sólo deben desempeñarse con estadísticas educativas, es decir las que se producen al interior del centro educativo, por ejemplo la cantidad de estudiantes de la escuela, de una tanda o de grado; o en qué rango de edad se encuentran, sus calificaciones; número de aulas, cuántos maestros/as hay en la escuela, por género, años en servicio, etc. Pero además deben manejar otras estadísticas, como las que se refieran a la salud de los estudiantes, cuáles son las enfermedades más frecuentes que padecen, las vacunas que les han sido administradas. Estadísticas sociales, como lugar donde viven, con quien viven y estadísticas demográficas referidas a la población de la comunidad y su estructura por sexo y edad, número de hermanos/as, niños/as en edad escolar, etc. Artículo escrito por el Maestro Ezequiel Valdez, para el Minerd
Capítulo 1. Conceptos Fundamentales de la Estadística 3
1.2 Estadística Es una disciplina científica que se dedica al desarrollo y aplicación de las técnicas y métodos apropiados para la recolección, organización, clasificación y análisis de datos para la toma de decisión.
Divisiones de la Estadística Para un mejor estudio de esta ciencia, la estadística se ha dividido en dos ramas las cuales son: Estadística Descriptiva y Estadística Inferencial. 1.2.1 Estadística Descriptiva Consiste en la presentación de datos en forma de tablas y gráficas. Esta comprende cualquier actividad para resumir o describir los mismos factores pertinentes adicionales, esto se refiere a no intentar nada que vaya más allá de los datos. Ejemplo de Estadística Descriptiva
1.2.2 Estadística Inferencial Es la encargada de inferir propiedades, conclusiones y tendencias, a partir de una muestra del conjunto. Su papel es interpretar, hacer proyecciones y comparaciones. La estadística inferencial emplea usualmente mecanismos que le permiten llevar a cabo dichas deducciones, tales como: a) Pruebas de estimación puntual o de intervalos de confianza. b) Pruebas de hipótesis. c) Pruebas paramétricas y no paramétricas. d) Análisis de correlación y de regresión. e) Series cronológicas. f) Análisis de varianza. g) Otros.
4 Estadística Básica
Ejemplos Estadística Inferencial • Encuestas políticas. • Estudio de correlación sobre una muestra para determinar si el nivel educativo y el ingreso de la población están relacionados. Verificando lo aprendido 1 Identifica el tipo de Estadística a aplicar en cada caso Casos de estudio
Tipo de Estadística para aplicar
1. Un informe anual para accionistas que detalla los bienes de la corporación. 2. Estimar el efecto de la inversión en publicidad de compañía en el volumen de ventas de sus productos en un determinado periodo. 3. El uso de los datos de una muestra en una encuesta para estimar la opinión de la población. 4. Un profesor de historia que anuncia a su grupo el número de estudiantes que obtuvieron la máxima calificación en examen reciente.
Verificando lo aprendido 2 La empresa de publicidad PUBLICART, con sede en Santiago, solicitó a una muestra de 1,960 consumidores que probaran un platillo con pollo recién elaborado por GOODCHICKEN. De las 1,960 personas de la muestra, 1,176 dijeron que comprarían el alimento si se comercializaba. 1. ¿Qué podría informar PUBLICART a GOODCHICKEN respecto de la aceptación en la población del platillo de pollo?
2. ¿Es un ejemplo de estadística descriptiva o estadística inferencial? Explique su respuesta.
Capítulo 1. Conceptos Fundamentales de la Estadística 5
Población vs Muestra Población: Es un conjunto de elementos (personas, productos, hogares, animales, objetos, etc.) con una o más características en común susceptible de estudio.
Muestra: Es un subconjunto de la población. Si la muestra es aleatoria y lo suficientemente grande, se puede utilizar la información obtenida de la muestra para hacer inferencias sobre la población. ¿Por qué los investigadores estudian la muestra si el interés es la población? Algunas razones para muestrear: 1. Establecer contacto con toda la población requeriría mucho tiempo. 2. El costo de estudiar todos los elementos de una población resultaría prohibitivo. 3. Es imposible verificar de manera física todos los elementos de algunas poblaciones. 4. Algunas pruebas son de naturaleza destructiva. 5. Los resultados de la muestra son adecuados.
Verificando lo aprendido 3 El CURSA ha entrevistado 100 estudiantes de informática para averiguar el tiempo semanal medio que dedican a navegar por internet. a) ¿Cuál es la población?
b) ¿Cuál es la muestra?
6 Estadística Básica
❖ Parámetro En Estadística, un parámetro es un modelo de la realidad, con el que se comparan los datos reales obtenidos, resumiendo la información obtenida y permitiendo predecir.
Ejemplo de parámetro En el caso de la presión arterial, se considera normal si es de 120/80. Si mide 140/90 o más se considera que el paciente sufre hipertensión arterial. a) ¿Qué podría significar esta lectura?
b) ¿Cuál es el parámetro?
❖ Estadístico En estadística un estadístico (muestral) es una medida cuantitativa, derivada de un conjunto de datos de una muestra, con el objetivo de estimar o inferir características de una población o modelo estadístico, que sirve para estimar determinado parámetro de la distribución de la que procede la muestra.
Ejemplo de estadístico En el caso de la presión arterial, se considera normal si es de 120/80. Si una persona llega a un hospital y la presión arterial mide 140/90 o más, ¿cuál es el estadístico?
Capítulo 1. Conceptos Fundamentales de la Estadística 7
❖ Datos Estadísticos Los datos estadísticos, son los valores que se obtienen al llevar a cabo un estudio. Se trata del producto de la observación del fenómeno que se pretende analizar. Son el conjunto de información recolectada. Ejemplo de datos estadísticos Supongamos que un periodista deportivo desea estudiar el rendimiento de un tenista a partir de los resultados que logró en el último año. En dicho plazo, el jugador disputó 15 encuentros, de los cuales ganó 5 y perdió 10. Los datos estadísticos obtenidos de la observación de los partidos son los siguientes: derrota – derrota – derrota – victoria – derrota – victoria – victoria – derrota – derrota – derrota – derrota- derrota – victoria – derrota – victoria. 1.4 Variables y sus clasificaciones ❖ Variable Una variable estadística es una característica de una muestra o población de datos que puede adoptar diferentes valores. Ejemplos -La estatura
-El peso
-Estado civil
-Genero
-Color
-Size
❖ Variable independiente Es aquella que es controlada en forma sistemática por el investigador. Ejemplo variable independiente Se estudia “el efecto de la privación del sueño con respecto al comportamiento agresivo”. a) ¿Cuál es la variable independiente? ❖ Variable dependiente La variable dependiente en un experimento es la que el investigador mide para determinar el efecto de la variable independiente. Ejemplo variable dependiente En el estudio del “efecto de la privación del sueño con respecto al comportamiento agresivo”. ¿Cuál es la variable dependiente?
8 Estadística Básica
Revisando lo aprendido 4 De León Pizza tiene los siguientes precios para sus tres tipos de pizzas. TIPO DE PIZZA Pequeña Mediana Familiar
PRECIO RD$350.00 RD$630.00 RD$890.00
Responde las preguntas ❑ ¿Cuál es la variable dependiente? ❑ ¿Cuál es la variable independiente? Verificando lo aprendido 5 Analice el siguiente experimento, y luego responda las 5 preguntas. Un psicólogo de la salud está interesado en saber si la motivación del temor es eficaz para reducir la incidencia del hábito de fumar. Cuarenta adultos fumadores son seleccionados de entre los individuos residentes en la ciudad en donde trabaja el psicólogo. A 20 de ellos se les pide fumar un cigarrillo, después ven una atemorizante película acerca de cómo el hábito de fumar provoca cáncer; vívidas imágenes de los pulmones y otros órganos internos enfermos de fumadores fallecidos se muestran en un esfuerzo de generar temor a fumar en estos sujetos. El otro grupo recibe el mismo tratamiento, excepto que ellos ven una película neutra que no está relacionada con el tabaquismo. Durante dos meses posteriores a la proyección de la película, el experimentador mantiene registros de número de cigarrillos que los participantes fuman a diario. Después calcula el promedio de cigarrillos fumados a diario de cada grupo después de la exhibición de la película, y compara una media con la otra para determinar si la película atemorizante surtió efectos sobre el hábito de fumar. Preguntas 1. ¿Cuál es la variable independiente?
2. ¿Cuál es la variable dependiente?
3. ¿Cuál es la población?
4. ¿Cuál es la muestra?
5. ¿Cuál es el estadístico?
Capítulo 1. Conceptos Fundamentales de la Estadística 9
❖ Variables categóricas o cualitativas Una variable cualitativa es un tipo de variable estadística que describe las cualidades, circunstancias o características de una persona, animal u objeto. De esta manera, las variables cualitativas permiten expresar un atributo, cualidad o categoría no numérica. Ejemplos de variables cualitativas a) Estado civil b) Religión c) Nivel de satisfacción de un cliente frente a un servicio ofrecido. ❖ Variables cuantitativas o numéricas Las variables cuantitativas son aquellas variables estadísticas que otorgan, como resultado, un valor numérico. Ejemplo de variables cuantitativas a) El peso de las vacas de una granja. b) Estatura de los habitantes de una ciudad. c) Número de clientes atendidos en una tienda. Las variables cuantitativas pueden ser continuas o discretas ❖ Variables cuantitativas discretas Son aquellas que sólo pueden adoptar ciertos valores a lo largo de un intervalo, dejando un espacio entre los valores posibles. Ejemplos de variables cuantitativas discretas a) Cantidad de personas que trabajan en zona franca. b) El número de hijos de una familia. c) El número de faltas en un partido de fútbol. ❖ Variables cuantitativas continuas Son aquellas que pueden adoptar un valor en cualquier punto a lo largo de un intervalo. Ejemplos variables cuantitativas continuas a) Peso en libras de una persona. b) La estatura de tu mejor amigo. c) Volumen de agua en una piscina.
10 Estadística Básica
Verificando lo aprendido 6 Clasifica las siguientes variables en cualitativas, cuantitativas discretas o cuantitativas continuas. Variable Tipo de variable 1. La nacionalidad de una persona. 2. Número de litros de agua contenidos en un depósito. 3. Número de libro en un estante de librería. 4. Suma de puntos obtenidos en el lanzamiento de un par de dados. 5. La profesión de una persona. 6. El área de las distintas baldosas de un edificio.
Capítulo 1. Conceptos Fundamentales de la Estadística 11
1.5 Niveles de medición de las variables Las variables se pueden clasificar también por niveles de medición. Existen cuatro niveles de medición: nominal, ordinal, de intervalo y de razón. La escala a la que pertenecen las mediciones es importante, ya que puedes determinar los métodos adecuados para describir y analizar datos. Las variables cualitativas se clasificar por dos niveles de medición: Nominal y Ordinal, mientras que las variables cuantitativas pueden tener medición de intervalo y de razón.
❖ Nivel de medición nominal Cuando una variable cualitativa consiste en nombres, etiquetas o categorías, diremos que su nivel de medición es nominal, ya que los datos no siguen un orden.
Ejemplos a) La filiación política de los participantes en una encuesta. b) Nacionalidad c) Religión
❖ Nivel de medición ordinal Los datos siguen un orden jerárquico, aunque las diferencias entre los valores de los datos carecen de significado.
Ejemplos a) La clasificación de hoteles por estrellas. b) Posición en una carrera deportiva. c) Satisfacción con un servicio al cliente.
❖ Nivel de medición de intervalo Incluye las propiedades del nivel ordinal, pero además la diferencia entre dos valores de datos cualesquiera tiene un significado. En este nivel el cero es relativo (el cero no corresponde a la ausencia del dato) y las razones entre valores no tienen significado.
Ejemplos a) Temperatura b) Talla El tiempo (Etapa de la historia)
❖ Nivel de medición de razón Incluye las propiedades del nivel de intervalo, pero además tiene un cero absoluto. En este nivel, la razón entre valores es significativa.
Ejemplos a) Distancias b) Precios c) Peso
12 Estadística Básica
Nominal Los datos sólo se clasifican
Resumen de los niveles de medición de las variables Ordinal Intervalo Razón Los datos se Diferencias Punto 0 y razón entre valores ordenan significativas entre significativas valores Ejemplo Ejemplo Ejemplo • El número de • Temperatura • Número de pacientes lista en las clases atendidos. de bachillerato.
Ejemplo • Números de camisetas de los jugadores. Verificando lo aprendido 7 ¿Cuál es el nivel de medición de cada una de las siguientes variables? Variable Nivel de medición 1. Los números en las camisetas de los corredores de maratones. 2. La distancia que viajan los estudiantes para llegar a clases.
3. Los sizes de los uniformes de un equipo universitario femenino de fútbol. 4. Una clasificación de personas de acuerdo con su afiliación política. 5. Una clasificación de estudiantes que cursan primero, segundo, tercero o último grados. 6. Número de horas que los alumnos estudian a la semana.
7. Los salarios de mujeres que son directoras generales de corporaciones. 8. Calificaciones de las películas de una estrella, dos estrellas, tres estrellas y cuatro estrellas. 9. Las temperaturas actuales en las capitales de las 50 entidades de Estados Unidos. 10.Cociente intelectual de los estudiantes.
Capítulo 1. Conceptos Fundamentales de la Estadística 13
1.6 Tipos de fuente Fuente de información A medida que se lleva a cabo la investigación para escribir un trabajo, se encuentran distintas fuentes de información. Estas diferentes fuentes generalmente se clasifican en primarias, secundarias y terciarias. Su profesor podría requerir que se incluyan los tres tipos de fuentes como base para su trabajo. Aquí se incluye una descripción de cada tipo de fuente de información. Se proporcionan ejemplos para cada una. ❖ Fuentes de información primarias Una fuente primaria de información proporciona información directa y de primera mano sobre un evento, persona, objeto u obra de arte. Las fuentes primarias son contemporáneas con lo que se describen. Son material original que no ha sido interpretado, condensado o evaluado por otra persona. • a) b) c)
Ejemplos de fuentes primarias Diarios Poemas Entrevistas
❖ Fuentes de información secundarias Una fuente de información secundaria analiza, interpreta o debate la información sobre una fuente primaria. Las fuentes secundarias son posteriores a lo que se describe dado que se producirán algún tiempo después de que apareció la fuente de información primaria. Los trabajos escritos por estudiantes contienen mayoritariamente fuentes secundarias. Ejemplos de fuentes secundarias a) Libros de texto b) Artículos de revistas c) Historia
14 Estadística Básica
Capítulo 1. Conceptos Fundamentales de la Estadística 15
Pasos Del Método Estadístico De La Investigación Científica ❖ Método Estadístico La investigación científica se basa en dos tipos de razonamientos: el deductivo y el inductivo, mientras que la investigación estadística se desarrolla utilizando el ciclo deductivo-inductivo en cuatro etapas: 1. Planteamiento del problema. 2. Recolección de la información. 3. Organización de la información. 4. Análisis e interpretación de los resultados. 1. Planteamiento Del Problema El primer paso de la investigación es definir claramente los objetivos del estudio y relacionar este objetivo con los valore numéricos de las variables observables. La investigación científica es una actividad con propósito (finalidad, meta) y como tal para quedar enteramente caracterizado debe dar respuesta a las siguientes interrogantes fundamentales: a) ¿En qué consiste el problema objeto de investigación? b) ¿Qué se quiere conocer? c) ¿Por qué o para que se plantea su investigación? d) ¿Sobre quién recae la investigación? e) ¿Dónde se va realizar?
f) ¿Cuándo se va a realizar? 2. Recolección de la Información La recolección correcta de los datos es de extrema importancia para el investigador, que tiene que ser realizada o vigilada por este. Para remarcarlo los investigadores han establecido la ecuación entrada de “datos basura” es igual salida de análisis “basura”. Esta etapa consiste en determinar los métodos de recolección adecuado, preparar los instrumentos de recolección, prueba del método y de los instrumentos de recolección seleccionados y realizar la recolección de los datos.
3. Organización y Clasificación de los Datos Aquí se debe hacer un análisis de consistencia y ajuste de los datos. Se trata de asegurar la validez y confiabilidad de los datos recopilados. Luego se debe clasificar y tabular los datos y finalmente presentarlos en cuadros estadísticos y gráficas.
4. Análisis e Interpretación de los Resultados En esta etapa se calculan indicadores y medidas resumen que describen al conjunto de datos. También se establece relaciones entre variables de modelos estadísticos que nos permitirán aceptar o rechazar los modelos.
16 Estadística Básica
UNIVERSIDAD AUTÓNOMA DE SANTO DOMINGO Facultad de Ciencias Económicas y Sociales Escuela de Estadística Práctica #1 Conceptos Fundamentales de la Estadística Profesor: Leonido Rosario, MA
Participante Matrícula Fecha Sección 1.1 ¿Qué es la estadística?
1.2 Muestra un ejemplo específico donde se vea la utilidad de la estadística en el área de tu profesión (Sea lo más preciso posible)
1.3 Establezca la diferencia entre la estadística descriptiva y la inferencial.
1.4 Indique cuáles de las siguientes afirmaciones representan una variable y cuáles una constante. a) El número de letras del alfabeto. ____________________ b) El número de horas que tiene 1 día. _________________ c) La hora en que usted come_____________________ d) El número de centímetros en un metro__________________ e) Su peso____________________
Práctica 1. Conceptos Fundamentales de la Estadística 17
1.5 Analice si las siguientes variables son discretas o continuas. a) Número de materias que usted ha cursado en su carrera.________________ b) Peso del contenido de las cajas de cereal. __________________ c) Número de libros que usted leyó el año pasado (ojalá que hayan sido muchos)._______________ d) Número de jonrones conectados por Samy Sosa en 1999.____________________ e) Velocidad de un automóvil en km h .________________________ 1.6 Indique cuáles de las siguientes situaciones corresponden a la estadística descriptiva y cuáles a la estadística inferencial. a) Un informe anual para accionistas que detalla los bienes de la corporación. _________________ b) Un profesor de historia que anuncia a su grupo el número de estudiantes que obtuvieron la máxima calificación en un examen reciente. _________________ c) El cálculo de la media de un conjunto de datos de una muestra para caracterizarla. ___________________ d) El uso de los datos de una muestra en una encuesta para estimar la opinión de la población. _____________________ e) Realizar un estudio de correlación sobre una muestra para determinar si el nivel educativo y el ingreso de la población están relacionados. ____________________
1.7 Roger Amster enseña un curso de inglés para 40 estudiantes. En la clase de ayer, preguntó a los cinco jóvenes que siempre se sientan en la parte posterior del aula si les gustaría que “A Tale of Two Cities” fuera la tarea de lectura para la clase siguiente. Tres de los cincos dijeron que “si”.
a) Identifique la población y la muestra en este caso.
b) ¿Es probable que sea una muestra representativa? De no ser así, ¿Por qué no?
18 Estadística Básica
1.8 Utilice el sentido común para determinar si el acontecimiento descrito es: imposible; posible, pero muy improbable; posible y probable. a) Multa por exceso de velocidad. Mientras conducía a su casa en Connecticut, David fue multado por conducir a 250 millas por hora en una ruta con un límite de velocidad de 55 millas por hora._____________________ b) Semáforos. Mientras conducía por la ciudad, Mario se encontró con tres semáforos consecutivos y todos estaban en verde.__________________ c) Día de Acción de Gracias. El año próximo, el Día de Acción de Gracias caerá lunes._____________________ d) Suprema Corte. Todos los magistrados de la Suprema Corte de Estados Unidos tienen la misma fecha de cumpleaños. ______________________ e) Calculadoras. Cuando los 25 estudiantes de estadística encienden su calculadora TI-84 plus, todas funcionan adecuadamente. _________________ f) Dados de la suerte. Steve Wynn lanzó un par de dados y obtuvo un total de 14 puntos._________________________ g) Máquina tragamonedas. Wayne Newton obtuvo el premio mayor en la máquina tragamonedas en 10 intentos.____________________
1.9 La directora de producción para la planta de Ford Motor Company, debe informar a su superior sobre el número de días promedio que los empleados de la planta se ausentan del trabajo. Sin embargo, la planta emplea más de dos mil trabajadores, y la directora de producción no tiene tiempo de revisar los registros personales de cada empleado. Como asistente usted debe decidir cómo puede ella obtener la información necesaria. a) ¿Qué consejo podría darle?
1.10 ¿Qué nivel de medición utilizaría usted en cada uno de los siguientes casos: a) Un sistema para evaluar a los empleados con base en el número de días que faltan al trabajo.
b) Un sistema para identificar las ciudades de nacimiento de los clientes.
c) Un sistema para registrar la población de las ciudades en las cuales viven los clientes.
Práctica 1. Conceptos Fundamentales de la Estadística 19
1.11 ¿En cuál escala de medida puede expresarse cada una de estas variables? a) Los estudiantes clasifican a su profesor de estadística sobre una escala de “Terrible”, “No tan malo”, “Bueno”, “Maravillosos”, y “dios griego”
b) Los estudiantes en una universidad están clasificados por profesión, tales como marketing, administración y contaduría.
c) Los estudiantes están clasificados por cursos utilizando los valores 1, 2, 3, 4 y 5.
d) Edades de los clientes.
1.12 ¿Cuál es el nivel de medición de cada una de las siguientes variables? a) Coeficientes intelectuales de los estudiantes. b) La distancia que viajan los estudiantes para llegar a clases. c) Los números en los jerseys de un equipo universitario femenino de fútbol. d) Una clasificación de estudiantes por fecha de nacimiento. e) Una clasificación de estudiantes que cursan primero, segundo, tercero o último grados. f) Número de horas que los alumnos estudian a la semana.
1.13 ¿Cuál es el nivel de medición de los siguientes artículos relacionados con el negocio de los periódicos? a) El número de periódicos vendidos todos los domingos durante 2011. b) Los diferentes departamentos, como edición, publicidad, deportes, etcétera. c) Un resumen del número de periódicos vendidos por condado. d) Cantidad de años que cada empleado ha laborado en el periódico.
20 Estadística Básica
1.14 La empresa Gallup realizó una encuesta telefónica empleando una muestra aleatoria nacional compuesta de 1005 adultos de 18 años o más. En la encuesta se les preguntó a los participantes “Cómo considera que es su salud física en este momento” (www.gallup.com, 7 de febrero de 2002)”. Las respuestas podían ser Excelente, Buena, Regular o Ninguna opinión. a) ¿Cuál es el tamaño de la muestra de esta investigación?
b) ¿Cuál es la población?
c) ¿Son estos datos cualitativos o cuantitativos?
d) ¿Sería conveniente usar promedios o porcentajes para resumir los datos de estas preguntas?
e) De las personas que respondieron, 29% dijo que su salud era excelente. ¿Cuántos fueron los individuos que dieron esta respuesta?
1.15 El Departamento de Comercio informa haber recibido las siguientes solicitudes para concursar por el Malcolm Baldrige Nacional Quality Award: 23 de empresas fabricantes grandes, 18 de empresas grandes de servicios y 30 de negocios pequeños. a) ¿Es el tipo de empresa una variable cualitativa o cuantitativa?
b) ¿Qué porcentaje de las solicitudes venían de negocios pequeños?
1.16 En un estudio sobre los suscriptores de Business Week de Estados Unidos se recogen datos de una muestra de 2861 suscriptores. Cincuenta y nueve por ciento de los encuestados señalaron tener un ingreso de $75 000 o más y 50% indicaron poseer una tarjeta de crédito de American Express. a) ¿Cuál es la población de interés en este estudio?
b) ¿Es el ingreso anual un dato cualitativo o cuantitativo?
c) ¿Es la posesión de una tarjeta de crédito de American Express una variable cualitativa o cuantitativa? d) Describa cualquier inferencia estadística posible para Business Week con base en esta encuesta.
Práctica 1. Conceptos Fundamentales de la Estadística 21
1.17 En otoño de 2003, Arnold Schwarzeneger disputó al gobernador Gray Davis la gobernación de California. En una encuesta realizada entre los votantes registrados se encontró que Arnold Schwarzeneger iba a la cabeza con un porcentaje estimado de 54% (Newsweek, 8 de septiembre de 2003). a) ¿Cuál fue la población en este estudio?
b) ¿Cuál fue la muestra en este estudio?
c) ¿Por qué se empleó una muestra en esta situación? Explique.
1.18 La UASD ha encuestado a sus estudiantes para averiguar el tiempo semanal medio que dedican a navegar por internet. a) ¿Cuál es la población?
b) ¿Cuál es la muestra?
c) ¿Cuál es el estadístico?
d) ¿Es el valor de 6.1 horas un parámetro o un estadístico?
22 Estadística Básica
1.19 Una compañía aérae sostiene que menos de un 1% de los vuelos programados que despegan del aeropuerto de Nueva York sale tarde. Se ha observado que el 1.5% de una muestra aleatoria de 200 vuelos salió más tarde de la hora prevista. a) ¿Cuál es la población?
b) ¿Cuál es la muestra?
c) ¿Cuál es el estadístico?
d) ¿El 1.5% es un parámetro o un estadístico?
1.20 Completa el siguiente cuadro guiándote del primer ejemplo: Fracción Decimal Por cientos 2 0.2857 28.57% 7
3 4
0.5 35.12% 0.05 1.21 Responde las siguientes preguntas: a) ¿Cuál es 37% de 500?
b) ¿Cuál es el 5% de 5020?
c) ¿Qué por ciento representa 56 de 803?
d) ¿Cuál es número cuyo 32% es 5492?
Práctica 1. Conceptos Fundamentales de la Estadística 23
1.22 Porcentajes en una encuesta Gallup. En una encuesta Gallup, aplicada a 734 usuarios de internet, el 49% reveló que de manera frecuente u ocasional realiza compras en línea. a) ¿Cuál es el número real de usuarios de Internet que afirmaron que compran en línea de manera frecuente u ocasional?
b) De los 734 usuarios de internet encuestados por Gallup, 323 dijeron que de manera frecuente u ocasional realizan planes de viaje consultando información en línea. ¿Cuál es el porcentaje de personas que afirmaron que de manera frecuente u ocasional realizan planes de viaje consultando información en línea?
1.23 En una encuesta que realizó Gallup con 976 adultos, 68 dijeron que consumen una bebida alcohólica al día. a) ¿Qué porcentaje de individuos encuestados dijeron que consumen la bebida alcohólica al día?
b) De los 976 adultos encuestados, el 32% dijo que nunca bebe. ¿Cuál es el número real de adultos encuestados que dijeron que nunca beben?
CAPÍTULO
2
Organización de los Datos Distribuciones de Frecuencias y su Representación Gráfica Competencias Específicas ➢ Razona y argumenta. Construye e interpreta distribuciones de frecuencias cualitativas y cuantitativas. Organiza e interpreta datos cualitativos o cuantitativos en una gráfica apropiada.
➢ Comunica
Fuente: Ministerio de Educación
Presenta cada paso para la construcción de una distribución de frecuencias cualitativa o cuantitativa.
Una vez que definimos con cuidado un problema, necesitamos Presenta cada paso para la recoger datos. A menudo el número de observaciones construcción de una gráfica de recogidas es tan grande que los resultados efectivos del estudio acuerdo a la naturaleza de los datos y al tipo de representación que se no están claros. Queremos reducir lo más posible una masa de desee. datos, evitando al mismo tiempo la posibilidad de ocultar características importantes por reducirlos excesivamente. ➢ Modela y Representa Modela e interpreta situaciones de Para lograr el punto de equilibrio desafortunadamente no la vida diaria a través de las existe un método único, sin embargo, la línea de ataque distribuciones de frecuencias y sus adecuada normalmente es específica de cada problema y gráficas. depende de dos factores: el tipo de datos y el fin del estudio. ➢ Conecta Utiliza las distribuciones y las Se ha dicho que una imagen vale más que mil palabras. gráficas para resumir un conjunto Asimismo, un gráfico vale más que mil cifras. de datos y explicarlo de una manera sencilla.
Una vez los datos han sido recolectados, siempre debemos preguntarnos: ¿cómo se pueden organizar? ¿Cómo se pueden ➢ Resuelve problemas Resuelve problemas del contexto graficar? ¿Qué nos sugiere la gráfica? educativo
que
impliquen
construcciones de distribuciones y En esta unidad, se introducen tablas y gráficas adecuadas, de gráficas. como distribuciones de frecuencia, gráficos de barras, gráficos de tarta, diagramas de pareto, gráficos de series temporales, ➢ Utiliza herramientas histogramas, diagramas de tallo y hoja, ojivas y otras. Nuestro tecnológicas Usa Excel, con el complemento objetivo es resumir los datos de manera que tengamos una MegaStat y otras herramientas imagen clara y precisa.
Paul Newbold
tecnológicas para construir distribuciones de frecuencias y gráficas.
Estadística Básica 24
2.1 Introducción Cuando la cantidad de información recolectada es relativamente grande, para responder a cuestionantes que impliquen generalizaciones de los datos originales, es necesario tomar en cuenta las distribuciones de frecuencias y las gráficas, que son dos formas de resumir de manera genérica los datos originales.
2.2 Organización de los datos. Una distribución de frecuencias es una tabla en la que organizamos los datos en clases, es decir, en grupos de valores que describen una característica de los datos.
➢ Razones de porqué las distribuciones de frecuencias son importantes 1. Es posible resumir conjuntos grandes de datos. 2. Se logra cierta comprensión sobre la naturaleza de los datos. 3. Se tiene una base para construir gráficas. ➢ Distribución de frecuencia cualitativa Es una agrupación de datos cualitativos en clases mutuamente excluyentes que muestra el número de observaciones en cada clase.
Ejemplo 2.1 Tabla de frecuencias de los vehículos que vendió Grupo Motors por locación en seis meses. Locación Números de autos Toyota Ford Honda Peugeot Total
52 40 45 43 180
➢ Distribución de frecuencia cualitativa relativa Otro enfoque útil para expresar los datos es la tabla de distribución de frecuencias relativas, que describe la proporción o el porcentaje de los datos que caen dentro de cada categoría. frecuencia relativa =
frecuencia de la clase 100% Total de datos
Ejemplo 2.2 Tabla de frecuencias relativas de los vehículos que vendió Grupo Motors por locación. Locación Números de autos Frecuencia Relativa Toyota 52 52 f r1 = 100% = 0.28 29% 180 Ford
40
Honda
45
Peugeot
43
Total
180
Capítulo 2. Organización de los datos 25
➢ Distribución de frecuencia cuantitativa acumulada Otro enfoque útil para expresar los datos es la tabla de distribución de frecuencias acumuladas, que presenta la cantidad de observaciones que están dentro o por debajo de cada una de las clases. Cuando las frecuencias acumuladas se dividen entre el número total de observaciones, el resultado es una tabla de distribución de frecuencias relativas acumuladas. Ejemplo 2.3 Tabla de frecuencias relativas de los vehículos que vendió Grupo Motors por locación. Locación Números de autos Frecuencia Acumulada Toyota
52
F1 = 52
Ford
40
F2 = 52 + 40 = 92
Honda
45
Peugeot
43
Total
180
Ejemplo 2.4 Complete la siguiente tabla de frecuencia. Especie en peligro de f extinción en USA Mamíferos
23
Aves
35
Reptiles
10
Anfibios
26
Peces
56
Total
150
Ejercicio 2.1 Complete la siguiente tabla de frecuencia. Especie en peligro de f extinción en USA Mamíferos
69
Aves
77
Reptiles
14
Anfibios
9
Peces
71
Total
240
fr
F
Fr
fr
F
Fr
Estadística Básica 26
➢ Distribuciones de frecuencias cuantitativas. Es una agrupación de datos cuantitativos en clases mutuamente excluyentes que muestra el número de observaciones en cada clase. Considere las medidas del pulso (en latidos por minuto) obtenidas de una muestra aleatoria simple de 20 mujeres y de otra muestra aleatoria simple de 30 hombres, con los resultados que se presentan a continuación: Pulsos (latidos por minutos) de hombres y mujeres 60 76
68 72
72 76
64 56
8 68
68 80
72 64
64 104
64 60
72 68
Mujeres 80 64 88 60 Hombres
60 60
86 60
76 56
68 76
60 84
68 72
84 72
72 84
80 72
56 72
76 88
64 84
60 86
El pulso es sumamente importante, ¡ya que es muy difícil sobrevivir sin él! Los médicos utilizan el pulso para evaluar la salud de los pacientes. Cuando el pulso tiene una frecuencia demasiado elevada o baja, esto podría indicar que existe algún problema médico; por ejemplo, un pulso muy alto podría indicar que el paciente tiene una infección o que está deshidratado. Un problema surge cuando trabajamos con grandes conjuntos de datos, para poder interpretar los datos necesitamos a menudo organizarlos y resumirlos elaborando una tabla llamada distribución de frecuencias. Antes de seguir trabajando con la distribución de frecuencias cuantitativas es necesario dominar algunos conceptos: Clase. Cada categoría de la distribución de frecuencias. (La tabla #1 tiene 5 clases) Frecuencia. La cantidad de datos que caen en cada clase. (En la tabla #1 los números 7, 7,…, son las frecuencias) Límites de clase. Son los valores extremos de cada clase. (Los números 60 y 69 son los límites de la primera clase) Rango. Es la diferencia entre el dato máximo y el mínimo. ( R = xmax − xmin ) Rv = 104 − 60 = 44 Anchura de clase. Es la diferencia entre el límite inferior de una clase y el límite inferior de la siguiente clase. ( A = li 2 − li1 ) (10 es la amplitud, ya que 70-60 =10). Para calcular la amplitud también usaremos la fórmula
R A= C
Tabla #1 Latidos por minutos de las mujeres Pulso Frecuencia 60 y menos de 70 7 70 y menos de 80 7 80 y menos de 90 5 90 y menos de 100 0 100 y menos de 110 1 Total 20
Capítulo 2. Organización de los datos 27
➢ Características de una tabla de distribución de frecuencias Al construir una tabla de distribución de frecuencias para un conjunto de datos específicos, se deben observar las características siguientes: 1. Las clases deben ser mutuamente excluyentes, es decir, cada dato sólo puede caer en una clase. No debe haber traslape entre las clases: (15 y menos de 20, y 19 y menos de 25), en estas dos clases hay traslape, ¿por qué? 2. El conjunto de clases debe ser exhaustivo, es decir, debe incluir todos los datos considerados. 3. Si es posible las clases deben tener la misma amplitud. 4. La elección de la cantidad de clases a utilizar es un proceso subjetivo, esta debe ser proporcional a la cantidad de datos. En general es conveniente elegir entre 5 y 20 clases. En muchos de los casos usaremos la fórmula: C = 1 + 3.33log n , para aproximar la cantidad de clases a utilizar. 5. Cuando sea posible las amplitudes de clases deben ser números redondos, es decir, 5, 10,15,…, 100. ➢ Procedimiento para construir una distribución de frecuencias Para construir la tabla #1, que aparece arriba, se dan los siguientes pasos Ejemplo 2.4 Construye una distribución de frecuencia a partir de los datos “pulsos (latidos por minutos) de mujeres ordenados de menor a mayor” 60 76
60 76
64 76
64 76
Mujeres 68 68 80 80
68 80
72 88
72 88
72 104
Ahora veamos cómo se construye una distribución de frecuencia utilizando los pulsos de los latidos por minutos de las 40 mujeres. 1. Rango. ( R = xmax − xmin ) R = 104 − 60 = 44
2. Determine el número de clases. C = 1 + 3.33 log n .
C = 1 + 3.33log 20 5.33 5 3. Calcule la anchura de la clase. La anchura de la clase se consigue utilizando la fórmula: R 44 A= A= = 8.8 10 . Redondeamos al número redondo más conveniente. Nc
5
Estadística Básica 28
4. Busque el límite inferior de la primera clase. Elija el valor más bajo o puede ser otro número más pequeño. ( Li = 60 ) 5. Calcule los límites inferiores y superiores de cada clase. Sume el ancho de la clase ( A = 10 ) al límite inferior de la primera clase para obtener el primer límite superior, como el límite superior no está contenido en la primera clase, ese será el límite inferior de la segunda clase. Con este algoritmo se completa los límites en las demás clases. Latidos por minutos Pulso Frecuencia
60 y menos de 70 70 y menos de 80 80 y menos de 90 90 y menos de 100 100 y menos de 110 Total
20
6. Determine la frecuencia absoluta. Se cuenta el número de datos que cae dentro de cada clase para construir la tabla de distribución de frecuencias absolutas como en la tabla. Como se observa en la tabla. Latidos por minutos de las 20 mujeres Pulso Frecuencia 60 y menos de 70 7 70 y menos de 80
7
80 y menos de 90
5
90 y menos de 100
0
100 y menos de 110
1
Total
20
Capítulo 2. Organización de los datos 29
Formas equivalentes y similar de representar una distribución, veamos: Formato anterior Pulso 60 y menos de 70 70 y menos de 80 80 y menos de 90 90 y menos de 100 100 y menos de 110 Total
Frecuencia 7 7 5 0 1 20 Primera forma equivalente
Pulso
Frecuencia 7
60, 70 ) 70, 80 )
7
80, 90 )
5
90, 100 ) 100, 110 )
0 1 20
Total Segunda forma equivalente Pulso 60 – 70 70 – 80 80 – 90 90 – 100 100 – 110 Total
Frecuencia 7 7 5 0 1 20 Forma similar
Pulso 60 – 69 70 – 79 80 – 89 90 – 99 100 – 109 Total
Frecuencia 7 7 5 0 1 20
Estadística Básica 30
Ejercicio 2.2 Construye una distribución de frecuencias para los datos dados a continuación: Pulsos (latidos por minutos) de hombres Hombres 68 72
64 56
8 68
72 64
64 60
72 68
60 60
86 60
76 56
60 84
84 72
72 84
56 72
64 84
60 86
Ordene los datos de menor a mayor
PASOS: 1. Busco el rango. R = xmax − xmin
2. Determine el número de clases.
C = 1 + 3.33log n
3. Calcule la anchura de la clase. R A= C
4. 4. Determine los límites de cada clase y complete la tabla.
Pulso de hombres por minutos de los 40 hombres Pulso Li
Frecuencia Ls
Capítulo 2. Organización de los datos 31
Ejercicio 2.3 Construye una distribución de frecuencias con los datos dados a continuación. Calificaciones de 20 estudiantes en un examen de 100 puntos 61 93 91 86 55 63 86 82 76 94 89 67 62 72 87 68 65 75 Ordene los datos de menor a mayor
PASOS: 1. Busco el rango. R = xmax − xmin
2. Determine el número de clases.
C = 1 + 3.33log n
3. Calcule la anchura de la clase. R A= C
4. Determine los límites de cada clase y complete la tabla.
Calificaciones de los 20 estudiantes Notas Li
Frecuencia Ls
57 84
Estadística Básica 32
➢ Distribución de frecuencia acumulada para variable cuantitativa Otro enfoque útil para expresar los datos es la tabla de distribución de frecuencias acumuladas, que presenta la cantidad de observaciones que están dentro o por debajo de cada una de las clases. Cuando las frecuencias acumuladas se dividen entre el número total de observaciones, el resultado es una tabla de distribución de frecuencias relativas acumuladas. Ejemplo 2.5 Tabla de frecuencias acumuladas del peso medido en libras de 180 estudiantes de la UASD. Peso (Libras) Números de estudiantes Frecuencia Acumulada 100
129
52
F = 52
130
159
40
F = 52 + 40 = 92
160
189
45
190
219
43
Total
180
Ejercicio 2.4 Para la siguiente tabla de frecuencia, agregue una columna de frecuencia acumulada, frecuencia relativa, y otra de frecuencia relativa acumulada. Edad de un grupo de personas f fr F Fr 05 - 09
6
10 - 14
2
15 - 19
10
20 - 24
4
25 - 29
1
Total
23
Capítulo 2. Organización de los datos 33
Ejemplo 2.6 Una enfermera registró el peso de 30 hombres cuya edad estaba comprendida entre 20 y 25 años. Construya una distribución de frecuencias completa. Peso de las 30 personas 160 150 155
120 136 133
134 145 154
130 154 130
112 180 170
154 148 155
170 159 161
200 154 153
200 119 154
175 115 126
130 154 175
133 154 180
134 154 200
136 155 200
Organizamos los datos 112 145 155 PASOS:
115 148 159
119 150 160
120 153 161
126 154 170
130 154 170
1. Busco el rango. R = xmax − xmin
2. Determine el número de clases. C = 1 + 3.33log n
3. Calcule la anchura de la clase. R A= C
4. Distribución de frecuencias del peso de los 30 hombres Pesos
f
30
f r (%)
F
Fr (%)
Estadística Básica 34
Interpretación de una distribución de frecuencias. Si tomamos la distribución del peso de los 30 hombres, se pueden extraer informaciones interesantes. Pesos 110 y menos de 125 125 y menos de 140 140 y menos de 155 155 y menos de 170 170 y menos de 185 185 y menos de 200 200 y menos de 215
f 4 6 9 5 4 0 2 30
f r (%) 13.3 20 30 16.7 13.3 0 6.7
F 4 10 19 24 28 28 30
a) ¿Cuántos hombres tienen un peso entre 155 y menos de 170 libras? b) ¿Cuántos hombres pesan menos de 185 libras? c) ¿Qué porciento de hombres pesa entre140 y menos de 155 libras? d) ¿Qué porciento de hombres pesa menos de 155 libras? e) Interprete la frecuencia simple de la clase #3
f) Interprete la frecuencia relativa de la clase #5
g) Interprete la frecuencia acumulada de la clase #4
h) Interprete la frecuencia relativa acumulada de la clase #6
Fr (%) 13.3 33.3 63.3 80 93.3 93.3 100
Capítulo 2. Organización de los datos 35
2.3 Presentación de los datos La presentación de datos estadísticos constituye en sus diferentes modalidades uno de los aspectos de más uso en la estadística descriptiva. A diario podemos visualizar a través de los diferentes medios escritos y televisivos de comunicación masiva la presentación de los datos estadísticos sobre el comportamiento de las principales variables económicas y sociales, nacionales e internacionales. Existen tres formas diferentes de presentar los datos estadísticos, que son: Presentación escrita, presentación tabular y presentación gráfica. 2.3.1 Presentación escrita: Esta forma de presentación de informaciones se usa cuando una serie de datos incluye pocos valores, por lo cual resulta más apropiada la palabra escrita como forma de describir el comportamiento de los datos. 2.3.2 Presentación tabular: Cuando los datos estadísticos se presentan a través de un conjunto de filas y de columnas que responden a un ordenamiento lógico, a este resultado le llamamos forma de presentación tabular o simplemente tabla o cuadro estadístico. Los elementos básicos de todo cuadro son: Título, encabezados, cuerpo del cuadro, columna matriz y Fuente. 1. Título: 2. Encabezados: Sirve para describir el contenido del cuadro. Son los distintos subtítulos que se colocan en Se debe indicar que el título debe responder las la parte superior de cada columna. inquietudes: ¿qué son los datos?, ¿dónde?, ¿cuándo? y ¿cómo se recogieron? (Gómez, 2008) 3. Cuerpo: 4. Columna matriz: El cuerpo contiene todas las informaciones Es la columna principal del cuadro. numéricas que aparecen en la tabla. 5. Fuente: Indica la procedencia de los datos. Cuando se usa una tabla con informaciones que ya han sido elaboradas por otros, es un deber señalar la institución que las recopiló y presentó, Sin embargo, si las informaciones fueron recopiladas y presentadas por la misma persona no es necesario señalar la fuente. Blanca Marvella García. Monografia.com
Estadística Básica 36
Ejemplo 2.7 Distribución de la muestra de estudiantes de 8vo grado elegidos de los centros con Jornada Escolar Extendida, regional 08, distrito 02, año escolar 2014-2015. No
Centros con jornada extendida
Cantidad
Frecuencia relativa
Muestra
1
Arturo Grullón
52
0.3355
39
2
Bao
9
0.0581
7
3
Luis María Pieter - La Barranca
15
0.0968
11
4
Generosa Ferreira - Sabana Iglesia
38
0.2452
28
5
Los Ranchos de Babosico Arriba
21
0.1355
15
6
La Zanja
20
0.1290
15
155
1
115
TOTAL
Fuente: Informaciones suministradas por el ministerio de educación, cuadro elaborado por Leonido Rosario y Tomás Hernández, octubre 2015. 2.3.3 Representación gráfica de los datos. Las gráficas proporcionan datos en un diagrama de dos dimensiones. En el eje horizontal podemos mostrar los valores de la variable. En el eje vertical señalamos las frecuencias de las clases mostradas en el eje horizontal. Las gráficas de distribuciones de frecuencias son útiles debido a que resaltan y aclaran los patrones que no se pueden distinguir fácilmente en las tablas. Atraen la atención del que las observa hacia los patrones existentes de frecuencias; nos permiten estimar algunos valores con sólo una mirada y proporcionan una verificación visual sobre la precisión de nuestras soluciones. De acuerdo al tipo de variable que vamos a representar, las principales gráficas son las siguientes: a. Gráfica de barras b. Gráfica de pastel c. Histograma d. Polígono de frecuencias e. Ojivas f. Gráfica lineal g. Tallo y hojas
Capítulo 2. Organización de los datos 37
a. La gráfica de barras. Representa las frecuencias de acuerdo con las alturas relativas de un conjunto de rectángulos. Los rectángulos adyacentes tienen una separación entre ellos. Este tipo de gráfico se usa para representar datos cualitativos. Ejemplo 2.8 Represente por medio de un gráfico de barras las ventas de Grupo Motors por locación manualmente y luego utilizando Excel. Locación Números de autos Toyota
52
Ford
40
Honda
45
Peugeot
43
Total 1. Copie estos datos a
180
Excel.
2.
Seleccionamos las celdas que queremos graficar.
Estadística Básica 38 3.
Insertamos el gráfico
➢ Agrega un comentario, explicando la gráfica ---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Ejercicio 2.5 Representa la siguiente distribución de frecuencias usando un gráfico de barras. Marcas de tenis que posee una tienda.
Puma Nike Jordán Adidas
Número de unidades vendidas durante los primeros 6 meses.
342 300 243 400 Gráfica de barras ➢ Análisis gráfico -------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Capítulo 2. Organización de los datos 39
b. Gráfica de pastel. Gráfica que muestra la parte o porcentaje que representa cada clase del total de números de frecuencia. Ejemplo 2.9 Construye una gráfica de pastel con Excel usando la información de la tabla siguiente. Gastos de la lotería del estado de Ohio en 2009 Uso del dinero de las ventas
Cantidad ( en millones de dólares)
Premios
1460.0
Educación
702.3
Bonos
150
Gastos
124.3
Total Siguiendo los pasos para graficar en vez de las barras usamos el circular y tendríamos. Le damos formato para que nos salgan los porcientos. Análisis gráfico Dado que cada rebanada del pastel representa la porción relativa de cada componente, es posible compararlas con facilidad: ✓ El gasto más cuantioso de la lotería se canaliza hacia los premios (60%) ✓ Cerca de la tercera parte (29%) de los fondos recaudados se transfieren a educación. ✓ Los gastos de operación apenas significan 5% de los fondos recaudados.
2436.6
Gastos de la lotería de Ohio en 2009 6% 5% 29% 60%
Premios
Educación
Bonos
Gastos
Nota: En la mayoría de los casos, las gráficas de pastel son las más informativas cuando se trata de comparar la diferencia relativa en el porcentaje de observaciones de cada una de las variables de la escala nominal.
Estadística Básica 40
Ejercicio 2.6 DeCenzo Specialty Food and Beverage Company sirve una bebida de cola con un sabor adicional, Cola-Plus, muy popular entre sus clientes. La compañía se encuentra interesada en la preferencia de los consumidores por Cola-Plus en comparación con Coca-Cola, Pepsi y una bebida de Lima-limón. Se pidió a 270 consumidores seleccionados de forma aleatoria que degustaran una prueba y eligieran la bebida que más les gustaba. Los resultados aparecen en la siguiente tabla: Bebida Número Cola-Plus
60
Coca-Cola
90
Pepsi
90
Lima-limón
30
Total
270
a) ¿Son los datos de naturaleza cuantitativa o cualitativa?
b) Construya una gráfica de pastel utilizando las frecuencias relativas.
Gráfica de pastel
➢ Análisis gráfico -------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Capítulo 2. Organización de los datos 41
c. Histograma Describe una distribución de frecuencias mediante una serie de rectángulos adyacentes, cuya base es proporcional a la anchura de cada clase (Valor del intervalo) y cuya altura es proporcional a la frecuencia. En este tipo de gráfico se representan datos cuantitativos. Ejemplo 2.10 Representa por medio de un histograma la siguiente distribución de frecuencias, usando Excel. Cantidad de conductores en cada categoría de velocidad en un tramo de una carretera Velocidad(MPH) Cantidad de conductores 30- menos de 40
2
40- menos de 50
9
50- menos de 60
15
60- menos de 70
28
70- menos de 80
12
80- menos de 90
6
90-menos de 100
3
Después de buscar las marcas de clases se grafican estas en el eje x y las frecuencias en el eje y. El gráfico debe quedar así:
➢ Análisis gráfico -------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Estadística Básica 42
Ejercicio 2.7 Representa por medio de un histograma la distribución de los pesos de 100 estudiantes del CURSA que se muestra a continuación (usando Excel). Peso (en libras) Cantidad de estudiantes 120 – menos de 130
6
130 – menos de 140
20
140 – menos de 150
30
150 – menos de 160
27
160 – menos de 170
10
170 – menos de 180
5
180 – menos de 190
2
➢ Análisis gráfico -------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Capítulo 2. Organización de los datos 43
d. Polígono de frecuencias Estrechamente relacionado con el histograma, este consiste en segmentos de líneas que conectan los puntos formados por las intersecciones de las marcas de clases y las frecuencias de clase. Luego de graficar los puntos, se agregan dos clases, una en cada extremo de la escala de valores observados. Éstas contienen cero observaciones, pero permiten que el polígono llegue al eje horizontal en ambos extremos de la distribución. Ejemplo 2.11 Representa por medio de un polígono de frecuencias la siguiente distribución de frecuencias, manualmente y usando Excel. Cantidad de conductores en cada categoría de velocidad en un tramo de una carretera Velocidad(MPH) Cantidad de conductores Marcas de clases (x) 30 + 40 70 = = 35 2 2
30- menos de 40
2
40- menos de 50
9
45
50- menos de 60
15
55
60- menos de 70
28
65
70- menos de 80
12
75
80- menos de 90
6
85
90-menos de 100
3
95
x=
Usando Excel ➢ Análisis gráfico -------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Velocidad (MPH)
-------------------------------------------------------------------------------------------------------------------------------------------------------------------
Estadística Básica 44
Ejercicio 2.8 Representa por medio de un polígono de frecuencia la distribución de los pesos de 100 estudiantes del CURSA que se muestra a continuación (manualmente y usando Excel). Peso (en libras) Cantidad de estudiantes x 120 – menos de 130
6
130 – menos de 140
20
140 – menos de 150
30
150 – menos de 160
27
160 – menos de 170
10
170 – menos de 180
5
180 – menos de 190
2
➢ Análisis gráfico -------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Capítulo 2. Organización de los datos 45
e. Ojiva Recordemos que una distribución de frecuencias acumuladas nos permite ver cuántas observaciones están por encima de ciertos valores. La gráfica de una distribución de frecuencias acumuladas se conoce como ojiva. Una ojiva es una gráfica lineal que describe frecuencias acumuladas y utiliza fronteras de clase a lo largo de la escala horizontal, y frecuencias acumuladas a lo largo del eje vertical. Ejemplo 2.12 Represente en una ojiva “menor que” la siguiente distribución, manualmente y usando Excel. Salarios por hora (Dólares) 8 – 10 10 – 12 12 – 14 14 – 16
Número de empleados 3 7 4 1
Solución: Para lograr esto, es necesario transformar la distribución tomando en cuenta los límites inferiores de cada clase y al final añadiremos una clase para que no queden observaciones fuera. Clases Menor que 8 Menor que 10 Menor que 12 Menor que 14 Menor que 16 Usando Excel:
Frecuencias acumuladas 0 ¿Por qué? 3 10 14 15
Responda las siguientes preguntas de acuerdo con el gráfico. a) ¿Cuántos empleados ganan menos de 10 dólares por hora? b) ¿Cuántos empleados ganan menos de 12 dólares por hora? c) ¿Cuántos empleados ganan menos de 14 dólares por hora? Salario por hora
d) ¿A cuántos empleados se les investigó el salario?
Estadística Básica 46
Ejercicio 2.9 Representa en una ojiva menor la siguiente distribución, manualmente y usando Excel. Cantidad de conductores en cada categoría de velocidad en un tramo de una carretera Velocidad (MPH) 30- menos de 40 40- menos de 50 50- menos de 60 60- menos de 70 70- menos de 80 80- menos de 90 90-menos de 100
Cantidad de conductores 2 9 15 28 12 6 3
Clases (menor que)
Frecuencias acumuladas
Gráfica
➢ Análisis gráfico ---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Capítulo 2. Organización de los datos 47
f. Gráfica de líneas La gráfica de líneas se construye para mostrar la dependencia entre dos variables cuantitativas. Ésta consiste en segmentos de recta que conectan los puntos observados para ambas variables. Cuando x representa el tiempo, el resultado es la gráfica de la serie de tiempo de la variable y. Ejemplo 2.13 La gerencia de una tienda de ropa para mujeres observa que las ventas registradas de bikinis en los meses de marzo hasta septiembre del año 2000, tienen la siguiente distribución. Construye una gráfica de líneas. Meses Cantidad de bikinis vendidos Marzo Abril Mayo Junio Julio Agosto Septiembre
80 80 200 300 200 170 100 Gráfica generada con excel
Ventas de bikinis 350 300 250 200 150 100 50 0 Marzo
Abril
Mayo
Junio
Julio
Agosto
Septiembre
➢ Análisis gráfico ---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Estadística Básica 48
Ejercicio 2.10 La siguiente distribución muestra los quintales de arroz vendidos por una factoría los primeros 6 meses del año 2000. Represente la información en una gráfica de línea: Año
Produción
Enero
40
Febrero
46
Marzo
56
Abril
63
Mayo
73
Junio
78
Julio
60
Agosto
67
Gráfica de líneas
➢ Análisis gráfico: -----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Capítulo 2. Organización de los datos 49
g. Gráfica de tallo y hojas Una gráfica de tallo y hojas representa datos cuantitativos separando cada valor en dos partes: el tallo (el dígito ubicado en el extremo izquierdo y la hoja (el dígito del extremo derecho). Ejemplo 2.14 Representa el pulso de las mujeres en un diagrama de tallo y hoja 76 72 88 60 72 68 64 80 64 68 120 80 76 68 72 96 52 68 Tallo (Decenas) Hoja (Unidades)
Ejercicio 2.11 Representa el pulso de los hombres en un diagrama de tallo y hoja 68 64 88 72 64 72 60 88 76 60 96 72 56 64 60 64 84 76 72 56 68 64 60 68 60 60 56 84 72 84 72 84 88 56 64 56 Tallo (Decenas) Hoja (Unidades)
72
80
84 56
88 64
Estadística Básica 50
2.4 Tablas y gráficos para describir relaciones entre variables En los ejemplos anteriores hemos desarrollado gráficos para describir una única variable. Estas “imágenes” nos han ayudado a analizar mejor la información que contenía un gran conjunto de datos. Ahora, ampliamos las medidas gráficas para describir las relaciones entre dos o más variables. En primer lugar, presentamos un diagrama de puntos dispersos para estudiar las posibles relaciones entre dos variables cuantitativas. A continuación, analizamos tablas cruzadas de dos variables para examinar posibles relaciones entre variables cualitativas.
➢ Diagramas de puntos dispersos Un diagrama de dispersión es una gráfica de datos apareados (𝑥, 𝑦). El diagrama de puntos dispersos es una representación de los datos, que se usa para verificar la relación entre dos variables cuantitativas. Muchos docentes quieren hacer creer que son excelentes maestros por las “notas que sacan sus alumnos”, pero esas calificaciones, en múltiples ocasiones suelen ser un mal indicador. Es por esta razón que el Minerd estudia la relación existente entre “la nota de presentación de cada asignatura y la nota obtenida en cada prueba nacional”. Veamos los siguientes ejemplos.
Ejemplo 2.15 Las siguientes calificaciones corresponden a la nota de presentación de 17 estudiantes con su respectiva nota de la prueba nacional de matemática, en un politécnico de la ciudad de Santiago. Represente esos datos en un diagrama de dispersión: Datos hipotéticos de la nota de presentación de un politécnico y el resultado de la prueba de matemática N P 55 56 60 62 63 63 64 64 65 67 67 68 68 69 69 69 69 NPN 23 24 25 26 26 27 15 26 27 28 28 29 29 28 17 30 30
Para hacer el gráfico manualmente solo marcamos un punto en cada par ordenado. Si deseamos hacerlo en Excel seleccionamos los datos e insertamos un gráfico de dispersión, resultando una imagen como la siguiente:
30% (Prueba nacional Mat)
Relación entre la nota de presentación y la nota de prueba nacional de matemática 32 30 28 26 24 22 20 18 16 14 12 10 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 70% (Nota de presentación Mat)
Análisis gráfico: Una interesante pauta es la tendencia ascendente positiva: la nota de la prueba nacional tiende a aumentar directamente con la nota de presentación. Obsérvese también que la relación no suministra una predicción exacta. Algunos estudiantes que obtienen una alta nota de presentación de matemática tienen una calificación baja en la prueba nacional. Vemos que la pauta básica indica que las notas más altas obtenidas en la nota de presentación predicen mayores calificaciones en las pruebas, pero los resultados no son perfectos.
Capítulo 2. Organización de los datos 51
Ejemplo 2.16 Las siguientes calificaciones corresponden a la nota de presentación de 17 estudiantes con su respectiva nota de la prueba nacional de matemática, en un politécnico de la ciudad de Santiago. Representa los datos en un diagrama de dispersión: Minerd, nota de presentación y la de prueba nacional de matemática de los estudiantes del aérea de mecatrónica de un politécnico de la regional 08, 1ra convocatoria, 2015. NP
53 18
57 15
50 18
56 17
53 18
53 21
56 17
53 21
55 21
NPN Representa los datos en un diagrama de dispersión:
60 20
50 19
51 16
68 17
57 20
60 16
51 16
62 17
Análisis gráfico: -------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Estadística Básica 52
2.4.1 Tablas cruzadas Una tabla cruzada, llamada a veces tabla de contingencia, enumera el número de observaciones correspondiente a cada combinación de valores de dos variables categóricas u ordinales. La combinación de todos los intervalos posibles de las dos variables define las casillas en una tabla. Una tabla cruzada de r filas y c columnas se denomina tabla cruzada de dimensión r×c.
La demanda de un producto por zonas residenciales Un minorista de materiales de construcción ha estado estudiando un plan para abrir tiendas en nuevos lugares dentro de su programa de expansión regional. En una ciudad propuesta para la expansión hay tres lugares posibles: norte, este y oeste. El minorista sabe por experiencia que los tres mayores centros de beneficios de sus tiendas son los de herramientas, madera y pintura. Para seleccionar un lugar, son importantes las pautas de demanda de las diferentes partes de la ciudad. Ha pedido, pues, ayuda al departamento de estudios de mercado para obtener y analizar los datos relevantes. Este minorista cree que tiene una ventaja comparativa en la venta de herramientas. En cada zona residencial, se contactó con 250 hogares por teléfono y se les pidió que indicaran cuál de tres categorías de productos habían comprado la última vez que habían ido a una tienda de materiales de construcción. La encuesta se realizó para determinar la demanda de herramientas, madera y pintura. Las tres zonas residenciales contienen el mismo número de hogares y, por lo tanto, la muestra aleatoria de 750 representa la población de hogares de toda la ciudad.
Ejemplo 2.17 Tabla cruzada de la demanda de productos por parte de los hogares por zonas residenciales Zona Este Norte Oeste Total
Herramientas 100 50 65 215
Madera 50 95 70 215
Pintura 50 45 75 170
Total 250 250 250 750
Análisis gráfico:
Gráfica Demanda de productos por parte de los hogares por zona de residencia Número de hogares
Ninguna 50 60 40 150
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
100
----------------------------------------------------------80
-----------------------------------------------------------
60
-----------------------------------------------------------
40
---------------------------------------------------------------------------------------------------------------------
20
-----------------------------------------------------------
0 Este
Norte
Oeste
---------------------------------------------------------------------------------------------------------------------
Herramientas
Madera
Pintura
Ninguna
---------------------------------------------------------------------------------------------------------------------
Capítulo 2. Organización de los datos 53
2.4.2 Gráfica de barras múltiples o compuestas Ésta contiene dos o más conjuntos de barras, y se utiliza para comparar dos o más conjuntos de datos. Ejemplo 2.18 Construya una gráfica de barras múltiples de los datos, y luego describa cualquier tendencia de la siguiente tabla que incluye el número (en miles) de hombres y mujeres estudiantes de educación superior en diferentes años en Estados Unidos. Año Hombres Mujeres
2004 7268 9826
2005 7356 9995
2006 7568 10,203
2007 7568 10,407
2008 7695 10,665
2009 7802 10,838
2010 7872 10,944
Fuente: National Center for Education Statistics Gráfica de barras múltiples
Anáilisis gráfico: -------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Ejercicio 2.12 Un estudiante universitario en su primer ciclo tomó las siguientes asignaturas, sacando las calificaciones que se muestran a continuación, en tres parciales de 20 puntos. Asignaturas Matemática Español Biología Geografía Inglés
1er parcial 16 12 14 16 15 Gráfica de barras múltiples
2do parcial 18 20 14 15 14
3er parcial 20 20 18 14 18
➢ Análisis gráfico --------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Estadística Básica 54
2.4.3 Gráfica de barras por componentes o superpuestas. En esta gráfica se representan todas las variables en una barra. Ejemplo 2.19 La siguiente distribución muestra los volúmenes de ventas de los productos A, B y C en los primeros 4 meses del año 2012 de una compañía. Construye una gráfica de barras componentes o superpuestas. Meses Enero Febrero Marzo Abril
A 25 35 40 50
B 35 45 20 15
C 40 20 10 5
Total
Gráfica de componentes o superpuestas ➢ Análisis gráfico -------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Ejercicio 2.13 Representa la siguiente distribución de las ventas de vehículos en una gráfica de barras componentes o superpuestas. Meses Enero Febrero Marzo Abril
Toyota 52 60 59 65
Ford 40 43 41 45
Honda 45 53 56 64
Peugeot 43 30 31 25
Total
Gráfica de barras componentes ➢ Análisis gráfico -------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Capítulo 2. Organización de los datos 55
2.4.4 Gráfica de líneas múltiples. Ésta contiene dos o más conjuntos de líneas, y se utiliza para comparar dos o más conjuntos de datos. Ejemplo 2.20 Construya una gráfica de líneas múltiples de los datos, y luego describa cualquier tendencia de la siguiente tabla que incluye el número (en miles) de hombres y mujeres estudiantes de educación superior en diferentes años en Estados Unidos. Año 2004 2005 Hombres 7268 7356 Mujeres 9826 9995 Fuente: National Center for Education Statistics
2006 7568 10,203
2007 7568 10,407
2008 7695 10,665
2009 7802 10,838
2010 7872 10,944
➢ Análisis gráfico: -------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Ejercicio 2.14 Construya una gráfica de líneas múltiples para la distribución de los autos vendidos de una agencia de vehículos al inicio del año 2010. Condición Nuevos Usados Chocados y reparados
Toyota Honda 30 20 60 55 45 30 Gráfica de líneas múltiples
Peugeot 5 10 2
Kia 25 70 50
➢ Análisis gráfico: -------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
56 Estadística Básica
UNIVERSIDAD AUTÓNOMA DE SANTO DOMINGO Facultad de Ciencias Económicas y Sociales Escuela de Estadística Práctica #2 Organización de los Datos Profesor: Leonido Rosario, MA
Participante Matrícula Fecha Sección 2.1 Responde: a) ¿Cuál es la diferencia entre los datos originales (sueltos) y una distribución de frecuencia?
b) ¿Por qué es útil convertir los datos originales (sueltos) en una distribución de frecuencia?
2.2 Grupos sanguíneos. A continuación se presenta una lista de los grupos sanguíneos O, A, B, y AB de donadores de sangre elegidos al azar. Construya una tabla donde resuma la distribución de frecuencias de esos grupo sanguíneos.
O
A
B
O
O
O
O
B
O
A
A
B
A
O
O
A
O
O
A
A
O
O
O
O
AB
O
O
B
O
A
A
A
AB
A
A
A
A
O
A
O
O
A
O
O
A
A
A
A
AB
A
Grupo Sanguíneo
Frecuencia
2.3 Un conjunto de datos consta de 38 observaciones. ¿Cuántas clases recomendaría para la distribución de frecuencias?
Práctica 2. Organización de los datos 57
2.4 Un conjunto de datos consta de 45 observaciones entre $0 y $29. ¿Qué tamaño recomendaría usted para el intervalo de clase?
2.5 Un conjunto de datos consta de 230 observaciones entre $235 y $567. ¿Qué intervalo de clase recomendaría?
2.6 Un conjunto de datos contiene 53 observaciones. El valor más bajo es 42 y el más alto 129. Los datos se van a organizar en una distribución de frecuencias. a) ¿Cuántas clases sugeriría?
b) ¿Qué cantidad sugeriría como límite inferior de la primera clase?
58 Estadística Básica
2.7 A continuación se muestran las notas obtenidas en estadística de 30 estudiantes de 7mo de un colegio. Construye una distribución de frecuencia. 80
90
92
85
75
86
87
88
89
70
74
72
71
82
98
90
76
60
63
73
78
81
84
85
65
93
86
88
82
89
Ordene los datos de menor a mayor
PASOS: a) Busco el rango. R = xmax − xmin
b) Determine el número de clases. C = 1 + 3.33log n
c) Calcule la anchura de la clase. A = R C
d) Construye la tabla.
Práctica 2. Organización de los datos 59
2.8 Quick Change Oíl Company cuenta con varios talleres en el área metropolitana de Seattle. Las cantidades diarias de cambios de aceite que se realizaron en el taller de Oak Street los pasados veinte días son las siguientes: 65 70
98 62
55 66
62 80
79 94
59 79
51 63
90 73
72 71
Los datos se organizarán en una distribución de frecuencias. a) ¿Cuál es el rango?
b) ¿Cuántas clases recomendaría usted?
c) ¿Qué intervalo de clase sugeriría?
d) ¿Qué límite inferior recomendaría para la primera clase?
e) Organice el número de cambios de aceite como distribución de frecuencias.
56 85
60 Estadística Básica
2.9 El gerente de Bilo Supermarket, en Mt. Pleasant, Rhode Island, reunió la siguiente información sobre la cantidad de veces que un cliente visita la tienda durante un mes. Las respuestas de 50 clientes fueron las siguientes: 5 1 8 1 3
1 3 10 4 14
7 8 1 2 6
2 5 4 4 9
4 4 9 12 5
3 5 6 11 4
4 6 12 2 3
4 6 5 7 6
6 6 4 5 5
7 5 15 1 1
a) Comience a partir de 0 como límite inferior de la primera clase, utilice un intervalo de clase de 3 y organice los datos en una distribución de frecuencias.
b) Convierta la distribución en una distribución de frecuencias relativas.
Práctica 2. Organización de los datos 61
2.10 La división de servicios alimentarios de Cedar River Amusement Park, Inc., estudia la cantidad que gastan al día en alimento y bebida las familias que visitan el parque de diversiones. Una muestra de 40 familias que visitó el parque ayer revela que éstas gastan las siguientes cantidades: 77 41 60 18 58
60 63 58 45 84
53 66 38 51 83
54 62 71 50 43
59 52 58 54 53
61 56 63 71 36
34 50 62 26 62
61 44 52 71 60
a) Organice los datos como distribución de frecuencias utilizando 7 clases y el 15 como límite inferior de la primera clase. ¿Qué intervalo de clase eligió?
b) Determine la distribución de frecuencias relativas.
62 Estadística Básica
2.11 Se le pidió a un grupo de personas que marque la imagen de su bebida gaseosa preferida.
Con la tabla de frecuencias obtenida elabora una gráfica de barras. Bebidas gaseosas
Sprite Pepsi Coca cola 7 up Fanta
Frecuencia Absolutas
10 25 30 15 20
Gráfica de barras
Análisis gráfico -------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Práctica 2. Organización de los datos 63
2.12 La compañía Northwind Traders Tea recibe un informe acerca de las ventas de las cajas
de los productos que 6 empleados han podido poner en el mercado en el primer trimestre del año 2000. Construye una gráfica de barras múltiples. Empleados Tomás Navarro María Gonzáles Antonio Bermejo Fabricio Noriega Arturo López Enrique Gil
Informe de ventas Enero Febrero 55 68 77 71 75 68
85 78 75 65 78 85
Marzo 66 94 80 78 85 86
Gráfica de barras múltiples
Análisis gráfico -------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
64 Estadística Básica
2.13 Representa la distribución de las ventas anterior en una gráfica de barras superpuestas
o por componentes.
Empleados Tomás Navarro María Gonzáles Antonio Bermejo Fabricio Noriega Arturo López Enrique Gil
Informe de ventas Febrero Enero 55 68 77 71 75 68
85 78 75 65 78 85
Marzo 66 94 80 78 85 86
Gráfica de barras superpuestas
Análisis gráfico -------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Práctica 2. Organización de los datos 65
2.14 Construye una gráfica circular a partir del número de medallas obtenidas por cada país
en las Olimpiadas de Invierno del 1998. País Alemania Noruega Rusia Estados Unidos Japón Corea del sur
Número Medallas 29 25 18 13 10 6
Análisis gráfico -------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
66 Estadística Básica
2.15 Las notas obtenidas de 50 estudiantes del CURSA en estadística básica se muestran en
la siguiente distribución. Construye un histograma. Notas 55 y menos de 60 60 y menos de 65 65 y menos de 70 70 y menos de 75 75 y menos de 80 80 y menos de 85 85 y menos de 90 90 y menos de 95
Frecuencia
5 6 8 20 7 4 2 1
Gráfica histograma
Análisis gráfico -------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Práctica 2. Organización de los datos 67
2.16 Construye un polígono de frecuencia con la distribución de frecuencia de las notas de
los estudiantes del punto anterior. Notas 55 y menos de 60 60 y menos de 65 65 y menos de 70 70 y menos de 75 75 y menos de 80 80 y menos de 85 85 y menos de 90 90 y menos de 95
Frecuencia
5 6 8 20 7 4 2 1
Gráfica: Polígono de frecuencia
Análisis gráfico -----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
68 Estadística Básica
2.17 Representa en una ojiva menor la distribución de los pesos de 35 estudiantes del CURSA
que se muestra a continuación. Peso 120 y menos de 130 130 y menos de 140 140 y menos de 150 150 y menos de 160 160 y menos de 170 170 y menos de 180 180 y menos de 190
Cantidad de estudiantes 3 8 15 12 5 4 2
Gráfica ojiva (menor que)
Análisis gráfico -------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Práctica 2. Organización de los datos 69
2.18 Representa con un gráfico de líneas la cantidad anual de niños vacunados en una
población. Años 1980 1985 1990 1995 2000
Niños vacunados 805 1250 3500 6550 7200
Gráfica de líneas
Análisis gráfico -------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
70 Estadística Básica
2.19 Una compañía estudia el uso de cajeros automáticos en una ciudad. Una muestra de 30
cajeros mostró que éstos se utilizaron la siguiente cantidad de veces el día de ayer. Elabore un diagrama de tallo y hojas. 83 64 63 80 95 36
84 84 78
76 73 61
84 68 59
54 52 84
75 65 95
59 90 47
70 52 87
61 77 60
Diagrama de tallo y hojas Tallo
Hojas
2.20 Molly’s Candle Shop tiene diversas tiendas de venta de menudeo en las áreas costeras
de Carolina del Norte y Carolina del Sur. Muchos de los clientes de Molly´s han solicitado que les envíe sus compras. La siguiente gráfica muestra el número de paquetes enviados por día durante los pasados 100 días. a) ¿Cuál es el número total de frecuencia?
b) ¿Cuál es la frecuencia de la clase 10 a 15?
c) ¿Cuál es la frecuencia relativa de la clase 20 a 25?
d) ¿Cuál es el punto medio de la clase 15 a 20?
e) ¿En cuántos días se enviaron 25 o más paquetes?
Práctica 2. Organización de los datos 71
2.21 La siguiente gráfica muestra el número de pacientes que admite diariamente el
Memorial Hospital por la sala de urgencias.
a) ¿Cuál es el punto medio de la clase que va de 2 a 4?
b) ¿Con qué frecuencia van de 4 a 6 pacientes por la sala de emergencia?
2.22 La siguiente gráfica muestra los salarios por hora que percibe una muestra de soldadores
en la zona de Atlanta, Georgia. (Ojiva menor que)
a) ¿A cuántos soldadores se estudió?
b) ¿Aproximadamente cuántos soldadores ganan menos de $10.00 la hora?
c) ¿Alrededor de 75% de los soldadores ganan menos de cierta cantidad? ¿Qué cantidad
es ésta? d) ¿Qué porcentaje de soldadores gana menos de $20.00 la hora?
72 Estadística Básica
2.23 Marca con un cotejo los gráficos que representan la misma información.
2.24 Elige la opción correcta. ¿Qué título le pondrías al gráfico?
a) Nombre de chicas más repetidas en mi colegio b) Mascotas de mis compañeros de colegio c) Calificaciones del examen de matemáticas
Práctica 2. Organización de los datos 73
NOTA: Observa el gráfico y elige la respuesta apropiada para los ítems 2.32 hasta el 2.36.
2.25 ¿Cuántos mensajes se enviaron en los últimos tres meses del año? a)10
b) 17
c) 9
d) 20
e) 35
2.26 ¿Cuántos mensajes se enviaron entre los meses de julio y agosto? a )20 b)32 c)38 d )12 e)28
2.27 Si cada mensaje cuesta 2 pesos, ¿Cuántos se gastó en mensajes durante el mes de
abril? a )20 pesos b)32 pesos c)16 pesos d )12 pesos e)18 pesos
2.28 ¿En qué mes se enviaron menos mensajes? a ) Enero b) Mayo c)Octubre d ) Agosto e) Diciembre
2.30 ¿En qué mes se enviaron más mensajes? a ) Enero b) Mayo c) Septiembre d ) Agosto e) Diciembre
CAPÍTULO
3
Medidas de Tendencias Céntricas Medidas Numéricas que Resumen un Conjunto de Datos Competencias Específicas ✓ Razona y argumenta. Reconoce, calcula e interpreta la media (todas las versiones), la mediana y la moda de datos sueltos y agrupados.
Fuente: Ministerio de Educación
✓ Comunica Explica cómo se obtiene la media (todas las versiones), la mediana y la moda de un conjunto de datos sueltos y agrupados. ✓ Modela y Representa Modela situaciones, donde se pueda calcular las medidas de tendencias céntricas.
✓ Conecta Utiliza conexiones entre las Fuente: Equipo de estadística. Dirección de evaluación de la calidad medidas de tendencias céntricas y las situaciones de La República Dominicana apuesta por la calidad de la educación. la comunidad educativa. Una de las tareas de la educación es la evaluación, ya que a través de ella podemos tomar los correctivos de lugar, para la mejora de ✓ Resuelve problemas las políticas que deben impactar las prácticas docentes. Resuelve problemas del contexto educativo que Para tomar decisiones correctas o las más idónea, es necesario impliquen calcular medidas tener las informaciones correctas que emanan de los datos que de tendencias céntricas. hemos recolectados en una investigación. ¿Cómo se podría hacer generalizaciones de los datos originales sin las gráficas o tablas ✓ Utiliza herramientas tecnológicas de frecuencias? En esta unidad, se introducen las medidas de tendencia céntricas, tales como: la media (en todas sus versiones), la mediana, y la moda. Nuestro objetivo es resumir un conjunto de datos a través de medidas de tendencias céntricas, con el fin de comprender e interpretar el lenguaje de los datos.
Usa Excel (con el complemento MegaStat) y otras herramientas tecnológicas para calcular medidas de tendencias céntricas de datos sueltos y agrupados.
Capítulo 3. Medidas de Tendencias Céntricas 75
3.1 Introducción Otra manera de visualizar la información que un conjunto de datos nos muestra aparte de las distribuciones de frecuencias y las gráficas son las medidas de resumen, también conocidas como medidas de tendencias céntricas. Imagine que el maestro de estadística dio un examen con un valor de 20 puntos a un grupo de 20 participantes y los resultados fueron los siguientes: 20 12
13 18
7 14
12 17
18 3
16 5
17 6
9 3
11 1
10 15
Un participante le pregunta al facilitador, ¿cómo nos fue profe?, si usted fuera el facilitador, ¿qué le responde? Una pregunta cómo esta podríamos responderla con un número que represente el equilibrio de los datos. A las medidas que se sitúan en el centro de un conjunto de datos se le conoce como medidas de tendencia central. Antes de continuar con el estudio de las medidas de tendencia central, necesitamos revisar el concepto de sumatoria por su aplicación en este tema. 3.2 Notación Sumatoria Con frecuencia en estadística resulta importante poder encontrar la suma de todos los términos de una distribución, es decir: X 1 + X 2 + X 3 + ... + X n En lugar de escribir todos esos términos, introducimos una manera más concisa de expresar dicha suma, llamada notación de sumatoria. Utilizando dicha notación, podemos escribir la suma como: n
X i =1
SÍMBOLO
i
= X 1 + X 2 + X 3 + ... + X n ; donde i, n N
SIGNIFICADO Letra griega mayúscula sigma, que indica sumatoria. Estos naturales indican dónde inicia y dónde termina la suma, respectivamente. Variable
NOTA: Cuando la sumatoria se realiza con todos los datos (de 1 a n) se abreviará de la siguiente manera:
76 Estadística Básica
Ejemplos 3.1 Para los siguientes datos, determine la sumatoria correspondiente. 6 8 9 10 1. X: Xi = 2.
Y
-10
4
20
25
8
5
5
Y = i =2
Y
-10
4
20
25
8
5
6
Y i =3
2
-12
14
16
i
=
2
i
Z +3 =
4.
Z
5.
Z
2
-12
14
16
(Z
6.
X:
6
8
9
10
X
7.
X:
6
8
9
10
( X )
i
i
+ 3) = 2 i
i
No PROPIEDAD 1
2
3
4
= 2
=
PROPIEDADES DE LA SUMATORIA SIGNIFICADO La sumatoria de una constante es igual a n veces la constante.
La sumatoria de una suma algebraica de dos o más variables es igual a la suma algebraica de las sumatorias de las variables. La sumatoria de una diferencia algebraica de dos o más variables es igual a la diferencia algebraica de las sumatorias de las variables. La sumatoria del producto de una constante por una variable es igual al producto de la constante por la sumatoria de la variable.
Capítulo 3. Medidas de Tendencias Céntricas 77
➢ Medidas de tendencia céntricas Una medida de tendencia central es un valor que se encuentra en el centro o a la mitad de un conjunto de datos. Las medidas de tendencias central más usadas son: ➢ La media ➢ Media ponderada ➢ La mediana ➢ Media geométrica ➢ La moda 3.2 Media Aritmética para datos sueltos La media aritmética es la medida numérica más importante que se utiliza para describir datos; comúnmente se le conoce como promedio. La media aritmética de un conjunto de valores es la medida de tendencia central que se calcula al sumar los valores y dividir el total entre el número de valores.
Fórmula para la media de una muestra x=
x n
Fórmula para la media de una población =
x N
Ejemplo 3.2 Las notas de dos estudiantes del Liceo Nocturno “Aguas de Amor” en el primer cuatrimestre fueron las siguientes. Alumnos Nota 1 Nota 2 Nota 3 Nota 4 Promedio A 85 90 98 95 B 94 85 80 75 a) ¿Qué se observa en el comportamiento de las notas del alumno A en el primer cuatrimestre?
b) ¿Qué se observa en el comportamiento de las notas del alumno B en el primer cuatrimestre?
c) Si usted fuera el docente, ¿qué harías después de entregar las calificaciones del primer mes para motivar el incremento de la nota del alumno A?
d) Si usted fuera el docente, ¿qué harías después del segundo mes para evitar que el descenso de las calificaciones del estudiante B siga su curso?
78 Estadística Básica
➢ Ventajas y desventajas de la media aritmética Ejercicio 3.1 Complete la tabla y deduzca qué sucede. Datos 1, 2, 5, 9, 10 1, 2, 5, 9, 100 1, 2, 5, 9, 1000 1, 2, 5, 9, 10000 ➢ ¿Qué ventajas posee la media?
Media
➢ ¿Qué desventajas tiene la media?
Ejercicio 3.3 Complete la tabla y deduzca qué sucede. Datos Promedio 2 5 1 4 n=4
2 + 5 +1+ 4 4 12 x= x=3 4
x−x
x=
( x − x) =
¿Cuál fue el resultado de la sumatoria de las desviaciones con respecto a la media?
Ventaja Una ventaja de la media es que resulta relativamente confiable, de manera que cuando se seleccionan muestras de la misma población, las medias muéstrales tienden a ser más consistentes que otras medidas de tendencia central.
3.3 Características de la media aritmética 1. Todo conjunto de datos cuantitativos posee una media y esta es única. 2. Todos los valores se encuentran incluidos en el cálculo de la media. 3. La media es muy sensible a los datos extremos. Un valor extremo perturba considerablemente el equilibrio de los datos. 4. La suma de las desviaciones de cada valor con respecto a la media es cero. ( X − ) = 0
Capítulo 3. Medidas de Tendencias Céntricas 79
Desventaja de la media Una desventaja de la media es su sensibilidad a los valores extremos, la mediana resuelve en gran medida, esa desventaja. La mediana es el valor intermedio, ya que la mitad de los datos están por debajo de la mediana y la otra mitad por encima de ella. 3.4 Mediana para datos sueltos La mediana es el dato que está ubicado en el centro de un conjunto de datos ordenados cuando el número de datos es impar. Si el número de datos es par, entonces, la mediana será el promedio de los dos valores céntricos. La mediana suele denotarse con x . La posición de la mediana viene dada por: x =
n +1 2
Ejemplo 3.3 Calcule la mediana de los siguientes datos: Datos Ordene los datos a) 8, 10, 4, 3, 1, 15
Mediana
b) 2.5, 1.8, 1.2, 2.48, 2.0 c) 2, 3, 5, 7, 10 d) 2, 3, 5, 7, 100 e) 2, 3, 5, 7, 1000 ➢ ¿Qué observa en los ejemplos c, d, y e? ¿A qué conclusión llegas? -------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
3.5 Características de la mediana 1. En su cálculo no se incluyen todos los valores de la variable. 2. La mediana no es afectada por los valores extremos.
80 Estadística Básica
3.6 Moda para datos sueltos La moda es otra medida de tendencia central de importancia en la descripción y resumen de una distribución de frecuencias. Es utilizado en el lenguaje común, por ejemplo, ¿cuándo las damas dicen que una cartera está de moda? En estadística se tiene una idea similar de la moda de un conjunto de datos.
Moda Se define como el dato con mayor frecuencia. Ejemplo 3.4 Complete la tabla. Datos
Moda
a) 1, 2, 4, 2, 3 b) 1, 2, 5, 9, 4, 999 c) 1, 2, 1, 2 d) 1, 2, 1, 2, 5 e) 1, 2, 5, 9, 5, 555 3.7 Características de la moda 1. En su cálculo no se incluyen todos los valores de la variable. 2. No es afectada por los valores extremos. 3. El valor de la moda puede afectarse de acuerdo con el método de designación de los intervalos.
Capítulo 3. Medidas de Tendencias Céntricas 81
Comparación entre la media, mediana y moda. Al decidir si vamos a utilizar la media aritmética, mediana o moda en una distribución unimodal, se debe tomar en cuenta la forma la distribución de los datos, que puede ser de tres maneras: simétrica, con sesgo positivo o con sesgo negativo. 1. Una distribución es simétrica cuando la curva que la representa es exactamente igual a ambos
lados de un punto de referencia. Si una distribución es simétrica decimos que es insesgada. En este tipo de distribución la media, mediana y la moda son iguales. Por tanto, cuando la distribución es simétrica no importa la medida que se use, pues son iguales. Observa la figura 1.
2. Una distribución de datos tiene asimetría positiva o está sesgada a la derecha si la cola se extiende más a la derecha del pico que a la izquierda. En este tipo de distribución la 𝑀𝑜𝑑𝑎 < 𝑀𝑒𝑑𝑖𝑎𝑛𝑎 < 𝑀𝑒𝑑𝑖𝑎. En distribuciones sesgadas la mediana suele ser la mejor opción. Observa la figura 2.
3. Una distribución de datos tiene asimetría negativa o está sesgada a la izquierda si la
cola se extiende más a la izquierda del pico que a la derecha. En este tipo de distribución la 𝑀𝑒𝑑𝑖𝑎 < 𝑀𝑒𝑑𝑖𝑎𝑛𝑎 < 𝑀𝑜𝑑𝑎. En distribuciones sesgadas la mediana suele la mejor opción. Observa la figura 3.
82 Estadística Básica
3.8 Media, mediana y moda para datos agrupados Es preciso indicar que cuando tenemos una tabla de frecuencia no es posible buscar la media, mediana o la moda real, ya que no tenemos los datos puntuales, por tanto, lo que buscamos es una aproximación de éstas. Hoy en día el uso de las medidas de tendencias céntricas para datos agrupados resulta poco útil por el avance de las Tics, es por esta razón que sólo nos limitaremos a mencionar las fórmulas sin ninguna aplicación o resolución de ejercicios. Para calcular la media, mediana y moda si los datos están en una distribución de frecuencia se debe usar las fórmulas descritas a continuación. Media para datos agrupados Cuando los datos aparecen con sus respectiva con sus respectivas frecuencias, para determinar la media de ellos, se usa la expresión: x=
x=
( f x)
f
=
( f x) n
( f x) n
Esta misma fórmula se usará cuando los datos aparezcan ordenados en una distribución de li + ls frecuencia con la salvedad de que x = es el punto medio de cada clase. 2 Mediana para una muestra de datos agrupados Si los datos aparecen agrupados para determinar la mediana se usará la fórmula: n − Fi −1 x = li + 2 fi
c
Símbolo Significado
li
Es el límite inferior de la clase que tiene la mediana.
n
Es la mitad del número de datos (recuerde que la mediana se sitúa en la mitad de los datos)
2
Fi−1
fi
c
Es la sumatoria de las frecuencias que están por debajo de la clase que contiene a la mediana.
Es la frecuencia de la clase mediana Es el tamaño de la clase, se determina así:
c = li2 − li1
Capítulo 3. Medidas de Tendencias Céntricas 83
3.10 Moda de una muestra de datos agrupados Si los datos aparecen agrupados para determinar la moda se usará la fórmula: d c mod = li + 1 d1 + d 2
Nota:
li Es el límite inferior de la clase que tiene la mayor frecuencia. d1 = f m − f m −1 d 2 = f m − f m +1
c = li2 − li1
Es el tamaño de la clase.
84 Estadística Básica
3.11 Media Ponderada Situación introductoria Una estudiante obtuvo calificaciones de 90 puntos en el examen parcial, 70 puntos en el examen final y 83 puntos en un proyecto semestral. Si estas tres notas se importantizan en 20%, 70% y 10% respectivamente, ¿Cuál es la media de las calificaciones? Solución:
x=
90 + 70 + 83 = 81 3
➢ ¿Será 81 realmente la media que representa estos datos? ¿Qué debilidad tiene esta media? Definición Media ponderada. Esta media nos permite calcular un promedio que tome en cuenta la importancia de cada valor con respecto al total. La fórmula es:
( w x) x= w
Donde w es el peso de los datos y x son las observaciones o datos.
Si en el ejemplo anterior se hace los cálculos, se tiene que:
0.20 90 + 0.70 70 + 0.10 83 0.20 + 0.70 + 0.10 75.3 x= 1
x=
x = 75.3
De manera que el estudiante obtuvo realmente una calificación de 75.3 puntos y no de 81 puntos. Si el estudiante quería que le fuera mejor, ¿en cuál de las tres evaluaciones debió esforzarse más? Ejemplo 3.9 Rafaela, estudia Educación Inicial en la UASD. En el semestre pasado ella obtuvo las calificaciones que se muestran en la tabla. Ayúdala a determinar su índice académico de dicho semestre. Asignatura Calificación Créditos xw Educación Física Didáctica General Leng Esp Y Tecn De Exp II Introducción A La Informática
100 92 98 80 75
Matemática Básica Total Calcule la calificación cuatrimestral media del estudiante. Solución:
x=
1 4 3 4 4 16
( w x) w
Respuesta ---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Capítulo 3. Medidas de Tendencias Céntricas 85
Ejercicio 3.4 Imagine que en el ejemplo anterior Rafaela confundió las calificaciones de las asignaturas de Educación Física y Matemática básica, es decir que las notas de estas dos materias iban intercambiadas, como se muestra en la tabla. a) ¿Su índice académico aumenta o disminuye? b) ¿Cuál sería su nuevo índice académico? Asignatura Calificación Créditos xw Educación Física Didáctica General Leng Esp Y Tecn De Exp II Introducción A La Informática
75 92 98 80 100
Matemática Básica Total Calcule la calificación cuatrimestral media del estudiante. Solución:
x=
1 4 3 4 4 16
( w x) w
Respuesta ---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Ejercicio 3.5 Un estudiante realizó 17 créditos en una universidad durante el primer cuatrimestre. Suponga que se le asigna un valor de 4 a A, 3 a B, 2 a C, 1 a D y 0 a F. Asignatura Calificación Valor Créditos V*C Inglés C Matemáticas B Biología B Español C Total Calcule la calificación cuatrimestral media del estudiante. Solución:
x=
4 5 3 5 17
( w x) w
Respuesta ---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
86 Estadística Básica
3.12 Media geométrica Imagina que tenemos tres elementos consecutivos a, m y b de una progresión geométrica como se muestra en la figura que está a la derecha. m b 2 Esto significa, que r = = , lo que implica que m = ab m = ab , a esta a m expresión se le conoce como la media geométrica para dos valores, pero si son varios valores, entonces, la media geométrica es:
xg = n x1 x2 x3 xn Ejemplos 3.10 Calcula la media geométrica de: Datos
Media geométrica
a) 2, 18 b) 9, 3, 3 c)1, 3, 9, 2 d)2, 3, 5, 6, 1
Nota: La media geométrica suele utilizarse para promediar por ciento (tasa de interés). Cuando trabajamos con cantidades que cambian cada cierto tiempo y se requiere conocer una tasa promedio de cambio utilizamos la media geométrica. El factor de crecimiento se define así: f .c. = 1 + tasa Precio del arroz Factor de crecimiento
Capítulo 3. Medidas de Tendencias Céntricas 87
Ejemplo 3.12 La compañía Birch, fabricante de tableros de circuitos eléctricos, ha producido el siguiente número de unidades en los últimos cinco años. Calcule el aumento porcentual promedio de unidades producidas en cada año. Años
Producción
Factor de crecimiento
2004
12,500
-------------------------------------
2005
13,250
13250 12500 = 1.06
2006
14,310
14310 13250 = 1.08
2007
15,741
1.1
2008
17,630
1.12
Solución: t g = 4 (1.06 1.08 1.1 1.12 )
t g = 1.08977
Respuestas: La fábrica aumentó 8.98% en promedio la producción anual de tableros de circuitos eléctricos. Ejercicio 3.6 La siguiente distribución presenta el gasto (millones de pesos dominicanos) del gobierno central durante el periodo 1992-1996. Calcule el aumento porcentual promedio del crecimiento en cada año. Año
Gasto
1992
16,056
1993
20,727.5
1994
23,135.3
1995
24,107.4
1996
27,691.1
Factor de crecimiento
Solución:
Respuesta: -----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
88 Estadística Básica
Otro modelo de aplicación de la media geométrica se relaciona con la determinación de un cambio porcentual promedio durante cierto periodo. Por ejemplo, si usted ganó $30 000 en el año 2000 y $50 000 en el 2010, ¿cuál es la tasa anual de incremento durante el periodo? Ésta es de 5.24%. La tasa de incremento porcentual promedio se deduce a partir de la fórmula del interés compuesto: s = c (1 + i ) c (1 + i ) = s n
(1 + i ) 1+ i =
n
= n
s c
n
n
(1 + i )
s i= c
n
n
=
n
s c
s −1 c
3.13 Tasa de incremento porcentual promedio durante el tiempo. tg = n
Valor al final del periodo −1 Valor al inicio del periodo
Ejemplo 3.13 Una persona toma prestado de 827,000 pesos en el año 2015 y debe de pagar un total de 1, 665,000 en 2020. Durante este periodo: a) ¿Cuánto pagó de intereses? ---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
b) ¿Cuál fue la tasa de incremento porcentual promedio durante el tiempo? -------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Capítulo 3. Medidas de Tendencias Céntricas 89
3.14 Características y aplicaciones de la media geométrica. 1. Toma en cuenta todos los valores de la variable. Si uno de los valores es cero, la media geométrica dará cero.
2. La media geométrica es afectada por datos extremos, aunque en menor medida que la media aritmética.
3. Es mayormente usada para promediar tasas de cambio, razones y valores que muestren una
progresión geométrica. 3.15 Media armónica Esta medida céntrica se define como la inversa de la media aritmética del recíproco de los valores de la variable. Esta medida es útil cuando en el problema estudiado intervienen unidades de medidas compuestas por un cociente o por una relación inversa. La fórmula para calcular la media armónica de datos sueltos es: xa =
n (1 x )
Ejemplo 3.14 Calcular la media armónica para los siguientes valores: 5, 4, 8, 10, 2 Solución: xa =
5 = 4.25 (1 5 + 1 4 + 1 8 + 1 10 + 1 2 )
xa = 4.25
Respuestas: La media armónica de la muestra de datos es 4.25 3.15 Características y aplicación de la media armónica: 1. Se toman en cuenta todos los valores de la variable para su cálculo. 2. Es menos afectada por los datos extremos. 3. El uso de la media armónica no es común, sin embargo, es de gran utilidad cuando se trata de algunas magnitudes físicas y otros campos relacionados.
90 Estadística Básica
3.16 Media cuadrática La media cuadrática se define como la raíz cuadrada de la media aritmética de los cuadrados de los valores de la variable. La fórmula es: xc =
x
2
N
Esta medida es útil en muchos cálculos de ciencias. Ejemplo 3.15 Calcule la media cuadrática de los datos: 1, 3, 4, 5, 7 Solución 12 + 32 + 42 + 52 + 72 xc = 5 xc =
1 + 9 + 16 + 25 + 49 5
xc =
100 = 20 = 4.47 5
xc = 4.47
Respuestas: La media cuadrática de la muestra de datos es 4.47 Ejercicio 3.9 Encuentre la media cuadrática para los siguientes datos muestrales: 10, 12, 24, 13,15, 22 Solución:
Respuesta: -------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
3.17 Características y aplicación de la media cuadrática: 1. En el cálculo de media cuadrática se emplean todos los datos de la variable. 2. Una aplicación clásica de la media cuadrática es la determinación del valor eficaz de un parámetro sinusoidal en electricidad, en corriente alterna (tensión en voltios o intensidad en amperios).
Capítulo 3. Medidas de Tendencias Céntricas 91
3.9 A continuación, se dan las evaluaciones de la asignatura de matemática de 6to A del Área de Informática del Politécnico Dios es Amor. Complete el cuadro evaluativo manualmente y usando Excel, luego responda las preguntas dadas a continuación. Prof. Juana no
P1
P2
P3
P4
01
87
86
94
80
02 75
75
70
70
03
79
72
85
78
04
60
64
60
60
05
90
78
85
99
06
89
80
87
90
07
50
65
60
60
08
80
80
82
87
09
99
100
95
99
10
85
80
95
93
NF
50% NF
Ex C
50% Ex C
NCFC
30% NF
Ex Ext
70% Ex Ext
NCFE
80
50
90
a) ¿Cuál es el por ciento promovido de la materia al final de año? NF
b) ¿Cuál es el promedio de la nota final del año escolar de los 20 alumnos?
c) ¿Cuál es el por ciento de estudiante que obtuvo una nota igual o superior a 88 puntos?
d) ¿Cuál fue el por ciento de reprobados?
92 Estadística Básica
UNIVERSIDAD AUTÓNOMA DE SANTO DOMINGO Facultad de Ciencias Económicas y Sociales Escuela de Estadística Práctica #3 MEDIDAS DE TENDENCIAS CENTRÍCAS Profesor: Leonido Rosario, MA
Participante Matrícula Fecha Sección 3.1 Para cada uno de los siguientes conjuntos de datos, determine, Variable x
n
x i =1
i
a) 2, 4, 5, 7 b) 2.1, 3.2, 3.6, 5.0, 7.2 c) 11, 14, 18, 22, 25, 28, 30 d) 110, 112, 115, 120, 133 3.2 Represente cada una de las siguientes expresiones por medio de la notación de sumatoria:
a ) x1 + x2 + + x10 =
b) x1 + x2 + x3 = c ) x12 + x22 + x32 + x42 + x52 =
3.3 Calcule la media, la mediana y la moda de los siguientes datos: Datos Media Mediana 5, 2, 8, 2, 3, 2, 4, 0, 6 30, 20, 17, 12, 30, 30, 14, 29 1.5, 4.5, 3.2, 1.8, 5.0, 2.2
Moda
Práctica 3. Medidas de Tendencia Céntricas 93
3.4 Para el siguiente conjunto de datos, indique si utiliaría la media o la mediana para representar la tendencia central de la distribución y explique las razones de su decisión. Datos: 1.2, 0.8, 1.1, 0.6, 25 Explicación:
3.5 Estudio de casos. En un estudio que se realizó en un asilo de ancianos, se tomó las edades de los envejecientes que pueden caminar sin dificultades. Busque la media, mediana y moda de los siguientes datos: 69 73 65 70 71 74 65 69 60 62
3.6 Ciencias. Un científico social para una organización defensora de la niñez seleccionó de manera aleatoria 10 programas de caricaturas por televisión del sábado en la mañana y efectuó un análisis del contenido, donde cuenta la cantidad de incidentes de violencia física o verbal en cada uno. Para las 10 caricaturas examinadas, estas fueron las cuentas: 27, 12, 16, 22, 15, 30, 14, 30, 11 y 21. Determine la media, la moda y la mediana para estos datos.
94 Estadística Básica
3.7 Administración. Una gran compañía farmacéutica contrata graduados de administración de empresas para vender sus productos. La compañía se expande con rapidez y dedica un día a capacitar a los nuevos vendedores. El objetivo que la compañía fija a cada nuevo vendedor es de $10 000 mensuales, cifra que refleja las ventas promedio actuales por mes de la empresa. Después de revisar las retenciones de impuestos de los nuevos empleados, la compañía encuentra que sólo 1 de cada 10 permanece más de tres meses en la empresa. Comente la utilización de las ventas promedio actuales mensuales como objetivo de ventas para los nuevos empleados. ¿Por qué abandonan los empleados la compañía? (No deben realizar cálculos) __________________________________________________________________________ __________________________________________________________________________ __________________________________________________________________________ __________________________________________________________________________ __________________________________________________________________________ __________________________________________________________________________ 3.5 En una muestra aleatoria de 5 semanas se observó que una agencia de cruceros recibía el siguiente número programas semanales especiales de cruceros al Caribe: 20
73
75
80
82
a) Calcule la media, la mediana y la moda. Media
Mediana
Moda
b) ¿Qué medida de la tendencia central describe mejor los datos?
3.6 El director de unos grandes almacenes tiene interés en saber cuántas reclamaciones recibe el departamento de atención al cliente sobre la calidad de los aparatos eléctricos que venden los almacenes. Los registros de un periodo de 5 semanas muestran el siguiente número de reclamaciones semanales: 13 15 8 16 8 a) Calcule el número medio de reclamaciones semanales. b) Calcule el número mediano de reclamaciones semanales. c) Halle la moda.
Práctica 3. Medidas de Tendencia Céntricas 95
3.7 Diez economistas recibieron el encargo de predecir el crecimiento porcentual que experimentará el índice de precios de consumo el próximo año. Sus predicciones fueron: 3.6 3.1 3.9 3.7 3.5 3.7 3.4 3.0 3.7 3.4 a) Calcule la media muestral. b) Calcule la mediana muestral.
c) ¿Cuál es la moda?
3.8 Una cadena de grandes almacenes eligió aleatoriamente 10 establecimientos situados en una región. Tras examinar los datos de ventas, observó que ese año se habían conseguido en las Navidades los siguientes aumentos porcentuales de las ventas en dólares con respecto al año anterior: 10.2 2.9
3.1 6.8
5.9 7.3
7.0 8.2
3.7 4.3
a) Calcule el aumento porcentual medio de las ventas en dólares.
b) Calcule la mediana.
3.9 La demanda de agua embotellada aumenta durante la temporada de huracanes en Florida. En una muestra aleatoria de 7 horas, se observó que en una tienda se vendió el siguiente número de botellas de 1 galón: 40 55 62 43 50 60 65 a) Describa la media.
b) Determina la mediana.
c) Determina la moda.
96 Estadística Básica
3.10 Un fabricante de radios portátiles obtuvo una muestra de 50 radios de la producción de una semana. Las radios se examinaron minuciosamente y el número de defectos encontrados fue el siguiente: Número de defectos 0
1
Número de radios
15 17 6
12
2 3
Halla las medidas de la tendencia central.
3.11 Durante un período de una hora en una tarde calurosa de un sábado, el cantinero Julio sirvió cuatro bebidas. Calcule la media ponderada de los precios de las bebidas (Precio ($), cantidad vendida). Bebidas
B1 B2 B3 B4 Total
Precio
50 75 90 110
Cantidad
PC
Proceso
5 15 15 15
3.12 Suponga que el Hospital Regional Universitario José María Cabral y Báez tiene 200 empleados en su personal de enfermería. 50 son auxiliares de enfermería; 50 enfermeras practicantes, y 100 son enfermeras tituladas. Las auxiliares de enfermería ganan 200 pesos la hora; las enfermeras practicantes 300 pesos y los titulados 400 pesos la hora. ¿Cuál es el salario promedio ponderado por hora?
Práctica 3. Medidas de Tendencia Céntricas 97
3.13 A continuación, se mencionan las materias que Luís Pérez llevó en el primer semestre de Ingeniería Química, el número de créditos y la calificación obtenida, determine la calificación promedio que obtuvo Luís Pérez en su primer semestre. Utilice la media ponderada. Número de Calificación Producto Materia Proceso créditos (1)
(2)
Metodología de la Inv.
3
90
Matemática 1
4
100
Programación
8
81
Química
10
78
Dibujo
6
100
Economía
4
84
Total 3.14 El crecimiento en el gasto por deudores morosos de una compañía financiera durante los últimos años es el que se muestra a continuación. Calcule el incremento promedio porcentual del gasto por deudores morosos durante ese periodo. Año Tasa de Factor de Proceso interés crecimiento 2008 0.110 2009
0.090
2010
0.075
2011
0.080
2012
0.095
2013
0.108
2014
0.120
98 Estadística Básica
3.15 En 1985 había 340,213 suscriptores a la telefonía celular en Estados Unidos. En 2008, el número de suscriptores aumentó a 262, 700,000. a) En número de suscriptores, ¿de cuánto fue el incremento para este periodo?
b) ¿De cuánto es el ritmo de cambio promedio anual de suscriptores?
c) ¿Cuál es la media geométrica del incremento anual del periodo?
3.16 En 1996, en Estados Unidos, un total de 14, 968, 000 contribuyentes presentaron en forma electrónica sus declaraciones de impuestos. En el año 2009 el número se había incrementado a 95, 000, 000. a) En número de contribuyentes, ¿de cuánto fue el incremento para este periodo?
b) ¿De cuánto es el ritmo de cambio promedio anual de contribuyentes?
c) ¿Cuál es la media geométrica del incremento anual del periodo?
Práctica 3. Medidas de Tendencia Céntricas 99
3.17 La compañía de Juan, fabrica computadora, y ha producido el siguiente número de unidades en los últimos cinco años: 2000 2001 2002 2003 2004 12,200 13,550 16,000 18,600 23,123 Calcule el aumento porcentual promedio de unidades producidas en este periodo
3.18 Define los siguientes conceptos: Conceptos
Significado
Media
Mediana
Moda
3.19 Calcule la media cuadrática y la media armónica de los siguientes datos muestrales: 2, 3, 1, 5, 5 Media cuadrática Media armónica
100 Estadística Básica
3.20 Enuncie las características de siguientes medidas de tendencia centrales. Media aritmética Mediana Moda
Práctica 3. Medidas de Tendencia Céntricas 101
A continuación, se dan las evaluaciones de la asignatura de matemática de 6to A del Área de Informática del Politécnico Dios es Amor. Complete el cuadro evaluativo manualmente y usando Excel, luego responda las preguntas dadas a continuación. Prof. José
3.21
no
P1
P2
P3
P4
01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19 20
87 50 87 60 90 89 72 90 99 65 87 56 70 82 86 88 54 80 87 90
90 65 88 64 78 80 75 90 100 60 90 60 80 87 80 85 60 93 95 98
88 70 85 60 85 87 86 92 95 52 97 60 85 89 86 88 65 94 90 94
80 70 89 60 99 90 80 97 99 60 99 60 90 90 88 88 66 98 98 98
NF
50% NF
Ex C
50% Ex C
NCFC
30% NF
Ex Ext
70% Ex Ext
NCFE
87 80
88 90
60
90
a) ¿Cuál es el por ciento promovido de la materia al final de año? NF
b) ¿Cuál es el porciento promovido en completivo?
c) ¿Cuál es el por ciento de estudiante que obtuvo una nota igual o superior a 85 puntos?
d) ¿Cuál fue el por ciento de reprobados?
CAPÍTULO
4
Medidas de Posición Competencias Específicas ✓ Razona y argumenta. Reconoce, calcula e interpreta los cuartiles, deciles y percentiles para datos sueltos y agrupados. ✓ Comunica Explica cómo se obtiene los cuartiles, deciles y percentiles para datos sueltos y agrupados. Fuente: Ministerio de Educación
La nutrición es la ingesta de alimentos en relación con las necesidades dietéticas del organismo. Una buena nutrición (una dieta suficiente y equilibrada combinada con el ejercicio físico regular) es un elemento fundamental de la buena salud.
✓ Modela y Representa Modela situaciones, donde se pueda calcular las medidas de posiciones.
Una mala nutrición puede reducir la inmunidad, aumentar la ✓ Conecta Utiliza conexiones entre las vulnerabilidad a las enfermedades, alterar el desarrollo físico y mental, medidas de posiciones y las y reducir la productividad. La OMS (Organización Mundial de la Salud) ha establecido las siguientes proporciones para una dieta balanceada:
situaciones de comunidad educativa.
la
➢ Los hidratos de carbono deben aportar al menos un 55% hasta ✓ Resuelve problemas Resuelve problemas un 60% del aporte calórico total. ➢ Las grasas no deben superar el 30% de las calorías totales ingeridas. ➢ Las proteínas deben de alcanzar el 15% restante en la dieta. ¿Cómo usted dividiría un conjunto de datos para una mejor interpretación de estos, de acuerdo con los propósitos de un estudio en específicos? En esta unidad, se introducen las medidas de posiciones, tales como: cuartiles, deciles, y los percentiles. Nuestro objetivo es dividir un conjunto de datos a través de medidas de estas posiciones con el fin de comprender e interpretar mejor el lenguaje de los datos.
del contexto educativo que impliquen calcular medidas de posiciones.
✓ Utiliza herramientas tecnológicas Usa Excel (con el complemento MegaStat) y otras herramientas tecnológicas para calcular cuartiles, deciles y percentiles de datos sueltos y agrupados.
Capítulo 4. Medidas de posición 103
4.1 Introducción Usted recordará que la mediana divide una distribución en dos partes iguales, es decir, el 50% de los datos estará por encima de la mediana y el otro 50% estará por debajo de ésta. Existen otras medidas que pueden dividir la distribución en 100 partes iguales, en 10 partes iguales o en 4 partes iguales.
4.2 Percentiles Los percentiles dividen un conjunto ordenado de datos en 100 partes iguales. Los percentiles dan los valores correspondientes al 1%, al 2%, al 3%,… y al 99% de los datos.
Los percentiles se representan con la letra P y la localización del percentil estará dada por la fórmula: Lk =
k ( n + 1) 100
Ejemplo 4.1 En la siguiente tabla aparecen las comisiones (en dólares) que ganó el último mes una muestra de 19 corredores de bolsa de la oficina de Salomón Smith, California. Esta compañía de inversiones tiene oficinas a lo largo de Estados Unidos. 2038 1940
1721 2311
1721 2054
1637 2046
2097 1471
2047 1460
2205 1787
2287 1900
1741 1800
1932 ------
1787 2205
1800 2287
1900 2311
1932 ------
Encuentre los siguientes percentiles: P30 y P70 Organicemos los datos 1460 1940
1471 2038
Solución
L30 =
1637 2046
30 (19 + 1) 600 = 100 100
L30 = 6
Solución
1721 2047
1721 2054
1741 2097
a) Buscamos la posición del P30 Resultado Respuesta Así que el percentil 30 se El 30% de los corredores ganó encuentra en la posición 6, es 1,741 dólares o menos por comisión el último mes de decir, que P30 = 1741 trabajo.
b) Buscamos la posición del P70 Resultado
Respuesta
104 Estadística Básica
Ejercicio 4.1 Una financiera registra el tiempo en días que emplean los clientes para pagar sus facturas. En la siguiente lista aparece una muestra de 24 clientes y el tiempo que tomaron para pagar. 13 41
35 35
82 56
41 41
41 51
13 13
20 27
10 67
25 53
45 38
34 47
Encuentre los siguientes percentiles: 𝑎)𝑃20 =
𝑏)𝑃24 =
𝑐)𝑃80 =
Organice los datos de menor a mayor
Solución
𝑎)𝑃20 = Resultado
Respuesta
Solución
𝑏)𝑃24 = Resultado
Respuesta
Solución
𝑐)𝑃80 = Resultado
Respuesta
34 31
Capítulo 4. Medidas de posición 105
4.3 Deciles Los deciles dividen un conjunto ordenado de datos en 10 partes iguales. Los deciles dan los valores correspondientes al 10%, al 20%, al 30%,..., y al 90% de los datos.
Ejemplo 4.2 Para los datos del ejemplo 1, calcule los siguientes deciles: 𝐷1 𝑦 𝐷6 Recordemos que los datos ordenados de menor a mayor son: 1460 1471 1637 1721 1721 1741 1787 1800 1900 1932 1940 2038 2046 2047 2054 2097 2205 2287 2311 -----a) Dado que D1 = P10, tenemos: Solución Resultado Respuesta Así que el D1 se encuentra en la El 10% de los corredores 10 (19 + 1) L10 = posición 2, es decir, que ganó 1,471 dólares o 100 D1 = P10 = 1471 menos por comisión el L10 = 2 último mes de trabajo.
Solución
b) Dado que D6 = P60, tenemos: Resultado
Respuesta
106 Estadística Básica
Ejercicio 4.2 Una financiera registra el tiempo en días que emplean los clientes para pagar sus facturas. En la siguiente lista aparece una muestra de 24 clientes y el tiempo que tomaron para pagar. 13 35 82 41 41 13 20 10 25 45 34 34 41 35 56 41 51 13 27 67 53 38 47 31 Encuentre los siguientes deciles: 𝐷4 𝑦 𝐷6 Organice los datos de menor a mayor
Solución
a) Dado que D4 = P40: Resultado
Respuesta
Solución
b) Dado que D6 = P60: Resultado
Respuesta
Capítulo 4. Medidas de posición 107
4.4 Cuartiles Los cuartiles dividen un conjunto ordenado de datos en 4 partes iguales. Los cuartiles dan los valores correspondientes al 25%, al 50% y al 75% de los datos.
Ejemplo 4.3 Para los datos del ejemplo 1, calcule los siguientes cuartiles: 𝐶1 𝑦 𝐶2 Recordemos que los datos ordenados de menor a mayor son: 1460 1471 1637 1721 1721 1741 1787 1800 1900 1932 1940 2038 2046 2047 2054 2097 2205 2287 2311 -----a) Dado que C1 = P25, tenemos: Solución Resultado Respuesta Así que el C1 se encuentra en El 25% de los corredores 25 (19 + 1) L25 = la posición 5, es decir, que ganó 1,721 dólares o menos 100 C1 = P25 = 1721 por comisión el último mes de L10 = 5 trabajo.
Solución
b) Dado que C2 = P50, tenemos: Resultado
Respuesta
108 Estadística Básica
Ejercicio 4.3 Las notas obtenidas de 13 estudiantes en la asignatura de matemática de un colegio de Santiago fueron las siguientes 67 72 73 90 72 70 70 68 97 85 78 98 100 ---Encuentre los siguientes cuartiles: 𝐶2 𝑦 𝐶3 Organice los datos de menor a mayor
Solución
Solución
a) Dado que C2 = P50, tenemos: Resultado
b) Dado que C3 = P75, tenemos: Resultado
Respuesta
Respuesta
Capítulo 4. Medidas de posición 109
Uso de Excel para encontrar percentiles En la siguiente tabla aparecen las comisiones (en dólares) que ganó el último mes una muestra de 19 corredores de bolsa de la oficina de Salomón Smith, California. Esta compañía de inversiones tiene oficinas a lo largo de Estados Unidos. 2038
1721
1721
1637
2097
2047
2205
2287
1741
1932
1940
2311
2054
2046
1471
1460
1787
1900
1800
------
Pruebe usando Excel que P30 = 1,741 y P70 =2,047
Ejercicio 4.4 A continuación, se presentan la edad de un grupo de 12 estudiantes de un colegio de Santiago. Determine lo siguiente (Use Excel): a) P40, b) P81 y c) P26 13 35 82 41 41 13 20 10 25 45 34 34 a) P40 =
b) P81 =
c) P26 =
110 Estadística Básica
4.5 Percentiles, deciles y cuartiles para datos agrupados El procedimiento para calcular estas medidas para datos agrupados en una distribución de frecuencias es similar al usado en el cálculo de la mediana. Como se puede reescribir los deciles y los cuartiles en función de los percentiles, entonces solamente usaremos la fórmula para calcular los percentiles de una distribución, que será: kn − F )c ( 100 P = Li + i −1
k
fi
Ya hemos dicho que las medidas para datos agrupados resultan poco útiles en nuestro tiempo, así que evitaremos trabajar con ellas.
Estadística Básica 112
UNIVERSIDAD AUTÓNOMA DE SANTO DOMINGO Facultad de Ciencias Económicas y Sociales Escuela de Estadística Práctica #4 MEDIDAS DE POSICIÓN Profesor: Leonido Rosario, MA
Participante Matrícula Fecha Sección 4.1 A continuación, se muestran las notas obtenidas por 24 estudiantes en un examen de 30 puntos. 20 18
13 19
11 2
18 5
22 10
23 1
0 29
27 25
19 30
21 2
28 12
Encuentre los siguientes percentiles: 𝑎)𝑃20 = 𝑏)𝑃60 = Organice los datos de menor a mayor
Solución
𝑎)𝑃20 = Resultado
Respuesta
Solución
𝑏)𝑃60 = Resultado
Respuesta
20 15
Estadística Básica 119
4.2 Rafael es gerente de una compañía que se dedica a vender libros de texto. Ha contratado 39 personas, las cuales hacen visitas a profesores universitarios para recopilar información que le servirá como insumo para la toma de decisiones. Cada sábado en la mañana solicita a su personal que le envié un informe, que debe incluir entre otras cosas, la cantidad de profesores que visitaron la semana anterior. En la lista de abajo, aparece la cantidad de visitas de la semana pasada. Recuerde interpretar cada resultado. 38 40 59 59
41 59
45 62
48 62
50 62
50 63
51 64
51 65
52 66
52 66
53 67
54 67
55 69
55 69
55 71
56 77
56 78
a) Determine el primer cuartil. b) Calcule el 6to decil. Organice los datos de menor a mayor
Solución
𝑎)𝐶1 = Resultado
Respuesta
Solución
𝑏)𝐷6 = Resultado
Respuesta
57 79
48 …
CAPÍTULO
5
Medidas de Dispersión Competencias Específicas ✓ Razona y argumenta. Reconoce, calcula e interpreta la varianza y la desviación estándar de una muestra y/o una población de datos sueltos y agrupados.
✓ Comunica
Fuente: Ministerio de Educación
Explica cómo se obtiene la varianza y la desviación estándar de una muestra y/o una población para datos sueltos y agrupados.
El Programa de Reconocimiento al Mérito Estudiantil se institucionaliza en el sector oficial con la finalidad de contribuir a elevar el nivel académico del estudiantado dominicano, mejorar la ✓ Modela y Representa calidad de la educación y fortalecer el sistema educativo en sentido Modela situaciones, donde se pueda calcular las medidas general. principales de dispersión.
Mediante la Orden Departamental No. 17´96, de fecha 12 de octubre del año 1996, del Minerd, se estableció y reglamentó el Programa ✓ Conecta de Reconocimiento al Mérito Estudiantil, en un primer momento, Utiliza conexiones entre las dirigido a los estudiantes de los centros educativos del sector oficial, medidas principales de dispersión y las situaciones de extendiéndose posteriormente a los colegios privados, con el la comunidad educativa. propósito de estimular la formación integral, la excelencia académica y el desarrollo de talentos en las diversas áreas del ✓ Resuelve problemas conocimiento. Resuelve
problemas
del
contexto educativo que Un padre de familia tiene dos hijos en un politécnico, ambos en el impliquen calcular la mismo grado, pero María estudia Enfermería, mientras que Ramón desviación estándar. estudia contabilidad. María le dice a su padre que sacó 90 puntos como promedio final en la asignatura Enfermería, mientras que ✓ Utiliza herramientas Ramón obtuvo 80 puntos en Contabilidad. El Padre da más crédito a tecnológicas María, ya que obtuvo mejor calificación. ¿Es válido el argumento Usa Excel (con el del padre para gratificar más a María? complemento MegaStat) y
En esta unidad, se introducen las medidas de dispersión, tales como: el rango, el rango intercuartil, el rango semi-intercuartil la desviación media absoluta, la varianza y la desviación estándar. Nuestro objetivo es resumir un conjunto de datos a través de medidas de tendencias céntricas y las medidas de dispersión, con el fin de comprender e interpretar correctamente el lenguaje de los datos.
otras herramientas tecnológicas para calcular la varianza y la desviación estándar de una muestra y/o una población para datos sueltos y agrupados.
Capítulo 5. Medidas de Dispersión 121
5.1 Introducción Se entregará una laptop, una Tablet, una calculadora gráfica y una mochila a los estudiantes con los mejores promedios en una clase. Al final del curso el profesor observa que 4 alumnos están empatados con el mismo promedio (95 puntos). Dado que tienen el mismo promedio debe buscarse alguna manera no aleatoria para asignar los premios. El maestro evalúa la consistencia en las calificaciones, y de esta manera entregar los premios de tal modo que el primer lugar lo obtenga el alumno con menor variabilidad en sus calificaciones. ¿Cómo debe el maestro distribuir los premios? Estudiantes A B C D
Periodo 1 100 95 100 94
Periodo 2 90 95 90 96
Periodo 3 94 90 100 95
Periodo 4 96 100 90 95
Promedio 95 95 95 95
Si solamente consideramos la media, no podemos reconocer ninguna diferencia entre el desempeño de los alumnos. Para poder comparar el rendimiento, no es suficiente conocer la media, es conveniente conocer algunas medidas que miden la variabilidad de los datos con relación a la media. Cuando hablamos de variabilidad nos referimos a qué tan lejos de la media están los datos. Si representemos los datos en un diagrama de puntos tendremos una visión más clara de la variación de las calificaciones de los alumnos. Diagrama de puntos para las calificaciones de los estudiantes Estudiante Gráfica de puntos A B
C
D ➢ ¿Cuál de los estudiantes parece tener menor variación en sus calificaciones con relación a la media? ➢ ¿Cuál de los estudiantes parece tener mayor variación en sus calificaciones con relación a la media?
122 Estadística Básica
Importancia de las medidas de dispersión. Las medidas de dispersión nos proporcionan información adicional que nos permite juzgar la confiabilidad de nuestra medida de tendencia central. Si los datos se encuentran muy dispersos, la posición central es menos representativa de los datos, como un todo, que cuando éstos se agrupan más cerca alrededor de la media. Las principales medidas de dispersión absolutas son: a. Rango b. Rango intercuartil c. Rango semi-intercuartil o desviación intercuartílica d. Desviación media e. Varianza f. Desviación estándar Aunque el rango, el rango intercuartil y el rango semi-intercuartil miden la dispersión de los datos, sólo tienen en cuenta dos de los valores de los datos. Necesitamos una medida que considere cada uno de los valores de los datos. Esa medida promediaría la distancia total entre cada observación y la media. La desviación media es prometedora si los valores de la diferencia se colocan en valores absolutos, pero tiene una debilidad que la hace poco útil al momento de trabajar con ella y es que la operación de valor absoluto no es una operación algebraica y eso tiene consecuencia a la hora de hacer inferencia, pero nos quedan las dos más importantes que son la varianza y la desviación estándar. La segunda depende de la primera, pero la de mayor uso es la desviación estándar. Veamos ahora la definición de estas medidas. 5.2 Desviación estándar Es un promedio de las desviaciones individuales de cada observación con respecto a la media de una distribución. También se puede definir como la raíz cuadrada de la varianza. La desviación estándar es la medida de variación más importante y útil.
Desviación estándar de una población 2 ( x − ) =
N
Desviación estándar de una muestra s=
(
x−x
)
2
n −1
5.3 Varianza Es la media aritmética del cuadrado de las desviaciones respecto a la media de una distribución estadística. También se puede definir como el cuadrado de la desviación estándar. Varianza de una población Varianza de una muestra = 2
(x − ) N
2
s2 =
(
x−x n −1
)
2
Capítulo 5. Medidas de Dispersión 123
Los datos del primer ejemplo componen una población. Busque la desviación estándar de cada uno y responda la inquietud inicial, es decir ¿cómo se deben distribuir los premios? Notas del alumno A 100 90 94 96
1. Buscamos la media
=
x
N 100 + 90 + 94 + 96 380 = = = 95 4 4 = 95
2. Buscamos la desviación estándar
= =
( x − )
2
N
(100 − 95)
2
+ ( 90 − 95) + ( 94 − 95) + ( 96 − 95 ) 2
2
2
4
=
25 + 25 + 1 + 1 = 4
52 4
= 3.6
Notas del alumno B 95
95
90
100
1. Buscamos la media =
x N
2. Buscamos la desviación estándar
=
( x − ) N
2
124 Estadística Básica
Notas del alumno C 100
90
100
90
1. Buscamos la media =
x N
2. Buscamos la desviación estándar
=
( x − )
2
N
Notas del alumno D 94
96
95
95
1. Buscamos la media =
x N
2. Buscamos la desviación estándar
=
( x − ) N
2
Capítulo 5. Medidas de Dispersión 125
Estudiantes
Distribución de los premios en forma descendente Media Desviación estándar 1er
Premio
2do 3er 4to
Ejercicio 5.1 Para el siguiente conjunto de datos muestrales, calcule la desviación estándar. Datos muestrales: 6, 2, 8, 5, 5, 4 1. Busque la media
x=
x n
2. Busque la desviación estándar
s=
( x − x) n −1
2
126 Estadística Básica
5.4 Uso de la calculadora científica (CASIO fx-82ms) para calcular la media y la desviación estándar de una población o una muestra de datos. Ejemplo 5.4 El siguiente conjunto de datos corresponde a una población, calcule la media y la desviación estándar usando la calculadora. Datos poblacionales: 8, 3, 7, 3 y 4. 1. Programe la calculadora en el modo estadístico. Para hacer esto, presione la tecla MODE luego el número 2 (SD).
2. Introduzca los datos: 8, 3, 7, 3, 4. Para hacer esto, presiona 8 y luego la tecla de data (M+) en la pantalla debe aparecer n = 1, indicando que el primer dato ya se introdujo. Con ese mismo proceso introduzca los demás datos. 𝑥̅ 𝜎𝑥 𝑠𝑥 1 2 3 Presionamos el 1 para buscar la media y nos da: 𝜇 = 5, hacemos el mismo proceso y presionamos el 2 para calcular la desviación estándar, la cual da 𝜎𝑥 ≈ 2.10 (si el caso fuera una muestra se trabaja con el 3)
3. Presionamos segunda función (shift) y luego el 2, en la pantalla debe aparecer
Resultados Media
Desviación estándar
𝜇=5
𝜎𝑥 ≈ 2.10
➢ VIDEO TUTORIAL
Si tiene alguna duda les invito a ver el video titulado “Desviación estándar para datos sueltos usando calculadora” a través del canal de YouTube llamado “Rosario Institud”.
Ejercicio 5.4 Para el siguiente conjunto de datos muestrales, calcule la media y la desviación estándar, usando la calculadora. Datos muestrales: 6, 2, 8, 5 Resultados Media
Desviación estándar
Capítulo 5. Medidas de Dispersión 127
➢ VIDEO TUTORIAL Compruebe usando Excel que la media y la desviación estándar de las calificaciones de los 4 alumnos son las que se muestran a continuación. Para hacer esto les invito a ver el video titulado “Desviación estándar usando Excel” en mi canal de YouTube llamado “Rosario Institud” Resumen de los resultados del primer ejemplo (Los datos provienen de una población)
Estudiante A B C D
Periodo 1 100 95 100 94
Periodo 2 90 95 90 96
Periodo 3 94 90 100 95
Periodo 4 96 100 90 95
Promedio 95 95 95 95
Desviación estándar 3.61 3.54 5 0.71
128 Estadística Básica
3.9 Una universidad nacional tiene un programa de becas para estudiar educación en el área de matemática. Para este propósito se elige un/a alumno/a del nivel secundario de cada centro educativo del perteneciente al distrito escolar 08-04. El beneficiario debe tener el mayor índice académico en la asignatura de matemática. A continuación, se dan las evaluaciones de los 20 estudiantes de 6to A en dicha materia, del Liceo Mauricio Rubio. Usando la herramienta de Excel complete el cuadro. ¿Cuál estudiante usted elegiría para darle la beca? (Suponga que no se tiene ninguna otra información que la se le suministra en este cuadro evaluativo) no
Nombre
P1
P2
P3
P4
01
Amelia Alcántara
87
86
94
80
02
Analía Jiménez
75
75
70
70
03
Caridad Aracena
79
72
85
78
04
Diana Espinal
60
64
60
60
05
Esmailin Almonte
90
78
85
99
06
José Espinal
89
80
87
90
07
Josefina Caraballo
50
65
60
60
08
Laura Díaz
80
80
82
87
09
Leonido Rodríguez
99
100
90
90
10
Leopoldo Cruz
68
65
64
60
11
Luisa Jaquez
80
100
99
99
12
Marcos Ferreira
80
89
87
95
13
Mercedes Martínez
91
79
75
88
14
Pedro Hernández
99
73
96
81
15
Randy Vegas
85
92
82
86
16
Rudy Morel
71
93
76
77
17
Sabrina García
94
72
78
83
18
Santiago Sánchez
90
74
100
83
19
Solange Cruz
90
96
95
97
20
Sonia Amarante
83
76
99
75
Respuesta
Promedio
Desviación Estándar
Capítulo 5. Medidas de Dispersión 129
Si los datos aparecen en una distribución de frecuencias, entonces las fórmulas para la varianza y la desviación estándar serán: 5.9 Varianza para datos agrupados Para una población Para una muestra
2
f (x − ) =
2
s2
N
5.10 Desviación estándar para datos agrupados Para una población =
f (x − ) N
( =
f x−x
)
2
n −1
Para una muestra
2
s=
f ( x − x)
2
n −1
Ya hemos dicho que las medidas para datos agrupados resultan poco útiles en nuestro tiempo, así que evitaremos trabajar con ellas.
130 Estadística Básica
5.12 Importancia de la desviación estándar Hemos visto como dos o más conjuntos pueden tener la misma media, pero uno con mayor dispersión que el otro. Esto sucede también con las tres distribuciones que se presentan en la figura siguiente. La media de las tres curvas es la misma, pero la curva A tiene menor separación (o variabilidad) que la curva B, y ésta tiene menor variabilidad que la C. Si medimos sólo la media de estas tres distribuciones, estaremos pasando por alto una diferencia importante que existe entre las tres curvas. Al igual que sucede con cualquier conjunto de datos, la media, la mediana y la moda sólo nos revelan una parte de la información que debemos conocer acerca de las características de los datos. Para aumentar nuestro entendimiento del patrón de los datos, debemos medir también su dispersión, separación o variabilidad.
➢ ¿Por qué es tan importante entender y medir la dispersión de la distribución? 1. Primero, nos proporciona información adicional que nos permite juzgar la confiabilidad de nuestra medida de tendencia central. Si los datos se encuentran muy dispersos, como los que representa la curva C de la figura, la posición central es menos representativa de los datos, como un todo, que cuando éstos se agrupan más cerca alrededor de la media, como en la curva A de la misma figura. 2. Quizás se desee comparar las dispersiones de diferentes muestras. Si no se desea tener una amplia dispersión de valores con respecto del centro de distribución, o esto presenta riesgos inaceptables, necesitamos poder reconocerla y evitar elegir distribuciones que tengan las dispersiones más grandes. Los analistas financieros están preocupados por la dispersión de las ganancias de una empresa. Las ganancias ampliamente dispersas —que van desde extremadamente altas a extremadamente bajas e incluso a niveles negativos— son indicativas de un riesgo mayor para los accionistas y para los acreedores que las ganancias que permanecen relativamente estables. De manera similar, los expertos en el control de la calidad analizan la dispersión de los niveles de calidad de un producto. Una medicina cuya pureza promedio es buena, pero que oscila desde muy pura hasta muy impura puede ser peligrosa para la vida humana.
Capítulo 5. Medidas de Dispersión 131
5.13 Coeficientes de variación (CV): Cuando se compara la variación de dos conjuntos diferentes de datos, se debe tomar en cuenta que las desviaciones estándares han de ser aproximadamente iguales o iguales, además los datos deben tener la misma escala y las mismas unidades. Si las medias son muy diferentes o si los conjuntos utilizan diferentes escalas o unidades de medición, podemos utilizar el coeficiente de variación. El coeficiente de variación es un coeficiente expresado como porcentaje que describe la desviación estándar en relación con la media. El coeficiente de variación está dado de la siguiente forma: Muestra s CV = 100% x
Población CV = 100%
Ejemplo 5.6 Un director de escuela tiene dos maestras de primero del nivel inicial. La maestra Juana usa el método 1 para alfabetizar a sus alumnos de primero A y la maestra Xiomara usa el método 2 para el mismo fin, con los estudiantes de primero B, al término del curso se miden las palabras por minutos de ambos grupos, resultando los siguientes datos: Primero A = 40
Primero B = 55
=9
= 10
¿Qué método resultó tener la menor variabilidad relativa en el desempeño de la lectura? ➢ Podemos observar que las medias son distintas, por tanto, no podemos comparar las desviaciones estándares absolutas, necesitamos calcular el coeficiente de variación para ambos grupos. Solución Coeficiente de variación de primero A Coeficiente de variación de primero B CV =
100%
CV =
100%
CV =
9 100% = 22.5% 40
CV =
10 100% = 18.18% 55
CV = 22.5%
CV = 18.18%
Conclusión El método A tubo mayor variación relativa en la lectura de palabras por minutos por parte de los estudiantes.
132 Estadística Básica
Ejemplo 5.7 Compare la variación de las estaturas de hombres con la variación de sus pesos utilizando los siguientes resultados: Para los hombres, las estaturas producen x = 68.34 pu lg y s = 3.02 pu lg ; los pesos producen x = 172.55lb y s = 26.33lb . Solución Coeficiente de variación de la estatura Coeficiente de variación del peso CV =
100%
CV =
Conclusión
100%
133 Práctica 5. Medidas de Dispersión
UNIVERSIDAD AUTÓNOMA DE SANTO DOMINGO Facultad de Ciencias Económicas y Sociales Escuela de Estadística Práctica #5 MEDIDAS DE DISPERSIÓN Profesor: Leonido Rosario, MA
Participante Matrícula Fecha Sección 5.1 ¿Cuáles datos cree usted que tengan mayor variación: ¿los ingresos de una muestra aleatoria
simple de 1000 adultos elegidos de la población en general, o los ingresos de una muestra aleatoria simple de 1000 profesores de estadística? ¿Por qué?
5.2 ¿Para cuál de las siguientes distribuciones la media es más representativa de los datos como un
todo? ¿Por qué?
5.3 Para medir el éxito escolar, los educadores necesitan probar los niveles de conocimientos y habilidades de los estudiantes. Tomar en cuenta las diferencias individuales de cada uno de ellos, permite a los profesores planear mejor el programa académico. Las curvas que se muestran a continuación representan las distribuciones basadas en resultados anteriores de dos pruebas distintas. ¿Cuál de ellas seleccionaría usted como mejor opción para los propósitos de los profesores?
134 Estadística Básica
5.4 Una empresa que usa dos métodos diferentes para enviar pedidos a sus clientes encontró
las siguientes distribuciones del tiempo de entrega para los dos métodos, según los registros históricos. Con la evidencia disponible, ¿qué método de envío recomendaría? ¿por qué?
5.5 Encuentre la desviación estándar de los siguientes datos muestrales.
a) 5, 2, 8, 2, 3, 4, 0, 6
Práctica 5. Medidas de Dispersión 135
5.6 Calcule la desviación estándar del siguiente conjunto de datos muéstrales: 1, 3, 4, 6, 6.
Desviación estándar de: 1, 3, 4, 6, 6.
Sume a cada dato una constante igual a 2. Calcule la desviación estándar para los nuevos valores. ¿Qué efecto produce sobre la desviación estándar el hecho de sumar una constante a cada dato? Desviación estándar de: ____, ____, ____, ____, ____ 5.6.1
Multiplique cada dato una constante igual a 2. Calcule la desviación estándar para los nuevos valores. ¿Qué efecto produce sobre la desviación estándar el hecho de multiplicar una constante a cada dato? Desviación estándar de: ____, ____, ____, ____, ____ 5.6.2
136 Estadística Básica
5.7 Calcule la desviación estándar de los siguientes datos muéstrales.
a) 6, 8, 7, 3, 6, 4
b) 6, 8, 7, 3, 6, 35
c) ¿Por qué la desviación estándar es tan grande en la parte b, en comparación con la parte a?
Práctica 5. Medidas de Dispersión 137
NOTA: ➢ Para los ejercicios 5.8 hasta 5.12 encuentre la desviación estándar. 5.8 Años para obtener el título de licenciatura. A continuación, se presenta el tiempo (en años) que le tomó a una muestra aleatoria de estudiantes universitarios obtener su título de licenciatura. Con base en los resultados, ¿Es inusual que un estudiante obtenga el título de licenciatura en 12 años? 4
4
4.5 4.5
6
6
8
9
13
15
5.9 Emisiones de automóviles. Científicos ambientales midieron las emisiones de gases de
invernadero de una muestra de automóviles. Las cantidades que se listan a continuación están en toneladas (por año), expresadas como equivalentes de CO2 . El valor de 9.3 toneladas es inusual? 7.2
7.1
7.4
7.9
8.2
9.3
138 Estadística Básica
Bancarrotas. A continuación, se lista el número de declaraciones de bancarrotas en un condado de Nueva York. Los números se presentan en orden mensual de un año reciente. Identifique cualquier valor que sea inusual.
5.10
59
85
95
143
371
14
15
5.11 Mediciones de la presión sanguínea. Siete estudiantes del segundo año de medicina de Bellevue Hospital midieron la presión sanguínea de la misma persona. A continuación, se listan las lecturas sistólicas (en mmHg). Si la presión sanguínea del sujeto permanece constante y los estudiantes de medicina aplican correctamente la misma técnica de medición, ¿cuál debería ser el valor de la desviación estándar? Obtenga la desviación estándar. 138 130 135 140 140 130 150
Práctica 5. Medidas de Dispersión 139
IMC y género. Es bien sabido que los hombres tienden a pesar más y a ser más altos que las mujeres. El índice de masa corporal (IMC) es una medida que se basa en el peso y en la estatura. A continuación, se muestran los valores de IMC de hombres y mujeres elegidos de manera aleatoria. ¿Parece existir una diferencia en la variación entre los dos conjuntos de datos? Calcule la desviación estándar. (Puedes usar Excel)
5.12
Hombres: 23.8
23.2
24.6
26.2
23.5
24.5
21.5
31.4
26.4
22.7
27.8
28.1
Mujeres: 19.6
23.8
19.6
29.1
25.2
21.4
22.0
27.5
33.5
20.6
29.9
17.7
140 Estadística Básica
Responde las siguientes preguntas. a) ¿Por qué el rango no es una medida de dispersión tan útil como la desviación estándar? 5.13
b) Si s = 0 , ¿Qué debe ser verdad acerca de los datos de la distribución?
c) ¿Es posible que el valor del rango, la desviación estándar o la varianza de un conjunto de datos sea negativo? Explique
Práctica 5. Medidas de Dispersión 141
A raíz de que los jóvenes en su mayoría están activos sexualmente en nuestras escuelas, y que las enfermedades de transmisión sexual son de alto riesgo, el psicólogo decide investigar cómo anda la fidelidad de los estudiantes en el noviazgo en el politécnico Dios es amor. Para esto, estudia una muestra de 20 alumnos (10 hembras y 10 varones) y encuentra los siguientes datos. (Puedes usar Excel)
5.14
Sexo Masculino Femenino
Número de parejas simultaneas de los 20 estudiantes. 1, 1, 3, 2, 4,1, 2, 3, 4, 5 1, 1, 1, 1, 2, 3, 2, 1, 1, 1
Calcule lo siguiente: Medidas Masculino
Sexo Femenino
a) La moda b) La mediana c) La media d) El rango e) Varianza f) Desviación estándar g) Coeficiente de variación
1. ¿Cuál de los dos grupos tiene mayor capacidad de mantenerse con una pareja?
2. Según su criterio, ¿cuáles son las razones que explican la respuesta a la primera pregunta?
3. ¿Cuál grupo se debe trabajar primero o con mayor ahínco?
4. ¿Qué medida debe implementar el psicólogo con la finalidad de hacer conciencia de la
importancia de la fidelidad en una relación amorosa?
142 Estadística Básica
3.9 Una universidad nacional tiene un programa de becas para estudiar educación en el área de matemática. Para este propósito se elige un/a alumno/a del nivel secundario de cada centro educativo del perteneciente al distrito escolar 08-04. El beneficiario debe tener el mayor índice académico en la asignatura de matemática. A continuación, se dan las evaluaciones de los 20 estudiantes de 6to A en dicha materia, del Liceo Mauricio Rubio. Usando la herramienta de Excel complete el cuadro. ¿Cuál estudiante usted elegiría para darle la beca? (Suponga que no se tiene ninguna otra información que la se le suministra en este cuadro evaluativo) no
Nombre
P1
P2
P3
P4
01
Amelia Alcántara
87
86
94
80
02
Analía Jiménez
85
98
100
100
03
Caridad Aracena
79
72
85
78
04
Diana Espinal
99
100
99
99
05
Esmailin Almonte
90
78
85
99
06
José Espinal
89
80
87
90
07
Josefina Caraballo
50
65
60
60
08
Laura Díaz
80
80
82
87
09
Leonido Rodríguez
99
100
90
80
10
Leopoldo Cruz
68
65
64
60
11
Luisa Jaquez
80
100
99
99
12
Marcos Ferreira
80
89
87
95
13
Mercedes Martínez
90
96
95
97
14
Pedro Hernández
99
73
96
81
15
Randy Vegas
85
92
82
86
16
Rudy Morel
71
93
76
77
17
Sabrina García
94
72
78
83
18
Santiago Sánchez
90
74
100
83
19
Solange Cruz
90
93
82
75
20
Sonia Amarante
83
76
99
75
Respuesta
Promedio
Desviación Estándar
CAPÍTULO
6
Concepto, Principios y Cálculo de Probabilidad Competencias Específicas ✓ Razona y argumenta. Reconoce, calcula e interpreta la probabilidad de evento simple o compuesto de tomando en cuenta los tres enfoques.
Fuente Externa
✓ Comunica Explica cómo se obtiene la probabilidad de evento simple o compuesto.
La violencia de género es un mal que afecta mucho a las familias. ✓ Modela y Representa Se hacen esfuerzos extraordinarios para combatirla. Modela situaciones, donde En las estadísticas que lleva la Procuraduría General de la se pueda calcular la República, los días que más matan a las mujeres son los sábados probabilidad de evento y los domingos. Mientras los días que menos ocurren son los simple o compuesto. miércoles y viernes. El 18 por ciento de los asesinatos de mujeres ocurre los sábados, el 21 por ciento los domingos. El lunes, el ✓ Conecta Utiliza conexiones entre martes y el jueves son días que también tienen un alto porcentaje, las probabilidades y las equivalente a un 12, 13 y 14 por ciento de asesinato de mujeres. situaciones de la comunidad educativa. Al 6 de noviembre, 2017, según las estadísticas de la Procuraduría General de la República, han ocurrido 56 asesinatos de mujeres por armas de fuego, 52 por armas blancas y 45 por otro tipo de ✓ Resuelve problemas Resuelve problemas del armas, equivalente 37%, 34% y 29% respectivamente. contexto educativo que ¿Qué posibilidad piensas que tienes de sufrir de violencia impliquen calcular intrafamiliar? ¿Qué probabilidad piensas que una persona tiene probabilidades. de sufrir violencia después de una primera vez? ¿Piensas que hay alguna relación entre la violencia intrafamiliar y la educación de ✓ Utiliza herramientas tecnológicas las personas violentas o las víctimas? Usa Excel (con el En esta unidad, se introduce el concepto, cálculo y aplicaciones complemento MegaStat) y de la probabilidad. Nuestro objetivo es comprender, calcular y otras herramientas aplicar probabilidades de evento simple o compuesto, en un tecnológicas para calcular contexto educativo. probabilidades.
144 Estadística Básica
6.1 Introducción Para Recordar: ✓ Indique cuáles de las siguientes situaciones corresponden a la estadística descriptiva y cuáles a la estadística inferencial: a) Un informe anual para accionistas que detalla los bienes de la corporación. b) Un profesor de historia que anuncia a su grupo el número de estudiantes que obtuvieron la máxima calificación en un examen reciente. c) El uso de los datos de una muestra en una encuesta para estimar la opinión de la población. d) Realizar un estudio de correlación sobre una muestra para determinar si el nivel educativo y el ingreso de la población están relacionados. La estadística descriptiva, simplemente resume y describe los datos recolectados, mientras que la estadística inferencial conocida también como la estadística inductiva va más allá de una descripción de los datos y hace inferencia con respecto al fenómeno o los fenómenos de los que se obtuvieron las muestras. Sin importar en cuenta la profesión que haya elegido, algo sí es seguro: en algún momento se han de tomar decisiones. Con mucha frecuencia esto tendrá que hacerse sin conocer todas las consecuencias de tales decisiones. Por ejemplo, los inversionistas deben decidir sobre la conveniencia de invertir en una acción en particular, con base en sus expectativas sobre rendimientos futuros. Un director debe tomar la decisión respecto a su profesión, sin conocer con exactitud cuáles serán los resultados. En un contexto empresarial, los asesores de inversiones no pueden asegurar cuál de dos acciones tendrá un mayor crecimiento durante el año siguiente, y los ingenieros tratan de reducir la probabilidad de que una máquina se descomponga. Asimismo, los vendedores sienten incertidumbre de la eficacia de una campaña publicitaria o del éxito de un nuevo producto. Las situaciones siguientes ofrecen otros ejemplos de la función de la incertidumbre en nuestras vidas. Ejemplo 6.1 a) En el último juego de la Serie Mundial, el equipo local está abajo por una carrera con las bases llenas y dos jugadores fuera en la parte inferior de la novena entrada. Le toca batear al lanzador, cuyo promedio de bateo es de sólo 0.105; el mánager decide traer un bateador emergente con un promedio de bateo de 0.320 en lugar del lanzador. ¿Para qué le sirvió la probabilidad?
Capítulo 6. Conceptos, Principios y Cálculo de Probabilidad 145
Ejemplo 6.2 b) Usted es gerente de una compañía de póliza de seguros. Arthur quiere comprarle a usted un seguro de vida. Arthur tiene 75 años, ha sufrido tres ataques cardiacos y trabaja como experto en desactivación de bombas en el departamento de policía. ¿Qué usted le responde a Arthur? El negocio de los seguros está muy relacionado con las probabilidades. Tal vez roben su automóvil, tal vez no; tal vez participe en un accidente, tal vez no; tal vez alguien resbale en la escalera de su casa y lo demande, tal vez no. Por supuesto, esperamos que no le suceda nada malo a usted o a su familia, pero el sentido común y el historial estadístico nos dicen que podría ocurrir. Todas estas cosas se asocian con probabilidades. Por ejemplo, si su automóvil es un Toyota Camry, la probabilidad de robo es mucho más alta que si conduce un Dodge Caravan. De hecho, en una estadística reciente que lista los 10 vehículos más robados en Estados Unidos, el Toyota Camry obtuvo el primer lugar. Términos Básicos a) Experimento. Proceso que induce a que ocurra una y sólo una de varias posibles observaciones. Ejemplo: El lanzamiento de una moneda al aire. b) Espacio Muestral. Todos los resultados posibles de un experimento. Ejemplo: E.M . = cara, cruz c) Evento. Es un subconjunto del espacio Muestral. Ejemplo Cara es un evento y cruz es otro evento.
146 Estadística Básica
Ejercicios 6.1 1. Escribe el espacio muestral del experimento: lanzar dos monedas al aire.
2. Escribe el espacio muestral del experimento: lanzar dos dados al aire.
6.2 Concepto básico de probabilidad “En general, la probabilidad es la posibilidad de que algo suceda. Las probabilidades se expresan como fracciones, como decimales o en porciento. Las probabilidades se miden entre 0 y 1”. Ejemplo 6.3 La probabilidad de que al lanzar una moneda al aire el resultado sea sello es: P (s) =
1 = 0.5 = 50% 2
❖ Tres tipos de probabilidad Existen tres maneras básicas de clasificar la probabilidad; éstas representan planteamientos conceptuales bastante diferentes para el estudio de la teoría de probabilidad:
6.3 Enfoque clásico La probabilidad clásica parte del supuesto de que los resultados de un experimento son igualmente posibles. El planteamiento clásico define la probabilidad de que un evento ocurra como:
Probabilidad De Eventos Que Son Igualmente Probables h Donde h es el número de resultados P ( x) = n favorables en los que ocurre el evento y n es el número total de resultados posibles.
Capítulo 6. Conceptos, Principios y Cálculo de Probabilidad 147
Ejercicios 6.2 ✓ Elige la opción correcta 1. Al lanzar un dado al aire un dado no cargado, la probabilidad de que salga el dos es: 2 6 1 b) P ( 2 ) = 6 a) P ( 2 ) =
c) P ( 2 ) = 0.2 d )P ( 2) = 1
2. Una encuesta se realizó a 34 estudiantes de una universidad y arrojó los resultados que se dan. ¿Cuál es la probabilidad de que el estudiante tenga una especialidad en administración? Contabilidad Finanzas Economía Administración Marketing
10 5 3 6 10
a) P ( A) = 17.6%
c) P ( A) = 5.66%
b) P ( A) = 29.4%
d ) P ( A) = 6%
3. Si la probabilidad de que ocurra un suceso es de 0.45. ¿Cuál es la probabilidad de que el suceso no ocurra? a) P ( x ) = 0.45
c) P ( x ) = 0.65
b) P ( x ) = 0.55
d ) P ( x ) = −0.55
4. En un pueblo hay 1,200 habitantes. Si la probabilidad de que un habitante sea una mujer es 1 3 . ¿Cuántas mujeres hay en el pueblo? a)200
c)400
b)300
d )600
148 Estadística Básica
5. Si en una caja hay 2 fichas blancas y 3 fichas negras, la probabilidad de sacar una ficha negra es. 2 3 3 b) P ( N ) = 5 a) P ( N ) =
3 2 1 d )P ( N ) = 2
c) P ( N ) =
Nota: Con los datos dados a continuación responde los ítems del 6 hasta el 8. Se encuestó a una muestra de personas, arrojando los resultados expuestos a continuación Hombres Mujeres Total
Piña 15 20 35
Manzana 13 12 25
Total 28 32 60
6. Si eligen una persona al azar, ¿Cuál es la probabilidad de que la persona elegida sea hombre? a) P ( H ) 0.47 c) P ( H ) 0.58 d ) P ( H ) 0.25 b) P ( H ) 0.53
7. Si eligen una persona al azar, ¿Cuál es la probabilidad de que la persona elegida sea mujer? a ) P ( M ) 0.47 c) P ( M ) 0.33 d ) P ( M ) 0.42 b) P ( M ) 0.53
8. Si eligen una persona al azar, ¿Cuál es la probabilidad de que la persona elegida le guste la tota de piña? a ) P (TP ) 0.25 c) P (TP ) 0.58 b) P (TP ) 0.53 d ) P (TP ) 0.42
9. Una urna contiene 2 bolas azules, 5 negras y 7 rojas. Si se extrae 1 bola, ¿cuál es la probabilidad de que sea azul? a ) P ( A ) 14.29%
b) P ( A ) 50% c ) P ( A ) 35.71% d ) P ( A ) 64.29%
Capítulo 6. Conceptos, Principios y Cálculo de Probabilidad 149 NOTA: Con los datos de la tabla: “relación entre empleo – vivienda de un barrio de Santiago” responde los ítems 3 y 4. Emp. / Viv. Vivienda propia Vivienda alquilada Total Empleo formal 101 485 586 Empleo informal 80 919 999 Total 181 1,404 1,585
10.La probabilidad de que una persona escogida tenga empleo formal es: a ) P ( EF ) 36.97%
b) P ( EF ) 55.80% c ) P ( EF ) 34.54% d ) P ( EF ) 270.47%
11.La probabilidad de que la persona escogida tenga empleo informal es: a ) P ( EI ) 44.20% b) P ( EI ) 55.80% c ) P ( EI ) 65.46% d ) P ( EI ) 63.03% 12.Si en una caja hay 2 fichas blancas y 3 fichas negras. Si se extrae 1 bola, ¿cuál es la probabilidad de que sea negra? a ) P ( N ) = 15%
b) P ( N ) = 1.5% c ) P ( N ) = 60% d ) P ( N ) = 67%
13.Si en una caja hay 2 fichas blancas y 3 fichas negras. Si se extrae 1 bola, ¿cuál es la probabilidad de que sea Roja? a ) P ( R ) = 7%
b) P ( R ) = 0% c ) P ( R ) = 50% d ) P ( R ) = 5%
14.Usted quiere llamar a una amiga por teléfono, pero sólo recuerda los 6 primeros dígitos de su número telefónico y se ha olvidado de los últimos cuatro. ¿Cuál es la probabilidad de que marque al azar el número correcto si hace un sólo intento? 1 10000 10000 b) P ( N .C .) = 1 3 c ) P ( N .C .) = 10000 1 d ) P ( N .C .) = 4 a ) P ( N .C .) =
150 Estadística Básica
Ejemplo 6.4 Doña Ramona juega el número 6 en la Lotería Nacional: a) ¿Cuál es la probabilidad de que Ramona se saque en el primer premio? b) ¿Cuál es la probabilidad de que Ramona se saque? c) ¿Cuál es la probabilidad de que Ramona no se saque? __________________________________________________________________________ __________________________________________________________________________ Este planteamiento de la probabilidad clásica es útil cuando se trata de los juegos de azar, pero no es tan útil cuando nos ocupamos de actividades reales en las que: 1) los resultados posibles no son igualmente probables o 2) los procesos en cuestión no se conocen bien. El planteamiento clásico de probabilidad supone un mundo que no existe. Supone que no existen situaciones que son bastante improbables pero que podemos concebir como reales. Sucesos como que una moneda caiga parada o que el salón de clase se incendie mientras se analiza el concepto de probabilidad (¡Dios nos libre!) son extremadamente improbable, pero no imposibles. Sin embargo, el planteamiento clásico supone que no existen. Las situaciones de la vida real, desordenadas y poco probables como son a menudo, hacen que sea útil definir la probabilidad de otras formas. 6.4 Enfoque De Frecuencia Relativa. Suponga que queremos saber: ¿Cuál es la probabilidad de que yo viva hasta los 85 años?, ¿Cuál es la probabilidad de que caiga un rayo en un determinado lugar? O ¿Qué las águilas ganen el juego del domingo próximo en el valle de la muerte? Rápidamente nos damos cuenta de que no somos capaces de emitir una respuesta por adelantado, sin antes hacer algo de experimentación, sobre cuáles son esas posibilidades. Al planteamiento de recolectar un gran número de información de lo que ha sucedido en el pasado con un evento para estimar lo que podría pasar en el futuro con ese mismo evento se le llama frecuencia relativa de presentación y este define la probabilidad como: La frecuencia relativa observada de un evento durante un gran número de intentos. Ejemplo 6.5 Una compañía de seguros sabe, por la información obtenida de los datos actuales registrados, que, de los hombres de 40 años, 60 de cada 100,000 morirán en un periodo de un año. Utilizando este método, la compañía estima la probabilidad de muerte de ese grupo de edad en particular como: P ( x) =
60 = 0.0006 = 0.06% 100, 000
Una dificultad presente en el planteamiento de frecuencia relativa es que la gente a menudo lo utiliza sin evaluar un número suficiente de resultados.
Capítulo 6. Conceptos, Principios y Cálculo de Probabilidad 151
6.5 Enfoque Subjetivo. Es la posibilidad asignada a un evento particular por un individuo a partir de cualquier información que encuentre disponibles.
Ejemplos 6.6 1. La probabilidad de que usted contraiga matrimonio antes de los 30 años. 2. La probabilidad de que el déficit presupuestario de Estados Unidos se reduzca a la mitad en los siguientes 10 años.
Ejercicios 6.3 En cada uno de los siguientes casos, indique si se utilizó la probabilidad clásica, frecuencia relativa o subjetiva. a) Un jugador de béisbol consigue 30 hits en 100 turnos al bate. La probabilidad de que consiga un hit en su siguiente turno es de 0.3.
b) Para estudiar problemas ambientales se forma un comité de estudiantes con siete miembros. ¿Cuál es la probabilidad de que cualquiera de los siete sea elegido vocero del equipo?
c) Usted compra uno de 5 millones de boletos vendidos por el Lotto Canada. ¿Cuáles son las posibilidades de que gane un millón de dólares?
d) La probabilidad de un terremoto al norte de California en los próximos 10 años es
de 0.80. e) Un agricultor experimentado estima si va a llover o no tomando en cuenta la temperatura del día.
152 Estadística Básica
6.6 Reglas de la probabilidad Temas Preliminares Conjunto este concepto es primitivo, es decir, no se define, aunque se puede tener una idea, cuando hay una reunión de objeto. Los conjuntos se representan con letras mayúsculas y los elementos con letras minúsculas. Ejemplo 6.7
A = 1, 2, 3, 4 Conjunto vacío es el que no tiene elementos se representa .
Con frecuencia es útil saber cómo se pueden relacionar dos conjuntos.
6.7 Unión de conjuntos A y B. Es el conjunto formado por todos los elementos que pertenecen a A ó B. El símbolo de la unión es . A B = x / x A x B Ejemplo 6.8 Sean: A = 1, 2, 3, 4, 5 ; B = 4, 5, 6, 7,8 C = a, b, c, d , e ; encuentre: a) A
B=
b) A
C =
c) A
A=
d )B
C =
Capítulo 6. Conceptos, Principios y Cálculo de Probabilidad 153
Las operaciones con conjuntos se pueden representar gráficamente por medio del Diagrama de Venn. A
A
B
B
6.8 Intersección de conjuntos A y B. Es el conjunto compuesto por los elementos comunes de A y B. Ejemplo 6.9 Sean: A = 1, 2, 3, 4, 5 ; B = 4, 5, 6, 7,8 C = a, b, c, d , e ; encuentre: a) A
B=
b) A
C =
c) A
A=
d )B
C =
La intersección se puede representar gráficamente por el diagrama de Venn de la siguiente manera:
154 Estadística Básica
Unión de eventos. Al menos uno de los posibles eventos ocurre. Una unión se representa mediante “A o B” ó “A o B o C”, dependiendo del número de eventos.
Intersección de eventos. Dos o más eventos ocurren al mismo tiempo. Tal intersección se representa mediante “A y B” o “A y B y C”, dependiendo del número de eventos involucrados.
Observa las siguientes situaciones: a) Ser hombre y ser madre a la vez.
b) Ser recién nacido y ser padre a la vez.
c) ¿Qué observa en estos eventos? __________________________________________________________________________ __________________________________________________________________________
6.9 Eventos Mutuamente Excluyentes. Dos eventos son mutuamente excluyentes si no pueden ocurrir al mismo tiempo. Otra manera de definirlo es que los eventos son mutuamente excluyentes si la ocurrencia de uno imposibilita la ocurrencia del otro. Regla de la adición para eventos mutuamente excluyentes P ( AoB ) = P ( A ) + P ( B )
Capítulo 6. Conceptos, Principios y Cálculo de Probabilidad 155
Ejercicios 6.4 Resuelve los siguientes problemas 1) ¿Cuál es la probabilidad de que al extraer una carta al azar de un juego de barajas esta sea un as o un rey?
2) ¿Cuál es la probabilidad de que al lanzar un dado el resultado sea 1 o un número par?
3) Suponga que va a elegir de manera aleatoria un individuo entre una población de 130 personas. En esa población hay 40 niños menores de 12 años, 60 adolescentes y 30 adultos. ¿Cuál es la probabilidad de que el individuo elegido sea un adolescente o un adulto?
Observa la siguiente situación: a) Sacar un seis o un blanco al extraer una ficha de un juego de dominó. ¿Este evento puede suceder? _____ ¿Puede suceder al mismo tiempo? _____
6.10 Eventos No Mutuamente Excluyentes. Dos eventos son no mutuamente excluyentes si pueden ocurrir al mismo tiempo, es decir, que la ocurrencia de uno no imposibilita la ocurrencia del otro. Regla De La Adición Para Eventos No Mutuamente Excluyentes P ( AoB ) = P ( A) + P ( B ) − P ( AyB )
156 Estadística Básica
Ejercicios 6.5 Resuelve los siguientes problemas: 1) ¿Cuál es la probabilidad de extraer un as o una espada de un juego de barajas?
2) ¿Cuál es la probabilidad de que al extraer una ficha de un juego dominó esta sea un 6 ó un blanco?
3) La compañía Herr –Mcfee, que produce barras para combustible nuclear, debe hacer pasar rayos x e inspeccionar cada barra antes de embarcarla. Karen Wood, una inspectora, ha observado que por cada 1000 barras que inspecciona, 10 tienen fallas internas, ocho tienen fallas de recubrimiento y cinco tienen ambas fallas. En su informe trimestral, Karen debe incluir la probabilidad de fallas en las barras para combustible. ¿Cuál es esta probabilidad?
6.11 Eventos independientes. Los eventos son independientes cuando la ocurrencia de uno no afecta la probabilidad del otro.
Ejemplo 6.10 o Se lanza una moneda dos veces. El hecho de que en el primer lanzamiento salga cara no tiene efecto alguno en la probabilidad para el segundo lanzamiento.
Capítulo 6. Conceptos, Principios y Cálculo de Probabilidad 157
Regla De La Multiplicación Para Eventos Independientes:
P ( AyB ) = P ( A ) P ( B ) Ejemplo 6.11 Resuelve los siguientes problemas: Una caja contiene 15 canicas. 5 canicas son negras, 8 azules y 2 blancas. Se extraen dos bolas con reemplazamiento. Determine la probabilidad de que: a) La 1ra sea blanca y la 2da azul.
b) La 1ra sea azul y la 2da sea negra.
c) La 1ra sea negra y la 2da no.
d) La primera blanca y la otra no.
Ejemplo 6.12 a) ¿Cuál es la probabilidad de obtener cruz, cara y cruz en ese orden, en tres lanzamientos consecutivos de una moneda no alterada?
158 Estadística Básica
6.12 Probabilidad Condicionada. Observa estas situaciones: 1) ¿Cuál es la probabilidad de que un estudiante que no haya estudiado (¡ese sin vergüenza!) trate de adivinar la pregunta de opción múltiple que tiene 4 opciones? 2) Para inciso 1) imagine que él sabe que la opción c) no puede ser la correcta, ¿Cuál es la probabilidad de que el elija la respuesta correcta? Definición. Un evento A está condicionado por otro B, cuando el hecho de haber ocurrido el evento B influye en la probabilidad de que ocurra A. El símbolo se lee: “La probabilidad de A dado que B ya ocurrió” Ejemplos 6.13 a) Una funda contiene 10 canicas: 7 azules y 3 verdes. Se sacan dos canicas sucesivamente al azar. ¿Cuál es la probabilidad de que la segunda canica sea verde si la primera ha sido azul? Ejercicio NOTA: Con los datos de la tabla: “relación entre empleo – vivienda de un barrio de Santiago” responde los ítems 1 hasta el 4. Emp. / Viv. Vivienda propia Vivienda alquilada Total Empleo formal Empleo informal Total
101 80 181
485 919 1,404
586 999 1,585
1. ¿Cuál es la probabilidad de que una persona escogida tenga vivienda propia dado que tiene empleo formal?
2. ¿Cuál es la probabilidad de que la persona escogida tenga vivienda alquilada dado que tiene empleo informal?
3. ¿Cuál es la probabilidad de que la persona escogida tenga vivienda alquilada dado que tiene empleo formal?
4. ¿Cuál es la probabilidad de que una persona escogida tenga vivienda propia dado que tiene empleo informal?
Capítulo 6. Conceptos, Principios y Cálculo de Probabilidad 159
6.13 Eventos Dependientes. Dos eventos son dependientes cuando la ocurrencia de uno afecta la posibilidad del otro. Ejemplo 6.14 o Cuando se extrae una bola de una funda sin reemplazo. ❖ Regla De La Multiplicación De Eventos Dependientes: P ( AyB ) = P ( A ) P ( B A ) Ejemplos 6.15 Resuelve los siguientes problemas 1) Una caja contiene 15 canicas. 5 canicas son negras, 8 azules y 2 blancas. Se extraen dos bolas sin reemplazamiento. Determine la probabilidad de que: a) La 1ra sea blanca y la 2da azul.
b) La 1ra sea azul y la 2da sea negra.
c) La 1ra sea negra y la 2da no.
d) La primera blanca y la otra no.
e) Ambas sean negras.
2) Si un huracán se forma en la parte oriental del Golfo de México, hay 76% de posibilidades de que éste golpee la costa occidental de Florida. A partir de los datos recabados en anteriores 50 años pasados, se ha determinado que la probabilidad de que se forme un huracán en la parte oriental del golfo en cualquier año dado es de 0.85. a) ¿Cuál es la probabilidad de que un huracán se forme en la parte oriental del Golfo de México y llegue a la costa occidental de Florida este año?
160 Estadística Básica
6.14 Ejemplos complementarios de probabilidades Resuelve los siguientes problemas: 1. A partir de la siguiente tabla de contingencia: B 10 A A' Total
20
a) ¿Cuál es la probabilidad del evento A ?
b) ¿Cuál es la probabilidad del evento A ' ?
c) ¿Cuál es la probabilidad del evento B ?
d) ¿Cuál es la probabilidad del evento B ' ?
e) ¿Cuál es la probabilidad del evento A y B ' ?
f) ¿Cuál es la probabilidad del evento A ' y B ' ?
g) ¿Cuál es la probabilidad del evento A y B ?
h) ¿Cuál es la probabilidad del evento A ó B ' ?
B'
20 40
Total
Capítulo 6. Conceptos, Principios y Cálculo de Probabilidad 161
2. Una muestra de 500 personas fue seleccionada en una gran área metropolitana para estudiar el comportamiento del consumidor. Entre las preguntas estaban: ¿Disfruta comprando ropa? De 240 hombres, 136 contestaron que sí. De 260 mujeres 224 contestaron que sí. a) Realice una tabla de contingencia o un diagrama de Venn para evaluar las probabilidades.
b) ¿Cuál es la probabilidad de que un encuestado elegido al azar disfrute comprando ropa?
c) ¿Cuál es la probabilidad de que un encuestado elegido al azar sea mujer y disfrute comprando ropa?
d) ¿Cuál es la probabilidad de que un encuestado elegido al azar sea mujer o disfrute comprando ropa?
e) ¿Cuál es la probabilidad de que un encuestado elegido al azar sea mujer u hombre?
162 Estadística Básica
3. En Estados Unidos una encuesta sobre vivienda estudió cómo llegan al trabajo los propietarios de casa. Suponga que la encuesta consistió en una muestra de 1,000 propietarios de casa y 1,000 inquilinos. Maneja al trabajo Si No Total
Propietario 824 176 1000
Inquilino 681 319 1000
Total 1505 495 2000
a) Si una persona responde que maneja hacia su trabajo, ¿cuál es la probabilidad de que él o ella sea propietario de su casa?
b) Si una persona responde que maneja hacia su trabajo, ¿cuál es la probabilidad de que él o ella sea inquilino?
c) Si quien responde es un propietario, ¿cuál es la probabilidad de que él o ella maneja hacia el trabajo?
d) Si quien responde es un inquilino, ¿cuál es la probabilidad de que él o ella maneja hacia el trabajo?
e) Si una persona responde que no maneja hacia su trabajo, ¿cuál es la probabilidad de que él o ella sea propietario de su casa?
Concepto, Principios y Cálculo de Probabilidad 163
UNIVERSIDAD AUTÓNOMA DE SANTO DOMINGO Facultad de Ciencias Económicas y Sociales Escuela de Estadística Práctica #6 PROBABILIDAD Profesor: Leonido Rosario, MA
Participante Matrícula Fecha Sección Concepto de probabilidad 6.1 Escribe el valor de verdad de las siguientes proposiciones: a) Probabilidad clásica es aquella que se obtiene al dividir el número de elementos favorables entre el número de resultados posibles. ________ b) Si A = 1, 2,3, 4,5 yB = 3, 4, 6, 7 , entonces, A B = 1, 2, 3, 4, 5, 6, 7 _______ c) Al lanzar un dado al aire la probabilidad de que salga un número natural entre el 1 y el 6 es 1. _______ d) El evento anterior es un ejemplo de probabilidad segura._______ e) Si en dos eventos A y B, la A B = , los eventos son no mutuamente excluyentes.________
6.2 Una encuesta se realizó a 34 estudiantes de una universidad y mostró que estos tenían las siguientes especialidades: Contabilidad Finanzas Economía Administración Marketing
10 5 3 6 10
Suponga que elige a un estudiante y observa su especialidad. a) ¿Cuál es la probabilidad de que el estudiante tenga una especialidad en administración?
b) ¿Cuál es la probabilidad de que el estudiante tenga una especialidad en Marketing?
c) ¿Cuál es la probabilidad de que el estudiante tenga una especialidad en Finanzas?
Concepto, Principios y Cálculo de Probabilidad 164
6.3 Si 300 de los 1000 trabajadores de una empresa son hombres, ¿cuál es la probabilidad de que un trabajador sea mujer?
6.4 Hay 15 vehículos de motor en una agencia numerado del 1 al 15. Se saca uno al azar. ¿Cuál es la probabilidad de que: a) El número sea 9? b) El número sea par?
Introducción a las Reglas de probabilidades. 6.5 Dada una baraja de 52 cartas, el conjunto A consta de los 13 corazones y el conjunto B son las 4 ases. Identifique cuáles cartas están incluidas en ( A B ) y ( A B ) a) ( A B ) ;
_________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ b) ( A B ) ;
_________________________________________________________________________ _________________________________________________________________________ _________________________________________________________________________ 6.6 ¿Cuáles de los siguientes ejemplos representan eventos mutuamente excluyentes? a) Obtener un 4 y un 7 al extraer una sola carta de una baraja ordinaria._______________________________________________________ b) Obtener un 3 y un 4 al lanzar una vez dos dados cargados._______________________________________________________
no
c) Ser hombre y estar embarazado._____________________________________ d) Obtener un 1 y un número par al lanzar un par dados.__________________________________________________________ e) Casarse y seguir soltero._____________________________________________
de
siendo
Concepto, Principios y Cálculo de Probabilidad 165
Regla especial de la adición P ( A o B ) = P ( A) + P ( B ) 6.7 En el 2002 McDonald’s tenía 31,108 restaurantes en todo el mundo. De éstos, 17,864 eran operados por franquicias, 9,000 por la empresa y 4244 por afiliados. ¿Cuál es la probabilidad de que un restaurante McDonald’s seleccionado al azar sea operado por una franquicia o un afiliado?
6.8 Los eventos A y B son mutuamente excluyentes. Suponga que P(A) = 0.30 y P (B) = 0.20. a) ¿Cuál es la probabilidad de que ocurran ya sea A o B?
6.9 Los eventos x y y son mutuamente excluyentes. Suponga que P(x) = 0.05 y P (y) = 0.02. a) ¿Cuál es la probabilidad de que x o y ocurran?
Regla general de la adición P ( A o B ) = P ( A) + P ( B ) − P ( A y B ) 6.10 De un juego de barajas, se saca una carta al azar. Determine la probabilidad de que al extraer la carta esta sea un corazón o un as.
6.11 Las probabilidades de los eventos A y B son 0.20 y 0.30, respectivamente. La probabilidad de que A y B ocurran es de 0.15. ¿Cuál es la probabilidad de que A o B ocurran?
6.12 Un estudiante toma dos cursos, historia y matemáticas. La probabilidad de que pase el curso de historia es de 0.60 y la de que apruebe el de matemáticas es de 0.70. La probabilidad de pasar ambos es de 0.50. ¿Cuál es la probabilidad de pasar por lo menos uno?
Concepto, Principios y Cálculo de Probabilidad 166
Regla especial de la multiplicación P ( A y B ) = P ( A) P ( B ) 6.13 Durante los últimos 4 campeonatos de fútbol norteamericano, el lanzamiento de la moneda cayó cara todas las veces. Su entrenador le dice que pedir sello esta vez aumentará la probabilidad de que usted gane el lanzamiento. ¿Está en lo cierto o está equivocado? Explique su respuesta.
6.14 Determina la probabilidad de extraer de manera aleatoria a 3 estudiantes de historia en tres extracciones de una población de 15 alumnos de música, 24 de historia y 46 de psicología. El muestreo es de una persona a la vez, con reemplazo. Re sp.P ( h, h, h ) = 0.0225 = 2.25%
6.15 De acuerdo con Bausch & Lomb Corporation, la mitad de quienes necesitan corregir su visión son pacientes que requieren lentes binoculares. a. Para un grupo seleccionado al azar de tres personas que requieren corrección de la visión, 1) ¿Cuál es la probabilidad de que las tres requieran bifocales? 2) ¿Cuál es la probabilidad de que ninguna de las tres requiera bifocales?
b. Si las personas se hubieran seleccionado de una organización formada por retirados mayores de 65 años, ¿cree que las probabilidades conjuntas calculadas en el inciso (a) todavía serían correctas? De no ser así, ¿por qué no? 1) P ( b, b, b ) = 0.125 = 12.5% Re sp.a. 2) P b,b,b = 0.125 = 12.5% b.Personal
(
)
6.16 Hasta el 30 de abril de la temporada de trámite de impuestos de 1999, 13.7% de todas las devoluciones personales de impuestos fueron preparadas por H & R Block. a. Si se seleccionan dos personas al azar de quienes tramitan devolución de impuestos durante este periodo, ¿Cuál es la probabilidad de que las devoluciones de las dos fueron preparadas por H & R Block?
b. En el inciso (a), ¿Cuál es la probabilidad de que ninguna devolución fuera preparada por H & R Block?
c. En el inciso (a), ¿Cuál es la probabilidad de que exactamente una de las dos devoluciones fuera preparada por H & R Block? a) P ( prep, prep ) = 0.0188 = 1.88% Re sp. b) P prep, prep = 0.7448 = 74.48% c) P ( una − de − las − dos ) = 0.2365 = 23.65%
(
)
Concepto, Principios y Cálculo de Probabilidad 167
Probabilidad condicionada P ( A B ) = P ( AyB )
P( B)
6.17 La tienda de departamentos Friendly ha sido objeto de muchos robos durante el último mes; pero, debido al aumento en las medidas de seguridad, se ha detenido a 250 ladrones. Se registró el sexo de cada ladrón; también se anotó si se trataba de un primer delito o era reincidente. Los datos se resumen en la siguiente tabla. Sexo Hombre Mujer Total
Suponga que se elige al azar un ladrón detenido, calcule: a) La probabilidad de que el ladrón sea hombre.
b) La probabilidad de que un hombre cometa el primer delito.
1er delito 60 44 104
Reincidente 70 76 146
Total 130 120 250
a ) P ( h ) = 0.520 = 52% b) P ( o h ) = 0.4615 = 46.15% R e sp. c) P ( m r ) = 0.5205 = 52.05% d ) P ( m o ) = 0.4231 = 42.31% e) P ( h r ) = 0.280 = 28%
c) La probabilidad de que una mujer sea reincidente.
d) La probabilidad de que sea mujer, dado que es el primer delito.
e) La probabilidad de que sea hombre y reincidente.
Regla general de la multiplicación
(
)
P ( AyB ) = P ( A ) P B A
6.18 Determina la probabilidad de extraer de manera aleatoria a 3 estudiantes de historia en tres extracciones de una población de 15 alumnos de música, 24 de historia y 46 de psicología. El muestreo es de una persona a la vez, sin reemplazo. Re sp.a) P ( h, h, h ) = 0.0205 = 2.05%
6.19 Suponga que P ( A) = 0.40
y P ( B A ) = 0.30
y ¿Cuál es la probabilidad conjunta de A y B?
Concepto, Principios y Cálculo de Probabilidad 168
6.20 Una urna contiene 5 bolas blancas, 3 azules y 4 negras. Se extraen 2 bolas al azar sin remplazamiento. Determina la probabilidad de que: a. Ambas sean negras. a ) P ( n, n ) = 0.0909 = 9.09% Re sp. b) P ( b, a ) = 0.1136 = 11.36% b. La 1ra sea blanca y la 2da azul. c) P ( a, a ) = 0.5455 = 54.55%
c. Ninguna sea azul.
6.21 El gerente regional del sureste de General Express, un servicio privado de mensajería, está preocupado por la probabilidad de una huelga por parte de algunos empleados. Sabe que la probabilidad de una huelga de pilotos es 0.75 y la probabilidad de una huelga de choferes es 0.65. Más aún, sabe que, si los choferes hacen una huelga, existe una posibilidad de 90% de que los pilotos apoyen la huelga. a) ¿Cuál es la probabilidad de que ambos se vayan a huelga?
b) Si los pilotos hacen huelga, ¿Cuál es la probabilidad de que los choferes apoyen la huelga? a ) P ( B y A ) = 0.585 Re sp. b) P ( B A ) = 0.78
Concepto, Principios y Cálculo de Probabilidad 169
6.22 A partir de la siguiente tabla de contingencia:
A A'
B
B'
10 25
30 35
Total a) ¿Cuál es la probabilidad del evento A ?
b) ¿Cuál es la probabilidad del evento A ' ?
c) ¿Cuál es la probabilidad del evento B ?
d) ¿Cuál es la probabilidad del evento B ' ?
e) ¿Cuál es la probabilidad del evento A y B ' ?
f) ¿Cuál es la probabilidad del evento A ' y B ' ?
g) ¿Cuál es la probabilidad del evento A y B ?
h) ¿Cuál es la probabilidad del evento A ó B ' ?
Total
Concepto, Principios y Cálculo de Probabilidad 170
6.23 ¿Es más probable que los blancos presenten demandas por prejuicios? Una encuesta que realizó Barry Goldman encontró que de 56 trabajadores despedidos, 29 presentaron demandas por prejuicios. De 407 trabajadores negros despedidos, 126 demandaron por prejuicios. Elabore una tabla de contingencia para evaluar las probabilidades. a) ¿Cuál es la probabilidad de que él/ella presente una demanda por prejuicios?
b) ¿Cuál es la probabilidad de que él/ella sea negro y no demande por prejuicios?
c) ¿Cuál es la probabilidad de que él/ella sea negro o demande por prejuicios?
Concepto, Principios y Cálculo de Probabilidad 171
Bibliografía consultada Anderson, D. R. (2008). Estadística para administración y economía. México: CENGAGE. Barrientos, M. G. (2012). Elementos de estadística descriptivas. San José, Costa Rica: EUNED. Juste, R. P. (2009). Estadística aplicada a la educación. Madrid: PEARSON. Levin, R. I. (2010). Estadística para administración y economía. México: PEARSON. Lind, D. A. (2012). Estadística aplicada a los negocios y la economía. México: McGrawHill. Mendenhall, W. (2010). Introducción a la probabilidad y estadística. México: CENGAGE Learning. Newbold, P. (2008). Estadística para administración y economía. Madrid: Pearson. Pagano, R. R. (2004). Estadística para la ciencias del comportamiento. México: THOMSON. Pérez, H. E. (2008). Estadística para las ciencias sociales, del comportamiento y de la salud. México: CENGAGE Learnig. Triola, M. F. (2009). Estadística. México: PEARSON. Webster, A. L. (2000). Estadística aplicada a los negocios y la economía. México: McGrawHill.
View more...
Comments