Estadística Aplicada A La Investigación Científica Con SPSS - Guillermo Pasto

November 19, 2023 | Author: Anonymous | Category: N/A
Share Embed Donate


Short Description

Download Estadística Aplicada A La Investigación Científica Con SPSS - Guillermo Pasto...

Description

Estadística aplicada a la investigación científica con SPSS

www.full-ebook.com

www.full-ebook.com

www.full-ebook.com

Dr. Lolo José Caballero Cifuentes Dr. Pedro Ramón Cajavilca Mg. Jady Luz Vargas Tumaya Dr. Guillermo Pastor Morales Romero Dr. Richard Santiago Quivio Cuno Dra. Sandra Yaquelin Gutiérrez Guadalupe MANUAL DE ESTADÍSTICA APLICADA A LA INVESTIGACIÓN CIENTÍFICA CON SPSS Editado por: Guillermo Pastor Morales Romero Calle 48 Mz. K 1 Lt 29 Conj. Hab. Mariscal Caceres San Juan de Lurigancho Lima Autores Dr. Lolo José Caballero Cifuentes Dr. Pedro Ramón Cajavilca Mg. Jady Luz Vargas Tumaya Dr. Guillermo Pastor Morales Romero Dr. Richard Santiago Quivio Cuno Dra. Sandra Yaquelin Gutiérrez Guadalupe Corrección de Estilo Dr. Pedro Ramón Cajavilca Diagramación Ernesto Hernández Lama Primera edición, agosto 2016 1,000 ejemplares Hecho el Depósito Legal en la Biblioteca Nacional del Perú N° 2016-09848 ISBN: 978-612-00-2372-3 Impreso en los talleres gráficos de IMAN Soluciones Gráficas EIRL Coop. Umamarca Mz. T Lt 13, San Juan de Miraflores Lima - Perú Agosto, 2016

www.full-ebook.com

Contenido Agradecimientos Introducción Capítulo I Capítulo II Capítulo III Capítulo IV Capítulo V ANÁLISIS DESCRIPTIVO DE DATOS SESIÓN 01 Presentación de datos 11 SESIÓN 02 Medidas de tendencia central 30 SESIÓN 03 Medidas de dispersión 43 SESIÓN 04 Medidas Auxiliares de Posición 50 SESIÓN 05 Medidas de distribución 56 SESIÓN 06 Regresión y correlación 74 SESIÓN 07 Técnicas de muestreo 86 VALIDEZ Y CONFIABILIDAD SESIÓN 08 Validez del instrumento 105 SESIÓN 09 Coeficiente Alfa de Cronbach 110 SESIÓN 10 Modelo Kuder Richardson 116 SESIÓN 11 Técnica de Dos Mitades 119 SESIÓN 12 Técnica de versiones Equivalentes o Paralelos 123 SESIÓN 13 Técnica estadística Test Retest 125 Ejercicios propuestos 135 PRUEBAS PARAMÉTRICAS SESIÓN 14 Pruebas paramétricas T- Pearson 140 SESIÓN 15 Prueba T- Studentpara Muestras Independientes 146 SESIÓN 16 Prueba Z Distribución Normal 155 PRUEBAS NO PARAMÉTRICAS SESIÓN 17 Estadístico Chi Cuadrado 165 SESIÓN 18 Prueba speraman 177 SESIÓN 19 Prueba Binomial 180 SESIÓN 20 Prueba kolmogorov Smirnov 188 SESIÓN 21 Prueba de Shapiro Wilk 190 SESIÓN 22 Prueba de Mann Whitney 194 SESIÓN 23 Prueba de Wilcoxon 196 SESIÓN 24 Prueba de Kruskal Wallis 198

www.full-ebook.com

SESIÓN 25 Prueba de Friedman 200 APLICACIÓN PRÁCTICA EN TESIS Aplicación en Tesis 1 205 Aplicación en Tesis 2 216 Aplicación en Tesis 3 228 Referencias bibliográficas 239 AGRADECIMIENTOS Expresamos sinceros agradecimientos a nuestros familiares por su apoyo y motivación

www.full-ebook.com

Introducción El presente Manual titulado: “ESTADÍSTICA APLICADA A LA CIENTIFÍCA CON SPSS” expone de manera sencilla los conceptos INVESTIGACIÓN teóricos, técnicas, problemas, métodos, objetivos, análisis estadístico, sacar conclusiones y tomar de decisiones para la investigación científica con una gran variedad de ejercicios, desde los más sencillos a los más extensos. Este manual tiene un doble propósito: por una parte, enseñar la estadística matemáticamente es decir, utilizando diversas fórmulas y por otra, enseñar paso a paso la estadística con el manejo del software estadístico SPSS de última versión. Los destinatarios del manual son, en general, los estudiantes de pre grado, post grado que deseen realizar análisis de datos utilizando el programa estadístico SPSS. La estructura del manual está compuesta por capítulos en forma didáctica, sencilla y práctica. Capítulo I titulado: “ANÁLISIS DESCRIPTIVO DE DATOS”, se refiere a la presentación descriptivo de los datos, el Capítulo II titulado: “VALIDEZ Y CONFIABILIDAD“, se refiere a los conceptos, técnicas y métodos de la estadística, que se consideran básicos e indispensables para ver si los instrumentos de investigación son válidos y confiables. El capítulo III titulado: “PRUEBAS PARAMÉTRICAS”, expone de manera sencilla los pasos para contrastar hipótesis con el software SPSS para los valores que tengan distribución normal de datos. El capítulo IV titulado: “PRUEBAS NO PARAMÉTRICAS”, expone de manera sencilla los pasos para contrastar hipótesis con el software SPSS para los valores que no tengan distribución normal de datos, que se consideran básicos e indispensables para la elaboración de la tesis de investigación. Finalmente el capítulo V titulado: “APLICACIÓN PRÁCTICA EN TESIS”, expone en forma didáctica el tratamiento estadístico para tesis desarrolladas con técnicas más importantes en una investigación científica. Los autores

www.full-ebook.com

Capítulo I

www.full-ebook.com

ANÁLISIS DESCRIPTIVO DE DATOS Sesión Nº 01 PRESENTACIÓN DE DATOS I. CONCEPTOS ESTADÍSTICOS FUNDAMENTALES 1.1 INTRODUCCIÓN Para llegar a comprender que es la estadística, debemos definir previamente que se entiende en la actualidad por ciencia estadística. En un diccionario encontramos la siguiente definición. Estudio de los datos cuantitativos de la población, de los recursos naturales e industriales, del tráfico o de cualquier otra manifestación de las sociedades humanas. Bien, ésta es que algunos autores llaman “concepción profana” de la estadística o, dicho de otro modo, lo que considera la mayoría de las personas que no se han especializado en esta ciencia. En realidad, debemos reconocer que operaciones tales como la recopilación de grandes masas de datos, su presentación en forma de cuadros, tablas, gráficos, el cálculo de promedios, porcentajes, variaciones, etc. Forman parte de nuestra ciencia, y de hecho constituyen la denominada “estadística descriptiva”. Pero todo aquello no queda ahí, sino que hay en realidad otras cuestiones generales más complejas de mayor alcance y profundidad. (García, 2013: 8) En este manual adoptaremos las siguientes conceptualizaciones • Es la ciencia que estudia cuantitativamente los fenómenos aleatorios. • Es la herramienta fundamental que permite llevar a cabo el proceso relacionado con la investigación científica. • Es una ciencia aplicada, que nos proporciona un conjunto de métodos para recopilar, organizar, resumir, interpretar datos para tomar fenómenos de estudio. presentar, analizar, hacer predicciones e decisiones sobre determinados hechos o 1.2 IMPORTANCIA DE LA ESTADÍSTICA

www.full-ebook.com

La estadística es importante para conocer el comportamiento de ciertos eventos, por lo que ha adquirido un papel clave en la investigación. Se usa como un valioso auxiliar y en los diferentes campos del conocimiento y en las variadas ciencias. Es un lenguaje que permite comunicar información basada en datos cuantitativos. Es tan importante que casi no existe actividad humana en que no esté involucrada la Estadística. Las decisiones más importantes de nuestra vida se toman con base en la aplicación de la Estadística. Ejemplo: La estadística es de gran importancia en la investigación científica debido a que: • Permite una descripción más exacta. • Nos obliga a ser claros y exactos en nuestros procedimientos y en nuestro pensar. • Permite resumir los resultados de manera significativa y cómoda. • Nos permite deducir conclusiones generales. La evolución de la estadística ha llegado al punto en que su proyección se percibe en casi todas las áreas de trabajo. También abarca la recolección, presentación y caracterización de información para ayudar tanto en el análisis e interpretación de datos como en el proceso de la toma de decisiones. La estadística es parte esencial de la forma profesional, es hasta cierto punto una parte necesaria para toda profesión. 1.3 ROL DE LA ESTADÍSTICA EN LA INVESTIGACIÓN CIENTÍFICA El rol de la estadística en la investigación es el de proveer herramientas útiles para el diseño de experimento, estudios observacionales y relevamientos muestrales. Por ejemplo la estadística aporta al investigador, en su fase de formulación del problema, la definición y clasificación de los tipos de variables aleatorias que conforman la problematización de la investigación. Una variable aleatoria es aquella en la que sus valores numéricos surgen de un proceso de azar o cuando no se puede determinar su valor o no se puede predecir exactamente con anticipación. Un ejemplo de variable aleatoria es el siguiente: a un investigador de mercados le interesa conocer las preferencias de los jóvenes de quince a veinte años, de ambos sexos, respecto a los programas de televisión. Al investigador no le interesa el nombre de los jóvenes, si estudia o no, sino que solamente le concierne una variable: la preferencia respecto a los programas de televisión. El análisis estadístico de la información se realiza sobre los atributos

www.full-ebook.com

de las personas, objetos o entidades. Es necesario, en un problema de investigación, conocer qué tipo de valores tiene las variables en un estudio, porque de esto depende la técnica estadística que se aplique al analizar la información. La estadística cumple básicamente dos funciones, brindar la información necesaria para la toma de decisiones y la solución de problemas. 1.4 RESEÑA HISTÓRICA • Etapa Inicial (antigüedad hasta siglo XVII) Desde los comienzos de la civilización han existido formas sencillas de estadística, pues ya se utilizaban representaciones gráficas y otros símbolos en pieles, rocas, palos de madera y paredes de cuevas para contar el número de personas, animales o cosas. Como por ejemplo hacia el año 3000 a.C, los babilonios usaban pequeñas tablillas de arcilla para recopilar datos sobre la producción agrícola y sobre los géneros vendidos o cambiados mediante trueque. Mucho antes de construir las pirámides, los egipcios analizaban los datos de la población y la renta del país. • Etapa de Sistematización (aparición de escuelas) Existió una etapa de sistematización donde destacan tres escuelas: la escuela alemana que crea la primera cátedra estadística y la asocia con la administración; por otro lado la escuela inglesa que utiliza la estadística para el estudio de fenómenos sociales y la política, denominada aritmética de estado, por último la escuela francesa que introduce la teoría de la probabilidad como fundamento matemático de la estadística. • Etapa Actual (a partir del siglo XIX hasta nuestros días) En el siglo XIX, con la generalización del método científico para estudiar todos los fenómenos de las ciencias naturales y sociales, los investigadores aceptaron la necesidad de reducir la información a valores numéricos para evitar la ambigüedad de las descripciones verbales. En la actualidad, la estadística se ha convertido en un método efectivo para describir con exactitud los valores de datos económicos, políticos, sociales, psicológicos, biológicos o físicos, y sirve como herramienta para relacionar y analizar dichos datos, aplicándose en todas las ramas del saber humano. 1.5 PARTES DE LA ESTADÍSTICA Estadística Descriptiva

www.full-ebook.com

Se encarga de la recolección, Clasificación, organización, presentación, descripción de una población sin sacar conclusiones de tipo general. Estadística Inferencial Su propósito es inferir conclusiones y/o predicciones respecto de una población en estudio. Aplica las Probabilidades. • Población Es el conjunto de personas u objetos susceptibles de ser estudiadas. Ejemplo: Una I.E. donde se puede estudiar las tallas de los estudiantes, nivel de desnutrición, la procedencia de sus padres. En una ferretería un stock de focos, etc. A un elemento de la población se le llama Unidad Estadística. Ejemplo: Un alumno, un padre, un foco. • Muestra Es un subconjunto de la población. Es una parte proporcional y representativa de una población que se desea estudiar. Ejemplo: Un grupo seleccionado de estudiantes de una I. E. • Dato Es el resultado de la observación, entrevista o recolección en general. Ejemplo: Cuando observamos el color de cabello, cuando medimos tu talla. • Parámetro Un parámetro es un número que resume la gran cantidad de datos que pueden derivarse del estudio de una variable estadística. • Frecuencia Número de veces que se repite un valor. • Carácter Estadístico Es una propiedad que permite clasificar a los individuos de una población. Pueden ser cualitativas o cuantitativas. • Variable Es la característica de la muestra o población que se está observando. • Variable Estadística Es el conjunto de valores que toma un carácter estadístico. Si las características permanecen inalterables se llaman constantes. Un ejemplo de constante: códigos de teléfonos de Lima.

www.full-ebook.com

1.6 TIPOS DE VARIABLES • Según su Naturaleza Cualitativa . Es una cualidad o atributo. No se puede medir. Ejemplos: color de ojos, curso preferido, nacionalidad, signo zodiacal, hobby, etc. Variable Cualitativa Nominal Una variable cualitativa nominal presenta modalidades no numéricas que no admiten un criterio de orden. Por ejemplo: El estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado y viudo. Variable Cualitativa Ordinal o Variable Cuasicuantitativa Una variable cualitativa ordinal presenta modalidades no numéricas, en las que existe un orden. Por ejemplo: La nota en un examen: suspenso, aprobado, notable, sobresaliente. Puesto conseguido en una prueba deportiva: 1º, 2º, 3º, Medallas de una prueba deportiva: oro, plata, bronce. Cuantitativa. Es aquella que podemos expresar numéricamente. Dan lugares a variables estadísticas. Se dividen en: Variable Discreta. Es aquella que se puede contar, se representa por un número entero. Ejemplo: Número de vecinos, número de CD vendidos, número de hijos, etc. Variable Continua . Es aquella que se puede medir, puede tomar los infinitos valores de un intervalo. Ejemplos: Tallas y pesos de alumnos, temperatura, etc. • Según su Función Variable independiente: Es aquella característica o propiedad que supone es la causa del fenómeno estudiado. En investigación experimental se llama así, a la variable que el investigador manipula. Variable dependiente: Hayman (1974: 69) la define como propiedad o característica que se trata de cambiar mediante la manipulación de la variable independiente. La variable dependiente es el factor que es observado y medido para determinar el efecto de la variable independiente. Ejemplo: En sociología, medir el efecto de la educación en ingreso promedio familiar, la variable dependiente es el nivel de ingreso en soles, y la variable independiente es el nivel de educación de las personas que componen la casa (es decir, grados académicos). 1.7 PRESENTACIÓN DE DATOS

www.full-ebook.com

• Variable Cualitativa a) Problema: ¿Cuál es el estado civil de los estudiantes de Postgrado UNE? b) Instrumento: encuesta Ejemplo: Marque usted con un aspa el cuadro correspondiente a su estado civil. Soltero Viudo Casado Divorciado c) Clasificar los datos de la encuesta d) Ordenar los datos e) Analizar los datos f) Tabular g) Graficar h) Interpretar Población Muestra N= 1500 estudiante n=100 s EPG UNE Cuadro Nº 001 “ESTADO CIVIL DE ESTUDIANTES DE POSGRADO DE LA UNE 2016” Estado civil Conteo fi hi hi% Soltero |||| |||| |||| |||| |||| |||| |||| |||| |||| ||||75 0.75 75|||| |||| |||| |||| |||| Casado |||| |||| |||| 15 0.15 15 Divorciado |||| 5 0.05 5 Viudo |||| 5 0.05 5 Total 100 100 1 100 Nota de pie : La Molina 2016 Fuente: Proviene de encuesta Elaborado: LCC Interpretación: H1 (%) El 75% de estudiantes de la Escuela de Postgrado de la

www.full-ebook.com

UNE tienen como estado civil soltero Ejercicios propuestos 1. La empresa "Tintayas S.A", dedicada a la fabricación de tintes para el pelo, realiza una encuesta sobre el color de tinte usado por un grupo de clientes, los colores favoritos son: caoba, castaño, negro, pelirrojo, negro, castaño, rubio, rubio, castaño, castaño, rubio, castaño, negro, caoba, pelirrojo, caoba, negro, pelirrojo, caoba, caoba Se pide: • construir una tabla de frecuencias • interpretar los datos 2. Complete el siguiente cuadro: Varones Mayores de 70 Años Cuadro N° 002 Indicador: Contraindicación para hacer actividad física Opción Cantidad ( fi) hi Hi(%) Si 3 No 29 Totales 32 • Tipos de Gráficos Estadísticos GRÁFICO DE BARRAS GRÁFICO Nº 001 “ESTADO CIVIL ESTUDIANTES DE POSTGRADO DE LA UNE 2016” 80 70 60 50 SOLTERO 40 CASADO30 DIVORCIADO 20 VIUDO 10

0

www.full-ebook.com

www.full-ebook.com

SOLTERO CASADO DIVORCIADO VIUDO ESTADO CIVIL Leyenda: S

C

D

V

www.full-ebook.com

Fuente: PROVIENE DEL CUADRO Nº 001 Elaborado: LJCC INTERPRETACIÓN: 75 estudiantes de postgrado de la UNE tienen como estado civil soltero. GRÁFICO DE SECTOR CIRCULAR GRÁFICO Nº 002 “ESTADO CIVIL DE ESTUDIANTES DE POSTGRADO DE LA UNE 2016”

5% 5% 15%

SOLTERO CASADO

75% DIVORCIADO VIUDO

www.full-ebook.com

Leyenda: S

C

V

D Fuente: Proviene del Cuadro Nº 001 Elaborado: LJCC GRÁFICO LINEAL CUADRO Nº 003 “ESTADO CIVIL DE ESTUDIANTES DE POSTGRADO DE LA UNE 2016” 80 70 60 50 40fi 30 20 10 0 SOLTERO CASADO DIVORCIADO VIUDO Leyenda :

www.full-ebook.com

Fuente : Proviene del Cuadro Nº 001 Elaborado: LJCC • Variable Cuantitativa Continua Problema: Se ha tallado una muestra de 10 estudiantes de la Institución Educativa Emblemática Ricardo Bentin Sánchez en el distrito del Rímac- Lima, el 01 de setiembre de 2014 y se obtiene los siguientes resultados en cm. Nº 1 2 3 4 5 6 7 8 9 10 Estudiantes Estatura 114 147 120 135 140 150 160 170 153 150

(cm.)

Se pide: a) Construir una tabla de distribución de frecuencias b) Interpretar los resultados f1, F2, h3 (%),H3( %) c) Construir el histograma y polígono de frecuencias A. Tabla de Distribución de Frecuencias 1. RANGO (R) R= Valor Máximo- Valor Mínimo R= 170-114 R= 56 2. NÚMERO DE INTERVALOS (K) K= 1+3,32*logn K=1+3,32*log10 K=1+3,32*1 K=4,32 K=4 3. AMPLITUD ( I) I =R =56 =14 K 4 4. ERROR ( e) e=K*I-R e=4*14-56 e=0 CUADRO Nº 002 “ESTATURA DE ESTUDIANTES DE LA I.E. RICARDO BENTIN SANCHEZ” Ii X’i CONTEO fi hi Hi (%) Fi Hi (%) 114-128 121 II 2 0.2 20 2 20 128-142 135 II 2 0.2 20 4 40

www.full-ebook.com

142-156 149 IIII 4 0.4 40 8 80 156-170 163 II 2 0.2 20 10 100 [ [ 10 10 1 100 Nota al pie : Distrito del Rímac 2014 Fuente: Encuesta local institucional Elaborado: LJCC B. Gráfico del histograma y polígono de frecuencias TABLA Nº 003 “ESTATURA DE ESTUDIANTES DE LA I.E. RICARDO BENTIN SANCHEZ” k I X'i fI 0 100-114 107 0 1 114-128 121 2 2 128-142 135 2 3 142-156 149 4 4 156-170 163 2 5 [170-184[ 177 0 Crear el gráfico con el software Excel Gráfico N° 001 Estatura de Estudiantes de I.E.E "R. Bentin" 4,54 4 3,5 3 2,5 2 2 2

2 H 1,5 P 1 0,50 0 0 [100-114] [114-128] [128-142] [142-156] [156-170] [170-184[ ESTATURAS Fuente: proviene de la Tabla Nº 003 Elaborado: LJCC INTERPRETACIÓN:

www.full-ebook.com

f1: 2 Estudiantes de la Institución Educativa Ricardo Bentin tienen como estatura promedio de 121 cm. H3 (%): El 80% de estudiantes de la Institución Educativa Ricardo Bentin tienen como estatura mayor e igual a 114 cm. y menor a 156 cm. • Variable Cuantitativa Discreta Problema: Se desea conocer el número de hijos por familia en el distrito de Jesús María año 2014. Para tal efecto se tomó una muestra de 20 familias. 5 2 2 3 8 1 2 3 4 4 4 3 3 3 4 2 2 10 3 2 Se pide: a) Construir una tabla de distribución de frecuencias b) Interpretar los resultados f2, h3 (%) c) Construir el histograma y polígono de frecuencias con el software Excel (tarea) • Tabla de Distribución de Frecuencias 1. Rango (R) R= Valor Máximo- Valor Mínimo+1 R= 10-1+1 R= 10 2. Número de Intervalos (K) K= 1+3,32*logn K=1+3,32*log20 K=1+3,32*1,3010 K=1+4,3 K=5 3. Amplitud ( I) I =R =10 = 2 K 5 4. Error ( e) e=K*I-R e=5*2-10 e=0 CUADRO Nº 003 “Número de hijos por familia en el distrito de Jesús María año 2014” Ii X’i fi hi hi(%) Fi Hi (%) 1 - 2 1,5 7 0.35 35 7 35 3 - 4 3,5 10 0,50 50 17 85 5 - 6 5,5 1 0.05 5 18 90

www.full-ebook.com

7 - 8 7,5 1 0.05 5 19 95 9 - 10 9,5 1 0.05 5 20 100 [ ] 20 1 100 Nota de pie : Distrito de Jesús María 2014 Fuente: Encuesta local institucional Elaborado: LJCC Interpretación f2: 10 familias del distrito de Jesús María tienen un promedio de 3,5 el número de hijos. h3 (%): El5%de familias del distrito de Jesús María tienen entre número de hijos entre 5 y 6 EJERCICIOS PROPUESTOS 1. Se aplicó una encuesta a 27 trabajadores de la Universidad Jaime Bausate y Meza y se les preguntó su edad, los datos obtenidos fueron: 30 26 29 27 31 22 29 17 21 36 41 30 21 36 26 18 31 23 27 29 19 17 23 29 30 24 29 Se pide: a) Construir una tabla de distribución de frecuencias adecuada. b) Interpretar: f2 , h1 (%) , F4 , H3(%) 2. Los pesos de los 65 empleados de la empresa SAC vienen dados por la siguiente tabla. peso [50-60> [60-70> [70- 80> [80-90> [90-100> [100-110> [110-120> fi 8 10 16 14 10 5 2 Se pide: a) Construir una tabla de distribución de frecuencias adecuada. b) Interpretar: f3 , h1(%) , F5 , H5(%) 3. En la maternidad “Santa Rosa de Lima” el personal de atención se distribuye de la siguiente manera: Enfermeras 15

www.full-ebook.com

Obstetras 22 Médicos 10 Técnicos 30 Elaborar la tabla de frecuencias para la variable Especialidad: Especialidad fi hi hi(%) Total Las enfermeras representan el __________% del personal, mientras que las obstetrices representan el __________% Es cierto que: a) Las enfermeras y las obstetrices, juntas, constituyen más del 50% del personal del área de salud en este establecimiento. b) El personal técnico es el más numeroso de esta maternidad c) Los médicos representan el 10% del personal 4. En la maternidad “Santa Rosa de Lima” se registran los pesos de 25 bebés (en Kg): 2.8 3.3 2.5 3.7 3.5 3 2.6 3.3 2.1 2.1 2.9 3.5 3.1 3.5 3.5 2.5 3.4 2.6 2.5 3.8 2.9 2.8 3.1 3.1 3.7 Elaborar la tabla de frecuencias para la variable Peso: Peso fi Fi hi hi(%) Hi(%) 2.1 2.5 2.6 2.8 2.9 3.0 3.1 3.3 3.4 3.5

www.full-ebook.com

3.7 3.8 Total a. Hay ----- recién nacidos con peso 3,4 Kg. b. Son ----- los bebés que tuvieron menos de 3,0 Kg. c. El ------% de los recién nacidos tuvieron 3,5 Kg. d. La cantidad de bebés que tuvieron 3,0 Kg ó más pero menor o igual que 3,5 Kg son ------------ y representan el --------% de la muestra. e. Los bebés que tuvieron más de 3,5 Kg representan el ------% f. Los bebés con 3,3 Kg o 3,7 Kg representan el ---------% de la muestra. 5. A un grupo de personas se les ha tomado el número de pulsaciones por minuto (ritmo cardíaco) y se han obtenido los siguientes resultados: 87 69 72 68 85 82 73 73 61 80 63 70 51 79 65 76 64 82 67 71 75 74 71 86 80 90 88 89 70 76 76 77 Elaborar la tabla de frecuencias para datos agrupados según la regla de Sturgess. Datos necesarios: Número de datos (N) = Valor máximo = Valor mínimo = Rango o amplitud = Para determinar el número de intervalos (k) se utiliza la regla de Sturgess: K = 1 + 3,32 log (N) K = 1 + 3, 32 log ( ) = (Se redondea según las reglas generales de redondeo). Para establecer el ancho del intervalo se utiliza: Ancho = Rango / K (Se redondea al entero inmediato superior). Luego, se construyen los intervalos correspondientes:

www.full-ebook.com

Ritmo X’ f F h h (%) H (%) i i i i i i cardíaco

[ [ [ [ [ [ [ [ [ [ Total 6. En el Centro Comercial Moll Aventura Plaza del Callao se consultó la edad a todas las personas que entraban entre las 6:00 p.m. y 11:00 p.m. Los resultados obtenidos fueron los siguientes: 15 73 1 65 16 3 42 36 42 3 61 19 36 47 30 45 29 73 69 34 23 22 21 33 27 55 58 17 4 17 48 25 36 11 4 54 70 51 3 34 26 10 Se pide: • Construir la tabla de frecuencias • Responder a las siguientes preguntas a) Del total de personas encuestadas, ¿cuántas personas tienen entre 25 y 49 años? b) Del total de personas encuestadas, ¿cuántas personas tienen 61 o menos años? c) Interprete: h3 (%), f2 y H3(%) 7. Supóngase que se selecciona aleatoriamente 20000 estudiantes de la Universidad Cesar Vallejo, en la provincia de Lima, el 07 de enero del 2012 y se investiga su especialidad obteniéndose los siguientes resultados. Cuadro Nº 01 ESPECIALIDAD NUMERO DE ESTUDIANTES Enfermería 2000 Medicina 1000 Administración 5000

www.full-ebook.com

Ingeniería de sistemas 2000 Derecho 10000 TOTAL 20000 • Trace una gráfica de sectores circulares para mostrar la distribución de frecuencia relativa (porcentual) y otros gráficos (Barras, Lineal y Columnas) 8. Se ha tallado una muestra de 50 alumnos de la Universidad Enrique Guzmán y Valle”del distrito de Lurigancho del 7 de enero del 2014 y se ha obtenido los siguientes resultados, en centímetros. 140 140 140 145 145 150 150 150 150 150 151 154 154 155 155 155 155 155 155 158 158 160 160 160 160 160 160 160 160 162 162 165 165 165 165 165 165 165 166 166 169 170 170 170 170 175 175 180 180 180 Se pide: a) Completar los datos del Cuadro Nº 02 (Tabla de Distribución de Frecuencias) Cuadro N° 02 “Distribución de talla de una muestra de 50 alumnos de la Universidad Enrique Guzmán y Valle” del distrito de Lurigancho. (Centímetros) i′ %) %) ( ( 1 142 3 0.06 6 3 0.06 6 2 139 − 145)7 10 0.20 3145 − 151) 154 0.18 18 19 38 4 160 12 24 0.62 62 5157 − 163) 0.18 18 40 0.80 6163 − 172 5 45 90 7169 − 175) 178 5 0.10 10 50 1.00 100 175 − 181)= 50 = 1 = ∑ ∑ℎNota de pie: Los Olivos, 7 de enero del 2012

Fuente: Encuesta Local.

www.full-ebook.com

Elaborado: Lolo Caballero b) Complete la Interpretación de los resultados: : Significa que, 7 alumnos tienen talla igual o mayor a ….. cm y menor de 151 cm. : Significa que, 19 alumnos tienen talla igual o mayor a 139 cm y menor de 157 cm : Significa que, 14% de los……………………………………………………….. ℎ (%): Significa que, 62% de los alumnos tienen talla igual o mayor a 139 cm y menor (%) de 163 cm.

www.full-ebook.com

Sesión Nº 02 MEDIDAS DE TENDENCIA CENTRAL O DE POSICIÓN Es un valor que está en el centro o punto medio de un conjunto de datos. Tiene como objetivo resumir los datos en un valor típico o representativo del conjunto de valores • Aplicadas a una muestra se les denomina estimadores o estadígrafos. • Aplicadas a poblaciones se les denomina parámetros o valores estadísticos de la población. Los principales métodos utilizados para ubicar el punto central son la media, la mediana y la moda. A. PARA DATOS SIN AGRUPADOS • La Media • La Mediana • La Moda

• La Media ( x ) Es la medida de tendencia central más utilizada, también se le conoce con el nombre de Promedio. Para calcular la media aritmética, se suman todos los datos de la muestra y el resultado se divide entre el total de datos.

n∑ Xi X = i = 1 n Ejemplo: 1, 2, 2, 8, 1, 4 x = 1+2 +2+8+1+4=18= 36 6 • La Mediana (Me) Es el valor medio de un arreglo ordenado de datos numérico, si no hay empates,

www.full-ebook.com

la primera mitad de las observaciones será menor que la mediana y la segunda mitad será mayor. Si un valor extremo se presenta en una secuencia de datos, es mejor utilizar la mediana. La mediana es el valor tal que el 50% de los datos son menores y el otro 50% son mayores Ejemplo: 1, 2, 2, 8, 1, 4 • Ordenamos en forma ascendente 1,1, 2, 2, 4, 8 • Por ser par tomamos los dos valores centrales y lo dividimos entredos 2+2= 22 Nota: Si es impar el valor central será la mediana. • La Moda (MO) Es el valor que aparece con mayor frecuencia en un conjunto de datos. Puede darse lo siguiente: • Distribución bimodal cuando los datos adquiridos en una columna encontremos dos modas, es decir, dos datos que tengan la misma frecuencia absoluta máxima. • Una distribución trimodal de los datos es en la que encontramos tres modas. Si todas las variables tienen la misma frecuencia diremos que no hay moda. Ejemplos: 1) 1, 2, 2, 8, 1,4 • Ordenamos en forma ascendente 1, 1, 2, 2, 4, 8 • Las frecuencias 1 y 2 tienen la misma frecuencia MO = [1, 2] es bimodal. 2) 2, 6, 5, 3, 3, 1, 3, • Ordenamos en forma ascendente 1, 2, 3, 3, 3, 5, 6 • La frecuencia que más veces se repite es 3 MO = [3] es unimodal APLICACIÓN CON SPSS PARA DATOS SIN AGRUPAR De los siguientes valores: 1, 2, 2, 8, 1, 4 Se pide en SPSS Calcular: la Media, la Moda, la Mediana, el valor máximo y mínimo. Paso 1: ingrese en vista de datos lo siguiente:

www.full-ebook.com

Paso 2: clic en Analizar/ Estadísticos Descriptivos/ Frecuencias

www.full-ebook.com

Paso 3: aparecerá la siguiente ventana: seleccione la variable

www.full-ebook.com

Paso 4: Clic en el botón de comando Estadísticos/ active las casillas deseadas

Paso 5: Clic en Continuar Paso 6: Finalmente Aceptar mostrándose el siguiente resultado: Estadísticos Muestra Válidos 6 N Perdidos 0 Media 3.00 Mediana 2.00 Moda 1(a) Mínimo 1 Máximo 8 Existen varias modas. Se mostrará el menor de los valores.

www.full-ebook.com

B. PARA DATOS AGRUPADOS La Media La Mediana La Moda • La Media Donde: fifrecuencia absoluta simple

x'í Marca de clase n

∑fi * x 'í x = i =1

n Ejemplo: Hallar la Media de datos agrupados del siguiente cuadro. Intervalo 2 a 4 4 a 6 6 a 8 8 a 10 Intervalo Marca de clase (x’i) fi fi * x’i 2 a 4 3 10 30 4 a 6 5 20 100 6 a 8 7 10 70 8 a 10 9 10 90 TOTAL 50 295 n

∑fi *x'i x = i=1

n x295 =5,8=50 • La Mediana (Me)

www.full-ebook.com

n2 −T  Me = li + fn *i   Donde: Me = Mediana li = Límite inferior del intervalo de la clase mediana n = Tamaño de la muestra T = Suma de todas las frecuencias absolutas simples anteriores a la clase mediana Fn = Frecuencia absoluta simple de la clase medina I = Amplitud n/2 = Clase Mediana Ejemplo: Hallar la Mediana de datos agrupados del siguiente cuadro. Intervalo 2 a 4 4 a 6 6 a 8 8 a 10

Intervalo Marca de clase ( x'í ) fi 2 a 4 3 10 4 a 6 5 20 Clase 6 a 8 7 10 Median a 8 a 10 9 10 50/2=2 TOTAL 50 n2 −T  Me = li + fn *i   Me = 4+25−10*220  Me =5,5 • La Moda (Mo) Mo = li + d1 *id1+d  Mo = moda li = límite inferior del intervalo de la clase modal

www.full-ebook.com

n = Tamaño de la muestra d1 = diferencia que existe entre la frecuencia de clase modal y la frecuencia anterior (tomados en valor absoluto) d2 = diferencia que existe entre la frecuencia de clase modal y la frecuencia posterior (tomados en valor absoluto) i = amplitud Mayor frecuencia 20 clase modal Ejemplo: Hallar La Moda de datos agrupados del siguiente cuadro. Intervalo 2 a 4 4 a 6 6 a 8 8 a 10

Intervalo Marca de clase ( x'í ) fi 2 a 4 3 10 4 a 6 5 20 6 a 8 7 10 8 a 10 9 10 TOTAL 50 d1= 20−10 =10 d2= 20−10 =10 Mo = li + d1 *id1+ d  Mo = 4+ 10 *210 +10

Mo = 5 Clase Modal Mayor Frecuencia 20 Ejercicios de Aplicación Dada la siguiente tabla expresada en pesos de 100 estudiantes de la Institución Educativa “Almirante Grau” del nivel secundaría distrito del Callao Lima año 2014

www.full-ebook.com

Intervalos (pesos) fi [60, 63) 5 [63, 66) 18 [66, 69) 42 [69, 72) 27 [72, 75) 8 100 Se pide: • Construir la tabla de distribución de frecuencias. • Hallar la media, la moda y la mediana e interpretar f2 y H3(%) APLICACIÓN CON SPSS PARA DATOS AGRUPADOS Ejemplo: Dado los datos en la siguiente tabla: Intervalo Frecuencia Marca de clase 2 a 4 10 3 4 a 6 20 5 6 a 8 10 7 8 a 10 10 9 Se pide en SPSS Calcular: la Media, Máximo Valor y Mínimo Valor Paso 1 En la ventana de Vista de Variables digite:

Paso 2 En SPSS en Vista de Datos digite:

Paso 3 Ponderar las Frecuencias (Datos / Ponderar Casos)

www.full-ebook.com

Paso 4 Analizar / Estadísticos Descriptivos/ Descriptivos /Seleccione la Marca de Clase

Paso 5 Clic en opciones / aparecerá la siguiente ventana de dialogo / seleccione el cálculo de las medidas deseadas/ Continuar/aceptar.

www.full-ebook.com

Paso 6 El resultado se muestra a continuación:

EJERCICIO DE APLICACIÓN

www.full-ebook.com

1. En un estudio de síntomas de fatiga entre hombres con lesiones cerebrales (LC), realizado por el Dr Gary Walker, se registraron las calificaciones de depresión de Zung para un grupo de individuos: con lesión cerebral y síntomas de fatiga LCCF, con lesión cerebral y sin síntomas de fatiga (LCSF), e individuos normales (CONTROL), de la misma edad que los pacientes, que sirvieron como individuos de “CONTROL”. Los resultados se muestran en la siguiente tabla: Tabla Nº 01 Nro Calificación de Zung Condición Sexo 1 46 LCCF M 2 61 LCCF M 3 51 LCCF F 4 36 LCCF M 5 51 LCCF F 6 45 LCCF M 7 54 LCCF F 8 51 LCCF M 9 69 LCCF M 10 54 LCCF F 11 51 LCCF M 12 38 LCCF F 13 64 LCCF M 14 39 LCSF M 15 44 LCSF M 16 58 LCSF F 17 29 LCSF F 18 40 LCSF F 19 48 LCSF M 20 65 LCSF F 21 41 LCSF F 22 46 LCSF M 23 36 CONTROL F 24 34 CONTROL M 25 41 CONTROL F 26 29 CONTROL F 27 31 CONTROL M 28 26 CONTROL F

www.full-ebook.com

29 33 CONTROL M A partir de esta información generé un archivo de datos en SPSS, estableciendo las siguientes características de las variables, tal como se detalla en la tabla 02. Nombre Tipo Nro Numérico Califica Numérico Condición Numérico Tabla Nº 02 Ancho Dec Etiqueta 8 0 Nro de orden 8 0 Calificación de Zung 8 0 Condición del paciente Sexo Numérico 8 0 Valores 1: Lesión cerebral con fatiga 2: Lesión cerebral sin fatiga 3: Grupo control 1: Masculino 2: Femenino Los datos que deben ser ingresados a dicho archivo se muestran, ya adaptados a formato SPSS, en la tabla 3. Tabla Nº 3 Nro Calificación de Zung Condición Sexo 1 46 1 1 2 61 1 1 3 51 1 2 4 36 1 1 5 51 1 2 6 45 1 1 7 54 1 2 8 51 1 1 9 69 1 1 10 54 1 2 11 51 1 1 12 38 1 2

www.full-ebook.com

13 64 1 1 14 39 2 1 15 44 2 1 16 58 2 2 17 29 2 2 18 40 2 2 19 48 2 1 20 65 2 2 21 41 2 2 22 46 2 1 23 36 3 2 24 34 3 1 25 41 3 2 26 29 3 2 27 31 3 1 28 26 3 2 29 33 3 1 A continuación se pide hallar: • Las medidas de tendencia central: Media, Moda, Mediana. Graficar e interpretar de la variable Calificación de Zung.•

www.full-ebook.com

Sesión Nº 03 MEDIDAS DE DISPERSIÓN INTRODUCCIÓN Llamadas medidas de variabilidad son los valores numéricos que indican o describen la forma en que las observaciones están dispersas o diseminadas, con respecto al valor central. Son importantes debido a que dos muestras de observaciones con en el mismo valor central pueden tener una variabilidad muy distinta. Las medidas dispersión tienen como objetivo analizar el grado de separación de los valores de una serie estadística con respecto a las medidas de tendencia central consideradas. Varianza Desviación Típica o Estándar Principales medidas deRangodispersión Coeficiente de Variación 1. Varianza (s2) Es una medida de dispersión que cuantifica la variabilidad de los datos con respecto a la media aritmética. Se le puede definir como un promedio de las distancias elevadas al cuadrado, entre cada variable y la media. Lo que hace la varianza es establecer la variabilidad de la variable aleatoria. Varianza Muestral Es cuando se calcula la varianza de una comunidad, grupo o población en base a una muestra. La Covarianza Es la medida de dispersión conjunta de un par de variables. A. Para Datos Sin Agrupados Para la población Para la muestra 2

=

www.full-ebook.com

∑ ( x i

www.full-ebook.com

− u ) 2 ∑(x −x)2 i s2= n−1σ N

Ejemplo 1 Hallar la varianza de las series numéricas siguientes: 12, 6, 7, 3, 15, 10, 18, 5 Paso 1 Hallar la media. x = 12+ 6+ 7 + 3+15+10 +18+ 5 = 76 = 9.58 8 ∑x − x2σ2 = nPaso 2 Hallar la varianza s 2 2 2 2 2 2 2 2 p =12 +6 +7 +3 +15 +10 +18 +5 2 −9.52 = 23,75 8 B. Para Datos Agrupados

k (x' − x )2 i 2

= ∑fi S i=1

n − 1 Ejemplo 1 Hallar la varianza de los intervalos de la tabla.

Intervalos X’i fi fi*x’i (x'i-x )2 fi*(x'i-x )2 2 - 4 3 1 3 4 4 4 - 6 5 2 10 0 0 6 - 8 7 1 7 4 4 4 20 8 Paso 1 Hallar la media para datos agrupados x20 = 5=4 Paso 2 Cálculo de la varianza s2 =8 = 2,673

www.full-ebook.com

2. Desviación Estándar o Típica(S) Esta medida nos permite determinar el promedio aritmético de fluctuación de los datos respecto a su punto central o media. La desviación estándar nos da como resultado un valor numérico que representa el promedio de diferencia que hay entre los datos y la media. Para calcular la desviación estándar basta con hallar la raíz cuadrada de la varianza, por lo tanto su ecuación sería:

www.full-ebook.com

2s = s 3. Coeficiente de Variación (CV)

s *100 x Es una medida relativa de variabilidad de los datos entre la media y la desviación estándar de una población o muestra. Se expresa como porcentaje y se distingue por permitir comparar la variabilidad de dos o más conjuntos de datos expresados en unidades diferentes. Existe una clasificación de dispersión de un conjunto de datos, según el porcentaje de coeficiente de variación: Distribución homogénea CV < 10% 10% 0 CC.=0 CC 0) la distribución es Leptocúrtica (k< 0) la distribución es Platicúrtica Nota: Cuando la distribución de los datos cuenta con un coeficiente de asimetría (As = ±0.5) y un coeficiente de Curtosis de (k = ±0.5), se le denomina Curva Normal. Este criterio es de suma importancia ya que para la mayoría de los procedimientos de la estadística de inferencia se requiere que los datos se distribuyan normalmente. MÉTODOS PARA CALCULAR LA CURTOSIS (α) a. Medida de Fisher Para datos sin agrupar

Para datos agrupados en tablas de frecuencias

www.full-ebook.com

Para datos agrupados en intervalos

Donde:

= cada uno de los valores n = número de datos;

= media aritmética;

www.full-ebook.com

= Cuádruplo de la desviación estándar poblacional f = frecuencia absoluta; xm = marca de clase Observación Si a < 3 la distribución es Platicútica Si a = 3 la distribución es normal o Mesocúrtica Si a > 3 la distribución es Leptocúrtica b. Medida basada en Cuartiles y Percentiles (k)

Observación Si

< 0,263 la distribución es Platicúrtica Si

= 0,263 la distribución es normal o Mesocúrtica Si

> 0,263 la distribución es Leptocúrtica Esta medida no es muy utilizada. EJEMPLOS DE APLICACIÓN 1. Dada la siguiente tabla X X2 X3 X4 X5 X6 X7 X8 6 9 9 12 12 12 15 17 Determinar el tipo de curtosis

www.full-ebook.com

mediante la medida de Fisher y la medida basada en cuartiles y percentiles Solución a) Calculando la media aritmética se obtiene X ∑Xi= 6+9+9+12+12+12+15+17= 92=11,5= n 8 8 b) Calculando la desviación estándar poblacional se obtiene:

(6−11,5)2 +(9−11,5)2 +(9−11,5)2 +(12−11,5)2 +(12−11,5)2 +(12−11,5)2 +(12−11,5)2 +(15−11,5)2 + (17−11,5)2

σ=8

c) Calculando la Medida de Fisher se obtiene: Datos 6 9 9 12 12 12 15 17 Total

-915,0625 39,0625 39,0625 0,0625 0,0625 0,0625 150,0625 915,0625 2058,5

www.full-ebook.com

d) Para calcular los cuartiles y percentiles se ordena los datos de menor a mayor 6 9 9 12 12 12 15 17 Xi X2 X3 X4 X5 X6 X7 X8 e) Calculando el cuartil uno se obtiene:

f) Calculando el cuartil tres se obtiene:

g) Calculando el percentil 90 se tiene:

www.full-ebook.com

h) Calculando el percentil 10 se tiene:

i) Calculando el coeficiente percentil de curtosis se obtiene:

j) Interpretación. Comoα= 2,23 y

la distribución es Platicúrtica

www.full-ebook.com

2. Se ha tallado una muestra de 50 alumnos de la Universidad de Educación la Cantuta del distrito de Chosica del 7 de setiembre del 2014 y se ha obtenido los siguientes resultados, en centímetros. 155 165 150 170 154 166 154 166 150 170 155 165 170 155 160 170 150 169 160 180 165 165 150 155 150 162 160 151 140 140 165 165 155 175 145 158 160 160 180 160 155 165 175 145 160 180 140 158 162 160 a) Construir una tabla de distribución de frecuencias. b) Interprete Ud., los siguientes resultados: , , , y c) Construir el histograma y el polígono de frecuencias ℎ (%) (%) d) Hallar la media, mediana y la moda e intérprete Ud. dicho resultado. e) Hallar la varianza, la desviación estándar y el coeficiente de variación. f) Calcular la simetría e interprete usted dicho resultado. g) Calcular la curtosis e interprete usted dicho resultado Datos ordenados 140 140 140 145 145 150 150 150 150 150 151 154 154 155 155 155 155 155 155 158 158 160 160 160 160 160 160 160 160 162 162 165 165 165 165 165 165 165 166 166 169 170 170 170 170 175 175 180 180 180 • Cálculo del Rango: cm ! = 180 − 140 = 40 • Cálculo del número de clase # = $ + &. &( ∗ *+,( -) . = 1 + 3.32 ∗ log( 50) = 7 • Cálculo de la amplitud: = ! 3 4 = 407 = 5 • Cálculo del error (e) 6 = 3 ∗ − ! 7 = 7 ∗ 6 − 40 = ( Entonces: 89:; + 1 = 180 + 1 = $ a) Distribución de frecuencias.

www.full-ebook.com

Cuadro N° 01 Distribución de talla de una muestra de 50 alumnos de la Universidad de Educación la Cantuta Del distrito de Chosica (centímetros) i? % % 1 142 3 0.06 6 3 0.06 6 2139 − 145) 148 7 0.14 14 10 0.20 20 3145 − 151) 154 9 0.18 18 19 0.38 38 4151 − 157) 160 12 0.24 24 31 0.62 62 5157 − 163) 166 9 0.18 18 40 0.80 80 6163 − 169) 172 5 0.10 10 45 0.90 90 7169 − 175) 178 5 0.10 10 50 1.00 100 175 − 181)= 50 = 1 Los Olivos, 7 de Setiembre del 2014= ∑ ∑ℎ Fuente: Encuesta Local Elaborado: LCC b) Interpretación de los resultados. : Significa que, 7 alumnos tienen talla igual o mayor a 145 cm y menor de 151 cm. : Significa que, 19 alumnos tienen talla igual o mayor a 139 cm y menor de 157 cm : Significa que, 14% de los alumnos tienen talla igual o mayor a 145 cm y menor de 151 cm : Significa que, 62% de los alumnos tienen talla igual o mayor a 139 cm y menor de 163 cm c) Histograma y polígono de frecuencia. GRÁFICO N° 01 Histograma y polígono de frecuencia de talla de una muestra de 50 alumnos de la Universidad Cesar Vallejo del distrito de Los Olivos (Centímetros)

www.full-ebook.com

Los Olivos, 7 de Setiembre del 2014 Fuente: Proviene de Cuadro N° 01 Elaborado: RSQC d) Hallar la media, mediana y moda. i ? 8? (8? − 8̅) ∙(8? − 8̅) 8 1 139 @ 145 142 3 426 332.70998.09 2 145 151 148 7 1036 149.82 1048.72 3 151 157 154 9 1386 38.94 350.44 4 157 163 160 12 1920 0.06 0.69 5 163 169 166 9 1494 33.18 298.60 6 169 175 172 5 860 138.30 691.49 7 175 181 178 5 890 315.42 1577.09 ∑8? = 8012 ∑ ∙ 8? 8̅ = 4965.12 Cálculo de la media: Para datos agrupados D = ∑ ?

GHIcm EF =JH = 160.24

www.full-ebook.com

Interpretación: La talla promedio de los 50 alumnos es 160.24 cm Cálculo de la mediana: Para datos agrupados K6 = L + M- (N − OP ∗K6 N = 50 2N = 25 JT IU = 157 + 3 = 160 cm QR = 157 + SI V∗ 6

Interpretación: 50% de los alumnos tienen talla menor o igual a 160 cm y 50 % de los alumnos tienen talla mayor a 160 cm Cálculo de la moda: Para datos agrupados. Y $

KW = L + XY$ + Y(Z ∗ 3 Q[ = 157 + X3 + 3Z ∗ 6 = 157 + 3 = 160 \] Interpretación : La talla de los alumnos se concentra en 160 cm. e) Cálculo de la varianza, desviación estándar y coeficiente de variación. Cálculo de la varianza: Para datos agrupados. ^ ? ( ( = ∑ ( − D) - − $ _ = 4965.12= 101.33 \] 49 Cálculo de la desviación estándar: ^ = `^( = 10.07 cm _ = √101.33 Cálculo del coeficiente de variación: bc = ^ D∗ ($dd) ef = 10.07FFFFFFFFF∗(100) = 6.28% 160.24 f) Cálculo de la Asimetría. 6) gh = &(D− K ^ ij = 3(160.24 − 160)= 0.07

www.full-ebook.com

10.07 Interpretación: ; La asimetría es positiva ij > 0 g) Cálculo de la curtosis. # = l& − l$ ((m>d − m$d) ln = L + o-n pN − Or ∗qn JH(I)N TIH = 152.67 sI = 151 + MU P ∗ 6 JH( )N T I = 167.32 s = 163 + MU P ∗ 6 mn = L + o-n $dd− Or ∗tn Interpretación: : El 25% de los alumnos tienen talla menor o igual a 152.67 cm. y el 75% tienen sI talla mayor de 152.67 : El 75% de los alumnos tienen talla menor o igual a 167.32 cm. y el 25% de los s alumnos tienen talla mayor de 167.32 cm uIH = 145 + o50(10) 100− 3r ∗ 6 = $p5. v$7 uUH = 169 + o50(90) 100− 40r ∗ 6 = $vw5 Interpretación: : El 10% de los alumnos tienen talla menor o igual a 146.71 cm. y el 90% tienen uIH talla mayor que 146.71 : El 90% de los alumnos tienen talla menor o igual a 175 cm. y el 10% tienen talla uUH mayor de 175 cm. Hallando la curtosis: # = l& − l$ ((m>d− m$d) Ixy.T IJ.xy= 0.259

. = (IyJT Ix.yI) Interpretación: , La curva es platicúrtica. . < 0.263 CALCULO CON SPSS PARA DATOS SIN AGRUPAR Ejemplo 01: Hallar la asimetría y curtosis de los datos:

www.full-ebook.com

X 6 9 9 12 12 12 15 17 1. Ingrese al SPSS 2. En vista de diseño ingrese la variable x tal como visualiza en el cuadro.

3. En vista de datos digite los siguiente:

www.full-ebook.com

www.full-ebook.com

4. Luego hacer clic en Analizar 5. Seleccione Frecuencias 6. Aparecerá la siguiente ventana

www.full-ebook.com

7. Hacer clic en la opción Estadísticos 8. A continuación se mostrará la ventana siguiente. Active las casillas correspondientes a asimetría y curtosis.

9. Clic en el comando Continua 10. Finalmente Aceptar 11. A continuación se muestra los resultados: Estadísticos X Válidos 8 N Perdidos 0 Asimetría .053

www.full-ebook.com

Error típ. de asimetría .752 Curtosis -.224 Error típ. de curtosis 1.481 EJERCICIOS PROPUESTOS 1. A partir de los siguientes datos. x i xi Xi 2 4 3 iX Xi 2 -2 4 -8 16

3 -1 1 -1 1 9 5 25 125 625 2 -2 4 -8 16 16 0 34 108 658 Se pide: • Calcular el índice de Asimetría y Curtosis 2. En la tabla se muestran las rentas en miles de dólares y el número de personas que perciben: Renta miles de dólares ni 3 - 7 12 7 - 13 18 13 - 17 24 17 - 23 12 23 - 27 12 Se pide hallar: La asimetría de Fisher y el Coeficiente de Curtosis. 3. Bien, los resultados obtenidos de los ejercicios 1 y 2 compruébalo con el software estadístico SPSS versión 22.

www.full-ebook.com

Sesión Nº 06 REGRESIÓN LINEAL Y CORRELACIÓN Análisis de Regresión Lineal El análisis de regresión lineal simple es una técnica que se utiliza para estudiar la relación entre variables. En la investigación estadística suele emplearse para pronosticar valores de un variable criterio (y) desde las puntuaciones de una variable predictora(x) La fórmula para una ecuación de regresión lineal es:Y = bX +a Donde: Y: Es el valor calculado a: Es el intercepto b: Es la pendiente de la línea X: Es el predictor “a” puede ser calculado a partir de la fórmula: • a = My – bMx Donde: My es la media de Y Mx es la media de X. “b” puede ser calculada a partir de la fórmula: • b = r (Sy/Sx) Donde: Sy es la desviación estándar de Y. Sx es la desviación estándar de X. Ejemplo 1 Existe relación entre la Masa corporal y la fuerza en los estudiantes universitarios de la UNE? Si existe, ¿Qué tipo de correlación?.Halle la ecuación lineal de la recta en SPSS y la correlación de Pearson con la formula. Alumnos Masa Corporal(Kg) Fuerza(Kp) V. independiente V. dependiente Carmen Pérez Ruiz Pedro Cajavilca Solis Juan Caballero Sosa Luís Carranza Pecho Ana Alva Franco Carlos Quijano Ruiz Elena Malca Molina Rosa Alva Alcalá Luís Palpa Mateo 60,00 100,00 65,00 105,00 70,00 102,00 75,00 135,00 80,00 95,00 85,00 125,00

www.full-ebook.com

90,00 140,00 95,00 130,00 100,00 148,00 2. Calculo de la ecuación de la recta en SPSS Mx My Sx Sy r 80 120 13,6906394 19,7104334 0,771130895

Entonces la Recta de Regresión es:Y=1,110X+31,2 3. Calculo de la correlación de Pearson con formula

www.full-ebook.com

r = 14985 116,19*167,25

r = 0,771 Interpretación: Existe una relación alta entre las variables de estudio masa y fuerza de los estudiantes de la UNE. GRÁFICA DE DISPERSIÓN DE PUNTOS CON SPSS Ejemplo: 01 Grafica la dispersión de puntos de los valores de las variables edad y peso que se muestran en el cuadro siguiente: SUJETOS EDAD PESO 1 39 58 2 30 55 3 50 65 4 52 70 5 62 69 6 60 65 7 38 50 8 56 60 9 51 60 10 54 67 Pasos: 1. En la Ventana de Editor de Datos active la pestaña que se encuentra en la parte inferior llamada VISTA DE VARIABLES (determine tus variables) 2. En la Ventana de Editor de Datos active la pestaña que se encuentra en la parte inferior llamada VISTA DE DATOS (introduzca los datos a las variables determinadas)

www.full-ebook.com

3. Seleccione el menú GRÁFICOS 4. Seleccione cuadros de DIÁLOGO ANTIGUOS 5. Elige el procedimiento DISPERSIÓN/ PUNTOS 6. Aparecerá el siguiente cuadro de diálogo

www.full-ebook.com

7. Seleccione Dispersión simple 8. Clic en el comando Definir 9. Aparecerá el siguiente cuadro de diálogo (definir los ejes de diagrama de las variables)

www.full-ebook.com

10. Clic en Títulos

11. Clic en continuar 12. Finalmente Aceptar 13. Resultado en SPSS (muestra el gráfico de dispersión) DISPERSIÓN SIMPLE PARA UNA VARIABLE PREDICTORA 70 60 50 40 30

50 55 60 65 70

PESO

LJCC

ANÁLISIS DE CORRELACIÓN DE PEARSON El análisis de correlación tiene como objetivo medir fuerza de una relación entre variables cuantitativas y/o cualitativas, esta es medida a través del coeficiente de

www.full-ebook.com

correlación de Pearson • Uso de Correlación Para variables cuantitativas que tienen distribución normal se utilizará la correlación momento- producto de Pearson Para variables cualitativas que no tienen distribución normal se utilizará la correlación de rango de Tau De Kendall o Spearman. • Observaciones Esta relación que es analizada puede estar dada de una manera lineal, lo cual nos dice que los datos se ajustarían a una línea recta o forma no lineal en este último caso los datos se ajustarían más a una curva. Es decir, dos variables pueden estar perfectamente relacionadas, pero si la relación no es lineal, el coeficiente de correlación de Pearson o de Spearman no será un estadístico adecuado para medir su asociación. Si la relación que se busca es solamente entre dos variables, recibe el nombre de correlación simple o bivariada. Si el número de variables se incrementa se le conoce como correlación múltiple. Hay otras técnicas que pueden estudiar la relación estadística entre dos variables como por ejemplo: la prueba T de dos grupos, el análisis chi- cuadrado o tablas de contingencia. Criterios de correlación La siguiente tabla según, M. Reyes, para deducir el grado de correlación lineal simple entre dos variables si p o r se encuentra en: • El coeficiente de correlación es un valor cuantitativo de la relación entre dos o más variables. • El coeficiente de correlación puede variar desde -1 hasta 1. • La correlación de proporcionalidad directa o positiva se establece con los valores +1 y de proporcionalidad inversa o negativa con -1. • No existe relación entre las variables cuando el coeficiente es cero (0). 1.00 Correlación Perfecta Y Positiva 0.90- 0.99 Correlación Muy Alta 0.70- 0.89 Correlación Alta 0.40-0.69 Correlación Moderada 0.20-0.39 Correlación Baja

www.full-ebook.com

0.01-0.19 Correlación Muy Baja 0 No Existe Correlación -1 Correlación Perfecta Y Negativa Formula del coeficiente de Pearson:

www.full-ebook.com

n∑xy−(∑x)(∑y)r= ∑x2−(∑x)2* n∑y2−(∑y)2n CALCULO DEL COEFICIENTE DE PEARSON CON EL SOFTWAREEN SPSS 1. Ingrese los datos a las variables de estudio

2. Seleccione el menú Analizar 3. Seleccione la opción Correlaciones 4. Clic en Bivariadas 5. Aparecerá la siguiente ventana de diálogo (seleccione las variables)

www.full-ebook.com

6. Seleccione la casilla de Pearson 7. Active las medias y desviaciones tal como se observa en cuadro

8. Finalmente ACEPTAR 9. Se mostrará el siguiente resultado. Estadísticos descriptivos Media DesviaciónNtípica HORAS/SEMANAL 67.70 12.667 10 SUELDO/SEMANAL 1032.40 209.859 10 Correlaciones Horas/Semanal Sueldo/Semanal HORAS/SEMANAL Correlación de

www.full-ebook.com

Pearson 1 0,777(**) Sig. (bilateral) .008 N 10 10 SUELDO/SEMANAL Correlación de Pearson 0,777(**) 1 Sig. (bilateral) .008 N 10 10 ** La correlación es significativa al nivel 0,01 (bilateral). Interpretación El resultado que muestra SPSS es de 0.777, esto quiere decir que hay una correlación alta entre las variables de estudio. Ejercicios de Aplicación - Recta de Regresión 1. En este ejercicio de aplicación se ilustra la manera de determinar la ecuación de la recta de regresión Y=bX+c mediante el uso de una tabla de valores, como ejemplo toma tomaré los datos recopilados por un gerente de ventas de la empresa Inka Kola, los cuales corresponde a los años de experiencia y el monto de ventas anuales de cada uno de sus cinco empleados. Años de experiencia 6 12 15 21 24 Venta anuales en miles de soles 38 68 83 113 128 En este caso, vamos a escoger los años de experiencia como variable independiente (xi) y las ventas anuales como variable dependiente (yi) Es de aclarar que i representa la cantidad de datos, este caso tomará los valores de 1 hasta 5 correspondientes a la cantidad de empleados, es decir, n=5 El objeto de este ejercicio es determinar la ecuación de la recta de regresión Y=bx+c, es decir, se deben determinar los valores de b y c mediante las siguientes formulas:

www.full-ebook.com

∑xiy− ∑ ∑ yi b = n

www.full-ebook.com

( ∑ x i

)2

∑ x 2

i −n x = ∑xi n y = ∑yi n c = y −bx • Desarrollando con la fórmula dada:

www.full-ebook.com

{ = | % } 2. Las calificaciones de un grupo de estudiantes en el examen parcial (x) y en el examen final (y) fueron los siguientes: X 12 08 10 13 09 14 17 11 18 12 Y 15 13 12 13 11 12 15 12 17 15 Se pide: a. Determine la ecuación de regresión lineal de Y en X. b. Calcule el coeficiente de correlación, coeficiente determinación y el coeficiente no determinación. OTRAS TÉCNICAS • Tau-B de Kendall Medida no paramétrica de asociación para variables ordinales o de rangos que tiene en consideración los empates. El signo del coeficiente indica la dirección de la relación y su valor absoluto indica la magnitud de la misma, de tal modo que los mayores valores absolutos indican relaciones más fuertes. Los valores posibles varían de -1 a 1, pero un valor de -1 o +1 sólo se puede obtener a partir de tablas cuadradas. • Spearman Versión no paramétrica del coeficiente de correlación de Pearson, que se basa en los rangos de los datos en lugar de hacerlo en los valores reales. Resulta apropiada para datos ordinales (susceptibles de ser ordenador) y para datos agrupados en intervalos que no satisfagan el supuesto de normalidad. Los valores del coeficiente varían de -1 a +1. El signo del coeficiente indica la dirección de la relación y el valor absoluto del coeficiente de correlación indica la fuerza de la relación entre las variables. Los valores absolutos mayores indican que la relación es mayor.

www.full-ebook.com

Sesión Nº 07 TEORÍA PARA ENCONTRAR EL TAMAÑO DE MUESTRA • Objeto del muestreo aleatorio. El objeto del muestreo aleatorio es seleccionar una parte representativa de la población con el fin de obtener estimadores de los parámetros • Tipos de muestreo: 1. Muestreo probabilístico: Es aquel en el que cada muestra tiene la misma probabilidad de ser elegida. 2. Muestreo no probabilístico Son procedimientos que no utilizan la ley del azar ni el cálculo de probabilidades y, por tanto, las muestras que se obtienen son sesgadas y no se puede saber cuál es el nivel de confiabilidad, de los resultados de la investigación. El muestreo no probabilístico asume varias formas: el muestreo por juicio o a criterio del investigador, el muestreo por cuota y muestreo accidental. 3. Muestreo intencional u opinático Es intencional, en el que la persona que selecciona la muestra es quien procura que sea representativa, dependiendo de su intención u opinión, siendo por tanto la representatividad subjetiva. 4. Muestreo sin norma: Se toma la muestra sin norma alguna, de cualquier manera, siendo la muestra representativa si la población es homogénea y no se producen sesgos de selección. Nosotros siempre haremos muestreo probabilístico, ya que en caso de elegir la técnica adecuada, es el que nos asegura la representatividad de la muestra y nos permite el cálculo de la estimación de los errores que se cometen. Dentro del muestreo probabilístico podemos distinguir entre los siguientes tipos de muestreo: • Muestreo aleatorio simple

www.full-ebook.com

• Muestreo sistemático. • Muestreo estratificado. • Muestreo por conglomerados. • Muestreo Aleatorio Simple, cuando todos los elementos de la población tienen la misma probabilidad de ser seleccionados en la muestra y esta probabilidad es conocida. Este tipo de muestreo es más recomendable, pero resulta mucho más difícil de llevarse a cabo y, por lo tanto, es más costoso. Para seleccionar una muestra de este tipo se requiere tener en forma de lista todos los elementos que integran la población investigada y utilizar tablas de números aleatorios. Ejemplo Nº 01 : A un grupo de 100 personas se les numera de uno a cien y sedepositan en una urna 100 bolitas a su vez numeradas de uno a cien. Para obtener una muestra aleatoria simple de 20 elementos, tendríamos que sacar 20 bolitas numeradas de la urna que nos seleccionarán en forma completamente al azar a los 20 elementos escogidos para que opinen sobre un nuevo producto. Ejemplo Nº 02 N= 50 azar n=5 x1 x2 x22x13 x45x x 50 48 • Muestreo Aleatorio Sistemático, el cual es susceptible de ser más preciso que el muestreo aleatorio simple. Se elige un primer elemento del universo y luego se van escogiendo otros elementos igualmente espaciados a partir del primero. Consiste en dividir la población en n estratos, compuestos por las primeras K unidades, las segundas k unidades y así sucesivamente. K=

N n Ejemplo No. 1: Si queremos seleccionar una muestra de 320 personas de un universo de 1,240 personas, entonces hallamos su intervalo. K= 1240 320 K=3.87 K=4.0 redondeando El intervalo K indica que la muestra estará constituido por los individuos, cuyos

www.full-ebook.com

trozos de papel fueron extraídos en el cuarto intento, a partir del primero. Dicho de otra manera, el sorteo empieza con el primero que salga, luego de extraer 3 fichas o números aleatorios, el cuarto es el muestreado y así sucesivamente hasta conseguir el último de la muestra. Hernández, recomienda sin embargo que el primer miembro de la muestra debe ser seleccionado al azar, utilizando un dado. Ejemplo 2 : A partir de una lista de 100 establecimientos de comestibles, deseamos seleccionar una muestra probabilística de 20 tiendas. La forma de hacerlo sería: o dividir 100 entre 20 para obtener 5, que es un salto sistemático o extraer un número al azar entre 1 y 5. Supóngase que es el número 2 el cual corresponde al primer elemento seleccionado. o Se incluyen en la muestra de establecimientos numerados: 2, 7, 12, 17, 22,…..,97. • Muestreo Estratificado Consiste en la división previa de la población de estudio en grupos o clases que se suponen homogéneos con respecto a alguna característica de las que se van a estudiar. A cada uno de estos estratos se le asignaría una cuota que determinaría el número de miembros del mismo que compondrán la muestra. Dentro de cada estrato se suele usar la técnica de muestreo sistemático, una de las técnicas de selección más usadas en la práctica. Según la cantidad de elementos de la muestra que se han de elegir de cada uno de los estratos, existen dos técnicas de muestreo estratificado: • Asignación proporcional: el tamaño de la muestra dentro de cada estrato es proporcional al tamaño del estrato dentro de la población. • Asignación óptima: la muestra recogerá más individuos de aquellos estratos que tengan más variabilidad. Para ello es necesario un conocimiento previo de la población. Ejemplo 01: para un estudio de opinión, puede resultar interesante estudiar por separado las opiniones de hombres y mujeres pues se estima que, dentro de cada uno de estos grupos, puede haber cierta homogeneidad. Así, si la población está compuesta de un 55% de mujeres y un 45% de hombres, se tomaría una muestra que contenga también esos mismos porcentajes de hombres y mujeres. • Muestreo Por Conglomerados

www.full-ebook.com

Si intentamos hacer un estudio sobre los habitantes de una ciudad, el muestreo aleatorio simple puede resultar muy costoso, ya que estudiar una muestra de tamaño n implica enviar a los encuestadores a n puntos distintos de la misma, de modo que en cada uno de ellos sólo se realiza una entrevista. En esta situación es más económico realizar el denominado muestreo por conglomerados, que consiste en elegir aleatoriamente ciertos barrios dentro de la ciudad, para después elegir calles y edificios. Una vez elegido el edificio, se entrevista a todos los vecinos. POBLACIÓN Y MUESTRA Población o Universo Es el conjunto de objetos, hechos, eventos que se van a estudiar con varias técnicas. En el enfoque cuantitativo la población es el conjunto de todos los casos que concuerdan con determinadas especificaciones (Selltiz, 1980). Delimitación de la Población • En los enfoques cualitativos la población o el universo no se delimita. • En los enfoques cuantitativos casi siempre sí. El error que cometen los investigadores es de no describir suficientemente las características de la población. • En los enfoques mixtos depende de la situación de la investigación. Ejemplo 01: • Investigación sobre el uso de Internet por los niños Está claro que en dicho investigación la unidad de análisis son los niños ¿Pero de qué población se trata? - De todos los niños del Mundo - De todo los niños de la República del Perú Sería muy ambicioso y prácticamente imposible a referirnos a población tan grande entonces, ¿Qué debemos hacer? Delimitar la población. Población de niños Límites de población de todos los niños de la zona Lima Metropolitana que cursan el 4º y 5º grado de educación primaria de las Instituciones Educativas Privadas del turno

MUESTRA

www.full-ebook.com

Población (N) Elementos o unidad de análisis Muestra (n) De acuerdo al enfoque cuantitativo una muestra es subgrupo de la población del cual se recolectan los datos y debe ser representativo de dicha población. De acuerdo al enfoque cualitativo una muestra es la unidad de análisis o conjunto de personas, contextos, eventos o sucesos sobre el cual se recolectan los datos sin que necesariamente sea representativa del universo. MÉTODOS PARA DETERMINAR EL TAMAÑO DE UNA MUESTRA Para poder determinar el tamaño de la muestra hay muchos criterios y variados métodos. A. Tabla DE FISHER-ARKIN-COLTON En dicha tabla se toma en cuenta la población total y el porcentaje de error, a mayor tamaño de la muestra corresponde un menor porcentaje de error, a menor tamaño de la muestra corresponde mayor porcentaje de error, a esto llamamos margen de error. La tabla nos indica el tamaño de la muestra para que sea representativa de poblaciones finitas considerando márgenes de error desde + 1% hasta +- 10% óptima. Tabla de fisher-arkin-colton Tabla forstadística Población % DE ERROR DE total Ni 1% 2% 3% 4% 5% 10% 500 222 83 1,000 385 286 91 1,500 638 441 316 94 2,000 714 476 333 95 2,500 1,250 769 500 345 96 3,000 1,364 811 520 353 97 3,500 1,458 843 530 359 98 4,000 1,538 870 541 364 98 4,500 1,607 891 546 367 98 5,000 1,667 909 556 370 98 6,000 1,765 938 565 375 99 7,000 1,842 959 574 378 99

www.full-ebook.com

8,000 1,905 976 580 381 99 9,000 1,957 989 584 383 99 10,000 5,000 2,000 1,000 588 385 99 15,000 6,000 2,143 1,034 600 390 100 20,000 6,667 2,222 1,053 600 392 100 25,000 7,143 2,273 1,064 610 394 100 50,000 8,333 2,381 1,087 617 397 100 100,000 9,091 2,439 1,099 621 398 100 Ejemplos • Si tenemos un universo de 500 personas, trabajando con el 5% de error necesitamos una muestra de 222 personas y, si trabajamos con margen de error del 10% necesitaremos una muestra de 83 personas. • Si tenemos una población de 3,000 personas, trabajando con el 3% de error necesitamos una muestra de 811 personas y, si trabajamos con margen de error del 5% necesitaremos una muestra de 353 personas. Según estos dos autores, en ambos casos la confiabilidad es óptima. Ahora cuando no se precisa la cifra, significa que la muestra (n) debe ser tomada muy alrededor de la mitad o, en el mejor de los casos, para garantizar la máxima confiabilidad, debe tomarse una muestra que sea algo superior a la mitad de la población. B. MEDIANTE CURVA NORMAL Esto implica una fórmula matemática, en busca de su máxima confiabilidad, en tanto que la población sea finita. Ejemplo 01 Si tenemos una Población de 1000 alumnos y necesitamos determinar el tamaño de la muestra la fórmula es:

z2.p.q.Nn = E2(N −1)+ Z2.P.q Donde: n = tamaño de la muestra N = tamaño de la población Z= número determinado según la tabla de áreas bajo la curva normal tipificada de 0 a Z, que representa el límite de confianza requerido para garantizar los resultados, es este caso para nuestro ejemplo tomaremos el valor de 1,96.

www.full-ebook.com

p=probabilidad de acierto, en este ejemplo el valor será 0,5 el 50%. q= probabilidad de no acierto, en este ejemplo el valor será 0,5 el 50%. E= error máximo permitido, que será del 5% e igual a 0.05 el 5%. Reemplazando valores 2 2 2 n = (1,96) ×0.5×0.5×1000 (0.05) (999)+(1,96) ×0.5×0.5 n = 960.4 2,4975+0,9604= 960.4 = 277,73,4579 n = 278 Observación: Los valores de p y q deben dar 1. También se puede tomar otros valores de 0.6 para p y 0.4 para q. USO DE LA TABLA: AREA DE LA CURVA NORMAL Z Por lo general se considera una confiabilidad de 95% a 99% que significa tener un error del 5% al 1% respectivamente. Ejemplo 01 Si queremos calcular una muestra con el 95% de confianza. • Dividimos 95 entre 2 porque la tabla de la curva normal está dividida en dos partes, logrando como resultado 47.5. • Ahora dividimos 47.5 entre 100 y el resultado es 0,4750 • En seguida buscamos los valores de Z. en la tabla, comparando la columna de la izquierda (1,9) y la fila superior (0,06); su valor es la suma de ambos como resultado tenemos 1,96. • Entonces el valor de z al 95% de confiabilidad en la tabla es 1,96 Ejemplo 02 Si queremos calcular una muestra con el 99% de confianza. • Dividimos 99 entre 2 porque la tabla de la curva normal está dividida en dos partes, logrando como resultado 49.5. • Ahora dividimos 49.5 entre 100 y el resultado es 0,4950 • En seguida buscamos los valores de Z. en la tabla, comparando la columna de la izquierda (2,5) y la fila superior (0,08); su valor es la suma de ambos como resultado tenemos 2,58. • Entonces el valor de z al 99% de confiabilidad en la tabla es 2,58 Ejemplo 03 Si queremos calcular una muestra con el 94% de confianza. • Respuesta: Z= 1,88 Ejemplo 04 Si queremos calcular una muestra con el 90% de confianza.

www.full-ebook.com

• Respuesta: Z= 1,65 Ejemplo 05 Si queremos calcular una muestra con el 93% de confianza. • Respuesta: Z= 1,81 Ejemplo 06 Si queremos calcular una muestra con el 92% de confianza. • Respuesta: Z= 1,75 Tabla: área de la curva normal z 0,0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0,0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359 0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753 0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141 0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517 0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879 0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224 0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549 0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852 0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133 0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389 1,0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621 1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830 1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015 1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177 1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319 1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441 1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545 1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633 1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706 1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767 2,0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817 2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857 2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890 2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916 2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936 2.5 0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952 2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964 2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974 2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981 2.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986 3,0 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990

DISTRIBUCIÓN NORMAL ESTÁNDAR

www.full-ebook.com

Esta curva "de campana" es la distribución normal estándar Puedes usar la tabla superior para saber el área bajo la curva desde la línea central hasta cualquier línea vertical "a valor Z" hasta 3, en incrementos de 0.1. Esto te dice qué parte de la población está dentro de "Z" desviaciones estándar de la media. En lugar de una tabla larga, hemos puesto los incrementos de 0.1 hacia abajo, y los de 0.01 de lado. C. MEDIANTE PROBABILIDAD DE CONCURRENCIA Cuando se hace una muestra probabilística recuerda que estas bajo un enfoque cuantitativo, uno debe preguntarse: dado una población N, ¿cuál es el menor número de unidades muestrales (personas, organizaciones, capítulos de telenovela, etcétera) que necesito para conformar una muestra (n) que me asegure un error estándar menor de 0.01? Para una determinada varianza (V2) de y, ¿qué tan grande debe ser mi muestra? Ello se determina en dos fórmulas: s 2 n'=V2

Donde:

www.full-ebook.com

n' n = 1+ n' / N N = Tamaño de la población y = valor promedio de una variable =1 n’ = tamaño de la muestra provisional sin ajuste n = Tamaño de la muestra e = error estándar V 2= Varianza de la población. Su definición cuadrado del error estándar (se) s2= Varianza de la muestra expresada como la probabilidad de concurrencia de Es decir: p (1-p) Ejemplo 01: De una población de 1176 alumnos de las instituciones particulares del distrito del Rímac se desea conocer la aceptación del blog como recurso didáctico en la web. Para ello se desea tomar una muestra, por lo que se necesita saber la cantidad de alumnos que deben ser entrevistados para obtener una información adecuada con error estándar de 0.015 al 90% de confiabilidad. Datos: N = 1176 y = 1 e = 0.015 V2= 0.000225 s2= 0.09 n’ = ? n = ? Remplazando tenemos: s 2

n' =V2

n ' = 0.09

0.000225= 400 n' 400Luego: n =1+n'/ Nn =1+400/1176= 298 Para nuestra investigación necesitaremos una muestra de 298 alumnos. EJERCICIO PROPUESTO 1. De una población de 2056 alumnos de las instituciones estatales del distrito de pueblo libre se desea conocer la aceptación del facebook como recurso

www.full-ebook.com

interactivo en la web. Para ello se desea tomar una muestra, por lo que se necesita saber la cantidad de alumnos que deben ser entrevistados para obtener una información adecuada con error estándar de 0.05 al 95% de confiabilidad. Cuadro Resumen Determinar el nivel de confianza con que se desea trabajar. (Z), donde z = 1.96 para un 95% de confianza o z= 1.65 para el 90% de confianza TABLA DE APOYO Certeza 95% 94% 93% 92% Z 1.96 1.88 1.81 1.75

3.84 3.53 3.28 3.06 91% 90% 80% 62.27% 50% 1.69 1.65 1.28 1 0.6745 2.86 2.72 1.64 1.00 0.45 E 0.05 0.06 0.07 0.08

0.0025 0.0036 0.0049 0.0064 0.09 0.10 0.20 0.37 0.50 0.0081 0.01 0.04 0.1369 0.25 Población infinita Población Finita n = z2.p.q e2

www.full-ebook.com

z2.p.q.Nn = E2(N −1)+ Z2.P.q Cuando no se sabe el número exacto de unidades del que está compuesta la población. Cuando se conoce cuántos elementos tiene la población En donde: Z = nivel de confianza. p = Probabilidad a favor. q = Probabilidad en contra. N = Universo e = error de estimación. n = tamaño de la muestra EJERCICIOS DE REFORZAMIENTO: 2. Una Universidad desea ofrecer una nueva carrera profesional; para ello debe calcular la proporción de estudiantes de último año de secundaria que piensa estudiar dicha carrera. ¿Qué tamaño, debe tener la muestra si su estimación debe estar a 0,025 del valor verdadero, con 99,60 % de confianza? a) El año anterior el 25 % de los estudiantes encuestados se inclinaba por una carrera similar. b) El número de estudiantes que cursan el último año de secundaria en la ciudad donde se realiza la investigación es de 12 000. Resuelto Manualmente a) E = 0,025 1 –α = 0,9960 0,9960 ÷ 2 = 0,498 p = 0,75 q = 0,25

www.full-ebook.com

0,498 0,498 Z 8 2,80 + 0,08 2,8 0,498 2,88 n = Z2 p*q E2 n = 2,882*(0,75)(0,25) 0,0252 n= 2 488,32 n= 2488 b) N= 12 000 p = 0,75 q = 0,25 E = 0,025 z2 * p*q*N (2,88)2 *0,75*0,25*12000n = E(N −1) +z2 * p*qn = (0,025) (12000−1)+(2,88)2 *0,75*0,25 18662,4n = 9,0546 n=2061 3. ¿Qué tamaño deberá tener una muestra para estimar dentro del 2%, la proporción de mujeres casadas que van periódicamente a consulta ginecológica, en una población de 20 000 mujeres y una seguridad del 99,9%? n = ? E = 2% = 0,02 N = 20 000 1 α = 0,99 α = 0,01 = 0,01 α = 0,99

α /2= 0.4995

www.full-ebook.com

α /2= 0.4995 0.499

Z=3,29 P + q = 1 p= q= 0,5 E = p – P = 0.02 Fórmula: z2 * p*q*N (3,29)2 *(0,5)*(0,5)*20000n = E(N −1)+ z2 * p*qn = (0,02)2(20000−1)+(3,29)2 *(0,5*(0,5) n= 5055,3 El tamaño de la muestra es 5055 4. Supóngase que se desea determinar la calidad y el nivel de servicio que ofrece nuestra Unidad de información Archivística; por lo que resulta necesario entrevistar a los distintos usuarios que acuden a nuestro archivo para así conocer su opinión. ¿Cómo calcularíamos el tamaño de la muestra? a) Establecer el nivel de confianza (95% y un error del 5%) o el (90% - y un error del 10%). b) Se obtiene el marco muestral, en este caso la referencia con que contamos será el registro de visitantes a nuestra Unidad de Información del año pasado y que arroja la cifra de 43,700. n = ? e = 5% =0.05 o 10% = 0.1 Z = 1.96 (tabla de distribución normal para el 95% de confiabilidad y 5% error) o Z = 1.65 para el 90% de confiabilidad y 10% error. N= 43,700 (universo) p = 0.50 q = 0.50

z2.p.q.Nn = E2(N −1)+ Z2.P.q

www.full-ebook.com

• Enseguida especificaremos las operaciones para evaluar a “n” (tamaño de la muestra), Para ésta estimación supondremos que contamos con un 95% de confiabilidad y por tanto un porcentaje de error del 5% (0.05)

www.full-ebook.com

n = 381 EJERCICIOS PROPUESTOS 4. Ahora bien, si nuestro criterio fuera otro como por ejemplo el considerar un margen del 90% de confiabilidad con su correspondiente porcentaje de error, en este caso sería del 10% 0.10) 5. Haciendo uso de la tabla de FISHER-ARKIN-COLTON establezca el tamaño de la muestra de una población de 2500 estudiantes, al 4% de error. 6. ¿Cuál es la muestra de una población de 2,723 estudiantes de la UNE, si queremos trabajar con un nivel de confianza del 95%, con un error del 5% y con una probabilidad de éxito del 60% y una probabilidad de fracaso del 40%? 7. Hallar el valor de Z en la tabla de la curva normal, para calcular una muestra con el 99% de confianza. (paso a paso) 8. Delimite la población, a su criterio, en una investigación sobre el uso del blog por los adolescentes.

www.full-ebook.com

Capítulo II

www.full-ebook.com

VALIDEZ Y CONFIABILIDAD Sesión Nº 08 VÁLIDEZ DEL INSTRUMENTO CONCEPTUALIZACIÓN Según Hernández Sampieri validez es el grado en que un instrumento realmente mide la variable que pretende medir. Según Thorndike grado en que un instrumento realmente mide lo que el investigador pretende.

EVIDENCIAS RELACIONADAS CON LA VALIDEZ DE DE CONTENIDO CRITERIO CONSTRUCTO MEDIANTE MEDIANTE Juicio de ExpertosCorrelacionar la Análisis de factoresmedición 1. EVIDENCIA RELACINADO CON EL CONTENIDO Es el grado en que la medición representa el concepto medido. Se determina antes de la aplicación del instrumento mediante Juicio de Expertos. EJEMPLO: DISEÑO DE OPINIÓN DE EXPERTOS DEL INSTRUMENTO DE INVESTIGACIÓN I. DATOS GENERALES 1.1. Apellidos y nombres del informante: …………. …….............................................. 1.2. Cargo e institución donde labora: ……………………. ………………………………….. 1.3. Nombre del instrumento o motivo de evaluación: Encuesta sobre Las TIC como recurso didáctico para mejorar el aprendizaje en la comprensión lectora en los estudiantes de 4 años del nivel inicial turno tarde de la I.E.E. Nº 0004 “Niño Jesús de Praga” de la UGEL Nº 03 del distrito Pueblo Libre, 2012. 1.4. Autor del instrumento: Rosario Angeliza Villena Franco, alumna de la

www.full-ebook.com

Sección Maestría de la Escuela de Postgrado de la Universidad Nacional de Educación “Enrique Guzmán y Valle”. INDICADORES CRITERIOS 1. Claridad 2. Objetividad 3. Actualidad 4. Organización 5. Suficiencia 6. Intencionalidad 7. Consistencia 8. Coherencia 9. Metodología Está formulado con lenguaje apropiado. Está expresado en conductas observables. Adecuado al avance de la ciencia y la tecnología. Existe una organización lógica entre variables e indicadores. Comprende los aspectos en cantidad y calidad. Adecuado para valorar aspectos sobre uso de las tics y el aprendizaje de la comprensión lectora. Consistencia entre la formulación del problema, objetivos y la hipótesis. De índices, indicadores y las dimensiones. La estrategia responde al propósito de la investigación. II. OPINIÓN DE APLICABILIDAD: …………………………. …….............................................. III. PROMEDIO DE VALORACIÓN: ….. ……………………………………………………………. Lugar y fecha: ………………………… DNI: …………..………. Teléfono: ….………………. ____________________________ Firma del Experto Informante 2. EVIDENCIA RELACINADO CON EL CRITERIO VALIDEZ CONCURRENTE: Si el criterio se fija en el presente VALIDEZ PREDICTIVA: Si el criterio se fija en el futuro.

www.full-ebook.com

3. EVIDENCIA RELACINADO CON EL CONSTRUCTO CONSTRUCTO: Según Ruiz Bolívar, (2001), es una variable medida que tiene lugar dentro de una teoría o esquema teórico. La validez de un constructo incluye tres etapas 1. Relación teórica entre los conceptos 2. Correlación de conceptos y análisis 3. Interpretación de la evidencia empírica de acuerdo con el nivel en que clarifica la validez de un constructo de una medición en particular. CALCULO DE LA VALIDEZ Validez de contenido: Juicio de Expertos Validez de criterio: correlacionar la medición con el criterio para obtener el coeficiente de validez. Validez de constructo. Suele determinarse un procedimiento estadístico denominado análisis de factores. Utilización de programas apropiados con el EXCEL , MINITAB Y SPSS 4. TÉCNICAS PARA CÁLCULO DE LA CONFIABILIDAD 1. Test Re-Test o Medida de Estabilidad 2. Test: Paralelos o Métodos de Formas Alternativas 3. División por Mitades o Mitades Partidas 4. Coeficiente alfa de Cronbach 5. kuder – Richardson o Coeficiente kr- 20 6. Otros. 5. SEGÚN EL INSTRUMENTO DE MEDICIÓN APLICAR ALFA DE CRONBACH. Se utiliza para más de dos alternativas (Escala de Likert) KUDER RICHARDSON. Se aplica para respuestas dicotómicas. DOS MITADES. Pruebas de velocidad, cuestionario, test, escalas, prueba de conocimiento. TEST RE -TEST Y PARALELOS. Se aplican en cuestionarios, test, escalas, prueba de conocimiento. Pero no son aplicable en pruebas de velocidad. TEST RE- TEST O MEDIDA DE ESTABILIDAD • El investigador debe aplicar el mismo instrumento dos veces al mismo grupo después de cierto período. • Debe calcular la confiabilidad del instrumento antes de la aplicación definitiva del mismo. • Coeficiente de correlación de pearson altamente positivo es igual al instrumento confiable. LIMITACIONES • El período de tiempo (corto o largo), entre las mediciones puede confundir la

www.full-ebook.com

interpretación del coeficiente de confiabilidad obtenido mediante esta técnica. TEST PARALELOS O MÉTODO DE FORMA ALTERNATIVA • Se administra dos o más versiones equivalentes de un mismo instrumento. • Deben ser similares en contenido, instrucciones, tipos de preguntas y dificultad. • Son administradas al mismo grupo en un período relativamente corto. • Los patrones de respuestas deben variar poco entre las aplicaciones • Coeficiente de confiabilidad e igual a la fórmula de correlación de Pearson ALGUNAS LIMITACIONES • Dificultad para obtener dos pruebas realmente paralelas. • Efecto que el primer instrumento tiene sobre puntajes del segundo • Implica un doble trabajo de construcción de instrumentos • Confiable sólo si correlación entre los resultados de ambas aplicaciones es positiva TÉCNICA DE DIVISIÓN POR MITADES • Requiere sólo un aplicación de medición • El conjunto total de ítems es dividido en dos mitades y se comparan las puntuaciones obtenidas en ambas mediciones • Correlación de Spearman Brown es igual al coeficiente de confiabilidad • Puntuaciones de ambas mitades fuertemente correlacionadas es igual al instrumento confiable. • Más ítems igual mayor confiabilidad. POSIBLES LIMITACIONES • Confiabilidad varía de acuerdo con el número de ítems que incluya el instrumento de medición • Demasiados ítems provocarán cansancio en el respondiente • Riesgo que el contenido de las mitades sea diferente.

www.full-ebook.com

Sesión Nº 09 CONFIABILIDAD: COEFICIENTE ALFA DE CRONBACH • Conceptualización Se trata de un índice de consistencia interna que toma valores entre 0 y 1 y que sirve para comprobar si el instrumento que se está evaluando recopila información defectuosa y por tanto nos llevaría a conclusiones equivocadas o si se trata de un instrumento fiable que hace mediciones estables y consistentes. Alfa es por tanto un coeficiente de correlación al cuadrado que, a grandes rasgos, mide la homogeneidad de las preguntas promediando todas las correlaciones entre todos los ítems para ver que, efectivamente, se parecen. Su interpretación será que, cuanto más se acerque el índice al extremo 1, mejor es la fiabilidad, considerando una fiabilidad respetable a partir de 0,80. Su Fórmula Estadística Es La Siguiente:

www.full-ebook.com

 ∑S2 α = Ki K − 1  1−s2 T    K: El número de ítems ∑ S 2 i : Sumatoria de Varianzas de los Items S2 : Varianza de la suma de los ÍtemsT

α: Coeficiente de Alfa de Cronbach Criterios De Confiabilidad Según George y Mallery (2003, p. 231) • No es confiable (es inaceptable) 0 a 0,49 • No es confiable (es pobre) 0,50 a 0,59 • Baja confiabilidad (es cuestionable) 0,60 a 0,69 • Existe confiabilidad (aceptable) 0,70 a 0,75 • Fuerte confiabilidad (bueno) 0,76 a 0,89 • Alta confiabilidad (excelente) 0,90 a 1 Ejemplo 1 El cuadro de resultados de un instrumento de investigación que está compuesto de 3 ítems, que fue aplicada a una muestra piloto de 6 estudiantes de la población. Cada ítems es evaluado mediante la escala de Likert (1: Totalmente en desacuerdo, 2: Desacuerdo, 3: Neutral, 4: De acuerdo, 5: Totalmente de acuerdo). ¿Es confiable el instrumento?

www.full-ebook.com

A. Mediante Formula Estadística n ÍTEM I ÍTEM II ÍTEM III SUMA DE ÍTEMS 1 3 5 5 13 2 5 4 5 14 3 4 4 5 13 4 4 5 3 12 5 1 2 2 5 6 4 3 3 10 VARP 1.58 1.14 1.47 S2T : 9,14 Sumatoria de las Varianzas de los S2i: 4,19 ítems K: El número de ítems : 3 ∑S2 : Sumatoria de Varianzas de los Ítems : 4,19i S2 : Varianza de la suma de los Ítems : 9,14T α : Coeficiente de Alfa de Cronbach α = 3  3 − 1  1 − 4.19  9.14  α = 0,81 Interpretación: Entre más cerca de 1 estáα, más alto es el grado de confiabilidad B. MEDIANTE EL SOFTWARE SPSS 1. En vista de variables ingrese los siguientes atributos.

2. En vista de datos ingrese los siguientes valores

www.full-ebook.com

3. Clic en el menú Analizar 4. Seleccione la opción Escalas 5. A continuación clic en Análisis de Fiabilidad 6. Aparecerá la siguiente ventana, donde deberá seleccionar las variables hacia el recuadro de elementos con el botón

www.full-ebook.com

7. En la opción modelo elegir alfa

8. Finalmente Aceptar 9. A continuación se mostrará el resultado del coeficiente alfa de cronbach (α)

www.full-ebook.com

10. Interpretación: Como se puede apreciar, el resultado tiene un valor α= 0,81, lo que indica que este instrumento tiene una fuerte confiabilidad, validando su uso para la recolección de datos. EJERCICIOS DE APLICACIÓN 1. Los datos de una muestra piloto que han sido considerados para una prueba de validación, constituida por 10 ítems, para una de las variables de estudio. La muestra piloto integrada por 10 alumnos, esta resumida en la siguiente tabla, mediante la escala de likert. 1 (TD) Totalmente en desacuerdo 2 (D) En desacuerdo 3 (N) Neutral, ni de acuerdo ni en desacuerdo 4 (A) De acuerdo 5 (TA) Totalmente de acuerdo • Calcule el coeficiente de Alfa de Cronbach. • ¿Es confiable el instrumento? LAS TIC Alumnos / ítems I II III IV V VI VII VIII IX X 1 5 4 5 4 4 4 4 4 4 4 2 4 5 4 5 5 4 5 4 4 5 3 4 3 3 3 3 3 3 3 4 4 4 3 2 2 2 4 3 4 2 4 3 5 2 4 4 3 4 5 3 3 3 3 6 3 2 2 4 3 4 3 5 3 4 7 4 3 3 3 2 4 4 4 5 4 8 2 3 3 3 3 3 3 2 4 3 9 5 4 4 3 4 4 3 3 4 4 10 2 4 3 4 3 5 4 4 4 3

2. Se presenta el cuadro de resultados de un instrumento de investigación que

www.full-ebook.com

está compuesto de 19 ítems, que fue aplicada a un grupo piloto de 19 estudiantes de la población. Cada ítems es evaluado mediante la escala de Likert (1: Nunca, 2: Algunas veces, 3: Casi siempre, 4: Siempre). • Calcule el coeficiente de Alfa de Cronbach. • Es confiable el instrumento Nº./items P1 P2 P3 P4 P5 P6 P7 P8 P9 P10 P11 P12 P13 P14 P15 P16 P17 P18 P19 1 3 2 2 3 3 2 2 3 2 3 2 3 3 4 2 2 1 3 2 2 3 2 2 1 3 3 2 3 2 2 4 4 3 4 1 2 3 2 2 3 3 4 4 3 1 3 1 1 2 4 1 4 4 4 2 1 1 4 1 4 3 3 3 3 3 3 2 3 2 4 1 4 4 4 3 1 1 4 2 5 2 2 3 2 2 3 1 2 2 3 3 3 3 3 3 2 2 2 3 6 4 3 3 4 3 4 2 3 2 4 3 4 3 3 4 2 3 3 3 7 4 3 3 4 3 4 2 3 2 4 3 4 3 3 4 2 3 3 3 8 4 4 2 3 2 2 1 4 1 2 2 3 4 3 2 4 1 4 2 9 4 3 3 4 3 4 2 3 2 4 3 4 3 3 4 2 3 3 3 10 3 3 3 2 2 2 1 3 1 3 3 3 4 4 3 2 2 3 2 11 4 4 2 3 2 2 1 4 1 2 2 3 4 3 2 4 1 4 2 12 4 3 3 4 3 4 2 3 2 4 3 4 3 3 4 2 3 3 3 13 3 3 3 2 2 2 1 3 1 3 3 3 4 4 3 2 2 3 2 14 4 4 2 3 2 2 1 4 1 2 2 3 4 3 2 4 1 4 2 15 4 3 3 4 3 4 2 3 2 4 3 4 3 3 4 2 3 3 3 16 4 3 3 4 3 4 2 3 2 4 3 4 3 3 4 2 3 3 3 17 4 2 3 3 3 4 4 3 2 4 3 4 3 3 4 2 3 3 3 18 4 3 3 4 3 4 2 4 2 4 3 4 3 3 4 2 3 3 3 19 4 3 3 4 4 4 2 3 2 4 3 4 3 3 4 2 3 3 3

www.full-ebook.com

Sesión Nº 10 CONFIABILIDAD: KUDER RICHARDSON 20 El Kr20 es un indicador de la fidelidad (consistencia interna). El modelo de Kuder -Richardson es aplicable en instrumentos de ítems dicotómicos en los cuales existen dos respuestas: correctas e incorrectas; si, no; verdadero, falso; etc. A continuación se presenta un ejemplo ficticio de un examen de 10 preguntas en el que se calcula el coeficiente de la consistencia interna Kr20. Fórmula:∑p*q kr 20 = k T k − 1 s2 −   s 2 T 

Donde: 2 = Varianza del total de las cuentas de la pruebas

T

p = Proporción de respuestas correctas q = Proporción de respuestas incorrectas k = Número total de ítems de la prueba ALUMNOS I II III IV V VI VII VIII IX X TOTAL JUAN 1 1 1 1 1 1 0 0 0 0 6 ADRIAN 1 1 1 1 1 1 1 0 0 0 7 JOSE 1 1 1 1 0 1 0 1 1 0 7 PABLO 1 0 0 0 0 0 0 0 0 0 1 ROSARIO 1 1 1 1 0 0 1 0 0 0 5 ANA 1 1 1 0 1 0 1 1 0 0 6

www.full-ebook.com

MARIA 1 1 1 1 1 1 0 1 1 1 9 PEDRO 1 1 0 0 1 0 0 1 1 1 6 OSCAR 1 1 1 1 1 0 1 0 0 0 6 HUGO 1 1 1 1 1 1 1 0 0 0 7 RC 10 9 8 7 7 5 5 4 3 2 V=4,22 RI 0 1 2 3 3 5 5 6 7 8 P 1.0 0.9 0.8 0.7 0.7 0.5 0.5 0.4 0.3 0.2 Q 0.0 0.1 0.2 0.3 0.3 0.5 0.5 0.6 0.7 0.8 p*q 0 0.09 0.16 0.21 0.21 0.25 0.25 0.24 0.21 0.16 S=1.78

kr20 =k −1s2 −∑p*qk  T   s 2 T 

kr 20 = 10 4,22−1,78 10−1 4,22  kr20 =0,64 Interpretación del Coeficiente de Confiabilidad La confiabilidad de un instrumento se expresa mediante un coeficiente de correlación: rtt, que teóricamente significa correlación del test consigo mismo. Sus valores oscilan entre cero (0) y uno (1). Una manera práctica de interpretar la magnitud de un coeficiente de confiabilidad puede ser guiada por la escala siguiente: Escala de confiabilidad según Guilford Escala Categoría 0 - 0,20 Muy baja 0,21 - 0,40 Baja 0,41 - 0,60 Moderada 0,61 - 0,80 Alta 0,81 - 1 Muy alta Por lo general, un coeficiente de confiabilidad se considera aceptable cuando está por lo menos en el límite superior (0,80) de la categoría “Alta”. No obstante, no existe una regla fija para todos los casos. Todo va a depender del tipo de instrumento bajo estudio, de su propósito y del tipo de confiabilidad de que se trate. INTERPRETACIÓN Para ejemplo citado la prueba tiene una confiabilidad alta por tener un valor de Kr20= 0.64, es decir se encuentra en el intervalo siguiente: 0,61-0,80 ALTA

www.full-ebook.com

EJERCICIOS DE APLICACIÓN 1. Se presenta el cuadro de resultados de un instrumento de investigación que está compuesto de 10 ítems, que fue aplicada a un grupo piloto de 10 estudiantes de la población. Cada ítems es evaluado mediante alternativas de forma objetiva (prueba de conocimiento), en el que una respuesta es correcta y las otras incorrectas (1: Correcta y 0: Incorrecta). a) Calcule el coeficiente de Kuder-Richardson KR20. b) ¿El instrumento es confiable? Estudiante Item 1 Item 2 Item 3 Item 4 Item 5 Item 6 Item 7 Item 8 Item 9 Item 10 1 1 1 1 1 1 1 0 0 0 0 2 1 1 1 1 1 1 1 0 0 0 3 0 1 1 1 0 1 0 1 1 0 4 1 0 0 0 0 0 0 0 0 1 5 1 1 1 1 0 0 1 0 1 0 6 1 0 1 0 1 0 1 1 0 0 7 1 1 1 1 1 1 0 1 1 1 8 1 1 0 0 1 0 1 1 1 1 9 1 1 1 1 1 0 1 0 0 0 10 1 1 1 1 1 1 1 0 0 1

2. Se presenta el cuadro de resultados de un instrumento de investigación que está compuesto de 5 ítems, que fue aplicada a un grupo piloto de 9 estudiantes de la población. Cada ítems es evaluado mediante alternativas de forma objetiva (prueba de conocimiento), en el que una respuesta es correcta y las otras son incorrectas (1: Correcta y 0: Incorrecta). a) Calcule el coeficiente de Kuder-RichardsonKR20. (Resultado=0,68) b) ¿El instrumento es confiable? Estudiantes P1 P2 P3 P4 P5 TOTALES 1 1 1 1 1 1 5 2 1 1 1 1 1 5 3 1 1 1 1 1 5 4 1 1 1 1 1 5 5 0 1 1 1 1 4 6 1 0 0 0 1 2 7 1 1 1 1 1 5 8 1 1 1 1 1 5 9 0 1 1 1 0 3

www.full-ebook.com

Sesión Nº 11 DOS MITADES La estimación de la confiabilidad a través del método de dos mitades, consiste en: dividir los ítems de la prueba en dos parte iguales; (ítems pares e impares), luego correlacionar las puntuaciones totales de las dos mitades, finalmente multiplicar el coeficiente obtenido por 2 y dividir por el término 1 (uno) más la correlación de las dos mitades, como se expresa en la fórmula que aparece:

R = 2 * r 1 + r En donde: R= Coeficiente de confiabilidad (Ecuación de Spearman Brown) r = Correlación de pearson entre las dos mitades EJEMPLO: 1. Dada la tabla siguiente. Estudie la confiabilidad del instrumento, mediante la técnica de dos mitades. Utilice el software SPSS. ¿Será confiable? Puntajes de 0120

a) En la pestaña inferior llamada vista de variables introduce los datos como se muestra a continuación:

b) En seguida active la pestaña vista de datos ingrese los valores tal como se muestra en la tabla3

www.full-ebook.com

Tabla Nº 03 c) En seguida clic en el menú Analizar d) Seleccione Escala e) Elegir la primera sub opción Fiabilidad f) Seleccione los ítems pares y luego los impares

g) Clic en la opción Dos Mitades h) Finalmente Aceptar i) Se abrirá otra venta nueva mostrando los resultados Resumen del procesamiento de los casos N % Válidos 10 100.0 Casos Excluidosa 0 .0 Total 10 100.0 a. Eliminación por lista basada en todas las variables del procedimiento. Estadísticos de fiabilidad Valor .704 Parte 1 N de elementos 5a

www.full-ebook.com

Alfa de Cronbach Valor .453 Parte 2 N de elementos 5b N total de elementos 10 Correlación entre formas .906 Coeficiente de Spearman-Brown Longitud igual .951 Longitud desigual .951 Dos mitades de Guttman .946 a. Los elementos son: item2, item4, item6, item8, item10. b. Los elementos son: item1, item3, item5, item 7, item9. j) Interpretación: La correlación entre las dos mitades es muy alta (0,95), por lo tanto el instrumento es confiable. Ejercicios de Aplicación 3. Dada la tabla siguiente. Estudie la confiabilidad del instrumento, mediante la técnica de dos mitades. Utilice el software SPSS. ¿Será confiable? N° Ítem 1 Ítem 2 Ítem 3 Ítem 4 Ítem 5 Ítem 6 Ítem 7 Ítem 8 Ítem 9 Ítem 10 1 5 5 4 5 5 4 5 5 5 4 2 4 4 3 3 3 3 4 4 4 5 3 3 3 3 4 4 3 3 3 3 3 4 2 4 3 3 2 4 4 3 2 3 5 3 4 2 2 3 4 3 3 3 5 6 4 2 3 3 3 3 3 3 4 3 7 4 4 5 2 3 3 4 3 3 3

www.full-ebook.com

LA CONFIABILIDAD DE VERSIONES EQUIVALENTES O PARALELOS Esta se utiliza en el caso de dos o más pruebas que miden el mismo constructo. Para ello, se preparan dos versiones de la misma prueba y se administran a la misma muestra de sujetos; luego estas dos distribuciones de puntajes son correlacionadas, para estimar el coeficiente de confiabilidad. Dicho coeficiente combina dos tipos de confiabilidad: estabilidad temporal y consistencia de las repuestas a las diferentes muestras de ítems (Helmstadter, 1964). En relación con la confiabilidad de versiones equivalentes es crucial considerar el concepto de muestreo de contenido; en el sentido de que es necesario estar seguro que las dos pruebas son realmente equivalentes; es decir, están integradas por muestras de ítems que son representativas del dominio de contenido bajo medición. Al respecto, es conveniente también que ambas pruebas sean presentadas de la misma manera, cubrir la misma cantidad de contenido, tener el mismo número de ítems y ser equivalentes en cuanto al nivel de dificultad de los ítems. Así mismo, se espera que las pruebas sean similares en cuanto a las instrucciones, límite de tiempo, ejemplos ilustrativos y formato de presentación. EJEMPLO Forma A y Forma B. En principio, deben tener el mismo número de ítems, estos deben ser de dificultad análoga, deben medir administración, ejemplos y otros los mismo y las instrucciones, tiempos límites de aspectos de cada uno de los tests, tienen que ser equiparables. Una manera da calcular dicha correlación (aunque no la única) viene dada por el cociente de la covarianza (SAB) entre el producto de la varianza de las puntuaciones en ambos test: r xx'

www.full-ebook.com

= sAB sAsB

S AB

= ∑ (A - A )( B −B) n Los supuestos de paralelismo son aceptados puesto que ambas versiones del test han sido construidas lo más similares posibles. Sin embargo, a pesar de haber sido construidas lo más similares posibles, Suen (1990) afirma que ello no garantiza que los supuestos de paralelismo se cumplan, por lo cual el coeficiente r de Pearson entre ambas formas del test se conoce como coeficiente de equivalencia. El problema de la forma paralela es que es costosa y con frecuencia muy difícil de elaborar (Cerdá, 1984; Aiken, 1996).

www.full-ebook.com

LA CONFIABILIDAD DE REAPLICACIÓN DE PRUEBAS (TEST - RETEST) En este procedimiento un mismo instrumento de medición (o ítems o indicadores) es aplicado dos o más veces a un mismo grupo de personas, después de un periodo de tiempo. Si la correlación entre los resultados de las diferentes aplicaciones es altamente positiva, el instrumento se considera confiable. Se trata de una especie de diseño panel. Desde luego, el periodo de tiempo entre las mediciones es un factor a considerar. Si el periodo es largo y la variable susceptible de cambios, ello puede confundir la interpretación del coeficiente de confiabilidad obtenido por este procedimiento. Y si el periodo es corto las personas pueden recordar cómo contestaron en la primera aplicación del instrumento, para aparecer como más consistentes de lo que son en realidad (Bohrnstedt, 1976) Ejemplo Práctico Tabla 1: Estimación del coeficiente de reaplicación (test-retest) confiabilidad de una prueba por el método de 1ª APLICACIÓN SUJETOS X X2 2ª APLICACIÓNX*Y Y Y2 1 35 1225 2 40 1600 3 20 400 4 30 900 5 33 1089 6 24 576 7 18 324 8 25 625 9 22 484 10 17 289 ∑ 264 7512 36 1296 1260 38 1444 1520 19 361 380 30 900 900 31 961 1023

www.full-ebook.com

22 484 528 20 400 360 25 625 625 24 576 528 17 289 289 262 7336 7413 En el Tabla 1, se presenta la simulación de dos aplicaciones de un instrumento a una muestra de 10 sujetos, con intervalo de dos semanas entre la primera y la segunda aplicación. Las Puntuaciones correspondientes a la primera aplicación aparecen debajo de la columna identificada con la letra X; mientras que las calificaciones de la segunda aplicación aparecen debajo de la columna Y. Para los fines de los cómputos necesarios para calcular el coeficiente de confiabilidad se calcularon los valores de X2, Y2 y XY. Luego se aplicó la fórmula para obtener el coeficiente de correlación por el método de los puntajes directos, el cual se expresa en la fórmula siguiente:

www.full-ebook.com

n∑xy−(∑x)(∑y)r= ∑x2−(∑x)2* n∑y2−(∑y)2n Donde: r : coeficiente de correlación las dos administraciones de la prueba n: número de sujetos ∑xy: resultado de sumar el producto de cada valor de X por su correspondiente valor en Y ∑X: suma total de valores de X (primera aplicación) ∑Y: suma total de valores de Y (segunda aplicación) ∑X2: resultado de sumar los valores de X elevados al cuadrado ∑Y2: resultado de sumar los valores de Y elevados al cuadrado (∑X)2 : Suma del total de valores de X, elevado al cuadrado. Sustituyendo los valores correspondientes en la fórmula, tenemos:

Por lo tanto el instrumento es confiable. EN EL SOFTWARE ESTADÍSTICO SPSS 1. Active la opción vista de variables de la ventana principal deSPSS 2. Ingrese las siguientes variables

3. A continuación Active la opción vista de datos de la ventana principal de SPSS

www.full-ebook.com

4. En seguida clic en ANALIZAR 5. Seleccione la opción ESCALA 6. Clic en ANÁLISIS DE FIABILIDAD

www.full-ebook.com

7. Aparecerá la siguiente ventana de diálogo donde deberá seleccionar las variables

8. Clic en el comando ESTADÍSTICOS, 9. A continuación active las casillas de correlación de la siguiente ventana

www.full-ebook.com

10. Clic en CONTINUAR 11. Finalmente ACEPTAR 12. Obtendrá los siguientes resultados, para el caso de nuestro ejemplo si es confiable el instrumento como se observa en el cuadro N° 01 Cuadro n° 01 Estadísticos de fiabilidad Parte 1 Valor .a N de elementos 1b Alfa de Cronbach Correlación entre formas Coeficiente de SpearmanBrown Dos mitades de Guttman Parte 2 Valor .a N de elementos 1c N total de elementos 2 .981 Longitud igual .990 Longitud desigual .990 .989 a. El valor es negativo debido a una covarianza promedio entre los elementos negativa, lo cual viola los supuestos del modelo de fiabilidad. Puede que desee comprobar las codificaciones de los elementos. b. El elemento es: X c. El elemento es: Y Parte 1 CorrelacionesParte 2interAmbaselementos partes a. El elemento es: X b. El elemento es: Y

www.full-ebook.com

Cuadro N° 02 Matriz de correlaciones inter-elementos X Y X 1.000 .981 Y .981 1.000 Cuadro N° 03 Estadísticos de resumen de los elementos Media Mínimo Varianza N de Máximo Rango Máximo/mínimo elementos .000 1.798E+308 .000 1a .000 1.798E+308 .000 1b .981 .981 .000 2 .981 .000 1.000 EJERCICIOS DE APLICACIÓN 1. Dada la tabla siguiente. Estudie la confiabilidad del instrumento, mediante la técnica de Test - Retest. Utilice el software estadístico SPSS N° Resultados 1 de Matemática Resultados 2 de Matemática 1 15 16 2 16 15 3 14 12 4 13 15 5 12 13 6 12 11 7 16 17 8 16 15 9 15 15 10 17 16 EJERCICIO RESUELTO 1. Dada las tablas siguientes. Estudie la confiabilidad del instrumento (cuestionario) mediante la técnica de Test - Retest. Utilice el software estadístico SPSS CUESTIONARIO1 VARIABLES EDAD1 GENERO1 GRADO1 CIVIL1 CONSUMO1

www.full-ebook.com

MARCA1 PRECIO1 CONSECUENCIA1 ITEMS ¿Cuál es su edad? ¿Cuál es su género? ¿Cuál es su grado de instrucción? ¿Cuál es su estado civil? ¿Cuántos cigarrillos consume diario? ¿Qué marca de cigarro fuma? ¿Cuánto gasta al mes por consumo? ¿Fumar es dañino para la salud? CUESTIONARIO2 (después de un periodo de tiempo) VARIABLES EDAD2 GENERO2 GRADO2 CIVIL2 CONSUMO2 MARCA2 PRECIO2 CONSECUENCIA2 ITEMS ¿Cuál es su edad? ¿Cuál es su género? ¿Cuál es su grado de instrucción? ¿Cuál es su estado civil? ¿Cuántos cigarrillos consume diario? ¿Qué marca de cigarro fuma? ¿Cuánto gasta al mes por consumo? ¿Fumar es dañino para la salud? a) Ingrese al programa SPSS b) Seleccione la opción INTRODUCIR DATOS NUEVOS c) A continuación active la opción VISTA DE VARIABLES ubicado en la parte inferior de su ventana principal. d) Proceda a LLENAR LAS VARIABLES Y ATRIBUTOS correspondiente a cada una de ellas tal como observa en la ventana siguiente:

www.full-ebook.com

e) En la pestaña VALORES correspondiente a cada variable asigne las siguientes ETIQUETAS para las variables mencionadas en la tabla. VARIABLE Género Grado de instrucción Estado civil Marca ETIQUETA 0 = Femenino 1 = Masculino 1 = No Tiene 2 = Primaria 3 = Secundaria 4 = Superior 1 = Casado 2 = Soltero 3 = Viudo 4 = Divorciado 1 = Lucky Strike 2 = Marlboro 3 = Blue 4 = Ducados 5 = Lm 6 = Pueblo Consecuencia 1 = Si 2 = No f) A continuación active la opción VISTA DE DATOS ubicado en la parte inferior izquierda de la venta principal y proceda al llenado de los datos tal como observa el cuadro inferior.

www.full-ebook.com

g) Clic en el menú ver y luego seleccione la opción etiqueta de valores para visualizar lo siguiente.

h) ¿Será confiable el instrumento?, Interprete y mencione los pasos del proceso de realización de confiabilidad en el software SPSS. 1. Clic en el menú ANALIZAR 2. Seleccione ESCALA 3. A continuación clic en ANÁLISIS DE FIABILIDAD 4. Visualizará la ventana siguiente (seleccionar las variables de cada periodo enviándolos a la ventana de elementos)

www.full-ebook.com

5. En la pestaña Modelo seleccione la opción DOS MITADES

6. Luego clic en el comando ESTADÍSTICOS donde visualizará la siguiente ventana

www.full-ebook.com

7. A continuación active la casilla correlaciones de la pestaña interelementos (tal como se observa en la ventana superior) 8. Clic en CONTINUAR 9. Luego ACEPTAR 10. Finalmente en una nueva c ventana se mostrará los siguientes. RESULTADOS Resumen del procesamiento de los casos N % Válidos 15 100.0 Casos Excluidosa 0 .0 Total 15 100.0

www.full-ebook.com

a. Eliminación por lista basada en todas las variables del procedimiento. Estadísticos de fiabilidad Parte 1 Valor -.103a N de elementos 8b Alfa de Cronbach Correlación entre formas Coeficiente de SpearmanBrown Dos mitades de Guttman Parte 2 Valor -.082a N de elementos 8c N total de elementos 16 .994 Longitud igual .997 Longitud desigual .997 .997 b. El valor es negativo debido a una covarianza promedio entre los elementos negativa, lo cual viola los supuestos del modelo de fiabilidad. Puede que desee comprobar las codificaciones de los elementos. INTERPRETACIÓN: El instrumento es confiable (muy alta confiabilidad 0,994)

EJERCICIOS PROPUESTOS 1. Se presenta una tabla de resultados de un instrumento de investigación que está compuesto de 18 ítems, que fue aplicada a un grupo piloto de 18 estudiantes

www.full-ebook.com

de la población. Cada ítems es evaluado mediante la escala de likert (1: Nunca, 2: Algunas veces, 3: Casi siempre, 4: Siempre). a) Calcule el coeficiente de Alfa de Cronbach. b) ¿El instrumento es confiable? c) Analice cada ítem del instrumento. Nº./items P1 P2 P3 P4 P5 P6 P7 P8 P9 P10 P11 P12 P13 P14 P15 P16 P17 P18 1 4 2 2 3 3 2 2 3 2 3 2 3 3 4 2 2 1 3 2 2 2 2 1 3 3 2 3 2 2 4 4 3 4 1 2 3 2 3 3 4 4 3 1 3 1 1 2 4 1 4 4 4 2 1 1 4 4 3 3 3 3 3 3 2 3 2 4 1 4 4 4 3 1 1 4 5 2 2 3 2 2 3 1 2 2 3 3 3 3 3 3 2 2 2 6 4 3 3 4 3 4 2 3 4 4 3 4 3 3 4 2 3 3 7 4 3 3 4 3 4 2 3 2 4 3 4 3 3 4 2 3 3 8 4 4 2 3 2 2 1 4 1 2 2 3 4 3 2 4 1 4 9 4 3 3 4 3 4 2 3 2 4 3 4 3 3 4 2 3 3 10 3 3 3 2 2 2 1 3 1 3 3 3 4 4 3 2 2 3 11 4 4 2 3 2 2 1 4 1 2 2 3 4 3 2 4 1 4 12 4 3 3 4 3 4 2 3 2 4 3 4 3 3 4 2 3 3 13 3 3 3 2 2 2 1 3 1 3 3 3 4 4 3 2 2 3 14 4 4 2 3 2 2 1 4 1 2 2 3 4 3 2 4 1 4 15 4 3 3 4 3 4 2 3 2 4 3 4 3 3 4 2 3 3 16 4 3 3 4 3 4 2 3 2 4 3 4 3 3 4 2 3 3 17 4 2 3 3 3 4 4 3 2 4 3 4 3 3 4 2 3 3 18 4 3 3 4 3 4 2 4 2 4 3 4 3 3 4 2 3 3

2. Se presenta el cuadro de resultados de un instrumento de investigación que está compuesto de 10 ítems, que fue aplicada a un grupo piloto de 10 estudiantes de la población. Cada ítems es evaluado mediante la forma dicotómica (1: Si y 0: No). Estudiante Item 1 Item 2 Item 3 Item 4 Item 5 Item 6 Item 7 Item 8 Item 9 Item 10 1 1 1 1 1 1 1 0 0 0 0 2 1 0 1 1 1 1 1 0 0 0 3 1 1 1 1 0 1 0 1 1 0 4 1 0 0 0 0 0 0 0 0 0 5 0 1 1 1 0 0 1 0 0 0 6 1 0 1 0 1 0 1 1 0 0 7 1 1 1 1 1 1 0 1 1 1 8 1 1 0 0 1 0 1 1 1 1 9 1 1 1 1 1 0 1 0 0 0 10 1 1 1 1 1 1 1 0 0 0

3. Calcule el coeficiente de Kuder-Richardson o KR20. 4. ¿El l instrumento es confiable? 5. Sean las variables:

www.full-ebook.com

V1: INSTRUMENTOS DE GESTIÓN INSTRUMENTOS DE GESTIÓN P1 P2 P3 P4 P5 P6 P7 P8 P9 P10 P11 P12 P13 P14 P15 1 3 2 1 1 2 2 1 1 2 1 3 1 3 1 1 2 1 1 1 1 1 1 3 1 1 1 1 1 1 1 1 3 1 2 1 1 1 1 2 1 2 1 1 2 1 1 1 4 2 1 2 1 2 1 1 1 1 1 2 2 1 2 1 5 1 2 1 1 2 1 2 1 2 1 2 1 2 2 2 6 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 7 3 2 1 3 3 3 1 1 1 1 3 3 2 3 2 8 1 3 1 1 3 1 3 3 1 1 1 3 1 3 1 9 2 2 1 1 3 1 2 2 1 2 2 2 2 2 2 10 1 2 1 1 1 1 1 1 1 1 1 1 1 1 1

V2: CALIDAD EDUCATIVA PLANIFICACIÓN LIDERAZGO CONTROL EVALUACIÓN P1 P2 P3 P4 P5 P6 P7 P8 P9 P10 P11 P12 P13 P14 P15 P16 P17 P18 P19 P20 P21 P22 P23 P24 P25 1 1 1 3 1 2 3 3 2 1 2 3 1 3 3 1 3 2 2 2 4 3 2 3 3 2 2 1 1 4 1 1 1 4 1 1 2 3 1 4 1 1 2 1 2 2 2 3 3 2 3 2 3 1 1 2 1 1 2 3 1 1 2 3 1 3 1 2 2 3 2 2 3 2 3 3 3 2 4 2 1 4 1 1 4 4 2 1 2 3 1 3 1 2 2 2 4 4 3 2 2 2 2 2 5 2 1 3 1 2 2 2 2 1 1 3 1 2 2 1 1 2 1 1 2 2 2 4 1 2 6 1 1 2 1 1 1 3 2 1 2 3 2 2 1 1 1 3 2 3 3 3 1 2 1 1 7 1 1 3 1 1 4 4 3 2 4 4 1 4 4 1 3 3 2 2 4 3 3 4 4 1 8 1 1 2 4 2 1 4 3 1 4 4 1 3 3 1 3 2 2 3 3 1 3 4 4 4 9 1 1 4 1 1 2 3 2 1 2 4 1 3 2 2 2 3 2 2 3 2 2 3 3 2 10 1 1 3 1 2 1 2 2 1 2 3 1 2 2 2 2 2 2 2 2 2 1 2 1 1

a) Elabore el estudio de confiabilidad de los instrumentos que se elaboraron teniendo en cuenta las variables instrumentos de gestión y calidad educativa

www.full-ebook.com

Capítulo III

www.full-ebook.com

PRUEBAS PARAMÉTRICAS PRUEBAS PARAMÉTRICAS Conceptualización Las pruebas paramétricas tienen mayor capacidad para detectar una relación real o verdadera entre dos variables, si es que la misma existe. Por ello, exigen que los datos a los que se aplican, cumplan tres requisitos: 1. Variable numérica: Que las variable de estudio (dependiente) esté medida en una escala que sea por lo menos de intervalo. 2. Normalidad: Que los valores de la variable dependiente sigan una distribución normal; por lo menos, en la población a la que pertenece la muestra. Kolmogorov Smirnov. 3. Homocedasticidad: Que las varianzas de la variable dependiente en los grupos que se comparan sean aproximadamente iguales (homogeneidad de las varianzas). Test de Levene. Observación: McGuigan (1993) y Siegel (1956) Sostienen que algunas escalas ordinales pueden ser consideradas por convención como numéricas y; por lo tanto, podría usarse una prueba paramétrica. Ejm: El rendimiento académico Ventajas de las Pruebas Paramétricas • Más poder de eficiencia. • Más sensibles a los rasgos de los datos recolectados. • Menos posibilidad de errores. • Robustas (dan estimaciones probabilísticas bastante exactas). Desventajas de las Pruebas Paramétricas • Más complicadas de calcular. • Limitaciones en los tipos de datos que se pueden evaluar

www.full-ebook.com

Sesión Nº 14 PRUEBA DE HIPOTESIS PARAMETRICAS TPEARSON A. COEFICIENTE DE CORRELACIÓN DE PEARSON (r) El valor del coeficiente de correlación de Pearson (r) determina si existe una relación lineal entre las variables de estudio. Sin embargo, no indica si esta relación es estadísticamente significativa. Para ello se aplica la prueba de hipótesis del parámetro p (rho). Como en todo prueba de hipótesis, la hipótesis nula (H0) establece que no existe una relación, es decir, que el coeficiente de correlación (p) es igual a 0. Mientras que la hipótesis alterna (H1), Propone que existe una relación significativa por lo que p debe ser diferente a cero.

www.full-ebook.com

∑xy−(∑x)(∑y)r= n ∑x2−(∑x)2 * n∑y2−(∑y)2n B. CONTRASTE DE HIPÓTESIS Según Mason Lind y Marshall mencionan que “existe un procedimiento de cinco pasos que sistematiza la prueba de hipótesis. Al llegar al paso 6 se tiene ya la capacidad de tomar la decisión de rechazar o no la hipótesis”. Ejemplo: Si se dispone de un cuadro con información ordenada de las mediciones, con 2 métodos distintos, de presión sistólica de 25 pacientes con hipertensión, ¿se puede establecer que existe una relación lineal significativa entre ambos métodos? PACIENTES MÉTODO I (X) MÉTODO II (Y) X^2 Y^2 X*Y 1 142 119 20164 14161 16898 2 158 134 24964 17956 21172 3 145 132 21025 17424 19140 4 146 140 21316 19600 20440 5 235 232 55225 53824 54520 6 138 140 19044 19600 19320 7 238 217 56644 47089 51646 8 229 218 52441 47524 49922 9 255 211 65025 44521 53805 10 219 216 47961 46656 47304 11 128 123 16384 15129 15744 12 138 132 19044 17424 18216 13 154 132 23716 17424 20328 14 174 124 30276 15376 21576 15 137 136 18769 18496 18632 16 134 119 17956 14161 15946 17 148 129 21904 16641 19092 18 146 146 21316 21316 21316 19 156 135 24336 18225 21060 20 134 132 17956 17424 17688 21 138 121 19044 14641 16698 22 252 221 63504 48841 55692 23 176 174 30976 30276 30624 24 153 146 23409 21316 22338 25 238 234 56644 54756 55692 TOTALES 4311 3963 789043 669801 724809

Paso 1: Primero se debe hallar el coeficiente de Pearson ( r ) • Valor de r en SPSS salió 0.951, el coeficiente de correlación indica una relación lineal directa intensa.

www.full-ebook.com

Paso 2: Planteamiento de la Hipótesis Nula (Ho) y de la Hipótesis (H1): H0:pxy=0 H1: pxy≠0 Paso 3: Establecer el nivel de confianza 95% Paso 4: Selección del nivel de Significación: (asumimos) α=0.05 Paso 5: Elección del valor estadístico prueba: El estadístico de prueba que revela si la hipótesis nula (H0) es o no verdadera es el siguiente:

n − 2 Tc= rxy1 − r2 xy grados de libertad (gl)= n-2

25 − 2 Tc= 0.95 1 − 0.952 Tc=14,59 Paso 6: Obtención del valor t crítico o t de la tabla conα=0.025 Tn-2 = 2.069 Paso 7: Formulación de la regla de decisión

www.full-ebook.com

• Para determinar si se rechaza o no la hipótesis nula(H0), se compara el valor de Tc con el valor hallado en la tabla (Tn-2) según el nivel de significancia y el grado de libertad (g.l) Paso 8: Representación Gráfica ZR

ZR ZA

-2.069 2,06914.59 Paso 9: Adopción de la decisión • Debido a que el valor de T-calculado, es mayor al valor hallado en la tabla (TCritico), entonces, tomamos la decisión de rechazar la hipótesis nula (H0) y aceptar la hipótesis alterna. Paso 10: Conclusión Se concluye que si existe una relación lineal significativa entre ambos métodos de estudio Ejercicios de aplicación: 1. En un salón de clase de 35 alumnos del IV ciclo de la Universidad Nacional de Educación la Cantuta, se tomó una muestra al azar de 10 alumnos. Se obtuvo la información del número de horas de estudio semanal (x) y las calificaciones (y) en un examen de estadística aplicada a la investigación. Los datos son los siguientes: x 2 2 3 3 3 4 4 5 5 5 y 08 10 11 14 13 15 13 13 15 17 Se pide: a. Halle el coeficiente de correlación de PEARSON b. Construye el diagrama de dispersión c. Construya el contraste de hipótesis e intérprete

www.full-ebook.com

2. Existe relación significativa entre la variable inteligencia(x) y la variable rendimiento académico (y) x y 105 4 116 8 103 2 124 7 137 9 126 9 112 3 129 10 118 7 105 6 Se pide: a. Realizar el contraste de hipótesis e intérprete Tabla de T-Pearson para una y dos colas Para dos colas 0,05 0,025 0,01 0,0005gl Para una cola 0,10 0,05 0,02 0,01 1 6,314 12,706 31,821 63,657 2 2,920 4,303 6,965 9,925 3 2,353 3,182 4,541 5,841 4 2,132 2,776 3,747 4,604 5 2,015 2,571 3,365 4,032 6 1,943 2,447 3,143 3,707 7 1,895 2,365 2,998 3,499 8 1,860 2,306 2,896 3,355 9 1,833 2,262 2,821 3,250 10 1,812 2,228 2,764 3,169 11 1,796 2,201 2,718 3,106 12 1,782 2,179 2,681 3,055 13 1,771 2,160 2,650 3,012 14 1,761 2,145 2,624 2,977 15 1,753 2,131 2,602 2,947 16 1,746 2,120 2,583 2,921 17 1,740 2,110 2,567 2,898 18 1,734 2,101 2,552 2,878 19 1,729 2,093 2,539 2,861 20 1,725 2,086 2,528 2,845 21 1,721 2,080 2,518 2,831 22 1,717 2,074 2,508 2,819

www.full-ebook.com

23 1,714 2,069 2,500 2,807 24 1,711 2,064 2,492 2,797 25 1,708 2,060 2,485 2,787 26 1,706 2,056 2,479 2,779 27 1,703 2,052 2,473 2,771 28 1,701 2,048 2,467 2,763 29 1,699 2,045 2,462 2,756 30 1,697 2,042 2,457 2,750 40 1,684 2,021 2,423 2,704 60 1,671 2,000 2,390 2,660 120 1,658 1,980 2,358 2,617 ∞ 1,645 1,960 2,326 2,576

www.full-ebook.com

Sesión Nº 15 PRUEBA T PARA MUESTRAS INDEPENDIENTES: Esta prueba permite comparar las medias de dos grupos de casos: los sujetos deben asignarse aleatoriamente a dos grupos, de forma que cualquier diferencia en la respuesta sea debida al tratamiento o falta de tratamiento y no a otros factores. Aplicación Práctica “NTIC, como estrategia metodológica para mejorar el Aprendizaje de las matemáticas en los alumnos del 4to grado de Educación Secundaria de la Institución Educativa Estatal San DiegoUGEL Nº 03 Pueblo Libre-2012” Pasos: 1. Planteamiento de la hipótesis:

Ha : µ≠ µ 1 2

Ho : µ= µ 1 2

µEnseñanza con NTIC en el cuarto grado de secundaria “E” 1 µEnseñanza sin NTIC en el cuarto grado de secundaria “C” 2

Ha : El nivel de aprendizaje de las matemáticas, en los alumnos del cuarto grado de secundaria “E”, es diferente que el aprendizaje en los alumnos del cuarto grado de secundaria “C”. Ho : El nivel de aprendizaje de las matemáticas, en los alumnos del cuarto grado de secundaria “E”, es igual al aprendizaje que el de los alumnos del cuarto grado de secundaria “C”. CUADRO DE RESULTADOS DE EVALUACIÓN DE SALIDA: CUARTO “E” N CUARTO GRADO DE SECUNDARIA “E”

www.full-ebook.com

EXAMEN DE SALIDA 1 Estudiante 1 16 2 Estudiante 2 18 3 Estudiante 3 19 4 Estudiante 4 16 5 Estudiante 5 17 6 Estudiante 6 18 7 Estudiante 7 16 8 Estudiante 8 15 9 Estudiante 9 17 10 Estudiante 10 14 11 Estudiante 11 18 12 Estudiante 12 9 13 Estudiante 13 17 14 Estudiante 14 15 15 Estudiante 15 15 16 Estudiante 16 7 17 Estudiante 17 17 18 Estudiante 18 15 19 Estudiante 19 18 20 Estudiante 20 14 21 Estudiante 21 15 22 Estudiante 22 9 23 Estudiante 23 16 24 Estudiante 24 16 25 Estudiante 25 10 26 Estudiante 26 15 27 Estudiante 27 17 28 Estudiante 28 17 CUADRO DE RESULTADOS DE EVALUACIÓN DE SALIDA: CUARTO “C” N CUARTO GRADO DE SECUNDARIA ”C” EXAMEN DE SALIDA 1 Estudiante 1 12 2 Estudiante 2 11 3 Estudiante 3 13 4 Estudiante 4 11 5 Estudiante 5 11

www.full-ebook.com

6 Estudiante 6 12 7 Estudiante 7 12 8 Estudiante 8 14 9 Estudiante 9 13 10 Estudiante 10 14 11 Estudiante 11 15 12 Estudiante 12 13 13 Estudiante 13 14 14 Estudiante 14 13 15 Estudiante 15 10 16 Estudiante 16 14 17 Estudiante 17 13 18 Estudiante 18 15 19 Estudiante 19 15 20 Estudiante 20 12 21 Estudiante 21 18 22 Estudiante 22 14 23 Estudiante 23 12 24 Estudiante 24 15 25 Estudiante 25 11 26 Estudiante 26 17 27 Estudiante 27 15 28 Estudiante 28 14 2. Establecer el nivel de significancia Nivel de significanciaα=0,05 = 5% 3. Elección de la prueba estadística Como las varianzas son desconocidas, y desiguales; además n50), o determinando la prueba de shapirowilk (n
View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF