ESTADISTICA SPSS UPSJB
February 11, 2017 | Author: Eros Ramazotti | Category: N/A
Short Description
Download ESTADISTICA SPSS UPSJB...
Description
ESTADÍSTICA APLICADA A LA INVESTIGACIÓN
Dr.. Javier Casimiro Urcos
La Investigación Científica ¿Qué es la investigación científica? Es la búsqueda sistematizada y objetiva nuevos conocimientos.
de
El método científico, comprende realizar la investigación en forma sistematizada y objetiva, organizada y coherente.
Etapas de la Investigación Científica Planificación: Elaboración del proyecto. Abarca una descripción detallada y fundamentada de cada una de las actividades a desarrollarse en la investigación. Ejecución: Es la etapa en la cual se lleva a cabo la investigación. Recolección de datos, análisis e interpretación. Informe: Escrito donde se presentan los hallazgos encontrados.
REFLEXIONEMOS EL ÚLTIMO DESEO DE ALEJANDRO EL GRANDE Encontrándose al borde de la muerte, Alejandro convocó a sus generales y les comunicó su último deseo: Que su ataúd fuese llevado en hombros y
transportado por los mejores médicos de la época
REFLEXIONEMOS Uno de sus generales, asombrado por tan insólitos deseos, le preguntó a Alejandro cuáles eran sus razones. Alejandro le explicó: “Quiero
que los más eminentes médicos carguen mi ataúd para así mostrar que ellos NO tienen, ante la muerte, el poder de curar”.
¿Qué es Estadística ? RECOLECTAR
ORGANIZAR
Es una ciencia científica que comprende diversas técnicas para :
ANALIZAR
INTERPRETAR
DATOS A esta secuencia se llama proceso estadístico.
RECUERDE QUE La selección de una técnica estadística adecuada está determinada por el diseño experimental, la o las hipótesis y los datos recogidos
LA ESTADÍSTICA SE DIVIDE EN DOS GRANDES RAMAS: ESTADISTICA DESCRIPTIVA.- Entendida como la parte que se encarga de la recolección y elaboración de datos, es decir: clasificación, presentación de la información y el cálculo de medidas de tendencia central y dispersión.
ESTADISTICA INFERENCIAL.- Permite tomar decisiones y/o predecir fenómenos con respecto a las características de la población en base a la información de la muestra extraída de la población en estudio.
¿Qué es la RECOLECCIÓN de datos ? Es el registro de características (medición, observación, conteo) de una unidad elemental (o de análisis).
¿Qué es la ORGANIZACIÓN de datos ? Es el ordenamiento para una mejor comprensión y facilitar sus análisis. (tablas, gráficos y figuras)
Los datos sin organizar se llaman datos brutos, y son de poca utilidad.
¿Qué es el ANALISIS de datos ? Es el cálculo de medidas representativas (o de resumen) tales como promedios, medidas de variabilidad y medidas de la forma de la distribución. También se analizan datos cuando se establecen relaciones entre ellos (regresión y correlación).
¿Qué es la INTERPRETACIÓN de datos ?
Es darle un sentido práctico o útil a los resultados obtenidos en el análisis.
¿Qué son los DATOS ? Son los registros de una característica. Ejemplo : Unidad de Características Datos medida años 27 Edad del paciente Kg. 3,750 Peso del recién nacido días 5 Tiempo permanencia °C 37,5 Temperatura corporal --Docente Profesión Si un DATO es útil para tomar decisiones se convierte en INFORMACIÓN.
¿Por qué necesitamos recolectar datos? Proporcionan la evidencia imprescindible en un estudio de investigación.
Permiten medir el desempeño en el proceso de producción de un bien o servicio. Satisfacen nuestra curiosidad innata.
DEFINICIÓN DE ALGUNOS TERMINOS ESTADÍSTICOS UNIDAD DE ANALISIS.- Llamada también elemento de la población: es la unidad de la cual se obtiene el dato estadístico; también se le denomina como la unidad indivisible y es el objeto de estudio.
Ejemplo: Puede ser una persona, vivienda, animal, etc. POBLACION.- Es el conjunto de personas u objetos con una característica o atributo especial cuantificable, en un periodo y en un lugar determinado.
•Número de maestristas que estudian en la UNDAC sede Cañete •Número de turistas que llegaron a Mollendo al 31 de Diciembre del 2008 •Número de estudiantes del 5° grado de secundaria en Cerro de Pasco al 31 de Julio del 2011 •Número de pacientes menores de 10 años en terapia de rehabilitación del Hospital del Niño
DEFINICIÓN DE ALGUNOS TERMINOS ESTADÍSTICOS MUESTRA.- Es un Subconjunto de la población que se obtiene con la finalidad de estudiar las características comunes de la población y debe ser representativa con un tamaño apropiado.
DEBEMOS CONSIDERAR LO SIGUIENTE: Toda investigación lleva implícito en la fase de diseño la
determinación del tamaño muestral necesario para la ejecución del mismo . El no realizar dicho proceso, puede llevarnos a dos situaciones diferentes: 1. Que realicemos el estudio sin el número adecuado de pacientes, con lo cual no podremos ser precisos al estimar los parámetros y además no encontraremos diferencias significativas cuando en la realidad sí existen. 2. Que podríamos estudiar un número innecesario de pacientes, lo cual lleva implícito no solo la pérdida de tiempo e incremento de recursos innecesarios sino que además la calidad del estudio, dado dicho incremento, puede verse afectada en sentido negativo.
¿PORQUÉ CALCULAR EL TAMAÑO DE MUESTRA?
Las muestras pueden estudiarse con mayor rapidez que las poblaciones. El estudio de una muestra es menos costosa que el de una población. Toma menos tiempo su estudio En la mayoría de las situaciones el estudio de una población es imposible. Con frecuencia los resultados de una muestra son más precisos que los que se basan en una población.
TAMAÑO DE MUESTRA PARA ESTIMAR PARÁMETROS A PARTIR DE UN GRUPO
TAMAÑO DE MUESTRA PARA UNA PROPORCIÓN a. Población Infinita
2
Z . p.q n 2 d Z = Valor de Z para la seguridad o nivel de confianza. Generalmente 95% (=0,05). p = Proporción (prevalencia) de la variable. De literatura, Prueba Piloto o maximizar con p = 0,05. q=1–p d = Precisión depende del Investigador. Costo y tiempo.
LOS VALORES ZA SEGÚN LA SEGURIDAD Y ZB SEGÚN EL PODER SE INDICAN EN LA TABLA Tabla 2. Valores de Z y Zb más frecuentemente utilizados Z
Test unilateral
Test bilateral
0.200 0.150 0.100 0.050 0.025 0.010
0.842 1.036 1.282 1.645 1.960 2.326
1.282 1.440 1.645 1.960 2.240 2.576
Potencia b
(1-b)
Zb
0.01 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50
0.99 0.95 0.90 0.85 0.80 0.75 0.70 0.65 0.60 0.55 0.50
2.326 1.645 1.282 1.036 0.842 0.674 0.524 0.385 0.253 0.126 0.000
Ejemplo 1 •Se desea conocer la prevalencia de TBC del distrito de la Victoria ¿A cuántas personas se debe estudiar? Se debe tener en cuenta que la prevalencia aproximada en la población es de alrededor del 5%, se desea tener una precisión del 3% y un nivel de confianza del 95% (α=0,05).
b. Población Finita 2
N .Z . p.q n 2 2 d .(N 1) Z . p.q N = Tamaño de la Población de estudio
PRACTICA 2: Sabiendo que la población del distrito limeño de la Victoria es de 198000 habitantes (Fuente INEI,2007), determinar el tamaño muestral para personas infectadas con tuberculosis, con una seguridad del 95% y una precisión del 3%, teniendo en cuenta que la proporción de TBC es del 5%.
TAMAÑO DE MUESTRA PARA ESTIMAR UN PROMEDIO O MEDIA a. Población Infinita 2
Z .S n 2 d
2
S = Desviación estándar. A partir de la bibliografía o prueba piloto.
PRACTICA 3
Si deseamos conocer la media de la glucemia basal de una población, con una seguridad del 95 % y una precisión de ± 3 mg/dl y tenemos información por un estudio piloto o revisión bibliográfica que la varianza es de 250 mg/dl. Hallar el tamaño muestral medial
…para estimar un promedio o media
b. Población Finita 2
2
N .Z .S n 2 2 2 d ( N 1) Z .S N = Tamaño de la Población de estudio
EJEMPLO 4 Se desea conocer el tamaño de muestra para analizar la glucemia basal de los alumnos de la Facultad de Medicina Veterinaria de la Universidad Nacional de San Marcos, sabiendo que la población es de 4000 alumnos, el nivel de confianza es del 95%, se desea una precisión de 3 mg/dl y se sabe por estudios anteriores que la varianza es de 200 mg/dl.
TAMAÑO DE MUESTRA PARA COMPARAR DOS GRUPOS
TAMAÑO DE MUESTRA PARA COMPARAR DOS PROPORCIONES
Z . 2p(1 p) Z . p (1 p ) p (1 p ) n
2
α
β
1
(p1 p 2 )
1
2
2
2
Zα = Valor correspondiente al riesgo. Valores Zα Zβ = Valor correspondiente al poder o potencia. Potencia .Valores Zβ (es recomendable que esté entre el 80 a 90%) P = Promedio de las proporciones (p1+p2)/2 P1 = Proporción o frecuencia en los casos, grupo de referencia, placebo, control o tratamiento habitual P2 = Proporción o frecuencia en los controles, otro grupo, el grupo del nuevo tratamiento, intervención o técnica.
PRACTICA 5 Deseamos evaluar si el Tratamiento T2 es mejor que el tratamiento T1 para el alivio del dolor para lo que diseñamos un ensayo clínico. Sabemos por datos previos que la eficacia del fármaco habitual está alrededor del 70% y consideramos clínicamente relevante si el nuevo fármaco alivia el dolor en un 90%. Nuestro nivel de riesgo lo fijamos en 0.05 y deseamos un poder estadístico de un 80%.
TAMAÑO DE MUESTRA PARA COMPARAR DOS MEDIAS 2( Z Z b ) * s 2
n
d
2
2
S2 = Varianza de la variable cuantitativa que tiene el grupo control o de referencia. d = Valor mínimo de la diferencia que se desea detectar (datos cuantitativos)
PRACTICA 6 Deseamos utilizar un nuevo fármaco antidiabético y consideramos que seria
clínicamente eficaz si lograse un descenso de 15 mg/dl respecto al tratamiento habitual con el antidiabético estándar. Por estudios previos sabemos que la varianza de la glucemia en pacientes que reciben el tratamiento habitual es de 16 mg/dl. Aceptamos un riesgo de 0.05 y deseamos un poder estadístico de 90% para detectar diferencias si es que existen.
TAMAÑO DE MUESTRA AJUSTADO A LAS PÉRDIDAS En todo proyecto se deben considerar imprevistos que pueden hacer que el tamaño de muestra calculada inicialmente se vea afectada ya sea por que el sujeto de estudio se mudó, no desea participar, abandona, viaja, etc.
Se emplea la siguiente fórmula:
n nc 1 pe Donde: nc = muestra corregida n = Muestra calculada Pe = Porcentaje de pérdidas
MUESTREO El muestreo es el proceso mediante el cual el investigador podrá seleccionar los pacientes o sujetos de estudio a partir de la muestra calculada previamente. Si el muestreo no se realiza con criterio, los resultados de la investigación no serán válidos, ya que se pueden cometer errores de sesgo o
de imparcialidad al momento de elegir los sujetos.
TIPOS DE MUESTREO
Probabilístico (Aleatorio)
No Probabilístico
Aleatorio Simple
Accidental
Sistemático
Por conveniencia
Estratificado
Por cuotas
Por conglomerados
Bola de Nieve
MUESTREO PROBABILÍSTICO
También se conoce como muestreo aleatorio, la característica de este muestreo es que todos los sujetos de la población de estudio tienen la misma probabilidad de ser seleccionados para formar parte de la muestra.
1. MUESTREO ALEATORIO SIMPLE (MAS) - Cada unidad tiene la probabilidad equitativa de ser incluida en la muestra. - Lista de todos los individuos de la población de estudio: “marco muestral”. - Selección al azar (tablas de números aleatorios, calculadoras, software).
Procedimiento 1. Elaborar el listado de pacientes (Población de estudio) sin ningún ordenamiento en particular. 2. Generar tantos números aleatorios como el tamaño de la muestra (n). Cuyos valores deben estar entre 1 y N. 3. Elaborar el listado de la muestra, seleccionando los pacientes de acuerdo con la ubicación proporcionada por los números aleatorios.
I Listado : N =600 1
2 3 4 : : 600 II Tamaño de n = 40 III Tabla números aleatorios IV
Selección
….tipos de Muestreo Probabilístico
2. MUESTREO SISTEMÁTICO
Se selecciona individuos del marco muestral a intervalos regulares. Ejemplo 5, 10, 15, 20, 25, ............
Lleva a sesgo de selección si el marco muestral está distribuido siguiendo algún patrón particular.
…..Muestreo Sistemático
Procedimiento 1. Elaborar el listado de pacientes sin ningún ordenamiento. 2. Calcular el intervalo con la siguiente fórmula:
i listado de N = 600 ii Tamaño: n = 40 iii Rango: N/n = 600/40
N k n
Redondear al entero inferior 3. Seleccionar aleatoriamente el número de inicio de la serie con una urna de números del 1 hasta k. 4. Elaborar la lista de la muestra seleccionando los pacientes de acuerdo con la ubicación proporcionada por los números del intervalo.
k = 15 iv Selección: 1
1º 3
2
2º 18
3
3º 33 4
600
Tipos de Muestreo
…tipos de Muestreo Probabilístico
3. MUESTREO ESTRATIFICADO
- Este tipo de muestreo se emplea cuando se tiene interés en que la muestra sea la más representativa
posible en lo que se refiere a subgrupos de interés relacionados con variables confusoras o que podrían crear sesgo a la investigación por ejm. Sexo, edad, situación laboral, etc. El marco poblacional se divide en grupos homogéneos (estratos); de cada uno se extrae una submuestra, proporcional al tamaño del estrato.
…Muestreo Estratificado
1. 2.
3.
4. 5. 6.
Procedimiento
Determinar la característica de los estratos o la composición de los estratos. Si se conoce el porcentaje de los estratos, distribuir porcentualmente el tamaño de muestra en los estratos. Si se conoce la cantidad de individuos en cada estrato, se calcula el factor de proporción con la siguiente fórmula: K = n/N. El cual se multiplica por la cantidad respectiva en los estratos. Seleccionar aleatoriamente los individuos en cada estrato. Elaborar la lista de la muestra por cada estrato
I Listado : N II Tamaño: n III Divide N en estratos o subpoblaciones NA
nA
NB
nB
NC
nC n
n nA n n B C N A N B NC N
IV Selección: a) sistemática b) aleatoria
…Muestreo Estratificado
Ejemplo: n = 140 Estrato
K = n / N = 140 / 1500 = 0.093333
Cantidad Muestra Porcentaje
Mujeres
1100
103
73.33 %
Varones
400
37
26.67 %
Total
1500
140
100 %
Tipos de Muestreo
…Tipos de Muestreo Probabilístico
4. MUESTREO POR CONGLOMERADOS
También se denomina de etapas múltiples. Se utiliza para poblaciones grandes y dispersas. No es posible disponer de un listado. En lugar de individuos se seleccionan conglomerados que están agrupados de forma natural (cuadras de casas, departamentos, hospitales, provincias, etc.) Se selecciona en primer lugar el conglomerado más alto, a partir de éste se selecciona un subgrupo. A partir de este subgrupo se selecciona otro subgrupo y así sucesivamente, hasta llegar a las unidades de análisis.
…Muestreo por conglomerados
Ejemplo. Si se desea estudiar a los hipertensos atendidos en los hospitales de nivel I de ESSALUD. Nuestro primer conglomerado serían las regiones o departamentos, a partir de estas regiones aleatoriamente seleccionar un subgrupo. Del subgrupo anterior formar un nuevo conglomerado de segunda etapa con las provincias. De este conglomerado seleccionar aleatoriamente un subgrupo de provincias. De este subgrupo de provincias formar un conglomerado de hospitales de Nivel I. Luego seleccionar aleatoriamente un subgrupo de Hospitales. A partir del grupo de hospitales hacer un listado de los pacientes hipertensos luego realizar muestreo aleatorio. Tipos de Muestreo
MUESTREO NO PROBABILÍSTICO
No existe el criterio de que todos los sujetos tengan la misma posibilidad de ser elegidos para formar parte de la muestra, ya que en este tipo de muestreo hay uno o más Criterios de decisión por parte del investigador para que un determinado sujeto pueda o no formar parte del estudio. Tipos de Muestreo
1. MUESTREO ACCIDENTAL
Se hace sobre la base de la presencia o no, en un lugar y momento determinados. Aunque se parece a un muestreo probabilístico, no todas las personas tienen la misma probabilidad de estar en el momento y lugar donde se seleccionan a los sujetos.
Ejemplo: Se quiere investigar sobre el efecto de un nuevo tratamiento en el caso de heridas punzocortantes. En este caso los pacientes tienen que ser contactados a medida que sean atendidos en el centro de salud en particular. Tipos de Muestreo
2. MUESTREO POR CONVENIENCIA
El investigador decide en base a los
conocimientos de la población, quienes son los que deben formar parte de la muestra. Se tiene en cuenta los criterios de inclusión y exclusión, los cuales deben estar bien establecidos y se deben cumplir rigurosamente.
Ejemplo. Si se quiere evaluar un tratamiento sobre la hipertensión, tal vez sea conveniente no considerar a los que tienen sobrepeso o estén desnutridos.
Tipos de Muestreo
3. MUESTREO POR CUOTAS La muestra se selecciona tomando en cuenta características (variables) específicas de la población. Tiene similitud con el muestreo estratificado solo que en este caso la selección dentro de cada cuota (estrato) se hace de manera accidental. Generalmente se usa para encuestas de opinión y mercado.
Ejemplo. De una muestra de 200 personas el investigador puede estar interesado que el 50 sean varones de 15 a 25 años, 50 mujeres de 15 a 20 años, 50 amas de casa y 50 mujeres profesionales.
Tipos de Muestreo
4. MUESTREO POR “BOLA DE NIEVE”
Se utiliza cuando la población es de difícil acceso por razones sociales (prostitutas, alcohólicos, drogadictos, etc.) En este caso se contacta con una persona del grupo a estudiar, puede ser el líder de una pandilla, el amigo de un colaborador, etc. Y a partir de éste se poco a poco se va llegando a un número mayor de individuos.
Tipos de Muestreo
DEFINICIÓN DE ALGUNOS TERMINOS ESTADÍSTICOS VARIABLE Es toda característica que se desea evaluar de las unidades de análisis. Se representa por letras mayúscula del alfabeto.
de
Ejemplo: X: Número de hijos de una familia del distrito Bellavista. Y: Sexo de un grupo de alumnos del C.E 1197.
DEFINICIÓN DE ALGUNOS TERMINOS ESTADÍSTICOS TIPO DE VARIABLE 1.VARIABLE
CUANTITATIVA: numérica, pueden ser:
Se
expresan
en
forma
Variable Cuantitativa Discreta (VCD): Toman valores enteros positivos en sus observaciones. Se registran por conteo. Ejemplo: X: número de hijos de una familia del distrito de Bellavista.
DEFINICIÓN DE ALGUNOS TERMINOS ESTADÍSTICOS Variable Cuantitativa Continua (V.C.C): Asume cualquier valor numérico en un intervalo continuo. Se obtienen con el uso de instrumentos de medición: Balanzas, termómetros, etc. Ejemplo: Z: peso (en gr) de los alumnos del 4° grado de primaria del Centro Educativo “Miguel Grau” de Chorrillos 2.
VARIABLE CUALITATIVA: Los resultados no pueden ser expresados en forma numérica. A las observaciones cualitativas se le llama atributos. Se subdividen en :
DEFINICIÓN DE ALGUNOS TÉRMINOS ESTADÍSTICOS Variable Cualitativa Nominal (V.C.N): En esta variable no se pueden establecer un orden entre las posibles observaciones. Ejemplo: X: razas de los conejos del criadero de la UNA. Variable Cualitativa Jerárquica (V.C.J): En ésta se pueden establecer un orden entre sus atributos. Ejemplo: X: Grado de instrucción de un ciudadano del distrito de Bellavista.
DEFINICIÓN DE ALGUNOS TERMINOS ESTADÍSTICOS Observación: Es el dato o registro realizado, producto de la apreciación de una característica de un individuo o unidad experimental. Se representa con letras minúsculas con sus respectivos subíndices. Ejemplo: X1: 18 hijos Y2: 20 manzanas.
W1: La Molina T 2 : Inferior.
DEFINICIÓN DE ALGUNOS TÉRMINOS ESTADÍSTICOS PARAMETRO: Es una medida descriptiva que resume una característica de la población, es decir es una función de todas las observaciones de una población.
• •
• •
Un parámetro es un valor único, se le llama incógnita (lo que el investigador desea conocer). Se denota por letras griegas. Ejemplos: Media poblacional : µ Varianza poblacional : σ2 Mediana poblacional : Me Moda poblacional : Mo
DEFINICIÓN DE ALGUNOS TERMINOS ESTADÍSTICOS
•
VALOR ESTADISTICO O ESTADIGRAFO: Es una medida descriptiva que resume una característica de la muestra y no depende de parámetro alguno. Se caracteriza porque puede tomar valores diferentes de muestra a muestra, debido a que las observaciones captadas en muestras diferentes no son necesariamente iguales. Ejemplo: Media muestral : X
•
Varianza muestral
: S2
•
Mediana muestral Moda muestral
: me : mo
•
ETAPAS DE UN TRABAJO ESTADÍSTICO Definición del problema y objetivos de la investigación. Formulación del plan de recopilación de datos Recopilación de datos. Datos de calidad. Clasificación, análisis e interpretación. Clasificar la información según sus características. Generalización e inferencia aplicando métodos de inferencia estadística, las conclusiones son generalizadas a la población.
SUMATORIAS Definición.- Representación algebraica simplificada de la suma ordenada de un conjunto de elementos. Ejemplo: Variable: Número de hijos de una familia del distrito de Bellavista, los resultados de familias elegidas al azar son: Número de hijos: 3, 1, 4, 2 La suma de los valores de las 4 observaciones se puede
expresar así: S= x1+x2+x3+x4
4
S i 1
x
i
PRESENTACIÓN DE DATOS Los datos pueden presentarse de dos formas: TABULAR Y GRÁFICA. Teniendo en cuenta que el instrumento más usado para recolectar información para un determinado estudio es el CUESTIONARIO; es preciso indicar que la tarea siguiente es el trabajo de campo, la crítica y la codificación correspondiente, luego la organización de la información para poderla resumir (Organizarla en categoría o grupos mutuamente excluyentes) antes de la presentación tabular.
MEDICIÓN DE LOS DATOS A NIVEL NOMINAL U ORDINAL
Estos pueden ser clasificados como: 1. Grupo de personas teniendo en cuenta el sexo 2. Grupo de personas teniendo en cuenta su estado civil 3. Grupo de personas teniendo en cuenta su estado socioeconómico
MEDIDAS DE TENDENCIA CENTRAL LA MEDIA Es la que se obtiene sumando los datos y dividiéndolos por el número de ellos. También es conocido como la media aritmética. LA MEDIANA Corresponde al percentil 50%. Es decir la mediana divide a la población exactamente en dos. Por ejemplo el número mediana de hijos en el centro de salud de Talavera es 2. LA MODA. Es el valor o los valores que aparecen con mayor frecuencia. Una distribución unimodal tiene una sola moda y una distribución bimodal tiene dos. Es útil como medida de resumen para las variables nominales. Ejemplo:
Hallar la Media, Mediana y Moda de la Variable Edad
MEDIDAS DE DISPERSION
Para describir y analizar ampliamente el comportamiento de una distribución de frecuencias no es suficiente obtener los valores centrales si no, además, algunos otros valores que nos permitan tener una idea sobre la dispersión o diseminación de los datos. Las medidas de dispersión tienen por objeto medir como los valores de las observaciones están esparcidos o dispersos alrededor de los valores centrales (principalmente de la media y la mediana).
.La Varianza
El cociente que resulta de dividir la suma de los cuadrados de las diferencias entre los valores individuales y la media aritmética por el número de observaciones se denomina VARIANZA ( V [X] o S² Tiene como finalidad minimizar la suma de las observaciones al cuadrado. Tiene mucha importancia en el diseño de las muestras y también para comparar 2 o más distribuciones.
.La Desviación Estándar Se le define como la raíz cuadrada de la varianza. Es la medida más importante entre todas aquellas que miden el grado de dispersión de los datos. Se le designa como (V(x) o S):
S = √ S² La S es la unidad de medida de dispersión, es decir mide el grado de alejamiento de las observaciones
ERROR TÍPICO DE LA MEDIA Cuando estimamos un parámetro, en este caso la media, a partir de los resultados obtenidos en muestras de un determinado tamaño (n) los valores que toma el estadístico aquí la media en las diferentes muestras varía. A la desviación típica de los valores que toma el estadístico se le denomina error típico del estadístico en cuestión
MEDIDAS DE POSICIÓN 1. PERCENTILES: Son 99 valores que dividen en 100 partes iguales el conjunto de datos ordenados. Ejemplo. El percentil de orden 15 deja por debajo al 15% de las observaciones, y por encima queda el 85% 2. CUARTILES: Son los tres valores que divide Al conjunto de datos ordenados en cuatro partes iguales; son un caso particular de los percentiles. Se denotan como Q1 o primer cuartil, Q2 segundo cuartil (La mediana) y Q3 tercel cuartil 3.DECILES: Son los nueve valores que dividen al conjunto de datos ordenados en diez partes iguales. Es también un caso particular de los percentiles
MEDIDAS DE FORMA 1.
SIMETRÍA: Una distribución es simétrica cuando la mediana, moda y media aritmética coinciden
M Me Mo
MEDIDAS DE FORMA 1.
Existen varias medidas de la asimetría de una distribución de frecuencias. Una de ellas es el coeficiente de Asimetría de Pearson. Su valor es cero cuando la distribución es simétrica, positivo cuando existe asimetría a la derecha y negativo cuando existe asimetría a la izquierda ASIMETRÍA:
MEDIDAS DE FORMA 3.
CURTOSIS O APUNTAMIENTO. La curtosis es una medida de la forma que busca cuantificar la mayor o menor concentración de frecuencias alrededor de la media y en la zona central de la distribución. Se mide con el coeficiente de apuntamiento o curtosis. Su valor es cero cuando la distribución es MESOCÚRTICA, positivo cuando es LEPTOCÚRTICA y negativo cuando es PLATICÚRTICA
GRÁFICAS
1. Para variables categóricas a. Diagrama de sectores Se toma un círculo y se divide en tantos sectores como categorías tenga nuestra variable, siendo el arco del círculo proporcional a las frecuencias absolutas (también lo podemos hacer con las frecuencias relativas o porcentajes). Es ideal para variables dicotómicas o politómicas de menos cuatro o menos categorías.
1. Para variables categóricas b. Gráfico de barras
Es una representación bidimensional con las categorías dispuestas paralelamente de manera que la extensión de cada barra es proporcional a la magnitud que se quiere representar. Es ideal para variables politómicas de o incluso para variables de categorías no excluyentes.
2. Para variables numéricas a. Histograma Se utiliza cuando se estudia una variable continua, como la edad o la talla y, por comodidad, sus valores se agrupan en clases, es decir, valores continuos. En los casos en los que los datos son cualitativos (nonuméricos), como sexto grado de acuerdo o nivel de estudios, es preferible un gráfico de barras.
2. Para variables numéricas b. Diagrama de caja y bigotes Gráfico basado en cuartiles, compuesto por un rectángulo, la "caja", y dos brazos, los "bigotes". Es un gráfico que suministra información sobre los valores mínimo y máximo, los cuartiles Q1, Q2 o mediana y Q3, y sobre la existencia de valores atípicos y la simetría de la distribución.
ESTADÍSTICA INFERENCIAL
CONCEPTO
Inferencia es el método estadístico que tiene por objetivo inferir y estimar un parámetro poblacional a partir de las estadísticas muestrales.
CALCULO DE UN INTERVALO DECONFIANZA En estadística se llama intervalo confianza de a un par de números entre los cuales se estima que estará un cierto valor desconocido con una determinada probabilidad de acierto. Formalmente estos números determinan un intervalo, que se calcula a partir de datos de una muestra y el valor conocido es un parámetro poblacional. La probabilidad de éxito en la estimación se representa con 1-∞ y se denomina NIVEL DE CONFIANZA. En estas circunstancias ∞ se denomina ERROR ALEATORIO o NIVEL DE SIGNIFICANCIA
CONFIANZA PARA UNA MEDIA X – 1,96 x s ≤ μ ≤ X + 1,96 x s √n √n
EJEMPLO
.- Se requiere determinar el peso promedio de niños al momento de nacimiento de cierta población, que es igual a la media nacional de 3200 gr. Se tomo una muestra de 50 recién nacidos de la población en estudio, se obtuvo un promedio de 2850 gr y una desviación estándar de 400 gr. Teniendo como Z0,95 = 1,96 1
Nivel de Significancia
Introducción
Al plantear un estudio sobre una población, idealmente debemos estudiar a todos los individuos que la conforman; pero no siempre podemos acceder a todos, entonces tenemos que escoger una muestra; sin embargo los resultados obtenidos de esta manera nunca serán exactamente iguales, a los que se obtendrían de estudiar a toda la población; es decir, siempre va a haber un margen de error.
Nivel de Significancia Antes de realizar el estudio debemos plantearnos; que proporción de error estamos dispuestos a aceptar para dar por válido nuestro. El error es el objetivo principal del estudio. El análisis estadístico consiste en calcular la probabilidad de cometer este error y esperamos que sea menor al planteado preliminarmente como nivel significancia.
Nivel de confianza Es la confianza que debemos alcanzar para generalizar el resultado de una muestra hacia toda la población. Es el complemento del nivel de significancia; es la confianza que tenemos, de que la conclusión a la que hemos llegado es cierta. Una probabilidad elevada nos da la tranquilidad de que lo que hemos calculado es cercano a lo real y no debida al azar
Niveles convenidos a) α = 5%. Existe 5% (0.05) de probabilidad de equivocarse y 95% (0.95) de confianza. b) α = 1%. Existe 1% (0.01) de probabilidad de equivocarse y 99% (0.99) de confianza.
Definición de términos El error tipo I: Ocurre cuando afirmamos la hipótesis del investigador, siendo que es falsa. Por lo tanto, es un juicio de valor equivocado. El p-valor: Es la probabilidad de equivocarse al aceptar nuestra hipótesis del investigador como verdadera; es decir la probabilidad de cometer un error tipo I. El nivel de significancia: Es la máxima probabilidad de error que estamos dispuestos aceptar para dar como válida nuestra hipótesis del investigador.
EL COEFICIENTE DE CORRELACION
La correlación es una prueba de hipótesis que debe ser sometida a contraste y el coeficiente de correlación cuantifica la correlación entre dos variables, cuando ésta existe. El coeficiente r de Pearson, por ser una prueba paramétrica requiere de variables numéricas con distribución normal; mientras que el coeficiente de correlación no paramétrica rho de Spearman acepta variables de libre distribución e incluso ordinales.
INTERPRETACIÓN
El coeficiente correlación varía entre 0 y 1, pudiendo ser positivo o negativo..
El valor numérico indica la magnitud de la correlación.
INTERPRETACIÓN El signo indica la dirección de la correlación
Correlación directa (+) Signo positivo “a mayor X, mayor Y” ó “a menor X, menor Y”
Correlación inversa (-) Signo negativo “a mayor X, menor Y” ó “a menor X, mayor Y”
INTERPRETACIÓN
Significancia estadística Solo interpretamos el coeficiente si “p” es menor de 0.05, (Nivel de significancia). Se puede indicar la significancia así: r = 0.48 (p
View more...
Comments