La Varianza Corregida
July 9, 2022 | Author: Anonymous | Category: N/A
Short Description
Download La Varianza Corregida...
Description
Análisis de datos. Dpto. Metodología. Metodología. U. Pontificia Comillas, 2º de Psicología
1. LA VARIANZA CUANTIFICA todo lo que hay de diferente entre los sujetos o las puntuaciones, la variabilidad, dispersión o diferencias individuales. Una varianza GRANDE indica que hay muchas variaciones entre los sujetos, que hay mayores diferencias individuales con respecto a la media. Una varianza PEQUEÑA nos indica poca variabilidad, diferencias menores entre los sujetos. La varianza tiene una propiedad importante: PODEMOS DESCOMPONERLA
La varianza DE se puede descomponer en varianzas proceso ANÁLISIS VARIANZA y nos permite aislar parciales: las fuentesAdeeste varia variación. ción. le llamamos
2. QUÉ COMPROBAMOS MEDIANTE EL ANÁLISIS DE VARIANZA Con la t de Student comprobamos si existen diferencias estadísticamente significativas entre las medias de dos muestras o grupos de sujetos. Con el ANÁLISIS DE VARIANZA comprobamos si existen diferencias estadísticamente significativas entre más de dos grupos (cuando tenemos dos grupos también podemos usar ANOVA, pero es más cómodo utilizar la t de Student). ¿Qué comprobamos? De cada sujeto tenemos dos tipos de información: - En qué grupo está clasificado, es decir, en qué nivel de la V.I. se encuentra clasificado. - Un valor en una variable en la que hemos medido. Esta variable es la V.D. Lo que nos dice el ANOVA, es si la V.I. tiene que ver o está asociada con la V.D. que hemos medido. Es decir, pone en relación los dos tipos de información que tenemos de cada sujeto. LO QUE DIRECTAMENTE COMPROBAMOS es si entre dos o más varianzas existen diferencias estadísticamente significativas. LO QUE REALMENTE DESEAMOS COMPROBAR es si hay diferencias entre una serie de medias. 1
Análisis de datos. Dpto. Metodología. Metodología. U. Pontificia Comillas, 2º de Psicología
Veamos estos conceptos con dos ejemplos extremos: Caso 1. Imaginemos dos grupos o muestras, con cinco sujetos cada una. Distinta media, misma varianza: A = (1, 2, 3, 4, 5). Ma= 3; S 2a = 2. B = (6, 7, 8, 9, 10). Mb = 8; S2b = 2. Unimos ambos grupos, considerando a todos los sujetos como pertenecientes a un único grupo. C = (1, 2, 3, 4, 5, 6, 7, 8, 9, 10). Mtotal = 5,5. S2c = 8.25 Observamos que existen diferencias entre los sujetos dentro de este gran grupo. ES LA VARIANZA DE ESTE GRAN GRUPO TOTAL LA QUE VAMOS A ANALIZAR O DESCOMPONER Si observamos las diferencias entre los sujetos de este gran grupo total podemos preguntarnos: ¿De dónde vienen las diferencias en este grupo total formado por las muestras a y b? ¿De que los grupos son distintos, con distinta media? ¿O de que los sujetos dentro de cada grupo son distintos? Veamos que podemos calcular dos varianzas en este gran grupo: - Una que expresa la diversidad dentro de los grupos. Entre los sujetos dentro de cada grupo. S2a = S2b = 2. 2 - Otra queS expresa la diversidad entre la media de los grupos. La diferencia entre los grupos. ab = 6.25
En este caso, los sujetos dentro de cada grupo tienen un grado semejante de homogeneidad o variabilidad. Dentro de cada grupo las diferencias entre los sujetos (las varianzas) son iguales. Lo que sucede es que las medias son distintas. Las medias de los grupos difieren entre sí más que los sujetos entre sí dentro de los grupos. Sab2 = 6.25 S2a = S2b = 2. Las medias de cada grupo se apartan más de la media total que los sujetos de su propia media. CONCLUSIÓN: Si las medias entre sí difieren más que los sujetos entre sí, podemos concluir QUE LAS MEDIAS SON DISTINTAS. Las muestras proceden de poblaciones distintas. 2
Análisis de datos. Dpto. Metodología. Metodología. U. Pontificia Comillas, 2º de Psicología
Caso 2 Ahora imaginemos que tenemos dos grupos o muestras, de cinco sujetos cada una. A = (1, 2, 3, 4, 5). Ma= 3; S 2a = 2. B = (1, 2, 3, 4, 5). Ma= 3; S 2a = 2. Los grupos tienen la misma media, no difieren en cuanto a grupos, pero entre los sujetos, dentro de cada grupo, hay diversidad. Las unimos para formar un único grupo que llamaremos C, el resultado es un grupo total con la misma media y varianza. C = (1, 2, 3, 4, 5, 1, 2, 3, 4, 5). Mtotal = 3. S 2c = 2. Nuevamente podemos preguntarnos: ¿DE DÓNDE VIENEN LAS DIFERENCIAS? ¿ES UNA DIFERENCIA DEBIDA A LA DIVERSIDAD ENTRE LOS GRUPOS O DENTRO DE LOS GRUPOS? En este caso las diferencias no vienen de diferencias entre los grupos, que tienen idéntica media (Ma = Mb = 3), sino de que los sujetos dentro de cada grupo son distintos. (S2a = 2, S2b = 2), (S2ba = 0 < S2a = 2 y S2b = 2). La media de los grupos se aparta menos de la media total que los sujetos de su propia media. Ejemplo de los enanos Imaginemos dos grupos, uno de enanos y otro de gigantes. a. Cada grupo tiene su media en altura. La media de los gigantes es mayor que la de los enanos. b. Dentro de cada grupo hay también diferencias; no todos los enanos son igualmente bajitos ni todos los gigantes igualmente altos. Pero, ¿cuál sería nuestra conclusión si comprobamos que la diferencia entre las medias es más o menos igual a las diferencias entre los sujetos dentro de los grupos? Pues que no tenemos enanos ni gigantes, por lo que respecta a la altura, podemos considerar que todos pertenecen al mismo grupo, es decir, a la misma población.
3.
LA VARIANZA TOTAL LA VAMOS A DESCOMPONER EN DOS VARIANZAS: - La varianza que indica la variabilidad ENTRE LOS GRUPOS (entre la media de dos grupos).
3
Análisis de datos. Dpto. Metodología. Metodología. U. Pontificia Comillas, 2º de Psicología
- La varianza que indica la variabilidad DENTRO DE LOS GRUPOS (diferencias entre los sujetos dentro de cada grupo). Estas son las diferencias que consideraremos normales, es decir, la diversidad normal o aleatoria. CUANDO: La diversidad ENTRE las medias Diversidad DENTRO de los grupos (entre los sujetos dentro de los grupos)
ENTONCES: Entre las medias hay diferencias superiores a lo que podemos encontrar por azar. Las medias son diferentes. Las muestras proceden de poblaciones con distinta media. Esta lógica es el punto de partida del análisis de varianza, el cual NOS PERMITE COMPARAR LAS MEDIAS DE VARIOS GRUPOS A PARTIR DEL ESTUDIO DE LAS VARIANZAS DE ESOS GRUPOS.
4. ¿QUÉ COMPROBAMOS MEDIANTE EL ANÁLISIS DE VARIANZA? LA RAZÓN F H0 Afirma que que todas las muestras proceden de la misma población. No existen diferencias estadísticamente significativas entre las medias de la VD en función de la VI; sus diferencias se explican adecuadamente por el error muestral. H1: Lo contrario. Existen diferencias estadísticamente significativas, al menos entre dos medias de la VD en función de la VI; sus diferencias se explican por el efecto de mi VI. Para contrastar esta hipótesis necesito: 1º. A partir de las puntuaciones individuales con respecto as u media respectiva dentro de cada grupo. Es lo que se llama VARIANZA DENTRO DE LOS GRUPOS; indica lo que difieren los sujetos entre sí dentro de cada grupo. 2º. A partir de las medias de los grupos, de su variabilidad respecto de la media total. Es lo que se denomina VARIANZA ENTRE LOS GRUPOS. Indica lo que difieren los grupos unos de otros. Estas dos varianzas o medias cuadráticas las obtenemos dividiendo en cada caso las sumas de cuadrados entre los grados de libertad correspondientes. La cuestión se centra en encontrar un método que nos permita comparar estas dos varianzas con el objetivo de determinar cuando la diferencia entre MCE y MCI es lo bastante muestreo.grande como para pensar que no puede ser atribuida al azar propio del 4
Análisis de datos. Dpto. Metodología. Metodología. U. Pontificia Comillas, 2º de Psicología
Esto es justamente lo que nos permite establecer los distintos modelos de ANOVA a través de la razón F. En la razón F lo que hacemos es comparar estas dos fuentes de variación o varianzas dividiendo la una entre la otra. En el ANÁLISIS DE VARIANZA al calcular la razón F colocamos en el denominador la varianza considerada normal o aleatoria, aunque no sea la más pequeña, y esta varianza aleatoria es la varianza dentro de los grupos (también llamada varianza del término o error residual). La varianza que colocamos en el numerador es la que nos interesa comparar con la que consideramos normal o aleatoria. En nuestro caso es la varianza entre los grupos.
Nuestro interés está en COMPROBAR SI LA VARIANZA DEL NUMERADOR DIFIERE SIGNIFICATIVAMENTE DE LA VARIANZA DEL DENOMINADOR, que es el término de comparación.
5. POSIBLES VALORES DE F a. Si la varianza del denominador es mayor que la del numerador: El cociente será inferior a 1. La diferencia entre las dos varianzas no será estadísticamente significativa, por lo tanto aceptamos la hipótesis nula. b.Si las dos varianzas son iguales. La razón F será igual a 1. También aceptamos la l a hipótesis nula. c.En la medida en que la varianza del numerador sea mayor que la del denominador, el cociente irá aumentando, irá siendo mayor que 1. ¡IMPORTANTE! Si mi F se mayor que 1, no puedo decir sin más que es estadísticamente significativa, lo único que sé es que la variabilidad ENTRE es mayor que la DENTRO o error, pero no si es significativa. El siguiente paso que tendremos que dar será consultar las tablas de Snedecor. Los valores de la tabla indican: A partir de qué valor podemos considerar que el cociente entre dos varianzas es lo bastante grande como para pensar que no puede ser atribuido al azar.
5
Análisis de datos. Dpto. Metodología. Metodología. U. Pontificia Comillas, 2º de Psicología
6. SI LA RAZÓN F ES SIGNIFICATIVA: 1. Hay una relación superior a lo aleatorio (o normal) entre la variable que corresponde al numerador de la razón F y la variable en la que hemos medido a los sujetos. 2. Podemos concluir que los sujetos son distintos en la variable dependiente porque también son distintos en la variable independiente que nos ha servido para clasificarlos. c lasificarlos. NO ESTAMOS IMPLICANDO UNA RELACIÓN CAUSAL 3.Las diferencias entre la variable medida están asociadas de hecho a pertenecer a un grupo u otro.
7. UNA
RAZÓN F SIGNIFICATIVA NO NOS DICE:
1.Entre qué grupos se da esa diferencia (para eso están los constrastes posteriores). 2. Cuál es la magnitud de la diferencia (relevancia práctica de los resultados). Es decir, que si tenemos una F estadísticamente significativa sólo sabemos que existen diferencias entre los distintos niveles de la V.I., pero tendré que hacer los análisis complementarios: - -
Contrastes posteriores. Tamaño del efecto.
8.¿POR EL ANÁLISIS DE VARIANZA EN VEZ QUÉ DE LAUTILIZAMOS T DE STUDENT? Cuando tenemos dos muestras y queremos constrastar si existen diferencias estadísticamente significativas entre sus medias usamos t de Student. Cuando tenemos más de dos grupos usamos el ANÁLISIS DE VARIANZA. ¿NO PODRÍAMOS USAR LA T PARA COMPARAR TODOS LOS GRUPOS DE DOS EN DOS? Esto parecería lo más lógico, pero existen varias razones por las que no se hace así: 1. La razón más importante y suficiente para no usar la t es uqe, al hacer muchas comparaciones de dos en dos aumenta la probabilidad de uqe alguna diferencia resulte significativa por azar y afirmemos que hay diferencias cuando realmente 6
Análisis de datos. Dpto. Metodología. Metodología. U. Pontificia Comillas, 2º de Psicología
no las hay. Es decir aumenta la probabilidad de cometer error tipo I, de que rechacemos una hipótesis nula que es verdadera. 2. Una prueba estadística basada en todos los datos utilizados simultáneamente, es más estable que una prueba o análisis que parcializa los datos. 3. Ahorro de tiempo. 9.OBSERVACIONES
SOBRE LOS REQUISITOS PREVIOS PARA UTILIZAR EL ANOVA (SUPUESTOS) Los modelos teóricos se asientan en cuatro suposiciones (supuestos): 1. Unidad de intervalo. 2. Observaciones independientes. 3. Homocedasiticidad. Las varianzas de las distintas poblaciones representadas en las muestras no difieren significativamente entre sí, es decir, son significativamente iguales.
4. La variable dependiente sigue la distribución normal (normalidad).
7
View more...
Comments