Manual de Infostat
Short Description
Download Manual de Infostat...
Description
Centro guatemalteco de investigación y capacitación de la caña de azúcar. -CENGICAÑA-
Joel Morales, José Luis Quemé y Mario Melgar.
Primera Edición
Santa Lucia Cotz. Agosto 2009.
InfoStat Contenido
Aspectos generales de InfoStat ........................................................................................................................... 1 Aspecto de la base de datos: Video. ............................................................................................................... 1 ¿Cómo importar una base de datos desde Excel? ....................................................................................... 1 ¿Cómo pegar una base de datos desde Excel? ............................................................................................ 2 Transformación de datos ................................................................................................................................ 3 Prueba de hipótesis ............................................................................................................................................. 4 Términos de importancia al realizar una prueba de hipótesis ......................................................................... 4 Pasos para evaluar una hipótesis estadística. .................................................................................................. 5 Prueba de hipótesis acerca de una media poblacional normal. Video ............................................................ 5 Prueba de hipotesis acerca de dos medias (parcelas apareadas). Video ........................................................ 8 Prueba de hipótesis acerca de dos medias independientes. Video ................................................................. 9 Diseño completamente al azar .......................................................................................................................... 10 Características generales .............................................................................................................................. 10 Utilización del diseño ................................................................................................................................... 10 Supuestos del modelo. .................................................................................................................................. 10 Diseño de bloques completos al azar ................................................................................................................ 14 Hipótesis del modelo .................................................................................................................................... 14 Supuestos del modelo ................................................................................................................................... 14 Serie de Experimentos ...................................................................................................................................... 19 Análisis de experimentos factoriales ................................................................................................................ 23 Arreglos combinatorios ................................................................................................................................ 24 Parcelas divididas ......................................................................................................................................... 28 Franjas divididas........................................................................................................................................... 31 Análisis de correlación lineal simple. ............................................................................................................... 34 Regresión Lineal............................................................................................................................................... 36 RL Simple..................................................................................................................................................... 36 Supuestos del modelo de regresión .......................................................................................................... 37 RL Múltiple .................................................................................................................................................. 41 Bibliografía....................................................................................................................................................... 42 Anexos .............................................................................................................................................................. 43
Manual de uso
Métodos estadísticos utilizados en la industria cañera.
CENGICAÑA
Aspectos generales de InfoStat Aspecto de la base de datos: Video. La base de datos es la matriz de información, sobre la que se trabaja. La forma de ingreso de la información es en base a los criterios de organización de datos, donde se colocan en las columnas las variables y en las filas las observaciones, por lo que cada fila es un individuo o unidad experimental y cada celda contiene el dato o el valor que pertenece a cada variable para cada observación. ¿Cómo importar una base de datos desde Excel? InfoStat posee grandes ventajas respecto a la facilidad en el manejo de datos, es muy versátil en la importación de datos desde Excel (versión 2003 o anterior), esto es importante, pues este último es muy utilizado en la generación de bases de datos tomados en campo. Es posible importar directamente una base de datos desde Excel y otros formatos. Esto facilita el manejo y presentación de los mismos.
Figura 1: Selección de la hoja de cálculo importada desde Excel.
InfoStat. | Centro guatemalteco de investigación y capacitación de la caña de azúcar.
1
Métodos estadísticos utilizados en la industria cañera.
CENGICAÑA
¿Cómo pegar una base de datos desde Excel? Muchas veces poseemos la base de datos de tal forma, que no coincide la primera fila y la primera columna con información propia de la base , o se poseen objetos distintos como gráficas o logotipos. Considerando esto, es relativamente fácil, el copiar la base de datos que se desea analizar de forma directa a la tabla de InfoStat. Para esto se puede incluir la primera fila como el nombre de las columnas o no. Se debe de presionar el botón derecho del ratón y seleccionar la opción “pegar” o “pegar incluyendo nombre de columnas”. 2
Figura 2: Como pegar una base de datos en la tabla de InfoStat.
InfoStat. | Centro guatemalteco de investigación y capacitación de la caña de azúcar.
Métodos estadísticos utilizados en la industria cañera.
CENGICAÑA
Transformación de datos Muchas veces se trabaja con variables cualitativas o datos no paramétricos, los cuales no cumplen con el supuesto de normalidad. Por lo anterior es necesario realizar transformación de estos datos. InfoStat ofrece una gran cantidad de transformaciones para una variable, y a la vez permite la operación entre variables. 3
Figura 3: Menú a seleccionar para realizar una transformación
Para realizar la transformación se debe de seleccionar la variable, luego de indicar que se desea realizar una transformación.
Figura 4: Opciones de trasformación
InfoStat. | Centro guatemalteco de investigación y capacitación de la caña de azúcar.
Métodos estadísticos utilizados en la industria cañera.
CENGICAÑA
Prueba de hipótesis
Hipótesis Nula (Ho)
Esta es la que el investigador evalúa y está dispuesto a sostener como probable, a menos que la evidencia experimental en su contra sea sustancial.
Hipótesis alternativa (Ha)
Es la negación de la hipótesis nula. 4
Términos de importancia al realizar una prueba de hipótesis
Error tipo I (α)
Es la probabilidad de rechazar una Ho cuando es falsa.
Error tipo II (β)
Es la probabilidad de no rechazar una Ho Cundo es falsa. Cuadro 1: Posibles errores.
Tomada de Anderson, E; Black, W. et al. 1999.
Nivel de significancia
Es el valor de probabilidad de error tipo I, que el investigador está dispuesto a aceptar.
InfoStat. | Centro guatemalteco de investigación y capacitación de la caña de azúcar.
Métodos estadísticos utilizados en la industria cañera.
CENGICAÑA
Pasos para evaluar una hipótesis estadística. 1.
Definir la hipótesis nula y alternativa adecuada para el caso de evaluación.
Cuadro 2: Casos de hipótesis a evaluar
5 2. Seleccionar el estadístico de prueba, necesario para evaluar la hipótesis. Cuadro 3: Estadísticos utilizados en la prueba de hipótesis
Tomado de López, E. 2008.
3. Especificar el nivel de significancia. 4. Establecer la regla de decisión. 5. Establecer los valores del estadístico seleccionado de la prueba y compararlo con el valor critico establecido. 6. Conclusión.
Prueba de hipótesis acerca de una media poblacional normal. Video Ejemplo: En una región cañera se siembra predominantemente una variedad de caña de azúcar que tiene un TCH promedio de 103.5 toneladas ha-1. Un programa de mejoramiento ha desarrollado una nueva variedad, comúnmente usada, con rendimientos mayores a la variedad predominante. Para probar esta aseveración se siembran nueve lotes experimentales con la nueva variedad y se obtienen los siguientes rendimientos:
InfoStat. | Centro guatemalteco de investigación y capacitación de la caña de azúcar.
Métodos estadísticos utilizados en la industria cañera.
CENGICAÑA
Cuadro 4: Rendimiento en toneladas de caña por hectárea, tomado de 9 lotes distintos.
Lote
TCH
1 2 3 4 5 6 7 8 9 Prom.
103.15 103.92 104.26 103.36 103.72 104.19 103.42 104.38 104.5 103.88
Identificación del parámetro sobre el cual se desea inferir en base a la muestra: Media (µ) Hipótesis a probar: Ho: µ≤103.5 Ha: µ>103.5 Elección del modelo probabilístico bajo el cual se operará: La t de Student Especificación del nivel de significancia. α = 5% o 0.05 Establecer la regla de decisión: Se Rechaza la Ho si p ≤ α
InfoStat. | Centro guatemalteco de investigación y capacitación de la caña de azúcar.
6
Métodos estadísticos utilizados en la industria cañera.
CENGICAÑA
7
Figura 5: Ubicación de la prueba
Se debe de seleccionar la columna a analizar y se debe de indicar el parámetro con el cual se realizará la comparación. Prueba T para un parámetro Valor del parámetro probado: 103.5 Variable n Media DE LI(95) TCH 9 103.88 0.49 103.57
T 2.32
p(Unilateral D) 0.0246
La regla de desición: En base a la prueba T, se observa una probabilidad de p = 0.0246. Este valor es menor a la probabilidad permitida (α= 0.05), por lo que se rechaza Ho. Conclusión: La muestra apoya la aseveraión del programa de mejoramiento.
InfoStat. | Centro guatemalteco de investigación y capacitación de la caña de azúcar.
Métodos estadísticos utilizados en la industria cañera.
CENGICAÑA
Prueba de hipotesis acerca de dos medias (parcelas apareadas). Video Cuadro 5: Rendimientos en toneladas de caña por hectarea, de dos variedades tamados de 6 lotes.
NF
CP72-2086
CG97-77
1 2 3 4 5 6 Prom.
160 112 184 186 104 152 150
130 118 225 149 168 139 155
8
Es importante que se ingresen los datos en dos columnas, una para cada población o conjunto de datos.
Figura 6: Ubicación de la prueba
En este caso la hipótesis a evaluar es: Ho: la diferencia entre las medias es igual a cero, que es igual a decir que ambas medias son iguales µ1 = µ2. Ha: µ1 ≠ µ2. Prueba T (muestras apareadas) Obs(1) Obs(2) CG97-77 CP72-2086
media(dif) 5.17
Media(1) 154.83
Media(2) 149.67
DE(dif) T 40.23 0.31
Bilateral 0.7658
Conclusión: En base a las evidencias se puede aseverar que los tonelajes de ambas variedades son semejantes. InfoStat. | Centro guatemalteco de investigación y capacitación de la caña de azúcar.
Métodos estadísticos utilizados en la industria cañera.
CENGICAÑA
Prueba de hipótesis acerca de dos medias independientes. Video Cuadro 6: Rendimientos en toneladas de caña por hectárea, bajo dos tratamientos de aplicación de fosforo.
Fosforo 0 P0 150 155 149 153
Fosforo 240 P240 165 167 168 167
9
Es necesario que para ingresar los datos en InfoStat, se debe de crear una columna donde se coloque el nombre o código de la variable, útil para la clasificación, y una columna donde se ingrese el valor de la variable a estudiar.
Figura 7: Ubicación de la prueba
Prueba T para muestras Independientes Variab Grupo(1)Grupo(2) TCH {P0} {P240}
media(1) 151.75
media(2) 166.75
p(Var.Hom.) T 0.2307-9.91
p 0.0001
Conclusión: Al observar la salida del análisis, se puede decir que el rendimiento del tratamiento P240 es mayor que el rendimiento del tratamiento P0.
InfoStat. | Centro guatemalteco de investigación y capacitación de la caña de azúcar.
Métodos estadísticos utilizados en la industria cañera.
CENGICAÑA
Diseño completamente al azar Es importante que al momento de realizar un análisis de varianza, se tenga bien claro las fuentes de variación consideradas por dicho modelo.
10
Tomado de López, E. 2008
Como la media general y el error experimental son términos que poseen en común todos los modelos, no es necesario el indicarlos entre las fuentes de variación.
Características generales
Se usa cuando las unidades experimentales son homogéneas Con el se puede probar cualquier número de tratamientos (ya sean niveles de un solo factor o combinaciones de nivel de varios factores) Los tratamientos se aplican a las unidades experimentales al azar. Cualquier número de repeticiones por tratamiento es posible.
Utilización del diseño Este diseño se recomienda cuando existe homogeneidad entre unidades experimentales, esto quiere decir que no existe influencia de la ubicación de la unidad experimental sobre el efecto del tratamiento, esto es muy utilizado en ensayos a nivel de laboratorio, cuando se utilizan macetas o medios de cultivos, donde las condiciones son las mismas para todas las unidades experimentales.
Supuestos del modelo.
Los errores son independientes. Los errores están normalmente distribuidos con media cero y varianza constante Existe homogeneidad de varianzas entre los tratamientos El modelo es lineal y de efectos aditivos. InfoStat. | Centro guatemalteco de investigación y capacitación de la caña de azúcar.
Métodos estadísticos utilizados en la industria cañera.
CENGICAÑA
Ejemplo: Video. Cuadro 7: Rendimiento (TCH), evaluando 3 frecuencias de riego.
Tratamientos
Repetición 1
Repetición 2
Repetición 3
Testigo (práctica regional)
123
133
131
Riego cada 21 días
175
167
192
Riego cada 28 días
199
203
166
Riego cada 35 días
179
188
203
11
Tomado de Martínez, A. (1998).
En este caso los datos se deben de ingresar en la Tabla de InfoStat, indicando en una columna el tratamiento evaluado y en la columna de la par la variable de respuesta correspondiente a cada tratamiento. Cuadro 8: Tabla de datos como se debe de ingresar a InfoStat.
Tratamientos
TCH
Testigo (práctica regional) Riego cada 21 días Riego cada 28 días Riego cada 35 días Testigo (práctica regional) Riego cada 21 días Riego cada 28 días Riego cada 35 días Testigo (práctica regional) Riego cada 21 días Riego cada 28 días Riego cada 35 días
123 175 199 179 133 167 203 188 131 192 166 203
En la pestaña estadísticas se encuentra la opción análisis de varianza, al aceptar aparece un cuadro donde se debe de indicar las variables dependientes (TCH) y las variables de clasificación (Tratamientos). Para esto se debe de utilizar los botones de acción
.
InfoStat. | Centro guatemalteco de investigación y capacitación de la caña de azúcar.
Métodos estadísticos utilizados en la industria cañera.
CENGICAÑA
12
Figura 8: Selección de las variables.
Al aceptar aparecerá otro recuadro, donde se debe indicar las fuentes de variación del modelo, como ya se mencionó la media general y el error no se indican. Esto se realiza en la pestaña . A un lado se encuentra la pestaña donde se puede indicar la prueba de media que se desea realizar, donde se encuentran varias opciones.
Figura 9: Selección del método de comparación de medias.
InfoStat. | Centro guatemalteco de investigación y capacitación de la caña de azúcar.
Métodos estadísticos utilizados en la industria cañera.
CENGICAÑA
Análisis de la varianza Variable TCH
N 12
R² 0.83
R² Aj CV 0.77 7.98
Cuadro de Análisis de la Varianza (SC tipo III) F.V. SC gl CM F p-valor Modelo 7526.25 3 2508.75 13.37 0.0018 Tratamientos 7526.25 3 2508.75 13.37 0.0018 Error 1500.67 8 187.58 Total 9026.92 11
13
Test:LSD Fisher Alfa=0.05 DMS=25.78763 Error: 187.5833 gl: 8 Tratamientos Medias Riego cada 35 días 190.00 Riego cada 28 días 189.33 Riego cada 21 días 178.00 Testigo (práctica regional.. 129.00
n 3 3 3 3
A A A B
Letras distintas indican diferencias significativas(pRepetición Variedad Localidad*Variedad Error Total
SC 227787.23 177483.08 3979.12 25378.43 20946.58 30873.63 258660.85
gl 50 2 9 13 26 117 167
CM 4555.74 88741.54 442.12 1952.19 805.64 263.88
Test:LSD Fisher Alfa=0.05 DMS=8.98910 Error: 442.1250 gl: 9 Localidad Medias n San Bonifacio 187.54 56 A Las Margaritas 144.36 56 Tululá 108.02 56
F 17.26 200.72 1.68 7.40 3.05
p-valor (Error)
View more...
Comments