COLEGIO DE BIÓLOGOS DEL PERÚ Consejo Regional XXII –Callao
Manual ECOLOGÍA NUMÉRICA Y ESTADÍSTICA APLICADA A LA BIOLOGÍA DE LA CONSERVACIÓN CON CON PAST 2.17 Héctor Aponte Ubillús 2013
H. Aponte Aponte (2013) (2013) – Manual Ecología Numérica con PAST
1
H éct ctor or A pont onte e Ubi Ubi llús Biólogo egresado de la Universidad Nacional Mayor de San Marcos con especialidad en Botánica,
con
Biodiversidad
y
Maestría
en
Ecología,
Evolución
(EBE)
en
la
Universidad Paris Sud (Orsay - Francia) dentro de la especialidad de Ingeniería Ecológica y Gestión de Ecosistemas. Maestría en Botánica Tropical dentro de la mención en Taxonomía y Sistemática
Evolutiva
de
la
Universidad
Nacional Mayor de San Marcos. Estudios Doctorales en Ciencias Biológicas (UNMSM). Profesor de Ecología, Diversidad Vegetal y Evolución de la Universidad Científica del Sur desde el año 2009. Investigador Asociado del Museo de Historia Natural - UNMSM. Autor de múltiples artículos científicos y libros de divulgación de la flora peruana. E-mail:
[email protected]
H. Aponte Aponte (2013) (2013) – Manual Ecología Numérica con PAST
2
H éct ctor or A pont onte e Ubi Ubi llús Biólogo egresado de la Universidad Nacional Mayor de San Marcos con especialidad en Botánica,
con
Biodiversidad
y
Maestría
en
Ecología,
Evolución
(EBE)
en
la
Universidad Paris Sud (Orsay - Francia) dentro de la especialidad de Ingeniería Ecológica y Gestión de Ecosistemas. Maestría en Botánica Tropical dentro de la mención en Taxonomía y Sistemática
Evolutiva
de
la
Universidad
Nacional Mayor de San Marcos. Estudios Doctorales en Ciencias Biológicas (UNMSM). Profesor de Ecología, Diversidad Vegetal y Evolución de la Universidad Científica del Sur desde el año 2009. Investigador Asociado del Museo de Historia Natural - UNMSM. Autor de múltiples artículos científicos y libros de divulgación de la flora peruana. E-mail:
[email protected]
H. Aponte Aponte (2013) (2013) – Manual Ecología Numérica con PAST
2
Presentación
En el estudio de la biodiversidad nos encontramos con la constante necesidad de aplicar análisis estadísticos y algoritmos matemáticos. Los algoritmos de la estadística univariada nos permiten darle un primer vistazo al set de datos y evidenciar tendencias y relaciones entre las variables. Sin embargo a veces es necesario aplicar técnicas multivariadas a fin de realizar análisis más complejos con datos provenientes de los ecosistemas. Asimismo, muchas veces es necesario hacer análisis de diversidad alfa y beta para entender y comparar la composición y estructura de las comunidades en los ecosistemas y como estos han cambiado. Todas estas herramientas son muy útiles, y el conocimiento y manejo adecuado de las mismas es muy importante. Algunos programas estadísticos estadísticos permiten realizar realizar estos análisis, pero son costosos o consumen consumen mucha memoria al procesar los datos. PAST 2.17 es un software de libre acceso, muy práctico y ligero, que permite hacer análisis estadísticas y de diversidad con mucha eficacia y en corto tiempo (Hammer et al. 2001). Este programa, creado en el 2001, es una herramienta muy útil en la evaluación de datos. Desde su primera versión, PAST ha ido añadiendo herramientas que permiten hacer un mejor y más variado análisis de los datos, por lo que permite abordar conjuntos simples de datos, pero también conjuntos complejos de los mismos.
Sin entrar a los detalles técnicos matemáticos, el presente manual intenta que los estudiantes den un vistazo rápido a los test estadísticos presentados, así como al procesamiento y al análisis de los resultados a partir de ejemplos enmarcados en la Biología de la Conservación. Como consecuencia, en esta guía usted encontrará los pasos seguidos para hacer los análisis, más no la base matemática matemática de los mismos. Para mayor detalle de los mismos recomiendo recomiendo la lectura de algunos textos (citados en la bibliografía) que le permitirán adquirir conocimientos más profundos de estadística y modelamiento, si así lo desea (Norman et al. 1996, Dytham 2011, Emden 2012). Invito también a los interesados en aprender más sobre el PAST a revisar la página web del programa (http://folk.uio.no/ohamm (http://folk.uio.no/ohammer/past/) er/past/) donde encontrarán encontrarán tutoriales, tutoriales, manuales manuales e información información adicional.
Espero que el presente curso sea de su agrado.
Héctor Aponte Ubillús
H. Aponte Aponte (2013) (2013) – Manual Ecología Numérica con PAST
3
Contenido Presentación .............................................. .......................................................................... 3 La plataforma PAST 2.17 .................................................................................................. 6 Ejemplo 1- Astrocaryum perangustatum: una palmera endémica sobreviviente en zonas deforestadas. ............................................................................................................. 7
Análisis Descriptivo Univariado y gráficos descriptivos ................................................. 9 Prueba de hipótesis: Test de Normalidad, transformación de datos, pruebas paramétricas y no paramétricas y su interpretación. .................................................... 13 ESTADÍSTICO IMPORTANTE: INTERPRETAR EL P VALOR (p-value) .................... 15 Ejemplo 2. Deforestación y la morfología de Astrocaryum perangustatum ................. 15
Gráficos de dispersión, correlación y regresión lineal .................................................. 16 ESTADÍSTICO IMPORTANTE: Correlaciones y Coeficiente de regresión .................. 17 Ejemplo 3. Revegetación en Tillandsiales ...................................................................... 18
Pruebas Post-Hoc ........................................................................................................... 19 ESTADÍSTICO IMPORTANTE: p valores en las pruebas Post Hoc ............................. 19 Ejemplo 4: ¿Qué variables caracterizan mi estación biológica?.................................. 20
Análisis de Componentes principales (ACP) ................................................................. 20 Ejemplo 5. Efectos de la ganadería en los humedales costeros .................................... 22
Análisis de correspondencia........................................................................................... 23 Ejemplo 6. Análisis de Diversidad en Los Suelos Crioturbados .................................. 24
Índices de diversidad Alfa ............................................................................ .................. 25 Perfiles de diversidad ..................................................................................................... 27 Test estadísticos para comparar diversidad................................................................... 27 Análisis SHE ................................................................................................................... 29 Riqueza por parcela (Quadrat Richness) ....................................................................... 29 H. Aponte (2013) – Manual Ecología Numérica con PAST
4
Índices de diversidad Beta .............................................................................................. 30 Límites de los índices de diversidad ............................................................................... 31 Curvas de Rarefacción ................................................................................................... 32 Dendrogramas de similaridad ........................................................................................ 34 Ejemplo 7. ¿Endémica o invasora? ................................................................................. 34
Construcción de cladogramas y análisis de parsimonia ................................................ 35 Referencias Bibliográficas ....................................................................................... ........ 36
H. Aponte (2013) – Manual Ecología Numérica con PAST
5
La plataforma PAST 2.17 A diferencia de otros programas estadísticos, PAST es un software amigable e intuitivo. Su plataforma se asemeja bastante a la plataforma de programas como Excel y Access de Microsoft Office, lo que hace que su manipulación sea de alguna manera conocida (Figura. 1). No cuenta con una versión en español, por lo que todas las indicaciones y comandos están en inglés.
Figura 1. Plataforma del software PAST
La barra de Herramientas que se muestra en la parte superior de la plataforma, contiene las pestañas esenciales para la manipulación y análisis de los datos (Figura 2). Esta se ha ido actualizando conforme se han ido creando diferentes versiones del programa.
Figura 2. Barra de Herramientas de PAST 2.17
La Barra de herramientas (de izquierda a derecha) contiene todas las pestañas mostradas en la figura 2, de las cuales utilizaremos: H. Aponte (2013) – Manual Ecología Numérica con PAST
6
Archivo (File): En ella encontrará las opciones para guardar, abrir, crear e imprimir un archivo.
Editar (Edit): Aquí se encuentran todas las opciones para copiar, pegar, remover o transponer los datos, insertar o eliminar columnas. PAST permite también retroceder (undo) o rehacer (redo) las acciones, pero estas son limitadas.
Transformar (Transform): Esta pestaña tiene todas las opciones necesarias para transformar los datos (por ejemplo logarítmicamente o transformar los datos a presencia/ausencia).
Gráficos (Plot): Permite hacer gráficos de doble entrada, gráficos de cajas e histogramas entre otros gráficos.
Estadísticos (Statistics): Aquí se encuentran las opciones para realizar análisis estadísticos univariados.
Multivariados (Multivar): Aquí se encuentran las opciones para realizar análisis estadísticos multivariados, incluyendo los análisis de agrupamiento (Cluster analysis).
Modelamiento (Model): Contiene algunas herramientas básicas para hacer modelamiento como modelos lineales y modelos lineales generalizados.
Diversidad (Diversity): Contiene las herramientas que utilizaremos para hacer un análisis estadístico de la diversidad alfa y beta.
Cladística (Cladistics): Permite hacer un análisis cladístico (de agrupamiento) a partir de datos morfológicos o de DNA.
Ejemplo 1- Astrocaryum perangustatum: una palmera endémica sobreviviente en zonas deforestadas. Basado en (Aponte 2012): Efectos de las actividades agropecuarias sobre la estructura
poblacional de Astrocaryum perangustatum F. Kahn & B. Millán (ARECACEAE) en Pozuzo (Pasco - Perú)
H. Aponte (2013) – Manual Ecología Numérica con PAST
7
En los últimos años, las poblaciones de palmeras han sido afectadas por la deforestación y el uso de tierras, principalmente con fines ganaderos y agropecuarios. Astrocaryum
perangustatum es una palmera endémica del Perú, y su territorio se ha visto afectado por actividades antrópicas como las mencionadas. El hábitat de esta especie (conocida como “huicungo” y “masanke”) comprende un mosaico de zonas deforestadas y relictos de bosque que recubre el bosque premontano. En estos ecosistemas ocupa el sotobosque, pues se trata de un árbol con un tamaño promedio de 6 metros de altura. Es una especie resistente a la deforestación y se le observa también en campos agrícolas y ganaderos (Figura 3). La distribución agrupada de esta especie en las zonas agropecuarias indica que, probablemente, ocupó grandes extensiones las cuales han sido reducidas por la deforestación desconociéndose los posibles efectos de la deforestación sobre su estructura poblacional.
Figura 3. Hábitat de Astrocaryum perangustatum en Pozuzo en zonas boscosas (izquierda) y deforestadas (derecha).
H. Aponte (2013) – Manual Ecología Numérica con PAST
8
A fin de conocer los cambios en la estructura de las poblaciones de A. perangustatum por 2
actividades agropecuarias, se hicieron comparaciones entre parcelas de 400m ubicadas en pastizales y en zonas boscosas de Pozuzo (Pasco, Perú). Se establecieron 50 parcelas, 25 en pastizales y 25 en zonas boscosas, con un total de 2 hectáreas de evaluación. En cada parcela se registró la abundancia de A. perangustatum en sus cuatro estadios: plántulas, juveniles I, juvenil II y adultos. Usted cuenta con la base de datos de las parcelas analizadas (EJ1 ASTROCARYUM) y se le pide responder a las siguientes preguntas: a) ¿La densidad poblacional de A. perangustatum ha sido afectada por la deforestación? b) Si hubiera un efecto: ¿Este es estadísticamente significativo? c) ¿Todos los estadíos de la población son afectados de la misma manera efectos? d) Sabiendo que en Pozuzo la principal actividad económica es la ganadería: ¿Qué propondría? e) Sabiendo que es una especie endémica del Perú y que su distribución es principalmente en hábitat afectados antropogénicamente: ¿qué sugeriría?
Análisis Descriptivo Univariado y gráficos descriptivos Los análisis descriptivos utilizan algoritmos básicos para tener una idea de lo que está sucediendo con la o las especies en estudio. Para iniciar este análisis procederemos de la siguiente manera.
Abra la hoja de cálculo del curso (Curso Ecología Numérica.xls) y el programa PAST.
Copie en el PAST la información del total de adultos (sin los títulos) en dos columnas, una para la cantidad de adultos en zonas de bosque y otra para la cantidad de adultos en pastizales. No es necesario copiar los datos uno por uno, puede copiar y pegar como se hace usualmente en los programas de office (Ctrl+C; Ctrl V). H. Aponte (2013) – Manual Ecología Numérica con PAST
9
Modifique los títulos en el PAST. Para modificar los títulos debe activar las casillas edit mode y edit labels que le permitirá modificar los títulos. Una vez terminada la edición, desactive la casilla edit labels. Los datos deben de quedar como lo muestra la figura 4.
Figura 4. Datos introducidos en PAST Una vez que los datos han sido introducidos, procederemos con el análisis univariado de la siguiente manera:
PAST realiza los análisis únicamente en las casillas seleccionadas, por ello es muy importante seleccionar las casillas antes de demandar un análisis. Puede hacerlo haciendo click sobre los títulos de las columnas que desea evaluar (figura 5a) o dando click en la celda de la esquina superior izquierda (figura 5b), esto último si lo que se desea es evaluar todas las columnas presentes en la hoja.
H. Aponte (2013) – Manual Ecología Numérica con PAST
10
a)
b) Figura 5. Datos seleccionados por columna (a) o en toda la hoja de cálculo.
Ahora vamos a pedir al PAST que nos dé un análisis univariado de los datos. Siga la siguiente ruta: Statistics > Univariate. PAST nos dará una tabla que indica las principales características de cada columna, incluyendo el promedio, valores máximos y mínimos, desviación estándar y otros estadísticos descriptivos útiles (figura 6). Los d atos pueden ser copiados (para pegar en Excel o en cualquier programa de Office) o impresos directamente con las opciones de la barra de herramientas debajo de las tablas.
Figura 6. Análisis univariado de los datos introducidos al P AST.
H. Aponte (2013) – Manual Ecología Numérica con PAST
11
Estos datos nos permiten tener una primera idea de qué es lo que ha pasado con las poblaciones en las dos zonas muestreadas. Otra forma interesante de analizar lo sucedido es haciendo un gráfico de cajas. Para ello basta con seleccionar los datos como fue indicado anteriormente y seguir la ruta Plot>Barchart/Boxplot. De inmediato obtendrá un gráfico de cajas que le permitirá interpretar los datos (Figura 7). Los gráficos pueden ser copiados (para pegar en Power Point o en cualquier programa de Office) o impresos directamente con las opciones de la barra de herramientas debajo de las tablas. Para editar los gráficos usted cuenta con diferentes barras de herramientas de acuerdo al tipo de gráfico. Otras opciones de fuentes y colores podrán encontrarse al hacer click derecho en el gráfico.
Figura 7. Boxplot de los datos analizados. Otro gráfico muy útil cuando se hacen comparaciones es hacer histogramas con los dos juegos de datos al mismo tiempo. Para ello, seleccione los datos y siga la ruta Plot>histogram. Obtendrá un gráfico en dos colores al cual usted puede añadirle una curva normal para cada grupo de datos (Figura 8).
H. Aponte (2013) – Manual Ecología Numérica con PAST
12
Figura 8. Histograma de los datos analizados. Es evidente que la concentración de adultos en ambas zonas evaluadas es diferente. Pero para responder la pregunta de si estas diferencias son estadísticamente significativas debemos proseguir con una prueba de hipótesis.
Prueba de hipótesis: Test de Normalidad, transformación de datos, pruebas paramétricas y no paramétricas y su interpretación. Uno de los primeros pasos para saber que tipo de prueba estadística utilizar consiste en verificar que los datos sigan una distribución normal. Para ello se utilizan diferentes pruebas estadísticas que te indican si los grupos de datos cumplen con este requisito. PAST da el resultado y un valor p para cinco pruebas estadísticas. Para realizar este análisis siga la ruta Statistics>Normality tests (figura 9).
Figura 9. Resultados de los análisis de Normalidad H. Aponte (2013) – Manual Ecología Numérica con PAST
13
Como podemos apreciar, la mayoría de los tests indican que los datos no cumplen con una distribución normal. Cuando esto ocurre una forma de cumplir con esta formalidad estadística es transformando los datos a su logaritmo. Para ello siga la ruta Transform>Log. Vuelva a aplicar el test de normalidad para saber si cumple con el requisito de tener una distribución normal. Frente a esta situación no podemos aplicar el clásico test de ANOVA, ya que no cumple con la normalidad, lo que nos obliga a utilizar test no paramétricos como los de Mann Wittney (para dos muestras) o el de Kruskall Wallis (para más de dos muestras). Para ello, seleccione los datos y siga la ruta: Statistics>Mann Whitney o Statistics>Kruskal Wallis según sea el caso. En nuestro caso utilizaremos el test de Mann Whitney. La figura 10 nos muestra el resultado del análisis en los datos de A. perangustatum estudiados.
Figura 10. Resultado del análisis de Mann Whitney Ahora que ya comprobó que existen diferencias significativas en los adultos, intente comprobar si en los otros estadios de la población se cumple el mismo patrón.
H. Aponte (2013) – Manual Ecología Numérica con PAST
14
ESTADÍSTICO IMPORTANTE: INTERPRETAR EL P VALOR (p-value)
El p valor (p value) es la probabilidad de que dos valores sean iguales habiendo hecho un análisis estadístico cualquiera. Permite rechazar o aceptar las hipótesis. Por ejemplo en una prueba de Normalidad (Normality test) si el p valor es menor que 0.05 significa que no sigue una distribución normal (se compara la distribución normal con la variable). Si en una comparación de dos tratamientos (prueba de hipótesis con ANOVA, Mann Wittney, Kruskal Wallis o cualquier otro test) el p valor es menor de 0.05 significa que los tratamientos son diferentes (se comparan ambos tratamientos).
Ejemplo 2. Deforestación y la morfología de Astrocaryum
perangustatum Tomado de (Aponte et al. 2011). Adaptabilidad morfológica a la deforestación de la palma peruana Astrocaryum perangustatum en Pozuzo
Otro de los efectos de la deforestación sobre las especies vegetales es el cambio de las condiciones ambientales donde estas viven, y la consecuente expresión de estos cambios en los caracteres morfológicos. Con la finalidad de estudiar la variabilidad morfológica de los adultos, fueron medidos los caracteres morfológicos de 60 adultos (30 en pastizales y 30 en zonas de bosque a las cuales se les midió dentro de los caracteres el número de hojas y largo de la hoja). Usted cuenta con parte de la base de datos de las palmeras medidas (EJ2 Astrocaryum) y se le pide responder:
¿Existe algún efecto de la deforestación sobre el número de hojas?
¿Existe algún efecto de la deforestación sobre el tamaño de las hojas?
¿Existe compensación entre los parámetros morfológicos analizados? H. Aponte (2013) – Manual Ecología Numérica con PAST
15
Haga un análisis descriptivo para tener una idea de la situación de los datos en campo. Una vez realizado el análisis, verifique la normalidad de los datos. De poder verificarse la normalidad Aplique ANOVA, siguiendo la ruta statistics>One-way Anova. Si no procede, utilice los análisis estadísticos descritos en la sección anterior.
Gráficos de dispersión, correlación y regresión lineal Para responder a la tercera pregunta es necesario hacer un gráfico de dispersión (un gráfico XY). Para ello seleccione la totalidad de los datos y siga la ruta plot>XY plot (Figura 11).
Figura 11. Gráfico XY
Por inspección del gráfico, se puede apreciar que no hay relación alguna entre las variables. Para cerciorarse de ello es importante hacer un test de correlación. Para ello siga la ruta Statistics>Correlation table. La Tabla de Correlación le permitirá tener los resultados del análisis de correlación (valor bajo la curva) acompañados de un valor p (valor sobre la diagonal) para cada análisis (Figura 12). H. Aponte (2013) – Manual Ecología Numérica con PAST
16
Figura 12. Tabla de Correlación Asimismo, puede usted realizar una regresión lineal y obtener el coeficiente de regresión (R2=r^2), la pendiente (slope a) y la constante de la curva (interc b) (figura 13).
Figura 13. Regresión lineal.
ESTADÍSTICO IMPORTANTE: Correlaciones y Coeficiente de regresión
Los análisis de correlación te indican si hay una correlación entre dos variables. Cuando los valores son negativos, significa que la relación es inversamente proporcional. Cuando los valores son positivos indica que la relación es directamente proporcional. Siempre verificar el p valor (si p valor < 0.05 hay una correlación estadísticamente significativa, si no se verifica, no hay correlación). H. Aponte (2013) – Manual Ecología Numérica con PAST
17
2
El coeficiente de regresión (R ) nos indica cuan cerca a los puntos se encuentra la línea 2
fruto de la regresión. Si el R es 0 significa que no se acerca a los puntos, es decir, que no 2
explica la distribución de los puntos en el plano. Si el R es 1 significa que la línea pasa por todos los puntos; es decir, que explica la distribución de los puntos en el plano.
Ejemplo 3. Revegetación en Tillandsiales Basado en (Aponte & Flores 2013): Densidad y Distribución Espacial de Tillandsia
latifolia en el Tillandsial de Piedra Campana (Lima, Perú). Revista Ecología Aplicada 12(1): 35-43 Los tillandsiales (formaciones vegetales dominadas por plantas de género Tillandsia) son ecosistemas permanentes que se encuentran en la costa peruana y chilena. Los tillandsiales son ecosistemas que se encuentran afectados en nuestra costa principalmente por contaminación con basura, su uso para deportes de aventura y la construcción de carreteras, tal y como se ha observado en el área de estudio. El uso de estos ecosistemas para deportes de aventura ha sido también reportado para algunas localidades de Chile donde se indica de el grave peligro que corren estos ecosistemas debido a estas actividades (Pinto et al. 2006). Con el objetivo de estudiar la densidad y distribución espacial de Tillandsia latifolia en el Cerro Piedra Campana (Lima, Perú) y su relación con 2
la topografía y el sustrato, fueron realizadas 72 parcelas cuadrangulares de 100 m
cuantificando la cobertura (ubicadas sistemáticamente en toda el área de estudio). Usted cuenta con esos datos (Ej3 Tillandsia). Responda las siguientes preguntas:
¿Existen diferencias significativas en la cobertura según la orientación de la ladera? ¿Cuál es la zona más vulnerable?
Si tuviera que transplantar individuos para la revegetación de un tillandsial afectado: ¿Qué orientación sería la mejor para revegetar? ¿De qué zona (del Tillandsial Piedra Campana) escogería las plantas?
H. Aponte (2013) – Manual Ecología Numérica con PAST
18
Pruebas Post-Hoc
PAST automáticamente realiza las pruebas Post Hoc cuando la variable tiene más de tres formas. Cuando se aplica un estadístico paramétrico (Anova) realiza el análisis de Tukey. Cuando la prueba es no paramétrica aplica la U de Mann Whitney (Figura 14). Las diferencias entre los grupos son arrojadas como p-valores sobre la diagonal.
Figura 14. Análisis Post-Hoc no paramétrico
ESTADÍSTICO IMPORTANTE: p valores en las pruebas Post Hoc
Las pruebas Post-Hoc son pruebas que permiten (una vez realizada la prueba de hipótesis inicial) revisar entre cuál de las formas de las variables (tratamientos, zonas, en nuestro caso orientación) existe diferencias significativas. Ello nos permite inclusive formar a
grupos, los mismos que se representan usualmente con una letra como subíndice ( por ejemplo). Los valores p en las pruebas post Hoc reciben la misma interpretación que los valores p para las pruebas de hipótesis (cuando es < 0.05 hay diferencias estadísticamente significativas).
H. Aponte (2013) – Manual Ecología Numérica con PAST
19
Ejemplo 4: ¿Qué variables caracterizan mi estación biológica? En una estación biológica se observa un cambio radical en la estructura comunitaria (diversidad y composición específica) después del mes de mayo. Usted cuenta con los datos de pH, Conductividad, partículas disueltas, Nitrógeno (como nitratos y como amonio), fosfatos, demanda biológica de Oxígeno, Turbidez y saturación de oxígeno (ej4 ACP). Se le solicita determinar cuáles fueron los cambios en los parámetros abióticos que llevaron a los cambios en la estructura de las comunidades. Intente responder a las siguientes preguntas:
¿Qué parámetro abiótico es el principal factor que conllevó a la modificación de la estructura de las comunidades en estos meses?
¿Se trata de un cambio natural? ¿Puede deberse a la intervención humana?
Análisis de Componentes principales (ACP)
Los estudios de biología nos levan a tomar muchos datos acerca de nuestras estaciones biológicas, entre ellos, parámetros abióticos (temperatura, humedad, profundidad, entre otros). Muchas veces estos datos son tomados en el tiempo y se tiene una progresión temporal en la cual resulta difícil discernir la característica más importante en un determinado momento. Entender qué parámetro es el que determina las características de mi estación biológica en determinada fecha es fundamental para tener una idea del componente abiótico más importante en un determinado momento y poder relacionarlo a las características de los componentes bióticos. El ACP permite reconocer el parámetro que caracterizó una estación en una progresión de tiempo. Utilice los datos del ejemplo 4 para realizar un análisis de componentes principales Siga la ruta Multivar>Principal Components. Probablemente tenga que convertir los datos para que estén en una misma escala (la conversión a logaritmo es una
buena opción, pero los ceros no serán reconocidos por el programa).
H. Aponte (2013) – Manual Ecología Numérica con PAST
20
Una vez homogeneizados los datos usted obtendrá el cuadro con los valores que determinan el porcentaje de explicación de cada componente (Figura 15). Seleccione la opción View Scatter que le presentará el gráfico en el cual usted puede seleccionar la opción Biplot para poder apreciar la relación entre la distribución de los puntos y los parámetros abióticos medidos, así como la opción Row labels para apreciar los títulos de los puntos (meses del año) (Figura 16).
Figura 15. Valores explicativos (Eigenvalue) de cada componente
H. Aponte (2013) – Manual Ecología Numérica con PAST
21
Figura 16. Biplot del Análisis de componentes principales.
Ejemplo 5. Efectos de la ganadería en los humedales costeros Basado en
Aponte & Ramírez (2011): Los Humedales de La Costa central del Perú:
Comunidades Vegetales y Conservación. Rev. Ecol. Apl. 10(1): 31 – 39.
Los humedales de Lima son parte de un corredor biológico a lo largo de la costa desértica del Perú. La mayor parte de estos ambientes coexiste con poblaciones humanas, quienes hacen uso de los recursos que los humedales les proporcionan, por ejemplo
Schoenoplectus americanus (Pers.) Volkart ex Schinz & R. Kéller (conocido como « junco ») es utilizado para la fabricación de productos artesanales (León et al. 1998). Otras actividades en estos ecosistemas son la pesca artesanal y la crianza de ganado vacuno y ovino. En ese sentido, la relación hombre-naturaleza tiene un lado productivo positivo. Sin embargo, esta relación también presenta un aspecto negativo, la extracción del junco en algunos humedales genera desechos que promueven la presencia de plagas (por ejemplo, la polilla y la quereza del junco) las cuales dañan diversas especies nativas (Aponte 2009). Otros humedales reciben aguas servidas y desechos orgánicos de poblaciones humanas aledañas, afectando la calidad del agua en estos ambientes (Young 1998). Asimismo, la ganadería es una actividad frecuente en los humedales costeros y que puede afectar la estructura de las comunidades vegetales. Usted cuenta con datos de dos H. Aponte (2013) – Manual Ecología Numérica con PAST
22
localidades: Las Albuferas de Medio Mundo (Végueta, no impactado intensamente) y los Humedales de Santa Rosa (Chancay, impactados por ganadería y agricultura)
(Ej 5
Humedales). Realice los análisis que le permitan evidenciar y explicar el efecto de la ganadería sobre las comunidades vegetales.
Análisis de correspondencia El análisis de correspondencia permite colocar en el un espacio bidimensional puntos que corresponden a determinadas variables. La distancia entre los puntos es calculado por distancias euclidianas. Este análisis permite apreciar la estructura de las poblaciones cuando se poseen de datos de abundancia (como en el ejemplo 5) y es la base para el análisis de comunidades que utilizan software como Can oco. Realice por separado el gráfico de correspondencia de Santa Rosa y de Medio Mundo. Luego haga el análisis siguiendo la ruta Multivar>Correspondence. Active las casillas de Column dot, Row sample, Row labels y Column Label para poder apreciar a qué parcela y especie corresponde cada punto (Figura 17).
. Figura 17. Ejemplo de Análisis de Correspondencia para Los Humedales de Santa Rosa IMPORTANTE: Recuerde que para hacer este tipo de análisis las muestras (parcelas)
deberán estar en las filas; de no estarlo las puede transponer directamente en el PAST siguiendo la ruta Edit > Transpose.
H. Aponte (2013) – Manual Ecología Numérica con PAST
23
Ejemplo 6. Análisis de Diversidad en Los Suelos Crioturbados
Basado en Cano et al. (2010): Flora y vegetación de suelos crioturbados y hábitats asociados en la Cordillera Blanca, Ancash, Perú. Rev. Peru. Biol. 17: 095 – 0103. La cordillera de los Andes proporciona una gran variedad de hábitats y diversidad biológica al Perú. Suelos crioturbados son aquellos sometidos a una secuencia de hielo y deshielo; fenómeno que ocurre diariamente en la parte alta de los Andes tropicales y que provoca el desplazamiento de partículas, modificando su distribución en las capas del suelo. Esta condición, sumada a las bajas temperaturas, la intensa radiación solar, y otros factores edáficos y climáticos, hacen que la vegetación que colonizan estos suelos sea diferente a la encontrada en hábitats circundantes, principalmente respecto a su diversidad, estructura, fisiología y ecología (Figura 18).
Figura 18. Especies propias de suelos crioturbados. a) Stangea henrici ( Valerianaceae ), b)
Xenophyllum decorum ( Asteraceae ), c) X. dactyllophyllum y d) Nototriche antoniana (Malvaceae). Tomado de Cano et al 2010.
H. Aponte (2013) – Manual Ecología Numérica con PAST
24
Con el objetivo de analizar la diversidad en este tipo de ecosistemas se hicieron un total de 21 parcelas (10 en suelos crioturbados y 11 en hábitat asociados). Usted cuenta con los datos de abundancia de cada especie por parcela (Ej. 6 Crioturbados). Con los datos que usted cuenta intente responder:
¿En cuál de las zonas (crioturbados o asociados) la diversidad es mayor?
¿En cuál de las zonas el recambio de especies es mayor? ¿Cuán similares son los puntos dentro de los suelos crioturbados? ¿Qué parcelas se semejan más?
¿Cuál es el esfuerzo mínimo de muestreo que debo realizar para monitorear los suelos crioturbados?
Índices de diversidad Alfa Entendemos por diversidad al conjunto de especies, sus genes y los hábitats donde viven estas especies. Dado que esto es prácticamente inmedible se utilizan los datos disponibles para tratar de comprender mejor la diversidad biológica que hay en un determinado lugar. Una de las formas de abordarlo es a partir de la cuantificación de índices de diversidad alfa. La diversidad alfa se concentra en medir la riqueza, abundancia y equitabilidad de las especies en un determinado lugar; en consecuencia, los índices de diversidad alfa medirán estos parámetros. Para ello, estos índices se basan en la teoría de las probabilidades. Veamos un ejemplo. Imaginemos que tenemos tres bolsas con canicas de diferentes colores (A, B y C en la figura 19). Es posible apreciar que, si yo metiera mi mano a la bolsa A
y sacara una canica al azar, podría salir cualquiera de los colores (existe
equitabilidad, la misma abundancia de cada color).
Figura 19. Bolsas A, B y C H. Aponte (2013) – Manual Ecología Numérica con PAST
25
En cambio, en la bolsa B, la probabilidad de sacar una canica azul aumenta, y se hace aún más evidente en la bolsa C (la equitabilidad disminuye, y la abundancia de cada especie disminuye). Aquellas bolsas (ecosistemas) donde las probabilidades sean iguales para todas las canicas (especies) serán considerados con u na mayor diversidad alfa. Existen dos grandes grupos de índices alfa:
Aquellos que aumentan conforme aumenta la riqueza y equitabilidad. Entre ellos tenemos al índice de diversidad de Simpson, Shandon-Wienner, Brillouin, Mehinick, Margalef, Fisher alfa y Chao-1.
Aquellos que aumentan conforme aumenta la dominancia (visto de otra manera, disminuyen conforme aumenta la diversidad). Entre ellos tenemos al índice de Dominancia de Simpson, Eveness y Berger-Parker.
Utilice los datos de diversidad total en cada tipo de zona (crioturbado o hábitat asociado) para obtener los índices de diversidad para cada zona. Puede hacerlo también Por cada parcela por separado y obtener un promedio. La ruta es Diversity>Diversity índices. Obtendrá una tabla con todos los índices para cada parcela o para el total según el análisis que haga usted (Figura 20). Para hacer el análisis simultáneamente entre dos columnas debe tener todas las casillas llenas (las puede rellenar con ceros).
Figura 20. Resultado del análisis con índices de diversidad alfa
H. Aponte (2013) – Manual Ecología Numérica con PAST
26
Perfiles de diversidad Otra forma de comparar la diversidad es haciendo unos gráficos denominados perfiles de diversidad. Estos gráficos utilizan los valore de riqueza (alfa=0) el índice de Shanon Wienne (para alfa=1) y el índice de Simpson (alfa=2). De esta manera pueden verse curvas simultáneas y discernir en cuál de ellas hay mayor diversidad. La ruta es Diversity>Diversity profiles (figura 21). Es posible añadir curvas de confiabilidad al 95% solo activando la casilla.
Figura 21. Perfiles de diversidad para las pa rcelas evaluadas en Suelos Crioturbados y Asociados.
Test estadísticos para comparar diversidad
Es posible hacer comparaciones estadísticas que nos permitan determinar si la diversidad es diferente entre ambos puntos. Uno de estos análisis lo ofrece PAST en su opción Compare diversities. En este caso PAST arma matrices nuevas por Bootstrap o por Permutación para poder establecer si hay diferencias significativas entre cada índice (valor p SHE analysis (figura 24).
Figura 24. Ejemplo de análisis SHE con los datos de las parcelas hechas en suelos crioturbados.
Riqueza por parcela (Quadrat Richness)
PAST también calcula la riqueza por parcela a partir de datos de presencia/ausencia (0/1) en una localidad. Para ello deberá transformar los datos de crioturbado (o asociado) a presencia/ausencia (Transform>Abundance to presence/absence) y aplicar el análisis de Quadrat Richness (Figura 25).
H. Aponte (2013) – Manual Ecología Numérica con PAST
29
Figura 25. Quadrat Richness de datos provenientes de Suelos Crioturbados
Índices de diversidad Beta Los índices de diversidad Beta, a diferencia de los alfa, se encargan de medir el recambio de especies. Dicho de otra manera, estos índices medirán cuantas especies se ganan y cuantas se pierden por cada parcela realizada en una localidad (o tipo de ecosistema). Este recambio será mayor en zonas con mayor diversidad. A mayor recambio, mayor será la diversidad beta. PAST calcula 8 índices de diversidad Beta y los muestra en una tabla. Para ello es necesario una matriz con datos de presencia y ausencia. Luego siga la ruta Diversity>Beta Diversity (figura 26). Es posible pedirle al PAST que haga comparaciones por pares seleccionando el índice que se desea (lado superior derecho de la pantalla emergente).
H. Aponte (2013) – Manual Ecología Numérica con PAST
30
Figura 26. Análisis de Diversidad Beta para los suelos c rioturbados
Límites de los índices de diversidad
Usar los índices de diversidad es muy sencillo (los cálculos se obtienen de inmediato con PAST), pero, al mismo tiempo, tiene sus límites. No es necesario depender de los índices de diversidad para hacer los análisis de diversidad. Por ejemplo, intente comparar la riqueza entre suelos crioturbados y hábitat asociados: ¿Hubiera tenido el mismo resultado? ¿Se hubiera discutido de la misma forma? El uso de los índices de diversidad está ampliamente difundido aunque muchas veces pocos entienden los resultados, o inclusive lo calculan de diferente manera (por ejemplo, el logaritmo no siempre usa la misma base en cada paquete estadístico); por ello es muy importante comprender no solo el valor, sino ir más allá y averiguar el algoritmo utilizado para el cálculo.
H. Aponte (2013) – Manual Ecología Numérica con PAST
31
Asimismo, con la finalidad de optimizar la evaluación obtenida a partir de los índices, es necesario corroborar que los muestreos entre los cuales se vayan a comparar hayan sido realizados con el mismo esfuerzo, el mismo es pecialista y el mismo método… cosa que muy pocas veces se cumple. Ello lleva a errores de interpretación. Aún así los índices de diversidad son muy útiles, pero deben ser considerados como relativos para la toma de decisiones de conservación y deben evaluarse de la mano con datos de importancia ecosistémica de las especies o, inclusive, listado de especies endémicas o invasoras.
Curvas de Rarefacción
Las curvas de rarefacción tienen diferentes usos. Uno de ellos es comparar la diversidad en dos muestras de diferente tamaño. Las curvas de rarefacción permiten analizar el número mínimo de parcelas que se deben realizar para poder hacer un muestreo suficientemente exhaustivo (por ejemplo en un monitoreo constante. Hay dos clases de curvas: a) Curvas de rarefacción por individuo Permite medir el número de individuos que debo muestrear como mínimo para monitorear toda la diversidad. Para preparar esta curva se requieren datos de abundancia total. La ruta es Diversity>Individual Rarefaction (figura 27). b) Curvas de Rarefacción por muestra Esta curva permite calcular el número mínimo de parcelas que se deben realizar para muestrear la diversidad total de una localidad. Para ello se necesitan datos de presencia y ausencia en una localidad. Luego seguir la ruta Diversity>Sample Rarefaction (Figura 28). Inclusive los datos obtenidos para la curva de rarefacción pueden modelarse siguiendo el modelo de Mikaelis-Menten.
H. Aponte (2013) – Manual Ecología Numérica con PAST
32
Figura 27. Curva de Rarefacción por individuo de los suelos crioturbados
Figura 28. Rarefacción por muestra para suelos crioturbados
H. Aponte (2013) – Manual Ecología Numérica con PAST
33
Dendrogramas de similaridad Existen múltiples índices de similaridad que permiten construir dendogramas entre los puntos muestreados en una misma localidad. Para ello se requieren de datos de presencia y ausencia (0/1). Siga la ruta Multivar>Cluster Analysis (figura 29). Recuerde que para realizar este análisis las parcelas deben estar ubicadas en el lado de las filas, no en las columnas (puede usar el comando edit>transpose).
Figura 29. Dendrogramas de Similaridad entre las parcelas muestreadas en los suelos crioturbados con el índice de Jaccard.
Ejemplo 7. ¿Endémica o invasora?
Las especies crípticas (también denominadas especies gemelas) son especies muy semejantes a nivel morfológico y fisiológico, pero que están separadas por barreras reproductivas(Mayr 1996). Un análisis exhaustivo de los anfibios de la Reserva Nacional de Pacaya Samiria (Loreto) permitió la colecta de una muestra (muestra X) que pertenece a un grupo de anfibios crípticos. Dentro de este grupo la especie S corresponde a un grupo H. Aponte (2013) – Manual Ecología Numérica con PAST
34
muy abundante con características invasivas. Por otro lado la especie E es una especie endémica de nuestro país muy poco frecuente. Usted cuenta con los datos morfológicos de 25 caracteres del aparato reproductivo de estas especies, caracteres que permiten diferenciar a estas especies crípticas, provenientes de 8 individuos (6 de la especie S y 2 de la especie E)(ej7 Críptica). Intente responder las siguientes preguntas:
¿A qué especie corresponde la muestra X?
¿Qué medida optaría según sus resultados?
Construcción de cladogramas y análisis de parsimonia PAST permite hacer cladogramas fácilmente utilizando la opción Cladistics>Parsimony Analysis. Recuerde siempre copiar los caracteres en las columnas, las muestras en el eje Y, y de tener en como primera fila al Outgroup (Figura 30). Puede usted también solicitar el cálculo del árbol consenso y que se muestren los valores Bootstrap.
Figura 30. Cladograma obtenido con los datos de las muestras de las especies S, E y X
H. Aponte (2013) – Manual Ecología Numérica con PAST
35
Referencias Bibliográficas
Aponte, H. 2009. El junco. Clasificación, Biología y gestión. Científica 6 (1): 38 – 45. Aponte, H. 2012. Efectos de las actividades agropecuarias sobre la estructura poblacional de
Astrocaryum perangustatum F. Kahn & B. Millan (ARECACEAE) en Pozuzo (PascoPerú). Científica 9(1): 17 – 32. Aponte, H. & J. Flores. 2013. Densidad y distribución espacial de Tillandsia latifolia en el tillandsia de Piedra Campana (Lima, Perú). Rev. Ecol. Apl. 12 (1): 35 – 43. Aponte, H., F. Kahn & B. Millán. 2011. Adaptabilidad vegetativa a la deforestación de la palma peruana Astrocaryum perangustatum. Rev. Peru. Biol. 18: 179 – 183. Aponte, H. & W. Ramírez. 2011. Los Humedales de La Costa central del Perú: Comunidades Vegetales y Conservación. Rev. Ecol. Apl. 10(1): 31 – 39. Cano, A., W. Mendoza, S. Castillo, M. Morales, M.I. La Torre, H. Aponte, A. Delgado, N. Valencia & N. Vega. 2010. Flora y vegetación de suelos crioturbados y hábitats asociados en la Cordillera Blanca, Ancash, Perú. Rev. Peru. Biol. 17: 095 – 0103. Dytham, C. 2011. Choosing and Using Statistics: A Biologist’ s Guide. John Wiley & Sons. Emden, H. van. 2012. Statistics for Terrified Biologists. John Wiley & Sons. Hammer, Ø., D.A.T. Harper & P.D. Rayan. 2001. PAST: Paleontological statistics software package for education and data analysis. Palaeontol. Electron. 4(1): 9. León, B., A. Cano & K. Young. 1998. Uso Actual de la Flora y Vegetación en los Humedales de la Costa Central del Perú, p. 191 – 104. In Los Pantanos de Villa: Biología y Conservación, Serie de Divulgación N°11. Universidad Nacional Mayor de San Marcos, Lima - Perú. Mayr, E. 1996. What is a species, and what is not? Philos. Sci. 262 – 277. Norman, G.R., J.E.D.B. Norman & D.L. Streiner. 1996. Bioestadística. Elsevier España. Pinto, R., I. Barria & P.A. Marquet. 2006. Geographical distribution of Tillandsia lomas in the Atacama Desert, northern Chile. J. Arid Environ. 65: 543 – 552. Young, K. 1998. El Ecosistema, p. 3 – 20. In Los Pantanos de Villa: Biología y Conservación, Serie de Divulgación N°11. Universidad Nacional Mayor de San Marcos, Lima - Perú.
H. Aponte (2013) – Manual Ecología Numérica con PAST
36