You are on page 1of 18

Anlisis estadstico de datos de cultivos in-vitro usando R

Juan Pablo Angamarca G. Becario Escuela de Ciencias de la Computacin Jpangamarca@utpl.edu.ec Mat. Pablo Ramn C. Docente Investigador Docente Investigador LFV UTPL paramon@utpl.edu.ec Unidad de Fisiologa y Ecologa Vegetal

Objetivos
Realizar el anlisis estadstico de los datos de cultivos in-vitro usando el lenguaje estadstico R como una mejor alternativa entre el software estadstico clsico. Incorporar nuevos procedimientos al anlisis estadstico mediante el lenguaje R, concretamente representaciones grficas, con la finalidad de optimizar la interpretacin biolgico-estadstica. Aprovechar la flexibilidad que ofrece este lenguaje estadstico en dicho anlisis.

Metodologa
Fase 1: Entender el funcionamiento del lenguaje R mediante la lectura de artculos y tutoriales. Fase 2: Realizar aplicaciones sencillas de anlisis de datos en el lenguaje. Fase 3: Utilizar los datos de las investigaciones realizadas en el laboratorio de Fisiologa Vegetal para un anlisis estadstico adecuado. Fase 4: Extender la fase 3 utilizando las caractersticas de programacin del lenguaje.

Anlisis de Varianza
Identificar el origen de la variabilidad de una o ms fuentes potenciales, llamadas tratamientos o factores. Variando los factores o niveles en un diseo predeterminado y analizando los resultados.

Anlisis de Varianza
Comparar promedios de tratamientos. Identificar si la variabilidad depende de los diferentes tratamientos o de un error aleatorio. Hiptesis: H0: 1 = 2 = = Donde i representa la media de cada nivel (one-way) o tratamiento (two-way).

Condiciones de ANOVA
Test de Bartlett (variabilidad) El test de Bartlett (Snedecor y Cochran, 1983) tiene como utilidad el determinar si k muestras tienen varianzas iguales (homogeneidad de varianzas). Test Kolmogorov-Smirnov Es un test de ajuste a una ley continua (normal). Test Shapiro-Wilk (Normalidad de los residuos) El test Shapiro-Wilk es un anlisis de varianza (semi/no) paramtrico que nos dota de evidencia para afirmar que existen ciertos tipos de normalidad, mas no garantiza normalidad.

Condiciones del ANOVA


Test de Bartlett (variabilidad) El test de Bartlett (Snedecor y Cochran, 1983) tiene como utilidad el determinar si k muestras tienen varianzas iguales (homogeneidad de varianzas). Test Kolmogorov-Smirnov Es un test de ajuste a una ley continua (normal). Test Shapiro-Wilk (Normalidad de los residuos) El test Shapiro-Wilk es un anlisis de varianza (semi/no) paramtrico que nos dota de evidencia para afirmar que existen ciertos tipos de normalidad, mas no garantiza normalidad.

Anlisis de Varianza
Luego de realizar el test ANOVA, se realiza una prueba post-hoc, ejm: test Tukey Test post-hoc = test comparaciones mltiples

Lenguaje y Entorno R
R lenguaje y entorno para computacin estadstica y grficos Es un proyecto GNU (software libre) Posibilidad de crear grficos, incluir smbolos y frmulas matemticas donde se necesiten. R es una suite integrada de utilitarios de software Un bien logrado, simple y efectivo lenguaje de programacin que incluye sentencias condicionales, bucles, funciones definidas por usuario y facilidades para ingreso y presentacin de datos

Lectura de datos con R


R puede obtener datos desde varias fuentes Ejm: datos en Excel, as que, para facilitarnos la importacin de datos, podemos exportar una hoja de Excel como un archivo de texto. Luego importarlo con la funcin read.table de R, que al leer el archivo, crear un objeto de datos llamado Data frame, que contendr los datos del archivo. Asignacin a un objeto brotacionCinchona los datos del archivo:
> brotacionCinchona <read.table(datos_anova.txt, header = TRUE)

Lectura de datos con R

CASO DE ESTUDIO: Brotacin de C. officinalis


Desarrollar un test de Bartlett para determinar si las varianzas en cada tratamiento son iguales estadsticamente. H0 = No existe diferencia significativa entre las varianzas de los tratamientos. > bartlett.test(brotacionCinchona$Brotacion, brotacionCinchona$Tratamientos)

Bartlett test for homogeneity of variances data: brotacionCinchona$Brotacion and brotacionCinchona$Tratamientos Bartlett's K-squared = 6.6692, df = 11, p-value = 0.8252

Conclusin: Puesto que p-value es mayor que 0.05, no se rechaza la hiptesis de homogeneidad de varianzas.

Test ANOVA
H0 = No existe diferencia significativa en la brotacin media de cada tratamiento. > aov.brotacionCinchona <aov(brotacionCinchona$Brotacion ~ brotacionCinchona$Tratamientos) > aov.brotacionCinchona Call: aov(formula = brotacionCinchona$Brotacion ~ brotacionCinchona$Tratamientos) Terms: brotacionCinchona$Tratamientos Residuals Sum of Squares 45 230 Deg. of Freedom 11 24 Residual standard error: 3.095696 Estimated effects may be unbalanced
> summary(aov.brotacionCinchona) Df Sum Sq Mean Sq F value Pr(>F) brotacionCinchona$Tratamientos 11 45.000 4.091 0.4269 0.9287 Residuals 24 230.000 9.583

Puesto que Pr > 0.05, no se rechaza la hiptesis de igualdad de promedios entre cada tratamiento.

Grficas de ANOVA

Test TUKEY HSD


OBJETIVO: Determinar tratamientos significativamente diferentes
> resultados.tukey <TukeyHSD(aov.cinchona) > resultados.tukey Tukey multiple comparisons of means 95% family-wise confidence level Fit: aov(formula = Brotacin ~ Tratamientos)

RESULTADOS TEST DE TUKEY

Tratamientos significativos
> parejas.dif.significativa Parejas.de.tratamientos 1 2 3 4 5 6 7 8 9 10 11 12 T-B1N0 T-B1N1 T-B1N2 T-B1N3 T-B2N0 T-B2N1 T-B2N2 T-B2N3 T-B3N0 T-B3N1 T-B3N2 T-B3N3 Valores.p 0.0015792 0.0230317 0.0120260 0.0011190 0.0031345 0.0061755 0.0011190 0.0044048 0.0022264 0.0031345 0.0011190 0.0002812

Grfica Test Tukey


> plot(datos.tukey)