Sie sind auf Seite 1von 41

Bioestadstica

Mtodos paramtricos y no
paramtricos

Medias, varianza y correlacin

Pruebas para variables continuas


Porqu usamos pruebas no paramtricas?
Porque no siempre se cumplen todos los
supuestos requeridos por las pruebas de
hiptesis tradicionales (paramtricas):

Distribucin normal
Tamao de muestra grande
Varianzas iguales (?)
Si la distribucion de la poblacion es sesgada
(Por lo que la media no es buen indicador de
tendencia central)
Cmo se aplican estas pruebas:
Aplicar una transformacin a los datos originales,
convertindolos en rangos, valores positivo o
negativo, etc.

Con los datos transformados, calcular un


estadstico en base a los datos (a veces tambin
se calcula su promedio y error estndar)

Con el estadstico y los parmetros calculados,


realizar una prueba de hiptesis de acuerdo a
una cierta distribucin paramtrica (Normal, Ji-
cuadrado, Binomial, etc.)
Transformaciones de datos

Si los datos tienen una distribucin


sesgada, en ocasiones pueden
transformarse para eliminar los sesgos

En algunos casos se puede emplear un


test paramtrico despus de la
transformacin
Ejemplo:
Si trabajamos con parasitemia, con frecuencia
tendremos que aplicar una transformacin

Log
Comando gladder:
Anlisis con variables numricas:
Anlisis Paramtrico No paramtrico
Describir un grupo , 2 Mediana, rango
intercuartil
Comparar un grupo T Student de una Prueba Wilcoxon
a un valor muestra
Comparar medias T Student de dos Mann-Whitney
en 2 grupos muestras
Comparar medias T Student Prueba Wilcoxon
en 2 grupos apareada
apareados
Comparar medias ANOVA Kruskal-Wallis
en 3 o mas grupos
Correlacin entre Pearson (lineal) Spearman
dos variables (monotnica)
Comparacin de una muestra contra una
constante

Se piensa que la edad de inicio del consumo


de cigarrillos es la adolescencia

Puntualmente se plantea que el consumo se


inicia a los 15 aos

Si la distribucin es sesgada o la muestra es


pequea, una prueba paramtrica sobre la
media puede ser poco relevante
histogram p59, fraction
.2
.15
Fraction

.1
.05
0

0 20 40 60
qu edad tena ud. cuando fum cigarrillos por primera vez?
Prueba T Student de una muestra
Aunque no es necesario, hagamos
la prueba no paramtrica:

Bioestadstica
Aplicada
Prueba signrank (Wilcoxon)

Ho: Mediana de la diferencia = 0


p59 15 = 0 p59 = 0

Asume una distribucin uniforme


alrededor de cero

Compara puntajes esperados con


observados
Bioestadstica Aplicada
Comparacin entre dos muestras
independientes
Se piensa que la edad de inicio del consumo
de cigarrillos vara entre varones y mujeres

Si la distribucin es sesgada, una prueba


paramtrica sobre la media puede ser poco
relevante

Si los tamaos de muestra son pequeos (n


< 30), el TLC no se cumplir y la prueba T
podra llevar a conclusiones errneas
Bioestadstica Aplicada
Prueba T Student (paramtrica):
Ho: varones = mujeres Ha: varones mujeres

Bioestadstica Aplicada
Igualdad de varianzas:

La prueba T de Student de grupos


independientes difiere si las varianzas
difieren entre los grupos, debiendo
agregarse la opcin unequal

Para evaluar si las varianzas son


comparables o no se utiliza el comando
sdtest

Bioestadstica Aplicada
Prueba de Varianzas (sdtest)
Ho: 2varones = 2mujeres Ha: 2varones 2mujeres

Bioestadstica Aplicada
T Student con varianzas
diferentes:

Bioestadstica Aplicada
Prueba de Mann-Whitney:
Equivalente no paramtrico a una prueba de
hiptesis de promedios para dos muestras

Determina si una variable tiene valores mas


altos en una poblacin que en otra. NO
COMPARA LOS PROMEDIOS!!!

Util si el tamao de muestra es pequeo o la


distribucin es demasiado sesgada

Bioestadstica Aplicada
Qu son los puntajes correlativos?
60
40
20
0

Varones Mujeres
.5 1 1.5 2 2.5
inf_sexo

Bioestadstica Aplicada
Prueba de Mann-Whitney:
Ho: Fumarvarones = Fumarmujeres Ha: Fumarvarones Fumarmujeres

Bioestadstica Aplicada
Interpretacin

Se estn comparando valores o la


distribucin, no los promedios

Si en un grupo los puntajes observados


son mayores a los esperados, ese
grupo tiene mayores valores

Bioestadstica Aplicada
Comparacin de dos grupos
apareados
Es una sola muestra, en verdad, en la que se
han medido dos valores

Se puede calcular la diferencia entre los


valores y sera una prueba de una sola
muestra

Qu comienza primero, alcohol o tabaco?

Prueba no paramtrica til si es muestra


pequea o distribucin muy sesgada
Bioestadstica Aplicada
Prueba T Student apareada:
Ho: fumar = tomar Ha: fumar tomar

Bioestadstica Aplicada
Prueba signrank (Wilcoxon):

Bioestadstica Aplicada
Anlisis de Varianza:
Prueba paramtrica para determinar si hay
diferencias en el promedio de una variable
cuantitativa (inicio fumar) entre tres o ms
poblaciones (estratos sociales). Supuestos:
Distribucin normal en todas las poblaciones (no
es necesario si el tamao de muestra es
grande)

Varianzas comparables entre poblaciones

Observaciones (muestras) independientes


Bioestadstica Aplicada
Comparacin de Varianzas:
Se usa en el ANOVA para determinar si hay
diferencias entre promedios de varias
muestras

Tambin se usa ANOVA en el anlisis de


regresin, siendo un caso particular del
ANOVA

Utiliza la prueba estadstica F

Bioestadstica Aplicada
Las hiptesis:

Hiptesis nula, Ho:


X-inicioAlto = X-inicioMedio = X-inicioBajo

Hiptesis alternativa, Ha:


Existen diferencias en la edad de inicio
de fumar promedios de al menos dos
estratos sociales

Bioestadstica Aplicada
Bioestadstica Aplicada
Prueba de Kruskal-Wallis:

Extensin de la prueba de Mann-Whitney a


mas de dos poblaciones

Equivalente no paramtrico del anlisis de


varianza

TAMPOCO COMPARA PROMEDIOS:


determina si una poblacin tiene valores
diferentes (mas altos o mas bajos) que las
otras poblaciones

Bioestadstica Aplicada
Los puntajes correlativos:
60
40
20
0

.5 1 1.5 2 2.5 3 3.5


estrato social

Bioestadstica Aplicada
En Stata:

Bioestadstica Aplicada
Determinando pares diferentes:

Bioestadstica Aplicada
Correlacin r de Pearson
Mide el grado de asociacin lineal entre dos
variables numricas

-1 <= r <= 1, r = 0 indica independencia

Se calcula en stata con el comando pwcorr

Requiere muestras grandes, distribuciones


cruzadas no sesgadas

Bioestadstica Aplicada
Las hiptesis:

Hiptesis nula (Ho):


rfumar - tomar = 0

Hiptesis alternativa (Ha):


rfumar - tomar 0

Bioestadstica Aplicada
scatter p59 p89
60
40
p59b

20
0

0 10 20 30 40 50
p89b

Bioestadstica Aplicada
Resultados:

Bioestadstica Aplicada
Correlacin de puntajes
(Spearman):
Equivalente no paramtrico a la prueba de
correlacin lineal de Pearson. Se aplica cuando
la correlacin no es lineal, la muestra es
pequea o existen valores muy extremos

Determina si dos variables cuantitativa u


cualitativa-ordinal estn correlacionadas positiva
(una crece y la otra tambin) o negativamente
(una crece y la otra disminuye)

Al igual que las pruebas de Mann-Whitney y


Kruskal-Wallis, tambin utiliza datos por rangos
Bioestadstica Aplicada
Las hiptesis:

Hiptesis nula, Ho:


-puntajesfumar - tomar = 0

Hiptesis alternativa, Ha:


- puntajesfumar - tomar 0

Bioestadstica Aplicada
Resultados:

Bioestadstica Aplicada
Que debemos llevar a casa hoy:
Alternativas disponibles cuando no se
cumplen las condiciones para usar
pruebas parmetricas

Como aplicar e interpretar las pruebas de


Wilcoxon, Mann-Whitney, Kruskal-Wallis y
Spearman

Limitaciones de las pruebas no


paramtricas
Bioestadstica Aplicada

Das könnte Ihnen auch gefallen