Sie sind auf Seite 1von 31

PLANTILLA ESTADÍSTICA

1
H0: NO HAY RELACIÓN V NO HAY
DIFERENCIAS
H1: HAY RELACIÓN V HAY
DIFERENCIAS
2
¿Cómo se hacen los test?

PARA VARIABLES NORMALES

T-TEST

ANOVA

3
ANOVA DE DOS VÍAS

4
ANCOVA

MANCOVA, MANOVA

5
TEST NO PARAMÉTRICOS (DISTRIBUCIÓN NO NORMAL)

MANN-WHITNEY

WILCOXON

6
KRUSKAL-WALLIS

FRIEDMAN

7
CORRELACIÓN (No hay una relación causal)

2 variables cuantitativas que no se sabe si están relacionadas


Los valores van de 1 a -1. Si el valor es igual a 0 no hay correlación. Si se rechaza H0
hay correlación.

REGRESIÓN

Se asume la relación entre 2 variables cuantitativas

8
REGRESIÓN LOGÍSTICA (En nuestro caso BINARIA)

Escogemos binaria porque hay dos grupos. Hay que decirle que categorías son
cualitativas en covariables categóricas y darle a categoría de referencia “primero”:

9
Vemos que las variables relacionadas con colesterol son edad, TG y ApoEcod. El
“Exp(B)” es la OR y lo que vemos es que el ApoEcod es el mayor factor de riesgo para
el colesterol.

10
REGRESIÓN LINEAL

Vemos que la correlación entre edad y tibia en un inicio era muy alta pero ahora nos
sale un valor muy bajo y eso es porque la tibia por sí sola no explica nada. Lo que
tenemos que hacer es poner como método el pasos sucesivos para que no introduzca
variables que no tienen una correlación significativa.

11
12
Lo que está haciendo aquí es darnos estadísticos para cada modelo. La primera variable
que entra es la de fémur y después hace una correlación parcial donde la variable de
control es fémur. Dentro de las variables excluidas es humero el que tiene un mayor
valor y la variable que entra pasa a controlar. En las variables excluidas la última que
entra no aporta nada nuevo al modelo.

Lo mejor es hacer este modelo de paso sucesivo para ver qué variables son las que
tienen más o menos influencia.

13
ANÁLISIS FACTORIAL (ANÁLISIS DE COMPONENTES
PRINCIPALES)

Cuando no hay variables dependientes e independientes, lo que tengo son casos que en
el análisis no juegan ningún papel, por lo que pido es que me reduzcan las variables a
dos tres.

14
Pongo el autovalor en 2 para interpretar un gráfico de dos dimensiones.

15
16
17
Lo que vemos es que la variable 1 con la que está más correlacionada es con ZYB. El
componente dos está correlacionado con BPL positivamente y con las anchuras
negativamente.

Las poblaciones con anchuras grandes tendrán larguras cortas. Esto es un gráfico de
correlaciones múltiples. En este caso si solo nos interesa quedarnos con tamaño nos
centraríamos en el componente 2. El SPSS no hace directamente el gráfico de los casos
que es lo que hay que pedir ahora. Si vemos la vista de variables vemos que han
aparecido tras el análisis dos nuevas variables que explican el 70 % de las 20 originales.
Inclusive puedo utilizar estar variables para hacer nuevos análisis.

18
19
Lo que vemos es si las variables discriminan sobre poblaciones o no. Lo que vemos es
que los buriat (Siberia) son los más diferentes entre todos los otros. También se puede
hacer un eje de coordenadas.

20
También podemos trabajar con este tipo de datos en frecuencias relativas que son de
ausencia o presencia. Vemos que se puede trabajar tanto con ausencia presencia como
con frecuencias absolutas y relativas. Vamos a hacer un análisis de componentes con
frecuencias:

21
Cuando tenemos frecuencias hay que usar mejor la matriz de covarianzas:

22
ANÁLISIS DE CORRESPONDENCIA (CA)

23
Cuanta más inercia haya más separado quedará el periodo.

24
ANÁLISIS DE CORRESPONDENCIA MÚLTIPLE

Si quiero hacer categorías:

Gráficos:

25
26
ANÁLISIS DISCRIMINANTE

ANÁLISIS DISCRIMINANTE

Imaginemos que la variable dependiente es cualitativa. Habría que hacer un análisis


discriminante. La diferencia con la regresión logística es que aquí quiero predecir y no
comparar diversas variables. Esto es como un análisis de componentes principales pero
que busca discriminar entre grupos.

Lo que quiero es buscar un factor discriminante alto.

27
28
Correlación canónica: es la varianza explicada, es decir, es una manera de saber el poder
discriminatorio (cuanto más alta sea es mejor). La lambda de Wilks explica la varianza
no explicada, si es muy baja el poder discriminatorio de mis variables es mayor.

29
Estos son los coeficientes para hacer la fórmula:

Resumen:

Clasificados correctamente al 73 %.

30
Punto de corte entre hombre y mujer es lo mismo que el resultado que te sale tras
aplicar la fórmula.

31