Sie sind auf Seite 1von 68

DISEOS DE INVESTIGACIN Y ANLISIS DE DATOS ORIENTACIONES TEMA N 1 (INTRODUCCIN)

TEMA N 1 ! ESTIMACIN DE PARMETROS Y CONTRASTE DE HIPTESIS

1.- INFERENCIA ESTADSTICA

Estudio de las muestras para conocer la poblacin a la que representan. La inferencia siempre se hace
en trminos probabilsticos (afirmamos con una cierta probabilidad de xito). El error muestral es la
diferencia entre el resultado obtenido en la muestra y el que habramos obtenido si se hubiese trabajado
con la poblacin.
Para cada caracterstica de la muestra que evaluemos se obtiene lo que se conoce como estadstico:
ndices descriptivos de centralidad (Media), variabilidad (Varianza), etc. A partir de los estadsticos
obtenidos en la muestra (lo concreto), se realizan afirmaciones sobre los parmetros de la poblacin (lo
general)

DISTRIBUCIONES DE PROBABILIDAD !

Distribucin Poblacional: (Distribucin de frecuencias que presenta la variable en la poblacin sobre la


que se quiere generalizar). Las medidas en la poblacin se denominan parmetros poblacionales y se
designan con letras griegas ! (Parmetros: Media de la poblacin = , Varianza de la poblacin = 2,
Proporcin de la poblacin = )

Distribucin de la Muestra: (Distribucin de frecuencias que presenta la variable en la en la muestra


con la que se trabaja). Las medidas realizadas en la muestra se denominan estadsticos y se designan
con letras latinas maysculas ! (Estadsticos: Media de la muestra = Y, Varianza de la muestra = S2,
Proporcin de la muestra = P)

Distribucin Muestral de un estadstico: (Distribucin de frecuencias que presenta el estadstico que


vamos a utilizar como base del proceso de inferencia para estimar los parmetros). Resulta de obtener
todas las muestras posibles (de un determinado tamao) de una poblacin y medir en ellas una
determinada caracterstica. Las distribuciones muestrales que ms vamos a utilizar son: la media, la
varianza y la proporcin.

DISTRIBUCIN MUESTRAL DE LA MEDIA !

Teorema Central del lmite: Si una poblacin tiene una media y una varianza 2 finitas, la
distribucin de las medias muestrales de tamao n extradas de manera aleatoria e independiente,
se aproxima a la forma de una distribucin normal con varianza 2/n y media conforme el
tamao de n se va incrementando. __
N ( , / n)

La Distribucin muestral de la media (media de


todas las medias posibles): Se trata de una
distribucin de probabilidad conocida que viene
recogida en las tablas. Es Normal N (0, 1) cuando
lo es la distribucin de la variable estudiada (al
margen del tamao de la muestra) y tiende a la
normal a medida que n va aumentando (al
margen de la distribucin de la variable).
La distribucin muestral de la media se ajusta a
la distribucin t de Student (con n-1 grados de
libertad), si ignoramos la forma de la distribucin
de la variable y/o el tamao de la muestra es
pequeo.

R. MEDRANO (TUTOR) Pgina 1


DISEOS DE INVESTIGACIN Y ANLISIS DE DATOS ORIENTACIONES TEMA N 1 (INTRODUCCIN)

DISTRIBUCIN MUESTRAL DE LA VARIANZA !

La varianza es un ndice de dispersin que permite


determinar la homogeneidad de la variable de estudio. La
distribucin muestral de la varianza se ajusta a la
distribucin Chi-cuadrado (con n-1 grados de libertad).La
cuasi varianza muestral (S2n- 1) es la mejor estimacin de la
varianza poblacional (2). Tiende a la normal a medida que
aumenta el tamao de la muestra (mayor de 100 sujetos)

DISTRIBUCIN MUESTRAL DE LA PROPORCIN !

Se trata de variables dicotmicas o dicotomizadas;


normalmente xito o fracaso. La distribucin de la
proporcin poblacional se ajusta al modelo binomial
con parmetros n y . La distribucin binomial se
aproxima a la normal a medida que el tamao de la
muestra va aumentado (Teorema Central del Lmite), con
parmetros ! N (, p)

D. Muestral (Media) D muestral (Varianza) D. Muestral (Proporcin)


_
Media E (X) = E (S2n- 1) = 2 p =
_ ________ __________
Desviacin Tpica x = / n S2n-1 = 2 2 / n 1) p = (1- ) / n
Error Tpico Media Error Tpico Cuasi Varianza Error Tpico Proporcin
_ _
X- X- (n-1) S2n-1 P-
2
Tipificacin Z = --------- y T = ----------- X n-1 = --------------------- Z = -------------------
/ n Sn-1 / n 2 (1- ) / n
D. Normal D. T Student 2
Distribucin X n-1 gl Distribucin Normal

PROBLEMAS EJEMPLO

El CI de los alumnos de un centro de E. Especial se distribuye normalmente con = 80 y =10. Si de


esta poblacin extraemos una muestra aleatoria de 25 alumnos. Cul es la probabilidad de obtener
una media mayor de 75 puntos?
_ 75 - 80
P (X 75) ! Z = ------------ ! Z = (- 250) se corresponde con p = 00062 ! 1 - 00062 = 09938
10 / 25

Los tiempos requeridos por un cierto autobs para alcanzar uno de sus destinos en una ciudad
grande forman una distribucin normal con una desviacin tpica =1 minuto. Si se elige al azar una
muestra de 17 tiempos, encuentre la probabilidad de que la cuasi varianza muestral sea mayor que 2.
Se busca el valor de ji-cuadrado correspondiente a S2n-1=2
(n-1) S2n-1 16 2
X2n-1 = --------------------- ! X n-1 = ------------ = 32
2

2 12
El valor de 32 se busca en la tabla Chi Cuadrado con 16 grados de
libertad. A este valor le corresponde una probabilidad de 0,99. En
consecuencia, 1-099 = 001! P(S2n-1 >2)

R. MEDRANO (TUTOR) Pgina 2


DISEOS DE INVESTIGACIN Y ANLISIS DE DATOS ORIENTACIONES TEMA N 1 (INTRODUCCIN)

Un partido poltico cree que el 60% del electorado est a favor de su programa. Como su lder
encuentra que esta prediccin es demasiado optimista decide hacer un sondeo con una muestra de
90 personas. Cul es la probabilidad de que como mximo 60 personas estn a favor de su partido?

067 060
P (60/90 = 067)! Z = --------------------- ! Z = (135) se corresponde con p = 09115
06 04 / 90

2.- ESTIMACIN DE PARMETROS

Generalmente se desconocen los parmetros de la poblacin por lo que se hace necesario estimarlos a
partir de los valores muestrales. Un estimador es un estadstico que utilizamos para estimar
parmetros. Se pueden considerar dos formas de estimar los parmetros poblacionales: estimacin
puntual (Conocida como mtodo de los momentos de Pearson, se extrapola el estadstico de la
muestra directamente a la poblacin) y estimacin por intervalos (establece un rango de valores
dentro del cual estara el valor del parmetro, con una determinada probabilidad)

Para que el estimador represente correctamente al parmetro !r cuatro propiedades bsicas:

1.- Carencia de sesgo: un estimador es insesgado o centrado cuando el valor del estadstico (en las
infinitas muestras de tamao n extradas de una poblacin) coincide con el valor del parmetro que
queremos estimar ! U es un estimador insesgado de , si ! E (U) =
La media, la proporcin y la cuasi varianza de la muestra son estimadores insesgados de sus valores
poblacionales
2.- Eficiencia (Precisin): Se considera la inversa de la varianza de su distribucin muestral. Cuanto
mayor es el cociente, mayor es la eficiencia. Eficiencia ! = 1 / 20 (A mayor varianza, menor
eficiencia). La Media Aritmtica es ms eficiente que la Mediana. La Varianza es ms eficiente que la
Cuasi varianza. Cuando tenemos distintos estimadores y queremos determinar el ms eficiente, se
comparan sus eficiencias. Ejemplo: La varianza de la distribucin muestral de dos estimadores es 2 y
1,5. Para un mismo tamao muestral, la eficiencia relativa sera 1,5 / 2 = 0,75. Si el cociente fuera 1
seran iguales.
3.- Suficiencia: el estimador utiliza toda la informacin de la muestra para estimar el parmetro
(Ejemplo: La media muestral sera suficiente para estimar la media poblacional. No lo sera la amplitud
intercuartlica para estimar la varianza poblacional)
4.- Consistencia: El requisito mnimo que se le exige a un estimador es que sea consistente. Un
estimador es consistente si, a medida que se dispone de ms informacin (que aumenta el tamao de
la muestra), aumenta la probabilidad de que la estimacin coincida con el parmetro. La media, la
proporcin y la varianza insesgada son consistentes porque son estimadores insesgados de los
parmetros correspondientes y en sus lmites valen cero (su sesgo y su varianza tienden a 0 a media
que aumenta n)

Cuando el valor del parmetro (poblacin) coincide con el valor del estadstico (muestra), se considera
que la estimacin (inferencia sobre la poblacin a partir de la muestra) es insesgada. Siempre que
operemos se debe procurar que nuestros estimadores sean insesgados y tengan una varianza pequea;
estas dos caractersticas se denominan acuracidad.

Resumen de las propiedades de los principales estadsticos


Carencia de sesgo Eficiencia Suficiencia Consistencia
Media Aritmtica SI > Mediana SI SI
Mediana NO < Media NO SI
Proporcin SI ----- SI SI
2
Varianza NO > S n-1 SI SI
2
Cuasi varianza SI <S SI SI

R. MEDRANO (TUTOR) Pgina 3


DISEOS DE INVESTIGACIN Y ANLISIS DE DATOS ORIENTACIONES TEMA N 1 (INTRODUCCIN)

ESTIMACIN POR INTERVALOS

Una estimacin por intervalos expresa el grado de confianza con el que se espera que est el valor
del parmetro dentro del intervalo, por lo que se suele llamar intervalo de confianza. La amplitud del
intervalo nos indicar su precisin. A menor amplitud, ms precisin, ms informativo es, ms til.
Una estimacin por intervalos depende de cuatro parmetros: una estimacin puntual del
parmetro; una medida de variabilidad; una probabilidad (nivel de confianza) y un supuesto acerca de
la distribucin en la poblacin.

INTERVALO DE CONFIANZA PARA LA MEDIA

N(0,1) t n-1 gl
Distribucin Normal (Conocida 2) Desconocida la 2 (Muestras pequeas)

_ _ _ _ _ _
X + (Z /2) (X) < < X + (Z1- /2) (X) X + (t /2) (Sn- 1/ n) < < X + (t1- /2) (Sn- 1/ n)

Problemas ejemplo: Se midieron los niveles de depresin en una muestra de 100 personas.
Asumiendo un nivel de medida de intervalo y que la variable se distribuye normalmente en la
poblacin, se calcul la media de las puntuaciones y se obtuvo un valor de (Media = 8) y una cuasi
desviacin tpica = 2. Hallar los lmites del intervalo de confianza para la media de la poblacin
con un nivel de confianza del 99%.
_
Datos ! X = 8 Distribucin normal de la VD = 0,01 Sn- 1 = 2

Desconocida la varianza poblacional ! n = 100 (muestra grande: Distribucin normal)


_
Intervalo de confianza ! X (Z Y) = Lmite superior y Lmite inferior

/ 2 = 0,01/2 = 0,005 1 - ( / 2) = 0,995 |Z | = 2,58


__
Error Tpico ! X = Sn- 1 / n ! X = 2 / 10 ! 0,20

Error mximo de estimacin ! |Z | X = (2,58 0,20) = 0,516

Lmites del intervalo de confianza ! 8 (2,58 0,20) = [7,484 y 8,516]

Hallar los lmites del intervalo de confianza suponiendo que la muestra est compuesta por 25
personas, a un nivel de confianza del 95%.
_
Datos ! X = 8 Distribucin normal de la VD = 0,05 Sn- 1 = 2

R. MEDRANO (TUTOR) Pgina 4


DISEOS DE INVESTIGACIN Y ANLISIS DE DATOS ORIENTACIONES TEMA N 1 (INTRODUCCIN)

Desconocida la varianza poblacional ! n = 25 (muestra pequea: Distribucin t de Student)

_ _
Intervalo de confianza ! X (t Sn- 1 / n) = Lmite superior y Lmite inferior

/ 2 = 0,05/2 = 0,025 1 - ( / 2) = 0,975 |t | = 2,06 (Tablas t de Student)


__
Error Tpico ! Sn- 1 / n ! 2 / 5 ! 0,4
__
Error mximo de estimacin ! |t | Sn- 1 / n = (2,06 0,4) = 0,824

Lmites del intervalo de confianza ! 8 (2,06 0,4) = [7,176 y 8,824]

INTERVALO DE CONFIANZA PARA LA VARIANZA


.

(n-1) S2n- 1 (n-1) S2n- 1


Li = ----------------- y Ls = ---------------
X2 (n-1)(1-/2) X2 (n-1)/2

P (Li < 2 < Ls) = 1 -

Los valores de X2 se obtienen en la tabla X2n-1


(Chi-Cuadrado con n-1 grados de libertad)

Distribucin X2n-1 (Chi Cuadrado con n-1 gl)

Problemas Ejemplo: En una muestra aleatoria de 20 sujetos, extrada de una poblacin normal, se ha
obtenido una media de 24 puntos y una cuasi desviacin tpica de 10,8 puntos. Averiguar los lmites del
intervalo de confianza para la varianza de la poblacin, suponiendo = 0,05.

Estimamos la varianza de la poblacin a partir de la varianza de la muestra (estimacin por intervalo):

(n 1) S2n- 1 / (2 / 2) < 2 < (n 1) S2n- 1 / (2 1- / 2)

Segn las tablas 2n-1 (219) ! para ( / 2 = 0,025) ! 8,91 y para (1 - / 2 = 0,975) ! 32,9

(19 10,82) / 32,9 < 2 < (19 10,82) / 8,91 ! Lmites del intervalo de confianza ! [67,36 y 248,7]

INTERVALO DE CONFIANZA PARA LA PROPORCIN

P + (Z / 2 ) (SP ) < < P + (Z1- / 2 ) (SP )


___________
Donde : SP = P (1 P) / n

P (Li < < Ls) = 1 P = (Li + Ls) / 2

Z /2 Sp = Error mximo de estimacin

Sp = Error Tpico (distribucin muestral de la Proporcin)

R. MEDRANO (TUTOR) Pgina 5


DISEOS DE INVESTIGACIN Y ANLISIS DE DATOS ORIENTACIONES TEMA N 1 (INTRODUCCIN)

Problema Ejemplo: Para comprobar la eficacia en la aplicacin de un tratamiento, se someten al mismo


64 pacientes. Finalizado el periodo de aplicacin, se observ que remiti la enfermedad en 50 casos.
Con un nivel de significacin del 92% ( = 0,08), estime por intervalo el porcentaje de efectividad del
tratamiento objeto de estudio.

Datos: Para ( / 2 = 0,04) ! Z = (- 1,75) y Para (1 - / 2 = 0,96) ! Z = (+ 1,75)

Proporcin muestral ! (50 / 64) = 0,781

Intervalo de confianza ! P |Z / 2| (SP) = Lmites Superior e Inferior


___________ ___________________
SP = P (1 P) / n ! SP = 0,781 (1 0,781) / 64 = 0,0517

P |Z / 2| (SP) ! 0, 781 (1,75 0,0517) = [0,87 y 0,69]

Con un margen de error del 8% el tratamiento ser efectivo entre el 69% y el 87% de los casos.

AMPLITUD DEL INTERVALO DE CONFIANZA Y RELACIN CON EL TAMAO MUUESTRAL

La amplitud del intervalo de confianza depende de dos factores: el nivel de confianza y el error tpico de
la distribucin muestral del estadstico (La suma de ambos E = Error mximo de estimacin). Cuanto
mayor es el tamao de la muestra mayor es la precisin del intervalo y mayor la precisin de la
estimacin. Cuanto menor es el error tpico, menor es el intervalo de confianza y, por tanto, ms preciso
(para reducirlo se aumenta el tamao muestral)

ESTADSTICO SUPUESTOS FRMULA


2 2 2
MEDIA Var. Poblacional conocida n = ( Z / 2) /E
Var. Poblacional desconocida
2 2 2
y muestra grande n = (S n-1 Z / 2) /E
Var. Poblacional desconocida
2 2 2
y muestra pequea n = (S n-1 / 2 t n-1) /E
4 2 2
VARIANZA Error Tpico (muestras grandes) n = (2S n-1 Z / 2) /E
2 2
PROPORCIN Error Tpico ( muestras grandes) n = P (1 P) Z /2 /E

Problemas Ejemplo: Por experiencias anteriores se sabe que las estaturas de los soldados tienen una
varianza de 64 cm. Qu tamao debe tener la muestra para que la media estimada no se aleje ms de
1, 5 puntos de la media poblacional?: considere ( = 0,02).

Para ( / 2 = 0,01) ! Z Tablas = 2,33 Varianza poblacional conocida 2 = 64

n = (2 Z2 / 2) / E2 mximo de estimacin ! n = (64 2,332) / 1,52 = 154, 42 154 soldados

Con un margen de error del 2% debemos tomar una muestra de 154 soldados.

" Un estudio sobre la proporcin de fumadores entre el personal de un hospital estableci que slo
fumaban el 35%. Si el anlisis se efectu con un nivel de confianza del 95%, Qu tamao debi
tener la muestra para que la proporcin estimada no se aleje ms de 0,15 puntos de la proporcin
poblacional?: considere ( = 0,05).

Para ( / 2 = 0,025) ! Z Tablas = 1,96

n = P (1 P) Z2 / 2 / E2 mximo de estimacin ! n = 0,35 0,65 1,962 / 0,152 = 38,84 39

Con un margen de error del 5% debemos tomar una muestra de 39 personas.

R. MEDRANO (TUTOR) Pgina 6


DISEOS DE INVESTIGACIN Y ANLISIS DE DATOS ORIENTACIONES TEMA N 1 (INTRODUCCIN)

3.- CONTRASTE DE HIPTESIS

Hiptesis estadstica: proposicin (afirmacin) sobre algn aspecto de la distribucin de una poblacin
(parmetro, forma, etc.) que puede someterse a prueba a travs de una muestra aleatoria de esa
poblacin. No tiene por qu suponerse inters cientfico.

Contraste de hiptesis: Procedimiento por el cual decidimos si una propuesta sobre la poblacin
puede aceptarse o no. Su finalidad es generalizar un resultado muestral a la poblacin de la que procede
la muestra. Siempre se formulan dos hiptesis (exhaustivas y mutuamente excluyentes); de tal modo,
que el rechazo de una implica la aceptacin de la otra.
H0 (hiptesis nula): se acepta provisionalmente como verdadera y se somete a contraste.
H1 (hiptesis alternativa): se acepta al rechazar la hiptesis nula.

Dependiendo de cmo se formule la hiptesis hablamos de direccin del contraste.

BILATERAL O BIDIRECCIONAL UNILATERAL IZQUIERDO UNILATERAL DERECHO

" La media () es algn valor " La media () es algn valor " La media () es algn valor
Igual o distinto a (X) No inferior a (X). No superior a (X).
Ho : = X Ho : X Ho : X
H1 : X H1 : < X H1 : > X

La decisin de utilizar contrastes unilaterales o bilaterales depende de la informacin o la idea del


investigador sobre la tendencia de la variable en la poblacin. Esta decisin influye en el nivel de
significacin () y en la interpretacin de los resultados. El tipo de contraste es similar para la media
(), la proporcin () y la varianza (2). En los tres tipos de contraste, el signo igual est en la H0.
Las hiptesis siempre se hacen sobre los parmetros poblacionales.
Estadstico de Contraste (medida de discrepancia): Instrumento para tomar decisiones sobre la
hiptesis nula, con una cierta probabilidad. La eleccin de un estadstico de contraste depende de las
caractersticas de la variable en la poblacin (forma, parmetros,...), de los datos muestrales (forma de
obtenerlos, nivel de medida,...) y de la hiptesis estadstica que se quiere contrastar (generada a partir
de la hiptesis de investigacin y los supuestos).
Estadstico de Contraste (Discrepancia)

Estadstico de Contraste Valor del estadstico en la muestra Valor del parmetro en la H0


Discrepancia = -----------------------------------------------------------------------------------------------------
Error tpico de estimacin

Se trata de averiguar la discrepancia entre los datos empricos observados en la muestra y los datos
tericos que planteamos en la H0.

Regla de decisin: Tomando en consideracin el valor o los valores crticos (mxima diferencia
que cabe esperar por simple azar entre los datos empricos y los tericos) y a partir del nivel de
significacin. Acumulado en los contrastes unilaterales () y dividido por dos en los bilaterales (/2)

CONTRASTE BILATERAL Valores / 1- / Z ms frecuentes


Valor crtico (Z /2) Valor crtico (Z /2)

005 001 0001


1- 095 99 0999
Z /2 - 196 - 258 - 329
Z 1-/2 196 258 329
! Nivel de significacin
1 ! Nivel de confianza
Z /2 ! Z (Tabla III negativa)
Z 1-/2 ! Z (Tabla IV positiva)

R. MEDRANO (TUTOR) Pgina 7


DISEOS DE INVESTIGACIN Y ANLISIS DE DATOS ORIENTACIONES TEMA N 1 (INTRODUCCIN)

CONTRASTE UNILATERAL IZQUIERDO CONTRASTE UNILATERAL DERECHO

Zona Zona Aceptacin Zona Aceptacin Zona


Rechazo H0 H0 (1 ) H0 (1 ) Rechazo H0
|------------|---------------------------------------| |-----------------------------------|-------------|
VALOR VALOR
CRTICO CRTICO

Nivel crtico (p) ! Calcular la probabilidad de obtener unos resultados como los observados en la
muestra bajo el supuesto de que la H0 es cierta.

Zona de rechazo (depende de que el contraste sea bilateral o unilateral). Teniendo en cuenta el riesgo
adoptado se determinan los valores del estadstico y se decide si la hiptesis nula es verdadera o falsa.
Nunca puede afirmarse categricamente que la hiptesis es cierta o falsa, se afirma con un determinado
nivel de probabilidad. As, Cmo decidir sobre la hiptesis nula? ! Dos mtodos equivalentes:

# A travs del nivel crtico ! si p es , rechazaremos H0, y si p > , no la rechazaremos.


# A travs del valor o los valores crticos. El criterio alfa divide la distribucin de probabilidad del
estadstico de contraste en dos zonas: la zona de aceptacin de H0 y la zona de rechazo de H0
(regin crtica). Si el valor muestral del estadstico de contraste cae en la zona de aceptacin no lo
rechazaremos, y s lo haremos cuando cae en la zona de rechazo.
# A travs del intervalo de confianza que delimita dos valores entre los cuales se encuentra o no el valor de
la hiptesis. Si est entre ellos se acepta la hiptesis nula, si no es as, se rechaza.

Ho (Cierta) ! (p) es mayor que () ! El valor se encuentra en el intervalo de confianza. El valor del
estadstico est entre los valores crticos.
Ho (Falsa) ! (p) es menor o igual que () ! El valor est fuera del intervalo de confianza. El valor del
estadstico supera o es inferior a los valores crticos.

El nivel de significacin () se fija de antemano, mientras que el nivel crtico p es consecuencia


del resultado obtenido al aplicar el estadstico de contraste.
El contraste bilateral es ms conservador que el contraste unilateral (es ms difcil rechazar la H0)

Conclusin e interpretacin: Contrastada la H0, considerada de forma provisional como verdadera,


y calculado el estadstico de contraste, se concluye rechazando o no la H0. Despus se interpreta el
resultado en el contexto de la investigacin.

R. MEDRANO (TUTOR) Pgina 8


DISEOS DE INVESTIGACIN Y ANLISIS DE DATOS ORIENTACIONES TEMA N 1 (INTRODUCCIN)

3.1.- RESUMEN DEL PROCEDIMIENTO (CONTRASTE DE HIPTESIS)

1.- Supuestos (descripcin de las caractersticas de la variable en la poblacin, y de los datos de


la muestra): N de muestras con el que trabajamos; son independientes o relacionadas;
seleccionadas de forma aleatoria o no; cmo son las escalas de medida utilizadas para las variables,
la distribucin de la que provienen los datos es conocida o desconocida, etc.

2.- Formulacin de las Hiptesis Estadsticas (exhaustivas y mutuamente excluyentes) de acuerdo


con la hiptesis cientfica y las caractersticas anteriores.

3.- Eleccin del estadstico de contraste apropiado.

4.- Fijar (regla de decisin). La zona de rechazo de la H0 estar formada por todos los valores del
estadstico cuya probabilidad de ser obtenidos es muy pequea bajo el supuesto de que la H0 es
cierta.

5.- Clculo del estadstico de contraste con los datos obtenidos en la muestra.

6.- Decisin sobre el rechazo o no de la H0.


Mediante el nivel crtico (p) ------------------- Mediante el los valores crticos ()

7.- Conclusin e interpretacin de los resultados en el contexto de la investigacin.

PROBLEMA EJEMPLO ! CONTRASTE DE HIPTESIS

Queremos contrastar la hiptesis que supone que la media poblacional en un test de atencin de los
estudiantes de la ESO es de 35 puntos. La distribucin de la variable en la poblacin es normal con
varianza = 225. Extraemos una muestra aleatoria de 144 alumnos y obtenemos: una media = 32 puntos.
Fijamos un nivel de significacin = 0,05.

Supuestos ! La variable (atencin) est medida a nivel de razn. Se distribuye normalmente en la


poblacin. Se trata de una muestra de observaciones aleatorias e independientes.

Hiptesis Estadsticas ! H0: = 35 H1: 35 (Contraste Bilateral)


_ __
Estadstico de Contraste ! Z = (Y ) / ( / n (varianza poblacional conocida)

Regla de decisin: Nivel de Significacin ! ( = 0,05) / Zona de rechazo de la H0 (Contraste


bilateral) ! Todos los valores iguales o menores que Z /2 = (- 1,96) y todos los valores iguales o
mayores que Z1 /2 = (+ 1,96), segn la distribucin normal.
____
Clculo del Estadstico de Contraste (datos de la muestra) ! Z = (32 35) / (15 / 144 = (- 2,4)

Toma de decisin sobre la H0:

# Nivel crtico: Como p = 2 [Z |- 2,4 |] = 2 (0,0082) = 0,0164 es menor que = 0,05,


rechazamos la hiptesis nula. Por tanto ! 0,0164 cae en la zona de rechazo de la H0.
# Valores crticos: Como (-2,4) < (-1,96) rechazamos hiptesis nula.
# Intervalo de confianza: 32 (1,96) (1,25) = 29,55 < < 34,45. Como 35 no est en el intervalo
de confianza se rechaza la H0.

Interpretacin de resultados ! Para un nivel de significacin = 0,05, podemos rechazar la


hiptesis nula (la media en atencin de los estudiantes de la ESO no es de 35 puntos).

R. MEDRANO (TUTOR) Pgina 9


DISEOS DE INVESTIGACIN Y ANLISIS DE DATOS ORIENTACIONES TEMA N 1 (INTRODUCCIN)

ERRORES EN LA TOMA DE DECISIONES

Los contrastes de hiptesis estn basados en estadsticos (medidas de discrepancia) y tienen una
distribucin de probabilidad conocida; as, todas las decisiones llevan aparejadas una probabilidad de
ocurrencia. Al tomar una decisin sobre una H0 pueden darse cuatro situaciones (dos de ellas son
decisiones acertadas y dos errneas). Siempre debemos proponernos que (1 - ) y (1 - ) sean altos
y que y sean bajos.

Decisin Ho (cierta) H1 (cierta)

Acepto H1 ERROR TIPO I DECISIN CORRECTA


Probabilidad ! Probabilidad ! 1
Acepto Ho
DECISIN CORRECTA ERROR TIPO II
Probabilidad ! 1 Probabilidad !

Siempre se cumple ! + (1 - ) = 1 y + (1 - ) = 1

Error tipo I () ! Bajo la distribucin de H0


representa la probabilidad de rechazar una
H0 verdadera = la probabilidad de aceptar
una H1 falsa / ( = probabilidad de cometer
error de tipo I = nivel de significacin)

Nivel de confianza (1) ! Representa la


probabilidad de aceptar una H0 verdadera =
la probabilidad de rechazar una H1 falsa.

Error tipo II () ! Bajo la distribucin de H1 cuando aceptamos errneamente la H0 siendo falsa ( =


probabilidad de cometer error de tipo II)
Potencia de contraste (1) ! Representa la probabilidad de rechazar la H0 siendo falsa = la
probabilidad de aceptar una H1 verdadera (probabilidad de obtener un resultado estadsticamente
significativo) 1 = Probabilidad de no cometer Error tipo II.

Tamao del efecto: Expresa la magnitud de la diferencia observada entre la H0 (el valor terico) y la
H1 (el valor observado)

R. MEDRANO (TUTOR) Pgina 10


DISEOS DE INVESTIGACIN Y ANLISIS DE DATOS ORIENTACIONES TEMA N 2 (CH UNA MUESTRA)

TEMA N 2 ! CONTRASTE DE HIPTESIS EN LOS DISEOS DE UNA MUESTRA

1.- TIPOS DE CONTRASTE:

Contrastes paramtricos: Son aquellos que se relacionan con el estudio de un parmetro


poblacional (media, varianza, proporcin, correlacin, etc.) y la variable de estudio proviene de una
poblacin con una funcin de densidad de probabilidad conocida. Ejemplo: Determinar si un
parmetro poblacional puede tomar un valor concreto / Determinar si las variables medidas en la
muestra son independientes en la poblacin. Segn Amn (1986):

" Las hiptesis recaen sobre los parmetros de la distribucin de la variable.


" El nivel de medida es, al menos, de intervalo.
" Los supuestos sobre la forma de la distribucin (normalidad) y/o sobre sus parmetros (varianza
conocida, desconocida, etc.) son restrictivos

En general, el contraste paramtrico es ms potente que su equivalente no paramtrico.

Contrastes no paramtricos: Son aquellos que no se relacionan con parmetros poblacionales o


se refieren a datos que provienen de una poblacin con una funcin de densidad de probabilidad
desconocida. Ejemplo: Determinar la forma de distribucin de una variable en la poblacin /
Determinar si los datos observados en la muestra son independientes entre s. Segn Amn (1986):

" Nivel de medida inferior al intervalo.


" Solo se establecen supuestos generales sobre la distribucin (continuidad, simetra, etc.)

En general, la utilizacin de contrastes no paramtricos disminuye la potencia de contraste


(probabilidad de aceptar la H1 cuando esta es cierta)

2.- PASOS DE CONTRASTE DE HIPTESIS !

Un contraste de hiptesis es un procedimiento para decidir si una hiptesis se acepta como vlida
o se rechaza. Los principales pasos para tomar la decisin son:

1. Establecer los supuestos.


2. Formular las hiptesis estadsticas
3. Eleccin del estadstico de contraste apropiado (discrepancia entre los datos del estadstico de la
muestra y el parmetro planteado en la hiptesis poblacional),
4. Regla de decisin (la distribucin muestral del estadstico nos permite fijar los valores crticos que
determinan la zona de rechazo de la H0). El clculo del estadstico de contraste nos permite
tambin la determinacin del nivel crtico p (probabilidad de que, siendo cierta la H0, obtengamos
unos datos como los observados en la muestra)
5. Conclusin (rechazamos o no la H0 a partir del nivel crtico p, o del valor o los valores crticos)
6. Interpretacin (en el contexto de la investigacin)

3.- CONTRASTE SOBRE LA TENDENCIA CENTRAL DE LOS DATOS !

MEDIA POBLACIONAL
2
PARAMTRICOS CONOCIDA
2
DESCONOCIDA

NO PARAMTRICOS PRUEBA DE LOS SIGNOS


PRIUEBA DE WILCOXON

R. MEDRANO (TUTOR) Pgina 1


DISEOS DE INVESTIGACIN Y ANLISIS DE DATOS ORIENTACIONES TEMA N 2 (CH UNA MUESTRA)

CONTRASTES PARAMTRICOS SOBRE LA MEDIA POBLACIONAL

Supuestos (Razones que justifican su eleccin): Disponemos de una muestra aleatoria de n


observaciones aleatorias e independientes. La variable dependiente sigue una distribucin normal
en la poblacin y est medida, al menos, a nivel de intervalo. Podemos conocer o no el valor de la
varianza poblacional (tambin aplicable a cualquier otro tipo de distribucin, con varianza
desconocida, si n 30, segn el Teorema Central del Lmite)

Hiptesis Estadsticas: 0 es el valor concreto de la media poblacional acerca del cual queremos
comprobar si es diferente, menor o mayor // Se aconseja formular primero H1

Contraste Bilateral: H0: = o


H1: o
Contraste Unilateral Izquierdo H0: o
H1: < o
Contraste Unilateral Derecho H0: o
H1: > o

Estadstico de contraste:
_ __
Conocida la varianza de la poblacin ! Z = (Y - 0) / / n
_ _
Y es la media muestral // / n es el error tpico de la media
0 es el valor propuesto para la media poblacional por H0
El Estadstico de Contraste sigue la distribucin N (0,1)
_ __
Desconocida la varianza de la poblacin ! T = (Y - 0) / S n-1 / n
_
S2n-1 = (Y Y)2 / n 1 es la cuasi varianza muestal (estimador insesgado de varianza poblacional)
El Estadstico de Contraste sigue la distribucin T de Student con n 1 gl. (Cuando gl > 30 la
distribucin T de Student se aproxima a la normal).
n S2
Relacin entre la varianza y la cuasi varianza muestral ! (n-1) S n-1 = n S // Luego S n-1 = ---------
2 2 2

n-1
Intervalo de confianza: _ _
Y + Z /2 / n = LS y LI (conocida 2 poblacional)
_ ______
Y + T n-1; /2 Sn-1 / n = LS y LI (desconocida 2 poblacional)

CONTRASTES NO PARAMTRICOS SOBRE LA MEDIANA POBLACIONAL

PRUEBA DE LOS SIGNOS: Considera que el valor de la mediana bajo la H0 es correcto; por tanto,
en la poblacin, existirn similares valores por encima y por debajo (mismo nmero de signos
positivos y negativos al calcular la diferencia entre cada valor y la mediana propuesta en la H0)

Supuestos (Razones que justifican su eleccin): muestra aleatoria de n observaciones aleatorias


e independientes de una poblacin con mediana desconocida. Contraste sobre el Promedio
Poblacional. Desconocemos el cumplimiento de los supuestos paramtricos. Asumimos que la
distribucin de la variable es continua por lo que no debemos encontrar diferencias nulas, si
aparecen, se descartan). Datos directos, sin agrupar, medidos, al menos, en una escala ordinal.

Hiptesis Estadsticas:
Contraste Bilateral: H0: = 0
H1: 0
Contraste Unilateral Izquierdo H0: 0
H1: < 0
Contraste Unilateral Derecho H0: 0
H1: > 0

0 es el valor concreto de la mediana poblacional // Se aconseja formular primero la H1

R. MEDRANO (TUTOR) Pgina 2


DISEOS DE INVESTIGACIN Y ANLISIS DE DATOS ORIENTACIONES TEMA N 2 (CH UNA MUESTRA)

Estadstico de contraste: (S+ S-) se obtienen al restar cada una de las observaciones del valor
de la mediana propuesto por la H0. Si alguna diferencia es nula, se elimina, reducindose el tamao
de la muestra. ____
Cuando la muestra es grande se aproxima a la normal mediante [S+ ( S-) n/2] / n/4

Distribucin muestral del estadstico: modelo binomial con parmetros n = S+ + S- y = 050.

PRUEBA DE WILCOXON: Conocida como prueba de rangos y signos, gana en precisin con
respecto a la prueba de los Signos, ya que aprovecha mejor la informacin disponible; tiene en
cuenta, a la vez, el signo de las diferencias y la magnitud de las mismas. Wilcoxon es una prueba
ms precisa.

Supuestos (Razones que justifican su eleccin): Disponemos de una muestra aleatoria de n


observaciones aleatorias e independientes. Se trata de un contraste sobre el Promedio Poblacional.
Desconocemos el cumplimiento de los supuestos paramtricos. La distribucin de la variable en la
poblacin ha de ser simtrica y continua. Datos directos, sin agrupar. Nivel de medida de los
datos, al menos, de intervalo.

Hiptesis Estadsticas: similares a la prueba de signos

Clculo del Estadstico de Contraste: (R+ R-) suma de rangos positivos y negativos.
Conocemos los datos obtenidos en la muestra // Calculamos las diferencias entre cada observacin
y la mediana propuesta por la H0. Se eliminan las diferencias nulas, reduciendo el tamao muestral
n // Estas diferencias, en valor absoluto, se ordenan de menor a mayor, y se sustituye cada una de
ellas por el rango que le corresponde // Si hay empates, se adopta el criterio del rango medio; es
decir, se le atribuye a cada una el rango promedio de los rangos que les hubieran correspondido de
ser diferentes // A cada rango se le aade el signo + o de la puntuacin de diferencia
correspondiente y se suman, obteniendo R+ y R-

Distribucin muestral del estadstico: distribucin de valores de Wilcoxon. Para utilizar la tabla W
de Wilcoxon se selecciona el sumatorio ms pequeo y se toma la decisin mediante los valores
crticos.

R. MEDRANO (TUTOR) Pgina 3


DISEOS DE INVESTIGACIN Y ANLISIS DE DATOS ORIENTACIONES TEMA N 2 (CH UNA MUESTRA)

PROBLEMAS EJEMPLO
CONTRASTE SOBRE LA MEDIA (VARIANZA POBLACIONAL CONOCIDA)

Supongamos que pertenecemos al consejo regulador de la denominacin de origen de los vinos de


Ribera de Duero. Sabemos que los vinos jvenes de aos anteriores tienen un grado alcohlico
medio de 12.5 grados y una varianza de 052 y que los datos en la poblacin se ajustan a una
distribucin normal N (125, 05). Para el ao actual, el consejo regulador, de acuerdo con todos sus
miembros, ha decidido cambiar algunos de los pasos del proceso de fabricacin. El primer problema
que se plantea es: Se ha modificado el grado alcohlico al modificar el proceso de fabricacin? La
definicin del problema a estudiar nos permite determinar la poblacin que queremos estudiar, los
vinos jvenes de ribera de Duero en el ao actual; la variable que queremos medir, el grado
alcohlico de los mismos, y la hiptesis de trabajo inicial Se ha modificado el grado alcohlico?
Para realizar el contraste de hiptesis, extraemos una muestra aleatoria de 14 observaciones que
aportan una media de 12529 grados y una cuasi varianza de 03382 establecemos un nivel de
confianza del 95%.

Estadstico de contraste: Discrepancia entre


el estimador (muestra) y el parmetro de la H0.

Valores crticos: con = 005 y un contraste


bilateral ! 196 (regin de aceptacin)
Decisin estadstica: El valor del estadstico
de contraste (0217) se sita en la regin de
aceptacin (entre los valores crticos); por tanto
aceptamos H0. El nivel crtico (p) asociado al E.
Contraste (0217) es 204129 = 08258 (1-
05871 = 04129) que resulta mayor que el
Supuestos: Se trata de una muestra aleatoria nivel de significacin fijado ( = 005); por
con datos medidos, al menos, en una escala de tanto, aceptamos H0. A partir del intervalo de
intervalo. Asumimos que la variable se confianza, aceptamos H0 (125 est incluido)
distribuye normalmente en la poblacin con ___
varianza conocida. 12529 (196 05 / 14 )! (1227 y 1279)

Hiptesis: Contraste bilateral H0: = 125 Conclusin: El cambio en el proceso de


H1: 125 fabricacin no ha modificado significativamente
Se trata de determinar si los datos de la el grado alcohlico.
muestra arrojan evidencia a favor o en contra Interpretacin: Con la informacin de la que
de la H0. disponemos no hemos encontrado evidencia
suficiente de que la media sea distinta de 12.5

Vamos a plantear otro supuesto que modificara la definicin de las hiptesis ! Sospechamos,
antes de realizar el experimento, que la modificacin en el proceso de fabricacin aumenta el
grado alcohlico.
Supuestos: Similares; Hiptesis (Contraste unilateral derecho): H0: = 125 y H1: > 125
Estadstico de contraste: Similar
Valores crticos: con = 005 y un contraste unilateral derecho ! 165
Decisin estadstica: El valor del estadstico de contraste (0217) se sita en la regin de
aceptacin (por debajo del valor crtico 165); por tanto aceptamos H0.
El nivel crtico (p): asociado al estadstico de contraste (0217) es 04129 (1-05871) que resulta
mayor que el nivel de significacin fijado ( = 005); por tanto, aceptamos H0
Conclusin: El cambio en la fabricacin no ha modificado significativamente el grado alcohlico.
Interpretacin: Con la informacin de la que disponemos no hemos encontrado evidencia
suficiente de que la media no sea igual a 12.5

R. MEDRANO (TUTOR) Pgina 4


DISEOS DE INVESTIGACIN Y ANLISIS DE DATOS ORIENTACIONES TEMA N 2 (CH UNA MUESTRA)

CONTRASTE SOBRE LA MEDIA (VARIANZA POBLACIONAL DESCONOCIDA)

Siguiendo con el ejemplo del grado alcohlico de los vinos de la denominacin de origen de
Ribera de Duero, los resultados del contraste bilateral desconocida la varianza de la poblacin
(suponiendo que no nos hubieran facilitado este parmetro), seran:

Estadstico de contraste: Discrepancia entre el


estimador (muestra) y el parmetro de la H0.

Valores crticos: con = 005 y un contraste


bilateral ! t18 gl = 2101 (regin aceptacin)

Decisin estadstica: El valor del estadstico de


contraste (0316) se sita en la regin de
Supuestos: Se trata de una muestra aceptacin (entre los valores crticos); por tanto
aleatoria con datos medidos, al menos, en aceptamos H0. El nivel crtico (p) asociado al E.
una escala de intervalo. Asumimos que la Contraste (0316) es aproximadamente (1-065 =
variable se distribuye normalmente en la 035) ! 035 2 = 07 > 005 (Aceptamos H0). A
poblacin con varianza desconocida. partir del intervalo de confianza, aceptamos H0
(125 est incluido)
___
Hiptesis: Contraste bilateral H0: = 125 12529 (196 0338 / 14 )! (1235 y 12705)
H1: 125
Conclusin: El cambio en el proceso de
Se trata de determinar si los datos de la fabricacin no ha modificado significativamente el
muestra arrojan evidencia a favor o en contra grado alcohlico.
de la H0. Interpretacin: Con la informacin de la que
disponemos no hemos encontrado evidencia
suficiente de que la media sea distinta de 12.5

CONTRASTES NO PARAMTRICOS (PRUEBA DE LOS SIGNOS Y PRUEBA DE WILCOXON)

En la figura se muestra como para distribuciones


asimtricas es mucho ms intuitiva la comparacin de
las medianas que la comparacin de las medias, ya que
estas estn afectadas por los valores muy extremos de
la distribucin.

Problema ejemplo: Una determinada empresa utiliza, desde hace muchos aos, un test de aptitudes
para seleccionar a sus empleados. Para dicho test tiene establecido que la mediana est en 180. El
psiclogo de la empresa quiere probar que efectivamente la mediana sigue siendo correcta (probar la
H0 de que la mediana en la poblacin es igual a 180). Para ello obtiene una muestra de 15
trabajadores y les aplica el test obteniendo los siguientes resultados:

189 233 195 160 212 176 231 202 193 174 166 248 199 213 185

Suponemos que la variable en la poblacin es simtrica y continua (medida en una escala de


intervalo) y que no sabemos nada acerca de la forma de la poblacin. Con estos datos y
nicamente con fines pedaggicos aplicaremos las pruebas de los Signos y la de Wilcoxon (sera
directamente aplicable Wilcoxon).

R. MEDRANO (TUTOR) Pgina 5


DISEOS DE INVESTIGACIN Y ANLISIS DE DATOS ORIENTACIONES TEMA N 2 (CH UNA MUESTRA)

Supuestos # Muestra aleatoria de n = 15 observaciones. Distribucin de la variable en la poblacin


(simtrica y continua). Nivel de medida de los datos, al menos, escala de intervalo.

Hiptesis (C. Bilateral) # H0: = 180 y H1: 180 // = 0,05

Estadsticos de Contraste: #
Signos: Previamente ordenamos las puntuaciones (la mediana es un ndice de posicin). Restando
180 a cada una de las 15 puntuaciones obtenidas por los sujetos, obtenemos 11 (S+) y 4 (S-)

160 166 174 176 185 189 193 195 199 202 212 213 231 233 248 ORDEN
-20 -14 -6 -4 5 9 13 15 19 22 32 33 51 53 68 RESTA
- - - - + + + + + + + + + + + SIGNOS

Probabilidad binomial con n = 15 (participantes) y p = 05 (probabilidad de xito si la H0 es cierta)

Wilcoxon: Ms precisa. Despus de ordenar las puntuaciones de menor a mayor y ordenar las
diferencias con la mediana en valor absoluto, obtenemos:

160 166 174 176 185 189 193 195 199 202 212 213 231 233 248 ORDEN
-20 -14 -6 -4 5 9 13 15 19 22 32 33 51 53 68 RESTA
-4 5 -6 9 13 -14 15 19 -20 22 32 33 51 53 68 ORDEN
- + - + + - + + - + + + + + + SIGNOS
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 RANGOS

Sumando los rangos cuyas diferencias tienen valor positivo y negativo:


R+ (2+4+5+7+8+10+ 11+12+13+14+15 = 101) y R- (1+3+6+9 = 19)
Utilizaremos como estadstico W ! R- (1+3+6+9 = 19) dado que es el ms pequeo ! W = 19

Decisin estadstica:
Signos: Funcin de distribucin Binomial (Tabla II); para n = 15 y probabilidad = 0,50, encontramos el
valor 0,0592 ! P (S- 4) = 0,0592. Para averiguar el nivel crtico p, multiplicamos por 2 la
probabilidad asociada al estadstico de contraste (00592 2 = 01184) dado que es bilateral.
Wilcoxon: Tablas ! para un contraste bilateral con /2 = 0,025 y n = 15; el valor crtico es ! 26

Conclusin:
Signos: Como p (01184) es mayor que (0,05) Mantenemos H0. Tambin tabla (Test de signos dos
direcciones) para n =15 y = 0,05, y un contraste bilateral, el valor crtico es igual a 3 ! como S- = 4 >
3 (Mantenemos H0)
Wilcoxon (ms precisa): Como 19 (se toma la suma menor) < 26 ! Rechazamos la H0
Interpretacin:
Signos: Teniendo en cuenta los resultados, es posible seguir manteniendo que la Mediana de la
poblacin de referencia es 180, con un = 0,05.
Wilcoxon: Teniendo en cuenta los resultados, no es posible seguir manteniendo que la Mediana de la
poblacin de referencia es 180, con un = 0,05.

R. MEDRANO (TUTOR) Pgina 6


DISEOS DE INVESTIGACIN Y ANLISIS DE DATOS ORIENTACIONES TEMA N 2 (CH UNA MUESTRA)

4.- CONTRASTE SOBRE LA VARIANZA POBLACIONAL !

Supuestos (Razones que justifican su eleccin): Disponemos de una muestra aleatoria de n


observaciones aleatorias e independientes. La variable dependiente sigue una distribucin normal y
est medida, al menos, a nivel de intervalo.

Hiptesis Estadsticas:
2 2
Contraste Bilateral: H0: = 0
2 2
H1: 0
2 2
Contraste Unilateral Izquierdo H0: 0
2 2
H1: < 0
2 2
Contraste Unilateral Derecho H0: 0
2 2
H1: > 0

20 es el valor concreto de la varianza poblacional acerca del cual queremos comprobar si la


varianza poblacional es diferente, menor o mayor // Se aconseja formular primero H1.

Estadstico de contraste ! X2 = (n-1) S2n-1 / 20

2o es el valor propuesto para la varianza poblacional por H0 y S2n-1 = la cuasi varianza muestral. El
Estadstico de Contraste sigue una distribucin Chi-Cuadrado con (n-1) gl.

(n-1) S2e (n-1) S2e


Intervalo de confianza ! 2
---------------- < < -----------------
X2 (n-1) (1-/2) X2 (n-1) /2

Si el contraste se hace a partir de la varianza poblacional, se sustituye (n-1) por n.

5.- CONTRASTE SOBRE LA PROPORCIN POBLACIONAL !

Supuestos (Razones que justifican su eleccin): Disponemos de una muestra aleatoria de n


observaciones aleatorias e independientes. La variable dependiente es dicotmica.La proporcin es
el cociente entre el nmero de veces que aparece la observacin dividido entre el nmero total de
observaciones)

Hiptesis Estadsticas:
Contraste Bilateral: H0: = 0
H1: 0
Contraste Unilateral Izquierdo Ho: 0
H1: < 0
Contraste Unilateral Derecho H0: 0
H1: > 0

0 es el valor concreto de la proporcin poblacional acerca del cual queremos comprobar si la


proporcin poblacional es diferente, menor o mayor // Se aconseja formular primero H1
____________
Estadstico de contraste: Z = (P - 0) / (0 (1 - 0) / n

P es la proporcin muestral de la caracterstica que interesa.


0 es el valor propuesto para la proporcin poblacional por la H0.
0 es el error tpico de la distribucin muestral de la proporcin.

El Estadstico de Contraste sigue la distribucin N (0,1) cuando n es suficientemente grande, lo


que significa que n p > 5 n = 25. Cuando no se cumple esta condicin (muestras pequeas), se
utiliza la distribucin binomial.
____________
Intervalo de Confianza ! P |Z/2| (0 (1 - 0) / n

R. MEDRANO (TUTOR) Pgina 7


DISEOS DE INVESTIGACIN Y ANLISIS DE DATOS ORIENTACIONES TEMA N 2 (CH UNA MUESTRA)

PROBLEMAS EJEMPLO

Contraste de hiptesis sobre la varianza: Los resultados de un reciente estudio indican que 81
estudiantes de primero de Psicologa de la UNED, elegidos mediante muestreo aleatorio simple,
estudian una media de 6 horas a la semana, con una cuasi desviacin tpica de 3. La poblacin
universitaria europea estudia, tambin, una media de 6 horas a la semana, pero con una desviacin
tpica de 2. Queremos saber si la variabilidad encontrada en nuestra muestra es estadsticamente
diferente de la de la poblacin de estudiantes europeos. Trabajaremos a un nivel de confianza del
95 %.
_
Supuestos: Muestra aleatoria de 81 estudiantes de la UNED (X = 6 y SX = 3). Datos de la poblacin
de estudiantes europea ( = 6 y = 2) para = 0,05. La variable dependiente est medida, al
menos, a nivel de intervalo. Se plantea un CH sobre la varianza.

Hiptesis: Contraste bilateral (resultado estadsticamente diferente). Las hiptesis siempre se


plantean sobre la poblacin (la poblacin universitaria europea tiene una = 2; luego la varianza de
la poblacin a contrastar ser ! 2 = 4. Luego ! H0: 2 = 4; H1: 2 4

Estadstico de contraste: 2 = (n 1) S2n-1 / 20 ! 2 = 80 9 / 4 = 180

Decisin estadstica:
$ A partir de los valores crticos (80 gl; /2 = 0,025 y 1-/2 = 0,975) ! 5715 y 10663.
Rechazamos la H0 porque el valor muestral del estadstico de contraste (180) > el valor
crtico superior (2 = 10663)
$ Si tenemos en cuenta el nivel crtico p (2 = 180 con 80 gl ! encontramos que p es < 0005)
y dado que p < (005) ! Rechazamos H0.
$ Considerando el intervalo de confianza: Rechazamos H0 (2 = 4 no est en el intervalo)
80 9 80 9
Intervalo de confianza ! ---------------- < 2 < ----------------- (675 y 1261)
10663 5711

Conclusin e interpretacin: Dado que hemos rechazado la H0 con = 0,05 ! La variabilidad en


el tiempo de estudio que emplean los estudiantes de Psicologa de 1 de la UNED no es igual que la
variabilidad en el tiempo de estudio semanal de la poblacin universitaria europea.

Contraste de hiptesis sobre la proporcin (Febrero 2008): Se quiere conocer la postura de la


poblacin espaola frente a la inmigracin ilegal. Se fija = 004, se extraen aleatoria e
independientemente 750 espaoles y se les pide que manifiesten si estn a favor o en contra. De los
750 espaoles, 435 se manifiestan en contra y 315 a favor. Se desea estudiar si son compatibles
estos resultados con la hiptesis que establece que las 3/5 partes de la poblacin espaola estn en
contra de la inmigracin ilegal.

Supuestos: Variable dependiente ! postura de la poblacin espaola frente a la inmigracin ilegal


(a favor o en contra). Se trata de una variable cualitativa dicotmica.
P = (435/750 = 058); se cumple (np > 5)! (750 058 = 435) Muestra grande (aproximacin a la
normal ! CH Proporcin

Hiptesis: Contraste bilateral (no se especifica ninguna direccin a favor o en contra). Sabemos
que = 3/5 = 0,6 y la hiptesis nula se centra si nuestros datos son compatibles con este resultado
(tericamente poblacional). Luego ! H0: = 06; H1: 06

Estadstico de contraste: Nuestra proporcin es ! 435/750 = 058. Con estos datos aplicamos la
frmula del estadstico de contraste ! Z = (058 06) / ( 0604 / 750) = - 002 / 00179 = - 112.

Valores crticos: Al tratarse de un contraste bilateral deben ser dos valores. Buscando en las tablas
de la curva normal con = 004 (bilateral /2 = 002 y 1-/2 = 098) encontramos las puntuaciones
tpicas (- 205 y 205)

R. MEDRANO (TUTOR) Pgina 8


DISEOS DE INVESTIGACIN Y ANLISIS DE DATOS ORIENTACIONES TEMA N 2 (CH UNA MUESTRA)

Decisin estadstica:
$ Teniendo en cuenta los anteriores valores crticos (- 205 y 205), Aceptamos la H0 porque el
valor muestral del estadstico de contraste (- 112) > el valor crtico inferior (- 205)
$ Si tenemos en cuenta el nivel crtico p (Z (-112) = 01314; luego 2 01314 = 02628). Como p
(02628) > que (004) ! Aceptamos H0.
$ Considerando el intervalo de confianza: Aceptamos H0 (06 est en el intervalo)
____________ __________________
P |Z/2| (0 (1 - 0) / n ! 058 205 (058 (1 058) / 750 = (0543 y 0617)

Conclusin e interpretacin: Dado que hemos aceptado la hiptesis nula ( = 06) podemos
afirmar que el 60% de la poblacin espaola estn en contra de la inmigracin ilegal; por tanto, el
40% estar a favor.

6.- CLCULO DE LA POTENCIA DE CONTRASTE !

Potencia de contraste (1): Representa la probabilidad de rechazar la H0 siendo falsa = la


probabilidad de aceptar una H1 verdadera (probabilidad de obtener un resultado estadsticamente
significativo). 1 = Probabilidad de no cometer Error tipo II. La disminucin de ( = Error de tipo I
provoca un aumento automtico de = Error tipo II)

Problema ejemplo: La aplicacin de un test entre docentes tiene, por experiencias anteriores, una
media de 55 y una varianza de 121, N (55, 121). Un psiclogo educativo considera que en la actualidad
el promedio se ha incrementado, pasando a ser de 60 puntos. Para contrastar esta hiptesis somete al
test a 50 individuos extrados aleatoriamente de la poblacin y obtiene una media de 58. Fijando un
nivel de significacin = 0,01. Puede aceptarse la hiptesis del psiclogo?

Hiptesis estadsticas (contraste unilateral derecho): H0: 0 = 55 y H1: 1 > 55 (1 = 60)

Descripcin de la variable y de los datos muestrales: Variable medida a nivel de intervalo, distribucin
normal, con varianza conocida N (55, 121) y observaciones aleatorias e independientes.

Estadstico de contraste y clculo: Bajo la H0: 0 = 55, tipificamos la media muestral = 58.
_ ___
Z = (Y 0) / Y ! Z = (58 - 55) / (11 / 50) = 1,93
Decisin estadstica:
$ A partir del valor crtico (para = 0,01. Se trata de un contraste unilateral, acumula en una
sola cola ! Z = 2,33). Como 193 (valor del estadstico de contraste) < 233 (valor crtico) ! Se
acepta la H0.
$ A partir del nivel crtico p (al valor del estadstico de contraste 193 le corresponde en las tablas
una probabilidad de p (Z < 1,93) = 0,9732 ! 1-09732 = 00268). Al tratarse de un contraste
unilateral p = 00268 > = 001; Por tanto, Se acepta la H0

R. MEDRANO (TUTOR) Pgina 9


DISEOS DE INVESTIGACIN Y ANLISIS DE DATOS ORIENTACIONES TEMA N 2 (CH UNA MUESTRA)

Interpretacin de los resultados: Para un nivel de significacin = 0,01, no podemos afirmar que la
media poblacional se ha incrementado en la actualidad.

Cul es la probabilidad de cometer error tipo II? (Rechazar la H1 siendo cierta)

Bajo la Hiptesis nula (H0: 0 = 55) se determina el lmite entre la regin de aceptacin y rechazo
(Contraste unilateral derecho)
_ -----------------------------------|-----
Z = (Yc 0) / Y ! Z = 2,33 Z = (Yc - 55) / (11 / 50); Yc = 58,62

Se busca la (Z) que corresponde al valor 58,62 en la distribucin de la H1 ! (H1: 1 = 60)

_ ------------------|------------------------------
Z = (Yc 1) / Y Z = (58,62 - 60) / (11 / 50); Z = (- 0,89)

Probabilidad de obtener una Z (- 0,89) ! Z (-0,89) = 0,1867 ! = 0,1867 (error tipo II)
Potencia de Contraste ! (1 ) = 0,8133

R. MEDRANO (TUTOR) Pgina 10


DISEOS DE INVESTIGACIN Y ANLISIS DE DATOS ORIENTACIONES TEMA N 3 (DISEOS 2 GRUPOS INDEPENDIENTES)

TEMA N 3 ! ANLISIS DE DATOS PARAMTRICOS PARA DISEOS DE DOS GRUPOS

TIPOS DE MUESTRAS

Muestras independientes: n1 y n2 muestras de sujetos diferentes, extrados aleatoriamente de sus


respectivas poblaciones.
Muestras relacionadas: se trata de los mismos n sujetos observados en condiciones experimentales
diferentes, o n pares de sujetos semejantes entre s (gemelos, hermanos,...)

CONTRASTES DE HIPTESIS PARA DOS MUESTRAS INDEPENDIENTES

Poblaciones normales N (0, 1)

Medias distintas y varianzas iguales Medias iguales y varianzas distintas

CONTRASTE DE HIPTESIS

VARIANZAS POBLACIONALES CONOCIDAS


SOBRE DOS MEDIAS VARIANZAS POBLACIONALES DESCONOCIDAS
(PARAMTRICOS) Y SUPUESTAMENTE IGUALES
VARIANZAS POBLACIONALES DESCONOCIDAS
Y SUPUESTAS DISTINTAS

SOBRE DOS MEDIANAS TEST DE MANN-WHITNEY-WILCOXON


(NO PARAMTRICOS)

SOBRE DOS VARIANZAS DIFERENCIA DE VARIANZAS

DIFERENCIA PROPORCIONES VALOR IGUAL A CERO


SOBRE DOS
PROPORCIONES DIFERENCIA PROPORCIONES VALOR DISTINTO DE CERO

Pasos para realizar el contraste de hiptesis:

1. Establecer los supuestos.


2. Formular las hiptesis estadsticas
3. Eleccin del estadstico de contraste apropiado
4. Regla de decisin (la distribucin muestral del
estadstico nos permite fijar los valores crticos que
determinan la zona de rechazo de la H0). El clculo del
estadstico de contraste nos permite tambin la
determinacin del nivel crtico p (probabilidad de que,
siendo cierta la H0, obtengamos unos datos como los
observados en la muestra). Tambin podemos utilizar el
intervalo de confianza.
5. Conclusin (rechazamos o no la H0 a partir del nivel
crtico p, o del valor o los valores crticos)
6. Interpretacin (en el contexto de la investigacin)

R. MEDRANO (TUTOR) Pgina 1


DISEOS DE INVESTIGACIN Y ANLISIS DE DATOS ORIENTACIONES TEMA N 3 (DISEOS 2 GRUPOS INDEPENDIENTES)

CONTRASTES DE HIPTESIS PARA DOS MEDIAS

" Observaciones independientes


Supuestos " Nivel de medida de intervalo o razn
" Distribuciones normales en la poblacin (n1 30 y n2 30)

Varianzas poblacin Desconocidas Desconocidas


conocidas Supuestamente iguales Supuestamente distintas
Hiptesis (homocedasticidad)
(Iguales en
los C. Bilateral C. Unilateral Derecho C. Unilateral Izquierdo
Tres casos) H0 : 1-2 = 0 H0 : 1-2 0 H0 : 1-2 0
H1 : 1-2 0 H1 : 1-2 > 0 H1 : 1-2 < 0

Estadstico
de
Contraste

Distribucin Normal Tipificada t de Student


Muestral N (0, 1) gl = n1 + n2 - 2

Conocida (Z) o desconocida (t) la varianza de la poblacin (valor o valores crticos)

Regla (C. Bilateral) ! t t / 2; n-2 y t t1 - / 2; n-2 // Z Z / 2 y Z Z 1 - / 2


decisin (C. Unilateral Izquierdo) t t ; n-2 // Z Z
(C. Unilateral Derecho) t t 1 ; n-2 // Z Z 1

Nivel crtico p ! Se rechaza H0 si p < y se acepta si p >

PROBLEMAS EJEMPLO (CH diferencia de Medias)

Dos centros de Educacin Especial vienen utilizando, desde hace dos aos, mtodos diferentes
para estimular las funciones superiores de los nios con retraso mental. El director de uno de los
centros sostiene que su mtodo (Mtodo A) logra mejores resultados que el del otro centro (Mtodo
B). Para estudiar esta cuestin, fijamos = 0,03, extraemos aleatoria e independientemente dos
muestras de nios, una en cada centro (nA = 120 y nB = 50) y les medimos el cociente intelectual (CI)
en una escala de intervalo. Los nios de ambos centros iniciaron el programa de estimulacin con
un CI medio igual a 70 y los CI medios tras el programa fueron 79 para los nios estimulados con el
mtodo A y 74 para los estimulados con el mtodo B. La distribucin de los CI es normal en las
poblaciones con A = 18 y B = 12 y todas las observaciones son independientes entre s.

Supuestos: Se trata de contrastar las medias de dos muestras independientes (varianzas


poblacionales conocidas); Distribucin Normal de los CI en ambas poblaciones; Variable
dependiente medida a nivel de intervalo.

Hiptesis: Planteamos un contraste unilateral derecho (queremos probar si el mtodo A es ms eficaz)

H0: A - B 0 H1: A - B > 0 Tambin ! H0: A B H1: A > B

Estadstico de contraste: Conocidas las varianzas poblacionales.


_ _ ________________ ___________________
Z = (Y1 Y2) / (21 / n1) + (22 / n2) ! Z = (79 74) / (324 / 120) + (144 / 50) = 2,12

R. MEDRANO (TUTOR) Pgina 2


DISEOS DE INVESTIGACIN Y ANLISIS DE DATOS ORIENTACIONES TEMA N 3 (DISEOS 2 GRUPOS INDEPENDIENTES)

Sigue una distribucin Normal tipificada N (0, 1)

Regla de decisin:

Valores crticos (para un nivel de confianza del 97% y un contraste unilateral, el valor crtico es !
Z097 = (188)
Nivel crtico p (el estadstico de contraste 212 se asocia a una probabilidad p = P (Z 2,12)
! 1 0,983 = 0,017

Conclusin: Se rechaza H0 [el estadstico de contraste 212 > 188 (valor crtico) y tambin p =
0,017 (nivel crtico) < = 0,03 (nivel de significacin)].

Interpretacin: El programa de estimulacin del CI ha sido eficaz con un nivel de confianza del
97% (mejor el mtodo A que el mtodo B)

Intervalo de confianza: Para realizarlo suponemos que se trata de un contraste bilateral; por tanto,
habra que reformular las hiptesis:
_ _
(Y1 Y2) | Z /2 | Error tpico ! Lmite superior y Lmite inferior

(79 74) (0,03/2 = Z (-217) 2,36 (denominador e. contraste) = 5 512 ! (- 012 y 1012)

Decisin: Aceptamos H0 (el intervalo de confianza contiene el valor 0, luego asumimos que la
diferencia de medias en la poblacin puede tomar ese valor

En una investigacin psicopedaggica se pas la misma prueba de nivel de lectura a dos grupos de
nios: los participantes haban sido elegidos de forma aleatoria de entre los alumnos de EGB de dos
provincias espaolas. Los datos se muestran en la tabla. La variable se midi en una escala de
intervalo y se supone que 2A = 2B

TAMAO MEDIA VAR. INSESGADA


PROVINCIA A 121 40 7
PROVINCIA B 61 38 6

Supuestos: Disponemos de dos muestras independientes (dos grupos de nios) que se someten a
una prueba de lectura. La variable dependiente medida a nivel de intervalo. Varianzas
poblacionales desconocidas y supuestamente iguales (2A = 2B). Muestras grandes (121 y 61).

Contraste las hiptesis para las medias (muestras independientes)

Hiptesis: Planteamos un contraste bilateral para ver si las diferencias se deben al azar.

(H0: A B = 0 y H1: A B 0) // Tambin ! H0: A = B y H1: A B)

Estadstico de contraste: Aplicamos el E. de Contraste para la diferencia de medias. Desconocidas


las varianzas de la poblacin (supuestamente iguales) :
_ _
T = (Y1 Y2) / Error tpico ! T = (40 38) / 0,408 = 4,90

_________________________________________________
Error tpico = [( n1 1) S21 + (n2 1) S22 / (n1 + n2 2)] (1 / n1 ) + (1 / n2 )
______
Error tpico = 01665 = 0,408

Sigue una distribucin t de Student con n1 + n2 2 grados de libertad.

R. MEDRANO (TUTOR) Pgina 3


DISEOS DE INVESTIGACIN Y ANLISIS DE DATOS ORIENTACIONES TEMA N 3 (DISEOS 2 GRUPOS INDEPENDIENTES)

Regla de decisin:

Valores crticos (tabla t de Student con 121 + 61 2 = 180 grados de libertad y = 0,05). Se trata
de un contraste bilateral y son muestras grandes; por tanto, utilizamos Z0025 (- 196) y Z0975 = (196)
Nivel crtico p (el estadstico de contraste 490 se asocia a una probabilidad < 00005 que es ms
pequea que )

Conclusin: Rechazamos H0 (el estadstico de contraste 490 no est entre los valores crticos
196 y de igual forma, considerando el nivel p crtico, p < )

Interpretacin: El rendimiento medio en la prueba de lectura no es igual en los dos grupos con un
nivel de significacin = 0,05.

Intervalo de confianza:
_ _
(Y1 Y2 ) | t (n1 + n2 2) | Error tpico = (Lmites inferior y superior)

(40 38) 196 0408 = 2 08 = (12 y 208) ! Rechazamos H0 (el intervalo de confianza no
contiene el valor 0, luego asumimos que la diferencia de medias en la poblacin no puede tomar
ese valor)

Distintos estudios muestran que la relajacin es eficaz para reducir la ansiedad precompetitiva.
Siguiendo esta lnea de investigacin y habiendo hipotetizado una reduccin de la ansiedad en las
escaladoras tratadas con relajacin, extraemos aleatoria e independientemente 12 escaladoras y
les asignamos aleatoriamente a las dos condiciones del experimento: la mitad de las escaladoras se
somete a un programa de relajacin durante seis meses y la otra mitad no realiza ningn tipo de
relajacin (suponemos que las poblaciones se distribuyen normalmente con distinta varianza). Al
finalizar el programa de relajacin, medimos la ansiedad precompetitiva de todas las escaladoras,
obteniendo una ansiedad media de 8 y una varianza insesgada de 150 en el grupo sin relajacin y
una ansiedad media de 65 y una varianza sesgada de 100 en el grupo con relajacin. El nivel de
significacin alfa se fij en 0,05, la variable dependiente est medida a nivel de intervalo y a mayor
puntuacin mayor ansiedad. Podemos afirmar que realmente la ansiedad precompetitiva de las
escaladoras se reduce utilizando tcnicas de relajacin?

Supuestos: 12 escaladoras en un experimento con dos condiciones: 6 escaladoras sin relajacin


y 6 con relajacin. Variable dependiente (ansiedad) medida a nivel de intervalo. Poblaciones con
distribucin normal ! Contraste de hiptesis para dos muestras Independientes (desconocidas
las varianzas poblacionales y supuestas distintas)

Hiptesis: Siguiendo a los investigadores planteamos un contraste unilateral derecho.

H0 : 1 - 2 0 H1 : 1 - 2 > 0 // // Tambin ! H0: 1 2 y H1: 1 > 2)

Estadstico de contraste: Contraste de medias, desconocidas las varianzas (supuestas distintas)


_ _
T = (Y1 Y2) / Error tpico ! (8 - 65) / 623 = 024
_______________
Donde ! Error tpico = 21 / n1 + 22 / n2

Clculos adicionales (Medias y Varianzas insesgadas) !


_ _
YSR = 8 2 SR = 150 (insesgada) YR = 6,5 2 R = 83 (insesgada)

Donde ! S2 R = 100 (sesgada) = (5 / 6) 100 ! 83


_____________ __________
Error Tpico de la diferencia ! 150 / 6 + 83 / 6 ! 25 + 1383 = 623

R. MEDRANO (TUTOR) Pgina 4


DISEOS DE INVESTIGACIN Y ANLISIS DE DATOS ORIENTACIONES TEMA N 3 (DISEOS 2 GRUPOS INDEPENDIENTES)

(150 / 6 + 83 / 6)2
gl = ----------------------------------------------------- =
[(150 / 6)2 / (6 1) + (83 / 6)2 / (6 1)

gl = 150777 / 16327 = 923 9 (valor < t = n1 + n2 2)

Regla de decisin:
Valor crtico para = 0,05 ! Segn la tabla t de Student (contraste unilateral derecho), con 9 gl
encontramos el valor ! t9; 005 = 1833
Nivel crtico p ! el valor del E. Contraste T = 024, con 9 gl se encuentra entre 055 < p < 060

Conclusin e interpretacin: Se acepta H0 para un nivel de confianza del 95%. Segn el valor
crtico (contraste unilateral derecho) T (024) < 1833 ! Aceptamos H0.
Segn el nivel p crtico (055 < p < 060) > que el valor de = 0,05. La ansiedad precompetitiva de
las escaladoras no disminuye utilizando tcnicas de relajacin.

CONTRASTES DE HIPTESIS DOS MEDIANAS (TEST DE MANN-WHITNEY-WILCOXON)

Supuestos " Variable dependiente con un nivel de medida ordinal o superior


" Dos poblaciones con distribuciones similares (misma forma) en la poblacin

C. Bilateral C. Unilateral Derecho C. Unilateral Izquierdo


Hiptesis H0 : 1-2 = 0 H0 : 1-2 0 H0 : 1-2 0
H1 : 1-2 0 H1 : 1-2 > 0 H1 : 1-2 < 0

1.- Asignamos rangos a todas las puntuaciones (muestra 1 y muestra 2) como si


formaran un nico grupo.
2.- Calculamos las sumas de rangos para las puntuaciones procedentes de cada
Estadstico una de las muestras (S1 para la primera muestra y S2 para la segunda muestra)
Contraste 3.- Calculamos los siguientes valores:

U1 = S1 - n 1 (n1 + 1) // U2 = S2 - n 2 (n2 + 1)

El estadstico de contraste U es el menor de U1 U2

Distribucin
Muestral Utilizamos la tabla U de Mann-Whitney-Wilcoxon

Conocida (Z) o desconocida (t) la varianza de la poblacin (valor o valores crticos)

Regla (C. Bilateral) ! U > un1, n2; /2


decisin (C. Unilateral Izquierdo) ! U < un1, n2;
(C. Unilateral Derecho) ! U > un1, n2;

Nivel crtico p ! Se rechaza H0 si p < y se acepta si p >

Aproximacin (Ui) [(n1 n2) / 2]


A la Normal Z = -------------------------------
n1 n2 (n1 + n2 + 1) / 12

R. MEDRANO (TUTOR) Pgina 5


DISEOS DE INVESTIGACIN Y ANLISIS DE DATOS ORIENTACIONES TEMA N 3 (DISEOS 2 GRUPOS INDEPENDIENTES)

PROBLEMA EJEMPLO

En una investigacin de Psicologa Social sobre valores, se han extrado dos muestras aleatorias de
personas. Una muestra se extrajo de una regin del interior de la Pennsula (n=5) y la otra de la
costa (n=6). Los participantes cumplimentaron un cuestionario de xenofobia, que ofrece
puntuaciones en una escala ordinal, obteniendo los resultados que se presentan en la Tabla 1 (a
mayor puntuacin mayor xenofobia). Se desea saber si la tendencia central de los habitantes de la
costa es ms baja que la de los del interior. Se asume que las distribuciones de la variable en las
dos poblaciones tienen la misma forma (si difieren slo lo hacen en su tendencia central)

Interior 6 14 10 18 20
Costa 16 12 4 8 2 22

Supuestos: Se trata de dos muestras independientes (personas de la pennsula y personas de la


costa). Puntuaciones del cuestionario en escala ordinal. Las distribuciones de la VD en las
poblaciones tienen la misma forma y, si difieren, lo hacen slo en su tendencia central.

Hiptesis: La hiptesis nula siempre es aquella que afirma lo contrario de lo que el investigador
desea probar. Desea probar que la tendencia central (contraste no paramtrico, mediana) en
habitantes de la costa es menor que en habitantes del interior. Contraste unilateral izquierdo

Hiptesis de la que parte el investigador ! H1: C < P


Hiptesis nula (negacin de la anterior) ! H0: C P

Estadstico de contraste:

1.- Ordenamos el total de las puntuaciones de menor a mayor (puntuaciones de interior en negrita)

2 4 6 8 10 12 14 16 18 20 22

2.- Asignamos rangos (vemos que no hay empates):

2 4 6 8 10 12 14 16 18 20 22
1 2 3 4 5 6 7 8 9 10 11

3.- Sumamos los rangos de cada grupo: Rangos de interior (negrita) S1 = 3+ 5+ 7+ 9 +10 = 34
Rangos de costa S2 = 1+2+4+6+8+11 = 32

4.- Aplicamos las frmulas del estadstico de contraste (U):


U1 = S1 - n 1 (n1 + 1) ! U1 = 34 (25 6) = 19
U2 = S2 - n 2 (n2 + 1) ! U2 = 32 (3 7) = 11

Elegimos como estadstico de contraste el valor inferior de U (U2 = 11)

Regla de decisin:

Si consideramos como estadstico de contraste la suma de rangos, el estadstico de contraste es W


= 34 (se elige la muestra 1 porque es la que tiene menor nmero de sujetos. El nivel crtico p del
estadstico W de MWW se encuentra en la Tabla A.7 ! buscamos n1 = 5 y n2 = 6. El nivel crtico es
el valor de probabilidad que tiene nuestro estadstico muestral. Como W = 34, vemos que p = 0.268

Conclusin: Dado que el nivel crtico p (0268) es mayor que (005) ! Aceptamos H0

Interpretacin: Las distribuciones del interior y las de la costa no difieren en cuanto a las medianas
en sus apreciaciones sobre la xenofobia.

R. MEDRANO (TUTOR) Pgina 6


DISEOS DE INVESTIGACIN Y ANLISIS DE DATOS ORIENTACIONES TEMA N 3 (DISEOS 2 GRUPOS INDEPENDIENTES)

CONTRASTES DE HIPTESIS DOS PROPORCIONES

Supuestos " Observaciones independientes


" Variable dependiente dicotmica o dicotomizada
" n 30

C. Bilateral C. Unilateral Derecho C. Unilateral Izquierdo


Hiptesis H0 : 1- 2 = D H0 : 1- 2 D H0 : 1- 2 D
H1 : 1- 2 D H1 : 1- 2 > D H1 : 1- 2 < D

D=0 D0
_____________________
Z = (P1 P2 ) - 0 / P (1 - P ) (1 / n1 ) + (1 / n2 ) ___________________________
Estadstico Z = (P1 P2) - . / P1 (1 P1 ) / n1 + P2 (1 P2 ) / n2
Contraste Donde P = (n1 P1 ) + (n2 P2 ) / (n1 + n2 )

Distribucin
Muestral Normal tipificada N (0, 1)

Conocida (Z) o desconocida (t) la varianza de la poblacin (valor o valores crticos)

Regla (C. Bilateral) ! Z Z /2 y Z Z 1-/2


decisin (C. Unilateral Izquierdo) ! Z Z
(C. Unilateral Derecho) ! Z Z 1

Nivel crtico p ! Se rechaza H0 si p < y se acepta si p >

Intervalo (P1 P2 ) | Z | Error tpico = (Lmites inferior y superior)


confianza

PROBLEMAS EJEMPLO

El grado de dificultad de las preguntas de un test se suele medir por el nmero de los sujetos que
los aciertan, o ms exactamente, por la proporcin de aciertos. Para averiguar si dos preguntas de
un determinado test de aptitud general difieren en dificultad, hemos seleccionado una muestra
aleatoria simple de 200 sujetos y los hemos repartido aleatoriamente en dos grupos de 100. Un
grupo de sujetos ha respondido a la pregunta 1 y el otro a la pregunta 2. La pregunta 1 la han
acertado 70 sujetos y la 2 la han acertado 60. El nivel de significacin se fij en 0,05.

Supuestos: Tenemos una muestra aleatoria de n = 200 sujetos, repartidos en dos grupos
independientes de 100 (cada uno responde a una pregunta y se considera el acierto o el error !
variable dicotmica). Se fija = 0,05. Se dan los supuestos para realizar un Contraste de
Proporciones al comparar el grado de dificultad de las dos preguntas del test.

Hiptesis: Planteamos un contraste bilateral para ver si las preguntas difieren en dificultad.

H0: 1 = 2 // H1: 1 2

Estadstico de contraste: La hiptesis se establece sobre una diferencia nula D = 0)


________________________
Z = (P1 P2 ) / P (1 - P ) (1 / n1 ) + (1 / n2 ) // Donde P = (n1 P1) + (n2 P2) / (n1 + n2)

R. MEDRANO (TUTOR) Pgina 7


DISEOS DE INVESTIGACIN Y ANLISIS DE DATOS ORIENTACIONES TEMA N 3 (DISEOS 2 GRUPOS INDEPENDIENTES)

Clculos previos: Aciertos ! G1 = 70 / 100 = 0,7 / G2 = 60 / 100 = 0,6

P = (n1 G1) + (n2 G2) / (n1 + n2) ! (100 0,7) + (100 0,6) / (100 + 100) = 0,65
_______________________________
Z = (0,7 0,6) / 0,65 (1 0,65) (1 / 100) + (1 / 100) = 1,48

Sigue una distribucin Normal tipificada N (0, 1)

Regla de decisin:

Valores crticos (para un nivel de confianza del 95% y un contraste bilateral, los valores crticos
son ! 196 ! Z0025 (- 196) y Z0975 = (196)
Nivel crtico p [el estadstico de contraste (Z = 1,48) en la tabla de la curva normal deja por debajo
0,9306] ! Probabilidad (Z 1,48) = 1 - 0,9306 = 0,0694; al ser bilateral ! 2 0,069 = 0,1388.

Conclusin: Aceptamos H0 (el estadstico de contraste 148 est entre los valores crticos 196 y
de igual forma, considerando el nivel p crtico, p (01388) > (005)

Interpretacin: Para un nivel de confianza del 95%, aceptamos la hiptesis nula (las preguntas no
difieren en dificultad)

Intervalo de confianza: (P1 P2 ) | Z | Error tpico = (Lmites inferior y superior)

(0,7 0,6) 196 0067 = (- 003 y 023)

Aceptamos H0 (el intervalo de confianza contiene el valor 0, luego asumimos que la diferencia de
medias en la poblacin puede tomar ese valor)

CONTRASTES DE HIPTESIS DOS VARIANZAS

Supuestos " Variable dependiente con un nivel de medida de intervalo o razn


" Dos poblaciones con variables distribuidas normalmente n1 30 y n2 30

C. Bilateral C. Unilateral Derecho C. Unilateral Izquierdo


2 2 2 2 2 2
Hiptesis H0 : 1 / 2 = 1 H0 : 1 / 2 1 H0 : 1 / 2 1
2 2 2 2
H1 : 1 / 2 1 2 2
H1 : 1 / 2 > 1 H1 : 1 / 2 < 1

2 2 2 2
Estadstico F =S 1 / S 2 Donde S 1 S 2 (varianzas insesgadas)
Contraste

Distribucin Distribucin Muestral F de Fisher


Muestral
con gl numerador = (n1 1) gl y gl denominador = ( n2 1)

Regla F f /2 y F f 1-/2 (C. Bilateral)


decisin F f 1 (C. Unilateral Derecho)
F f (C. Unilateral Izquierdo)

Intervalo
2 2 2 2 2 2
confianza (f / 2 ; n1 1 y n2 1) 1 / 2 < 1 / 2 < (f 1 / 2 ; n1 1 y n2 1) 1 / 2

R. MEDRANO (TUTOR) Pgina 8


DISEOS DE INVESTIGACIN Y ANLISIS DE DATOS ORIENTACIONES TEMA N 3 (DISEOS 2 GRUPOS INDEPENDIENTES)

PROBLEMAS EJEMPLO

Deseamos contrastar si las pacientes anorxicas (PA) son ms variables, en cuanto a su nivel de
estrs, que las pacientes bulmicas (PB). Para ello, extraemos dos muestras aleatorias de dichas
pacientes y se obtienen los siguientes datos sobre su nivel de estrs (donde a mayor puntuacin
mayor estrs), considere = 0,05:

PA 4 6 8 12 16
PB 3 5 7 9 14

Sabemos que la variable nivel de estrs est medida a nivel de intervalo y distribuida normalmente en
ambas poblaciones.

Supuestos: Disponemos de dos muestras independientes, la variable dependiente medida a nivel de


intervalo y dos poblaciones con variables normalmente distribuidas! Se trata de un contraste de
varianzas para dos muestras independientes.

Hiptesis: H0: 2PA / 2PB 1 y H1: 2PA / 2PB > 1. Contraste Unilateral Derecho.

Tambin ! H0: 2PA 2PB y H1: 2PA > 2PB

Estadstico de contraste: F = 21 / 22 ! Donde 21 22 (varianzas insesgadas)

Distribucin Muestral F de Fisher con (n1 1) gl y (n2 1) gl


2 2
PA PB PA PB
4 3 16 9
2 2
6 5 36 25 F = 1 / 2
8 7 64 49
12 9 144 81 F = 23,2 / 17,8 = 1,3
16 14 256 196
= 46 = 38 = 516 = 360

Media PA = 46 / 5 = 9,2 21 = (516 / 5) 9,22 (5 / 4) = 23,2


Media PB = 38 / 5 = 7,6 22 = (360 / 5) 7,62 (5 / 4) = 17,8

Regla de decisin: Valor crtico ! f0, 05; 4 y 4 gl = 6,39

Conclusin e interpretacin: No se rechaza H0 porque 1,3 (estadstico de contraste) < 6,39 (valor
crtico). Por tanto, las pacientes anorxicas (PA) no son ms variables que las bulmicas (PB) en
cuanto a su nivel de estrs considerando un nivel de confianza del 95%.

Intervalo de confianza (para poder realizarlo suponemos contraste bilateral):

(f / 2 ; n1 1 y n2 1) 21 / 22 < 21 / 22 < (f 1 / 2 ; n1 1 y n2 1) 21 / 22

0,10) (23,2 / 17,8) = 0,13 < 21 / 22 < (9,60) (23,2 / 17,8) = 12,48

Siendo los valores crticos: f 0,025; 4 y 4 gl = 9,60 y f 0,975; 4 y 4 gl = 1 / 9,60 ! 0,10 (propiedad recproca).

Decisin: Como la H0 debe plantear que las varianzas son iguales (21 / 22 = 1) y apreciamos que
uno est dentro del intervalo de confianza (0,13 y 12,48). Se aceptara la H0 (las varianzas de
ambas poblaciones son iguales)

R. MEDRANO (TUTOR) Pgina 9


DISEOS DE INVESTIGACIN Y ANLISIS DE DATOS ORIENTACIONES TEMA N 3 (DISEOS 2 GRUPOS INDEPENDIENTES)

TAMAO (MAGNITUD) DEL EFECTO

La magnitud o tamao del efecto alude al ndice que mide el efecto que tiene un tratamiento. Deben
estar implicados al menos dos grupos (el experimental y el control). Es independiente del tamao
muestral.
|YTRATAMIENTO YCONTROL |
ndice d = -------------------------------------------------------
[( n1 1) 21 + (n2 1) 22 / (n1 + n2 2)]

Segn Cohen (1988) ! Magnitud del efecto [pequeo (d = 02); mediano (d = 05) y grande (d =
08 o superior)

Problema ejemplo: En un equipo de baloncesto se desea contrastar la eficacia del entrenamiento


psicolgico en los tiros libres, por lo que se seleccionaron aleatoriamente 5 jugadores, a los que se
entren tcnica y psicolgicamente, que fueron comparados con los otros 5, a los que slo se
entren tcnicamente. El porcentaje de mejora a lo largo de la temporada aparece en la siguiente
tabla:

ENTRENAMIENTO PSICOLGICO 37 14 38 43 35
ENTRENAMIENTO TCNICO 29 36 11 17 13

Supuestos: Disponemos de dos muestras independientes con n = 5 para contrastar la eficacia de


un tipo de entrenamiento (el psicolgico). Datos en porcentaje de mejora ! Comprobar la
magnitud del efecto.

PSICOLGICO TCNICO DATOS INSESGADOS


2 2
X X Y Y
37 1369 29 841 MEDIA PSICOLGICO = 167 / 5 = 33,4
14 196 36 1296 MEDIA TCNICO = 106 / 5 = 21,2
38 1444 11 121 2
43 1849 17 289 VARIANZA PSIC = (6083 / 5) 33,4 = 101,04 (5/4) = 126,3
2
35 1225 13 169 VARIANZA TCN = (2716 / 5) 21,2 = 93,76 (5/4) = 117,2

T = MEDIA PSIC - MEDIA TCN = (33,4 21,2) = 12,2


____________________________
Error Tpico = (4 126,3) + (4 117,2) / (5+5-2) = 9
= 167 = 6083 = 106 = 2716
d = 12,2 / 9 = 1,35 ! (09115)

La d = 135 es la distancia estandarizada entre las medias de los dos grupos y su probabilidad
asociada (09115) ! El 9115% de los sujetos con entrenamiento psicolgico mejoran respecto a
los que nicamente reciben entrenamiento tcnico.

R. MEDRANO (TUTOR) Pgina 10


DISEOS DE INVESTIGACIN Y ANLISIS DE DATOS ORIENTACIONES TEMA N 4 (DISEOS 2 GRUPOS RELACIONADOS)

TEMA N 4 ! ANLISIS DE DATOS PARAMTRICOS PARA DISEOS DE DOS GRUPOS


(MUESTRAS RELACIONADAS)

CONTRASTES DE HIPTESIS PARA DOS MUESTRAS RELACIONADAS

Muestras independientes: n1 y n2 muestras de sujetos diferentes, extrados aleatoriamente de sus


respectivas poblaciones.
Muestras relacionadas: se trata de los mismos n sujetos observados en condiciones experimentales
diferentes, o n pares de sujetos semejantes entre s (gemelos, hermanos,...)

Las muestras relacionadas nos ayudan a reducir la varianza de error. As, cuanto mayor sea la
relacin entre ambas muestras, menor ser la varianza de la distribucin muestral de las diferencias
y, por tanto, mayor el estadstico de contraste.

CONTRASTES DE HIPTESIS:

PARA DOS MEDIAS CONOCIDA LA VARIANZA POBLACIONAL DE LAS DIFERENCIAS


(PARAMTRICOS) DESCONOCIDA LA VARIANZA POBLACIONAL DE LAS DIFERENCIAS

PARA DOS MEDIANAS (NO PARAMTRICOS) ! TEST DE WILCOXON

PARA DOS PROPORCIONES

CONTRASTES DE HIPTESIS PARA DOS MEDIAS (MUESTRAS RELACIONADAS)

" Observaciones independientes


Supuestos " Nivel de medida de intervalo o razn
" Distribuciones normales en la poblacin de diferencias bien (n 30)

VARIANZA POBLACIONAL VARIANZA POBLACIONAL DE LAS


DE LAS DIFERENCIAS CONOCIDA DIFERENCIAS DESCONOCIDA
Hiptesis
(similares) C. Bilateral C. Unilateral Derecho C. Unilateral Izquierdo
H0 : 1-2 = 0 H0 : 1-2 0 H0 : 1-2 0
H1 : 1-2 0 H1 : 1-2 > 0 H1 : 1-2 < 0

_ __ _ __
2
Estadstico Z = (D d) / (d / n ) T = (D d) / ( d / n )
Contraste
Distribucin
Muestral Normal Tipificada: (0, 1) t de Student: gl = n-1

Conocida (Z) o desconocida (t) la varianza de la poblacin (valor o valores crticos)

Regla (C. Bilateral) ! t t / 2; n-2 y t t1 - / 2; n-2 // Z Z / 2 y Z Z 1 - / 2


decisin (C. Unilateral Izquierdo) t t ; n-2 // Z Z
(C. Unilateral Derecho) t t 1 ; n-2 // Z Z 1

Nivel crtico p ! Se rechaza H0 si p < y se acepta si p >

_ __ _ __
Intervalo D | Z /2 | D / n = (Lm. infer y sup) D | t /2; n 1 | SD / n = (Lm. infer y sup)
confianza Distribucin Muestral Z con N (0,1) Distribucin Muestral T con (n 1) gl

R. MEDRANO (TUTOR) Pgina 1


DISEOS DE INVESTIGACIN Y ANLISIS DE DATOS ORIENTACIONES TEMA N 4 (DISEOS 2 GRUPOS RELACIONADOS)

PROBLEMAS EJEMPLO (CH diferencia de Medias Relacionadas)

Se desea estudiar si los alumnos de la ESO son ms variables en cuanto a su nivel de


concentracin antes y despus de haberles sometido a una terapia. Sobre una muestra aleatoria de
7 alumnos se toman medidas del nivel de concentracin previo y posterior a la aplicacin de la
terapia, obtenindose los siguientes resultados (a mayor puntuacin, mayor concentracin):

MEDIDA PREVIA 12 9 11 10 9 6 7
MEDIDA POSTERIOR 7 5 6 6 5 6 7

Sabiendo que para aplicar el estadstico de contraste se resta la medida posterior de la previa, que
la concentracin es una variable medida a nivel de intervalo y que se distribuye normalmente en
ambas poblaciones, tmese un nivel de significacin = 0,05 y compruebe si los alumnos se
concentran ms al finalizar la terapia.

Supuestos: Siete alumnos de la ESO (antes y despus de la terapia) ! Muestras relacionadas, (


= 0,05), variable medida a nivel de intervalo y se distribuye normalmente en ambas poblaciones.
Varianza poblacional desconocida ! Diferencia de medias (muestras relacionadas)

Hiptesis: La hiptesis alternativa es la hiptesis del investigador. Del planteamiento del problema
se deduce de que se trata de un contraste unilateral izquierdo donde:

H0: despus antes ! H1: despus < antes


Estadstico de contraste:

2
Medida Medida Diferencia D - DMedia (D - DMedia)
Previa Posterior Posterior - Previa
12 7 -5 - 1,86 3,4596
9 5 -4 - 0,86 0,7396
11 6 -5 - 1,86 3,4596
10 6 -4 - 0,86 0,7396
9 5 -4 - 0,86 0,7396
6 6 0 3,14 9,86
7 7 0 3,14 9,86
= 64 = 42 = (- 22) = 28,86

_
Averiguamos la media (D) y la varianza insesgada (2d) de las puntuaciones diferencia:
_ __ __
Desconocida la varianza de la poblacin: T = (D 0) / (2d) / n) ! T = (- 3,14) / (4,81 / 7) = - 1,7
__________________ _ _ _
Donde: 2d = (Di DMedia)2 / (n 1) y D = Y1 Y2 = Di / n
________ _
2d = 28,86 / 6 = 4,81 y D = (- 22) / 7 = (- 3,14)

Regla de decisin:

Valor crtico (contraste unilateral izquierdo) ! - 1,943 (valor crtico T0, 05 y 6 gl)
Nivel crtico p slo puede obtenerse el valor aproximado, porque 1,7 no figura en la tabla T de
Student para n1 = 6 gl. El valor 1,7 est entre 0,10 (1,4) y 0,05 (1,9).

Conclusin e interpretacin: Teniendo en cuenta que se trata de un contraste unilateral izquierdo


se acepta H0 ! El estadstico de contraste (-1,7) < (-1,943) (valor crtico T0, 05 y 6 gl) // El nivel p crtico
(005 < p < 010) > = 0,05 por lo que se acepta H0. No disponemos de evidencia suficiente para
afirmar que los alumnos se concentran ms al finalizar la terapia.

R. MEDRANO (TUTOR) Pgina 2


DISEOS DE INVESTIGACIN Y ANLISIS DE DATOS ORIENTACIONES TEMA N 4 (DISEOS 2 GRUPOS RELACIONADOS)

Intervalo de confianza: Suponemos un contraste bilateral para realizar el intervalo.


_ __
D | t /2; n 1 | 2d / n = (Lmite inferior y superior) // Distribucin Muestral T con (n 1) gl

(-314) 1943 481 / 264 ! (- 314) 354 ! (04 y 668) ! No contiene el 0, Rechazamos H0

Unos psiclogos hipotetizan que los hombres (H) con ms de 20 aos son ms afectuosos hacia su
pareja que las mujeres (M). Extrae una muestra aleatoria de 8 parejas casadas y les mide el grado
de afectividad hacia la pareja, obteniendo los datos que aparecen a continuacin (a mayor
puntuacin mayor afectividad hacia la pareja). Se sabe que la puntuacin en afectividad es una
variable medida a nivel de intervalo que se distribuye normalmente y que las observaciones entre
las muestras no son independientes. Se fija alfa en 001. Suponemos conocida la varianza de las
diferencias (2d = 5).

PAREJAS 1 2 3 4 5 6 7 8
HOMBRES 13 5 6 9 10 7 11 8
MUJERES 1 9 8 6 5 8 3 5

Supuestos: Se sabe que la puntuacin en afectividad es una variable medida a nivel de intervalo,
que se distribuye normalmente en ambas poblaciones y que conocemos la varianza de las
diferencias (2d = 25). Se fija en 0,04. Segn el enunciado ! Diferencia de medias (muestras
relacionadas)

Hiptesis: Se plantea un contraste unilateral derecho ! H0: H M. y H1: H > M

Estadstico de contraste:
H M D
13 1 12
5 9 -4
6 8 -2
9 6 3
10 5 5
7 8 -1
11 3 8
8 5 3
Media = 8,7 Media = 5,7 = 24
_ _ _ _
D = H M = Di / n ! D = 24 / 8 = 3 // 2d = 5
_ __ _
Z = (D 0) / (2d / n) ! T = 3 / (5 / 8) = 3 / 177 = 1,69

Regla de decisin:
El nivel crtico p (probabilidad de obtener un valor del estadstico, al menos, tan extremo como el
hallado) se obtiene a partir del valor muestral del estadstico de contraste (1,69) que buscando en la
tabla de la curva normal ! p = 1 P (T 169) ! 1-0`9545 = 00455.
El valor crtico para un contraste unilateral derecho y un alfa = 001 es ! 233

Conclusin e interpretacin: Al nivel de confianza del 99% no existen diferencias significativas.


No aceptamos la hiptesis de psiclogo (H1); por tanto, aceptamos H0 (los hombres no son ms
afectuosos que las mujeres)

Intervalo de confianza: Suponemos un contraste bilateral para realizar el intervalo.


_ __
D |Z /2| 2d / n = (Lmite inferior y superior) // Distribucin Muestral Z con N (0, 1)

3 258 5 / 283 ! 3 457 ! (- 157 y 757) ! Como contiene 0 aceptamos H0

R. MEDRANO (TUTOR) Pgina 3


DISEOS DE INVESTIGACIN Y ANLISIS DE DATOS ORIENTACIONES TEMA N 4 (DISEOS 2 GRUPOS RELACIONADOS)

CH DOS MEDIANAS (MUESTRAS RELACIONADAS) PRUEBA DE WILCOXON

Supuestos " Variable dependiente con un nivel de medida al menos ordinal


" La distribucin de la diferencia de los rangos es simtrica

C. Bilateral C. Unilateral Derecho C. Unilateral Izquierdo


Hiptesis H0 : M1 = M2 H0 : M1 M2 H0 : M1 M2
H1 : M1 M2 H1 : M1 > M2 H1 : M1 < M2

1.- Calculamos las diferencias entre las puntuaciones originales.


2.- Asignamos rangos a los valores absolutos de las diferencias.
Estadstico 3.- Sumamos los rangos que proceden de diferencias positivas y los rangos que
Contraste proceden de diferencias negativas, obteniendo: R - y R +

El estadstico de contraste W es el menor de R - y R +

Distribucin
Muestral Utilizamos la tabla U de Mann-Whitney-Wilcoxon

Conocida (Z) o desconocida (t) la varianza de la poblacin (valor o valores crticos)

Regla (C. Bilateral) ! W > wn1, n2; /2


decisin (C. Unilateral Izquierdo) ! W < wn1, n2;
(C. Unilateral Derecho) ! W > wn1, n2;

Aproximacin (T) [n (n +1) / 4]


A la Normal Z = -------------------------------
n 30 n (n+1)(2n+1) / 24

PROBLEMA EJEMPLO
Un investigador desea comparar el grado de hiperactividad en obesos cuando estn en un
programa para bajar de peso (dieta) y sin programa para bajar de peso. Dispone de 10 sujetos a los
que somete a las dos condiciones experimentales (con dieta y sin dieta). Las puntuaciones se
reflejan en la tabla. Sabiendo que la distribucin de las diferencias es simtrica, con un nivel de
confianza del 95%, se puede afirmar que hay diferencias en hiperactividad en obesos cuando
estn o no en un programa de dieta?

Supuestos: Disponemos de dos muestras relacionadas (tamao pequeo). Sabemos que la


distribucin de las diferencias en la poblacin es simtrica. Datos medidos, al menos, a un nivel
ordinal.

Hiptesis: Planteamos un contraste bilateral ! H0 : M1 = M2 y H1 : M1 M2

Estadstico de contraste:

R. MEDRANO (TUTOR) Pgina 4


DISEOS DE INVESTIGACIN Y ANLISIS DE DATOS ORIENTACIONES TEMA N 4 (DISEOS 2 GRUPOS RELACIONADOS)

R+ = (15 + 75 + 95 + 45 + 75 + 45 + 45) = 395 y R- = (15 + 95 + 45) = 155


Se toma el valor del ms pequeo de los sumatorios ! W = 155 (Estadstico de Contraste)

Regla de decisin: Con /2 = 005 (contraste bilateral) y n = 10, acudimos a la tabla de Wilcoxon y
obtenemos un valor crtico = W0025; 10 = 9

Conclusin e interpretacin: Dado que el estadstico de contraste (W = 155) > el valor crtico (W = 9)
no podemos rechazar la H0 con un nivel de confianza del 95%. Las diferencias en el incremento o
disminucin de la hiperactividad en personas obesas con dieta o sin dieta, no son significativas.
Estadsticamente resultan iguales, en razn de que pueden ser diferencias dadas al azar.

CONTRASTES DE HIPTESIS DOS PROPORCIONES


Tpico problema sobre cambios de opinin (pretest-postest), cuando la variable est dicotomizada.

Supuestos " Variable dependiente dicotmica o dicotomizada que medimos en la misma


muestra en dos ocasiones.
" Muestra con [b + c] Observaciones independientes, donde [b + c] > 25
(b+c) representan a los sujetos cuya puntuacin es distinta en las dos ocasiones.

C. Bilateral C. Unilateral Derecho C. Unilateral Izquierdo


Hiptesis H0 : b = c H0 : b c H0 : b c
H1 : b c H1 : b > c H1 : b < c

_______
2 2
Z = (b - c) / (b + c) = (b c) / (b + c)
Estadstico
Contraste b ! (sujetos que puntan 1 en la primera medida y 2 en la segunda).
c ! (sujetos que puntan 2 en la primera medida y 1 en la segunda)
Distribucin
Muestral Normal tipificada N (0, 1) Chi Cuadrado con 1 grado de libertad
2 2
Regla (C. Bilateral) ! Z Z / 2 y Z Z 1 - / 2 < 1; 1- Mantener H0
decisin (C. Unilateral Izquierdo) ! Z Z
2 2
(C. Unilateral Derecho) ! Z Z 1 > 1; 1- Rechazar H0

_______
Intervalo (P1 P2 ) | Z /2 | (b + c) = (Lmites inferior y superior)
confianza

PROBLEMA EJEMPLO

Una psicloga desea estudiar si la proyeccin de imgenes de accidentes de trfico influye en la


forma de conducir. Extrae una muestra aleatoria de 102 sujetos con elevado historial de infracciones
de trfico y observa si cometen o no infraccin en una determinada situacin que propicia el hacerlo
(saltarse un semforo que acaba de cambiar a rojo). Encuentra que 54 no se lo saltan. Tras
proyectarles imgenes de accidentes de trfico, vuelve a observar si los sujetos se saltan o no se
saltan el semforo en las mismas condiciones. Encuentra que 34 de los que no se lo saltaban antes
de proyectarles las imgenes se lo saltan despus y 5 que se lo saltaban antes, tambin se lo saltan
despus. Se desea saber si ha habido un cambio significativo en cuanto a infracciones tras la
proyeccin de imgenes. Utilice alfa = 0,01

Supuestos: Muestra grande de 102 sujetos sometidos a dos medidas de la misma variable
(cometer o no cometer infraccin)! Variable dependiente dicotmica. [b + c] > 25 Se trata de
contrastar las proporciones en dos muestras de observaciones relacionadas.

Hiptesis: Planteamos un contraste bilateral ! H0 : b = c y H1 : b c

R. MEDRANO (TUTOR) Pgina 5


DISEOS DE INVESTIGACIN Y ANLISIS DE DATOS ORIENTACIONES TEMA N 4 (DISEOS 2 GRUPOS RELACIONADOS)

Estadstico de contraste:

Primera medida (Antes)


Si saltan (SI = 1) No saltan (NO = 2) TOTALES
Si saltan a=5 b = 34 39
Segunda (SI = 1)
Medida No saltan c = 63-20 = 43 d = 54-34 = 20 102 39 = 63
(Despus) (NO = 2)
48 54 102
TOTALES
______ ________
Z = (b - c) / (b + c) ! (34 43) / (34 + 43) = 1`02 // Distribucin normal N (0,1)

Regla de decisin:

Los valores crticos, contraste bilateral, con /2 = 0,005 y 1- /2 = 0,995 ! 258.


El nivel crtico p (probabilidad de obtener un valor del estadstico, al menos, tan extremo como el
hallado) se obtiene a partir del valor muestral del estadstico de contraste ( 102) que buscando en
la tabla de la curva normal ! 2 [P (Z 102) = 2 (1 0,8461) = 2 0,1539 ! 0,3078.

Conclusin e interpretacin:

Como p (0,3078) > (0,01) ! Aceptamos H0. Tambin como 102 (valor muestral del estadstico de
contraste) < 258 (el mayor de los valores crticos). Tambin 102 est entre los valores crticos (-
258 y 258).
Para = 001, podemos afirmar que la proporcin poblacional de los sujetos que se saltan el
semforo es la misma antes de la proyeccin de imgenes que despus.

Tambin con el test de McNemar: 2 = (b c)2 / (b + c) ! 2 = (34 43)2 / (34 + 43) = 105

Para 2con un grado de libertad, el valor 105 se encuentra entre (010 < p < 090) por lo que el nivel p
crtico > que (0,01) ! Aceptamos H0

R. MEDRANO (TUTOR) Pgina 6


DISEOS INVESTIGACIN Y ANADATOS ORIENTACIONES TEMA N 5 (DISEOS MS DE 2 GRUPOS INDEPENDIENTES / 1 FACTOR)

TEMA N 5 ! DISEOS CON MS DE DOS GRUPOS INDEPENDIENTES

FUNDAMENTOS DEL ANLISIS DE VARIANZA (ANOVA)

Anlisis de Varianza (ANOVA ANVAR) ! es una tcnica paramtrica de anlisis estadstico que
se utiliza para comparar las medias de ms de dos grupos.
El diseo de ms de dos grupos tiene por objeto estudiar la influencia de ms de dos valores de la
variable independiente sobre la variable dependiente y, por tanto, tiene ms posibilidades de establecer
la relacin precisa entre ellas. Una de las caractersticas ms importantes del diseo de experimentos
es la aleatoriedad: eleccin de un grupo (muestra) y su distribucin en tres o ms grupos de forma
aleatoria.
Al comparar distintos grupos para realizar un estudio tenemos en cuenta la variabilidad que aparezca
entre los sujetos en la variable dependiente que se considera formada por dos componentes: la que se
debe al factor estudiado (atribuible a los distintos tratamientos experimentales; variable independiente) y
la que se debe a factores extraos y no controlados (Error Experimental)
El Anlisis de Varianza se fundamenta en el estudio de estas variabilidades. La varianza general o
comn se divide en: varianza intergrupos (atribuible a los distintos niveles del factor estudiado) y
varianza intragrupos (atribuible al error experimental). Al comparar ambas varianzas obtenemos la
aceptacin o rechazo de la hiptesis nula (que consiste en afirmar que no existe diferencia entre las
medias de los distintos grupos)
Lgica del mtodo: Los sujetos se distribuyen aleatoriamente en los mencionados grupos (para
minimizar la influencia de las variables extraas); por tanto, son semejantes en cuanto a la variable
estudiada dentro de cada grupo y entre los distintos grupos. Si despus de aplicar el tratamiento
experimental existen diferencias, se puede pensar que son debidas a los procedimientos aplicados.

TERMINOLOGA:

Factores = Var. Independientes que se estudian. Niveles = categoras en que dividimos los factores.
Efectos Fijos = slo nos interesan unos niveles concretos, los establecidos. Los resultados slo afectan
a estos niveles. Efectos Aleatorios = los niveles actan como una muestra y las conclusiones se pueden
generalizar en el sentido de los datos de la muestra.
Modelo Equilibrado = igual nmero de sujetos en los grupos. Modelo no Equilibrado = distinto nmero
de sujetos en los grupos.

PASOS PARA REALIZAR EL ANOVA !

1.- Probar los supuestos (independencia de las observaciones, normalidad de las distribuciones y
homogeneidad de las varianzas)para asegurarnos que se puede aplicar el ANOVA
2.- Enunciar las hiptesis estadsticas
3.- Decidir el estadstico de contraste que vamos a utilizar para probar la H0
4.- Con qu nivel de confianza vamos a trabajar (establecer la regin crtica de rechazo de la H0
5.- Calcular el estadstico de contraste (Tabla del ANOVA)
6.- Tomar la decisin sobre la H0 (comparar el valor F obtenido con el valor crtico)
7.- Interpretacin en el contexto de la investigacin

SUPUESTOS DEL ANOVA

1.- Escala de medida de la VD, al menos, de intervalo.


2.- Normalidad de las distribuciones: Las muestras o grupos a comparar proceden de poblaciones que
se distribuyen normalmente ! Pruebas de Bondad de Ajuste (Lilliefors, Kolmogorov-Smirnov, X2 de
Pearson) // No es necesario desarrollarlas.
3.- Independencia de las observaciones: Las muestras o grupos han sido obtenidos de forma aleatoria
(las muestras y las observaciones deben ser independientes) ! Test de rachas.
4.- Homogeneidad de las varianzas (homocedasticidad): Los grupos a comparar deben proceder de
poblaciones cuyas varianzas no difieran de forma significativa ! Test de Cochran (modelos equilibrados
y Test de Bartlett (modelos no equilibrados)

R. MEDRANO (TUTOR) Pgina 1


DISEOS INVESTIGACIN Y ANADATOS ORIENTACIONES TEMA N 5 (DISEOS MS DE 2 GRUPOS INDEPENDIENTES / 1 FACTOR)

INDEPENDENCIA DE LAS OBSERVACIONES (TEST DE RACHAS) !

Hiptesis estadsticas:
H0: Las observaciones y las muestras son independientes
H1: Las observaciones y las muestras no son independientes

Estadstico de Contraste: (r = n de rachas // n1 = n de signos + // n2 = n de signos )


Si n1 y n2 20, entonces Estadstico r ! (n de rachas = n de grupos de signos iguales seguidos)
Si n1 y/o n2 > 20, entonces Estadstico T ! Distribucin ! Curva Normal N (0, 1)
r [(2n1n2 / n1 + n2) + 1]
T = -----------------------------------------------------------
2n1n2 (2n1n2 n1 n2) / (n1 + n2)2 (n1 + n2 1)

Distribucin Muestral: Estadstico r ! Tabla (Test de Rachas) // Estadstico T ! Tabla N (0,1)

Clculo del Estadstico de Contraste: Para poder aplicar el Test hemos de dicotomizar la variable
observada. Para ello: A partir de la Mediana (Md) de todas las puntuaciones tomadas conjuntamente
(si una puntuacin es mayor que la Md se sustituye por un signo + y si es menor por un signo )

Valores Crticos: Si el estadstico es r ! U/2 y U1-/2 (en la tabla de valores crticos del Test de
Rachas, buscamos los valores de n1 y n2) // Si el estadstico es T ! Z/2 y Z1-/2

Zona de Aceptacin: Zona de Rechazo:


Estadstico r ! U/2 < r < U1-/2 Estadstico r ! r U/2 y r U1-/2
Estadstico T ! Z/2 < T < Z1-/2 Estadstico T ! T Z/2 y T Z1-/2

Decisin: Estadstico r ! Decisin: Estadstico T !


Si U/2 < r < U1-/2 ! Aceptamos Ho Si Z/2 < T < Z1-/2 ! Aceptamos Ho
Si r U/2 r U1-/2 ! Rechazamos Ho Si T Z/2 o T Z1-/2 ! Rechazamos Ho.

PROBLEMA EJEMPLO

Un seleccionador de baloncesto desea averiguar como incide la hora del da a la que se entrena en el
rendimiento de los jugadores durante los partidos. Para ello selecciona 18 sujetos y los distribuye
aleatoriamente en turnos de maana (M), tarde (T) y noche (N); seis en cada turno. Al final de la
temporada el seleccionador los convoca a un torneo y hace el recuento de canastas conseguidas por los
jugadores, obteniendo los siguientes resultados:

TURNOS NMERO DE CANASTAS ENCESTADAS POR LOS 18 SUJETOS


MAANA 15 12 14 10 11 16
TARDE 7 9 12 17 10 12
NOCHE 13 15 20 17 16 18

Comprobar si las observaciones son independientes (sabemos que la Mediana = 135):


Hiptesis ! H: Las muestras son aleatorias y H1: Las muestras no son aleatorias

Para contrastar la independencia (Test Rachas) ! las observaciones pueden dicotomizarse, utilizando la
mediana (asignando un + cuando la puntuacin sea mayor y un - cuando la puntuacin sea menor)

Canastas 15 12 14 10 11 16 7 9 12 17 10 12 13 15 20 17 16 18
Signo + - + - - + - - - + - - - + + + + +
Rachas 1 2 3 4 5 6 7 8 9
r ! (n de rachas) = 9 // n + = 9 (signos positivos) // n - = 9 (signos negativos)

Con un nivel de significacin = 0,05, buscamos los valores crticos en la tabla del test de Rachas
n - = 9; n + = 9; / 2 = 0,025 y 1 - / 2 = 0975 (bilateral)
T (0,025) = 5 y T (0,975) = 14 ! Como (rachas = 9) est dentro del intervalo (entre 5 y 14), se acepta H0. Las
observaciones son independientes.

R. MEDRANO (TUTOR) Pgina 2


DISEOS INVESTIGACIN Y ANADATOS ORIENTACIONES TEMA N 5 (DISEOS MS DE 2 GRUPOS INDEPENDIENTES / 1 FACTOR)

HOMOGENEIDAD DE LAS VARIANZAS (TEST DE COCHRAN) !

Este supuesto es el que ms va a distorsionar los resultados, en caso de no cumplirse, porque si al


final hay diferencias entre los grupos, no podremos saber si se deben a la variable independiente o a
que ya existan con anterioridad. Supuestos (Modelo equilibrado)

Hiptesis estadsticas:
H0: 21 = 22 = 23 = (Las varianzas poblacionales son iguales)
H1: 21 22 23 . (Para alguna 2i)

Estadstico de Contraste ! R = (Varianza Muestral Mayor / Varianzas Muestrales)

El estadstico de contraste (distribucin de valores crticos segn la tabla de Cochran)

Valor Crtico: R r,n,


(r = n de grupos y n = n de sujetos por grupo) Zona de Aceptacin: R < R r,n,

Decisin:
Zona de Rechazo: R R r,n, Si R < R r,n, ! Aceptamos Ho
Si R R r,n, ! Rechazamos Ho

PROBLEMA EJEMPLO

Con el enunciado del problema utilizado para el test de rachas (Modelo equilibrado):

TURNOS NMERO DE CANASTAS ENCESTADAS POR LOS 18 SUJETOS


MAANA 15 12 14 10 11 16
TARDE 7 9 12 17 10 12
NOCHE 13 5 20 17 16 18

Sabiendo que se cumple el supuesto de normalidad de las distribuciones, comprobar si las varianzas
son homogneas ! H0: Las varianzas son iguales // H1: No todas las varianzas son iguales
Para contrastar la homocedasticidad (Test de Cochran) ! R = mx 2I / 2I

2MAANA = (1042 / 6) - 132 = 4,67 2TARDE = (807 / 6) 11,172 = 9,73

2NOCHE = (1663 / 6) 16,52 = 4,92 R = 9,73 / (4,67 + 9,73 + 4,92) = 0,504

Con un nivel de significacin = 0,05, buscamos los valores crticos de las tablas de Cochran ! n = 6
// r (grupos) = 3 // R = 0,7071

Decisin ! Como 0,504 < 0,7071, se acepta H0 (Las varianzas no difieren significativamente)

HOMOGENEIDAD DE LAS VARIANZAS (TEST DE BARTLETT) !

Hiptesis estadsticas ! Similares a las enunciadas en el test de Cochran.

Supuestos ! El test de Bartlett se usa para modelos no equilibrados.

Estadstico de Contraste ! Sigue la distribucin Chi-Cuadrado con (r-1) gl (r = n de grupos)


2 2 2
Valor Crtico: X (r-1)(1-) Zona de Aceptacin: X < X (r-1)(1-)

Decisin:
2 2 2 2
Zona de Rechazo: X X (r-1)(1-) Si X < X (r-1)(1-) ! Aceptamos Ho
2 2
Si X X (r-1)(1-) ! Rechazamos Ho

R. MEDRANO (TUTOR) Pgina 3


DISEOS INVESTIGACIN Y ANADATOS ORIENTACIONES TEMA N 5 (DISEOS MS DE 2 GRUPOS INDEPENDIENTES / 1 FACTOR)

PROBLEMA EJEMPLO

Sean tres muestras para probar la homogeneidad de varianzas:

Nios Nias Adultos


6 9 8 Medias ! 4,67 (Nios) // 7,625 Nias // 7,33 Adultos
5 8 10
6 8 8 Varianzas Insesgadas !
4 5 3
3 10 7 2 NIOS = 1 2 NIAS = 2,55 2ADULTOS = 4
5 7 6
4 6 7
4 8 9 Varianza insesgada ponderada ! gi 2 i / g
5 8
2 2 2
= 42 = 61 = 66 (n1 1) N + (n2 1) N + (n3 1) A
2
2 = 204 2 = 483 2 = 516 = -----------------------------------------------------------------
n1 = 9 n2 = 8 n3 = 9 (n1 1) + (n2 1) + (n3 1)

ESTADSTICO DE CONTRASTE !

Con logaritmos decimales (r = grupos)! 2 R-1 = 2,3026 / C {g log 2 - gi log 2 i}

Siendo C = 1 + {1 / 3 (r - 1)} {( 1 / gi) 1 / g}


gi = denominador de cada varianza insesgada i (n 1)
g = suma de todas las gi ( gi)

Averiguamos la Varianza Ponderada ! 2 = gi 2 i / g = 2,515

2 = {(9 1) 1 + (8 1) 2,55 + (9 1) 4} / (9 1) + (8 1) + (9 1) = 2,515

Averiguamos C ! 1 + {1 / 3 (3 - 1)} {(1 / 8 + 1 / 7 + 1 / 8) 1 / 23} = 1,0291

Aplicamos el estadstico de Contraste !

2 r-1 = 2,3026 / {1,0291 [23 log 2,515 (8 log 1 + 7 log 2,55 + 8 log 4)]} = 3,45

CONCLUSIN ! Distribucin 2 con (r 1= 2) gl y = 0,05 ! 5,99

DECISIN ! Como 5,99 > 3,45 Aceptamos hiptesis nula de homocedasticidad.

R. MEDRANO (TUTOR) Pgina 4


DISEOS INVESTIGACIN Y ANADATOS ORIENTACIONES TEMA N 5 (DISEOS MS DE 2 GRUPOS INDEPENDIENTES / 1 FACTOR)

ANOVA (UN FACTOR) !


______________________
ANOVA UNIFACTORIAL ! Influencia de un nico factor (variable) en distintos niveles (categoras).
Se utiliza el mismo esquema operativo para el efecto fijo y aleatorio, para el modelo equilibrado y el no
equilibrado.

MODELO "Yij = + ij + ij // Cualquier puntuacin (Y) tiene tres componentes: () que es la media de
la poblacin. () el nivel en que se encuentra, comn a todos los componentes adscritos a ese nivel.
() el error experimental o factores no controlados en el experimento (se asume que es una variable
aleatoria distribuida segn N (0, ). Ejemplo ! Y17 = puntuacin del sujeto 7 del grupo 1.

HIPTESIS " Efectos fijos (sobre las medias poblacionales) // Efectos aleatorios (sobre las
varianzas ! cuando son = 0, las medias son iguales).

EFECTOS FIJOS ! EFECTOS ALEATORIOS !


2
H0: 1 = 2 = 3 = = i H0: B = 0
2
H1 : 1 2 3 i H1: B 0
al menos para una i
Clculo similar

TABLA ANOVA UNIFACTORIAL


FUENTE DE S MAS GRADOS DE MEDIAS ESTADSTICO
VARIACIN CUADRTICAS LIB RTAD CUA RTICAS DE CONTRASTE
ENTRE SC INTER I1 MC INTER
NIVELES N de grupos o (SC INTER) / (I 1) MC INTER
niveles menos 1 F = ---------------
DENTRO DE SC INTRA NI MC INTRA MC INTRA
LOS NIVELES N de sujetos (SC INTRA) / (N I)
menos N de
grupos
TOTAL SC TOTAL N1 F se distribuye ! F con (I 1) y (N I)
N de sujetos grados de libertad.
menos 1

CLCULOS " Se cumple [SC TOTAL = SC INTER + SC INTRA] y G. Libertad: [N 1 = (I 1) + (N I)]

SC TOTAL = Y2 {( Y)2 / N}
SC INTRA = SC TOTAL - SC INTER
SC INTER = ( Y)2 / n {( Y)2 / N}

DECISIN " Rechazamos H0 (igualdad de medias en los distintos niveles) si el valor de la F


experimental (estadstico de contraste) es mayor que el valor F obtenido en las tablas, para un nivel de
significacin () predeterminado.

El Numerador del estadstico de contraste contiene la Varianza de error + Efecto real de la VI. El
Denominador contiene la Varianza de error. Por tanto, cuanto menor es el efecto real de la VI ms se
acerca el cociente a uno.

Valor Crtico: F (I-1) (N-I) (1-) Zona de Aceptacin: F < F ((I-1) (N-I) (1-)

Decisin:
Zona de Rechazo: F F (I-1) (N-I) (1-) Si F < F crtico ! Aceptamos H0
Si F F crtico ! Rechazamos H0

R. MEDRANO (TUTOR) Pgina 5


DISEOS INVESTIGACIN Y ANADATOS ORIENTACIONES TEMA N 5 (DISEOS MS DE 2 GRUPOS INDEPENDIENTES / 1 FACTOR)

Clculos abreviados (Utilizamos el sistema de notacin propuesto por Keppel): El clculo de las
Sumas de cuadrados se realiza sumando y restando las razones bsicas: [Y] (relacionada con las
puntuaciones individuales); [A] con los totales de los niveles y [T] con la suma total.

Estructura de clculo del numerador ! Se elevan al cuadrado las cantidades implicadas y


posteriormente se suman.
Estructura de clculo del denominador ! Cualquiera que sea el trmino se divide por el nmero de
puntuaciones que contribuyen a su clculo.

Frmulas para las razones bsicas Sumas Cuadrados a partir de razones bsicas

[T] = T2 / (a)(n) ! Diseo equilibrado SCTOTAL = [Y] [T] ! SCTOTAL


[T] = T2 / N ! Diseo no equilibrado _
SCT = (Y YTOTAL)2
[A] = A2 / n ! Diseo equilibrado
SCA = [A] [T] ! SCINTERGRUPO
[A] = (A21 / n1) + (A22 / n2) + _ _
(Diseo no equilibrado) SCA = n (YA YTOTAL)2

[Y] = Y2 SCS | A = [Y] [A] ! SCINTRAGRUPO

SCS | A = (Y YA)2

N = Nmero total de observaciones // n = Observaciones por nivel

PROBLEMA EJEMPLO

Un seleccionador de baloncesto desea averiguar cmo incide la hora del da a la que se entrena en el
rendimiento de los jugadores durante los partidos. Para ello selecciona 18 sujetos y los distribuye
aleatoriamente en turnos de maana (M), tarde (T) y noche (N); seis en cada turno. Al final de la
temporada el seleccionador los convoca a un torneo y hace el recuento de canastas conseguidas por los
jugadores, obteniendo los siguientes resultados:

TURNOS NMERO DE CANASTAS ENCESTADAS POR LOS 18 SUJETOS


MAANA 15 12 14 10 11 16
TARDE 7 9 12 17 10 12
NOCHE 13 15 20 17 16 18

2
SUMATORIOS () N DE CASOS MEDIAS
MAANA 78 1042 6 13
TARDE 67 807 6 11,17
NOCHE 99 1663 6 16,5
TOTAL 244 3512 18 13,55

Clculo de las Sumas Cuadrticas:

SC TOTAL = Y2 {( Y)2 / N} ! 3512 - (244)2 / 18 = 204,45 ! Abreviado: [Y] [T]

Y2 = segn tabla 3512


( Y)2 / N = segn tabla 2442 / 18 = 3307,55

SC INTER = ( Y)2 / n {( Y)2 / N} ! 3395,67 - (244)2 / 18 = 88,11 ! Abreviado: [A] [T]

( Y)2 / n = (782/6) + (672/6) + (992/6) = 3395,67


( Y)2 / N = segn tabla 2442 / 18 = 3307,55

SC INTRA = SC TOTAL - SC INTER ! 204,45 - 88,11 = 116,3

R. MEDRANO (TUTOR) Pgina 6


DISEOS INVESTIGACIN Y ANADATOS ORIENTACIONES TEMA N 5 (DISEOS MS DE 2 GRUPOS INDEPENDIENTES / 1 FACTOR)

TABLA ANOVA UNIFACTORIAL


FUENTE DE SUMAS GRADOS DE MEDIAS ESTADSTICO DE
VARIACIN CUADRTICAS LIBERTAD CUADRTICAS CONTRASTE
ENTRE SC INTER I1 MC INTER
NIVELES 88,11 31=2 88,11 / 2 = 44,05 F = 44,05 / 7,75 =
DENTRO DE SC INTRA NI MC INTRA 5,68
LOS NIVELES 116,3 18 3 = 15 116,3 / 15 = 7,75
TOTAL SC TOTAL N1 F de Snedecor con (2 y 15) g l. y = 0,05
204,45 18 1 =17 F (Tablas) = 3,68

Decisin ! Comparando los resultados F (tablas) = 3,68 < F (experimental) = 5,68, por tanto
rechazamos la hiptesis nula. Existen diferencias significativas entre el rendimiento de los jugadores
dependiendo de la hora del da a la que entrenan a un nivel de confianza del 95%.

COMPARACIONES MLTIPLES (previo rechazo de la H0) "

Permiten obtener informacin sobre las diferencias entre los distintos tratamientos considerados uno a
uno. El objetivo de las comparaciones mltiples es reducir la cantidad de Error Tipo I () que
cometeramos si se compararan sin ms, dos a dos, todas las muestras posibles. Dos tipos:
! Comparaciones planificadas o a priori (no interesan todas las comparaciones, slo algunas)
! Comparaciones no planificadas, a posteriori o post hoc.
Las que vamos a utilizar se denominan no planificadas, a posteriori o post hoc (se llevan a cabo
cuando se ha realizado el Anlisis de Varianza y la F ha sido significativa / hemos rechazado la H0). Las
ms importantes ! TUKEY // SECHEFF.

___________
PRUEBA TUKEY (HSD) ! HDS TUKEY = q , gl, K MC error / n

q ! valor crtico en la tabla de rango studentizado. Se averigua considerando el nivel de confianza fijado
(), los grados de libertad de la MC error y el nmero de grupos o tratamientos a comparar en el ANOVA.
MC ERROR ! media cuadrtica error del Anova (MCINTRA / MCS | A)
n ! tamao de cada grupo (los modelos han de ser equilibrados). Cuando el modelo no es equilibrado,
se sustituye n por n ! n = k / (1 / n1) + (1 / n2)...
_ _
Rechazamos H0 cuando (| Yi Yj | HDS TUKEY

PRUEBA SCHEFF (CR) ! Permite, adems, realizar comparaciones complejas (una media con otras
dos consideradas en conjunto). Los coeficientes c (pesos) ! (2), (- 1) y (-1). Cuando se utiliza en lugar
de Tukey, para comparaciones dos a dos, es menos potente y ms conservadora que Tukey, lo que
significa que, en igualdad de condiciones, el valor crtico de Scheff es ligeramente superior al de
Tukey, por lo que resulta ms difcil rechazar la hiptesis nula de la igualdad de medias.
_________________ ___________________
CR SCHEFF = (k - 1) F (k - 1), gl ERROR MC ERROR [ (c2j / nj)]

k ! Nmero de grupos
ni = nmero de sujetos de cada grupo.
F (k - 1), gl ERROR ! F experimental del ANOVA.
MC ERROR ! Media cuadrtica error.
c2j ! Coeficiente de las combinaciones lineales (en cada combinacin la suma de coeficientes = 0)
_ _ _
1 = 2 Y1 (Y2 + Y3) ! Entonces: c1 = 2, c2 = (-1), c3 = (-1) ! Dado que (cj = 0)

Para hallar los cj, se debe tener en cuenta que siempre deben sumar 0. Es ms fcil calcular primero
los cj de los que se combinan conjuntamente, que siempre sern negativos, y luego el del que se
compara frente a todos, que ser la suma de los otros, pero con signo positivo.
Decisin:
Si 1 CR ! Existen diferencias significativas entre el nivel y los otros tomados conjuntamente.
Si 1 < CR ! No existen diferencias significativas entre el nivel y los otros tomados conjuntamente

R. MEDRANO (TUTOR) Pgina 7


DISEOS INVESTIGACIN Y ANADATOS ORIENTACIONES TEMA N 5 (DISEOS MS DE 2 GRUPOS INDEPENDIENTES / 1 FACTOR)

PROBLEMAS EJEMPLO !

Siguiendo con nuestro planteamiento anterior:


_________
Prueba Tukey (HSD) ! HDS TUKEY = q , gl, K MC error / n
_ _ _
n = 6 // k = 3 // XMAANA = 13 // XTARDE = 11,17 // XNOCHE = 16,5

Valor q para = 0,05; 15 grados de libertad y tres grupos ! 3,67 MCINTRA ! 7,75
_______
HDS TUKEY = 3,67 7,75 / 6 = 4,17 (modelo equilibrado)

| 13 - 11,17 | = 1,83 < 4,17 Diferencia no significativa.


| 13 - 16,5 | = 3,5 < 4,17 Diferencia no significativa.
| 11,17 - 16,5 | = 5,33 > 4,17 Diferencia significativa.

Decisin ! Existen diferencias significativas entre entrenar por la tarde y por la noche, siendo el mejor
rendimiento por la noche (media ms alta)

Prueba Scheff (CR) ! Comparacin entre la media del turno de noche con las de maana y tarde
consideradas conjuntamente.
__________________ __________________
CR SCHEFF = (k - 1) F (k - 1), gl ERROR MC ERRROR [ (c2j / nj)

Valor F para = 0,05 // 2 y 15 grados de libertad ! 3,68 MCINTRA ! 7,75


__________ ________________________
CR SCHEFF = (3-1) 3,68 (7,75) (22 / 6 + 12 / 6 + 12 /6) = 6,15

Coeficientes c (pesos) ! (2), (- 1) y (-1) ! | (2 16,5) + (- 1 11,17) + (- 1 13) | = 8,83

Decisin ! Como 8,83 > 6,15 ! Rechazamos H0 (existen diferencias significativas entre el turno de
noche y los de maana y tarde considerados conjuntamente.

MODELOS NO PARAMTRICOS PARA MUESTRAS INDEPENDIENTES:


Se utilizan como alternativa al ANOVA cuando no se cumplen los supuestos ya indicados. Tienen
menos restricciones y tambin una potencia menor.
TEST DE KRUSKAL - WALLIS " Es una ampliacin del test de Mann-Whitney.
Supuestos: VD es una variable continua que se transforma en una escala ordinal (que disminuye el
impacto de los valores extremos); la distribucin poblacional puede ser de cualquier tipo (las varianzas
deben ser homogneas); se trata de k muestras aleatorias e independientes que queremos comparar.

HIPTESIS ! H0: 1 = 2 = = K
H1: 1 2 K Al menos para una

ESTADSTICO DE CONTRASTE ! H = {12 / N (N + 1)} { (R2 / n} 3 (N + 1)


N = nmero total de observaciones; n = nmero de observaciones de cada muestra
R2 = suma de rangos de cada muestra, previa ordenacin nica.
El estadstico de contraste sigue la distribucin X2 con (k-1) gl

Clculo: Se ordenan todas las puntuaciones en una sola serie, (es decir, tomndolas todas en cuenta),
asignamos rangos de 1 a n, dando a la puntuacin menor el rango 1. En caso de empate ! (rango
medio); es decir, asignndoles la media aritmtica de los rangos que les hubieran correspondido de ser
distintas.

Decisin: Cuando se rechaza la H0, se procede a realizar comparaciones mltiples (tratamientos entre
los que se producen las diferencias)

R. MEDRANO (TUTOR) Pgina 8


DISEOS INVESTIGACIN Y ANADATOS ORIENTACIONES TEMA N 5 (DISEOS MS DE 2 GRUPOS INDEPENDIENTES / 1 FACTOR)

_________________
Diferencia mnima crtica ! MVKV = Z adj N(N+1) /12 (1/ai)

Siendo Z adj el percentil 1 ( / 2c) de la distribucin normal tipificada. (c) es el n de comparaciones a


realizar en un contraste bilateral [en uno unilateral ! Z adj = 1 ( / c)]
_ _
Para comparar las diferencias de rangos ! Ri - Rj > MVKW

PROBLEMA EJEMPLO

En un estudio sobre antojo por el chocolate varios autores queran determinar si la distribucin
poblacional del consumo de chocolate en una semana era igual en una muestra de nios (N), que en una
muestra de mujeres adultas (MA) y que en una de hombres adultos (HA). Para ello se seleccionaron
aleatoriamente 5 sujetos de cada grupo y se midi su consumo de chocolate contabilizando (segn se
recoge en la tabla) el nmero de alimentos con chocolate consumidos en una semana (C):

NIOS MUJERES ADULTAS HOMBRES ADULTOS


N RANGO N RANGO N RANGO
6 1 31 13,5 13 7
11 4,5 7 2 32 15
12 6 9 3 31 13,5
20 9 11 4,5 30 12
24 10 16 8 28 11

= 30,5 / 5 = 61
Rango Medio Rango Medio =
31 / 5 = 62 Rango Medio =
58,5 / 5 = 117
2 2 2
RANGOS = 930,25 RANGOS = 961 RANGOS = 3422,25
2 2 2
R / 5 = 186,05 R / 5 = 192,20 R / 5 = 684,45

Asumiendo que la distribucin de consumo es continua y = 0,10. Se trata de tres muestras


independientes y los datos estn medidos en una escala de razn.

Hiptesis !
H0: No existen diferencias poblacionales en el consumo semanal de chocolate entre N, MA y HA.
H1: Existen diferencias poblacionales en el consumo semanal de chocolate entre, al menos dos grupos.

Estadstico de Contraste ! Kruskal Wallis H = {12 / N (N + 1)} { (R2 / n} 3 (N + 1)

H = {12 / 15 (15 + 1)} {186,05 + 192,20 + 684,5} 3 (15 + 1) = 5,135

El estadstico de contraste sigue la distribucin X2 con (3-1) gl y = 0,10 ! X22; 090 = 461

Decisin ! Como 5,135 > 4,61 Se Rechaza la Hiptesis Nula (Comparaciones mltiples ! Las tres
muestras son equilibradas)
_________________ _______________
MVKV = Z adj N(N+1) /12 (1/ni) ! MVKV = 213 15(16) /12 (1/5) ! MVKV = 426

Donde Z adj ! [1 ( / 2c)] ! [1 (010/ 6)] = 09834 (Z = 213) (c = 3 comparaciones)


_ _
| RMA RN | = | 62 61 | = 0,1 < 426 Diferencia no significativa
_ _
| RMA RHA | = | 62 117 | = 55 > 426 Diferencia significativa
_ _
| RN RHA | = | 61 117 | = 56 > 426 Diferencia significativa

Interpretacin del resultado en el contexto de la investigacin ! Existen diferencias significativas en


el consumo semanal de chocolate entre N, MA y HA a un nivel de confianza del 90 % considerado
globalmente. Analizando los resultados, las diferencias se dan entre N y MA con HA.

R. MEDRANO (TUTOR) Pgina 9

Das könnte Ihnen auch gefallen