Beruflich Dokumente
Kultur Dokumente
Estudio de las muestras para conocer la poblacin a la que representan. La inferencia siempre se hace
en trminos probabilsticos (afirmamos con una cierta probabilidad de xito). El error muestral es la
diferencia entre el resultado obtenido en la muestra y el que habramos obtenido si se hubiese trabajado
con la poblacin.
Para cada caracterstica de la muestra que evaluemos se obtiene lo que se conoce como estadstico:
ndices descriptivos de centralidad (Media), variabilidad (Varianza), etc. A partir de los estadsticos
obtenidos en la muestra (lo concreto), se realizan afirmaciones sobre los parmetros de la poblacin (lo
general)
DISTRIBUCIONES DE PROBABILIDAD !
Teorema Central del lmite: Si una poblacin tiene una media y una varianza 2 finitas, la
distribucin de las medias muestrales de tamao n extradas de manera aleatoria e independiente,
se aproxima a la forma de una distribucin normal con varianza 2/n y media conforme el
tamao de n se va incrementando. __
N ( , / n)
PROBLEMAS EJEMPLO
Los tiempos requeridos por un cierto autobs para alcanzar uno de sus destinos en una ciudad
grande forman una distribucin normal con una desviacin tpica =1 minuto. Si se elige al azar una
muestra de 17 tiempos, encuentre la probabilidad de que la cuasi varianza muestral sea mayor que 2.
Se busca el valor de ji-cuadrado correspondiente a S2n-1=2
(n-1) S2n-1 16 2
X2n-1 = --------------------- ! X n-1 = ------------ = 32
2
2 12
El valor de 32 se busca en la tabla Chi Cuadrado con 16 grados de
libertad. A este valor le corresponde una probabilidad de 0,99. En
consecuencia, 1-099 = 001! P(S2n-1 >2)
Un partido poltico cree que el 60% del electorado est a favor de su programa. Como su lder
encuentra que esta prediccin es demasiado optimista decide hacer un sondeo con una muestra de
90 personas. Cul es la probabilidad de que como mximo 60 personas estn a favor de su partido?
067 060
P (60/90 = 067)! Z = --------------------- ! Z = (135) se corresponde con p = 09115
06 04 / 90
Generalmente se desconocen los parmetros de la poblacin por lo que se hace necesario estimarlos a
partir de los valores muestrales. Un estimador es un estadstico que utilizamos para estimar
parmetros. Se pueden considerar dos formas de estimar los parmetros poblacionales: estimacin
puntual (Conocida como mtodo de los momentos de Pearson, se extrapola el estadstico de la
muestra directamente a la poblacin) y estimacin por intervalos (establece un rango de valores
dentro del cual estara el valor del parmetro, con una determinada probabilidad)
1.- Carencia de sesgo: un estimador es insesgado o centrado cuando el valor del estadstico (en las
infinitas muestras de tamao n extradas de una poblacin) coincide con el valor del parmetro que
queremos estimar ! U es un estimador insesgado de , si ! E (U) =
La media, la proporcin y la cuasi varianza de la muestra son estimadores insesgados de sus valores
poblacionales
2.- Eficiencia (Precisin): Se considera la inversa de la varianza de su distribucin muestral. Cuanto
mayor es el cociente, mayor es la eficiencia. Eficiencia ! = 1 / 20 (A mayor varianza, menor
eficiencia). La Media Aritmtica es ms eficiente que la Mediana. La Varianza es ms eficiente que la
Cuasi varianza. Cuando tenemos distintos estimadores y queremos determinar el ms eficiente, se
comparan sus eficiencias. Ejemplo: La varianza de la distribucin muestral de dos estimadores es 2 y
1,5. Para un mismo tamao muestral, la eficiencia relativa sera 1,5 / 2 = 0,75. Si el cociente fuera 1
seran iguales.
3.- Suficiencia: el estimador utiliza toda la informacin de la muestra para estimar el parmetro
(Ejemplo: La media muestral sera suficiente para estimar la media poblacional. No lo sera la amplitud
intercuartlica para estimar la varianza poblacional)
4.- Consistencia: El requisito mnimo que se le exige a un estimador es que sea consistente. Un
estimador es consistente si, a medida que se dispone de ms informacin (que aumenta el tamao de
la muestra), aumenta la probabilidad de que la estimacin coincida con el parmetro. La media, la
proporcin y la varianza insesgada son consistentes porque son estimadores insesgados de los
parmetros correspondientes y en sus lmites valen cero (su sesgo y su varianza tienden a 0 a media
que aumenta n)
Cuando el valor del parmetro (poblacin) coincide con el valor del estadstico (muestra), se considera
que la estimacin (inferencia sobre la poblacin a partir de la muestra) es insesgada. Siempre que
operemos se debe procurar que nuestros estimadores sean insesgados y tengan una varianza pequea;
estas dos caractersticas se denominan acuracidad.
Una estimacin por intervalos expresa el grado de confianza con el que se espera que est el valor
del parmetro dentro del intervalo, por lo que se suele llamar intervalo de confianza. La amplitud del
intervalo nos indicar su precisin. A menor amplitud, ms precisin, ms informativo es, ms til.
Una estimacin por intervalos depende de cuatro parmetros: una estimacin puntual del
parmetro; una medida de variabilidad; una probabilidad (nivel de confianza) y un supuesto acerca de
la distribucin en la poblacin.
N(0,1) t n-1 gl
Distribucin Normal (Conocida 2) Desconocida la 2 (Muestras pequeas)
_ _ _ _ _ _
X + (Z /2) (X) < < X + (Z1- /2) (X) X + (t /2) (Sn- 1/ n) < < X + (t1- /2) (Sn- 1/ n)
Problemas ejemplo: Se midieron los niveles de depresin en una muestra de 100 personas.
Asumiendo un nivel de medida de intervalo y que la variable se distribuye normalmente en la
poblacin, se calcul la media de las puntuaciones y se obtuvo un valor de (Media = 8) y una cuasi
desviacin tpica = 2. Hallar los lmites del intervalo de confianza para la media de la poblacin
con un nivel de confianza del 99%.
_
Datos ! X = 8 Distribucin normal de la VD = 0,01 Sn- 1 = 2
Hallar los lmites del intervalo de confianza suponiendo que la muestra est compuesta por 25
personas, a un nivel de confianza del 95%.
_
Datos ! X = 8 Distribucin normal de la VD = 0,05 Sn- 1 = 2
_ _
Intervalo de confianza ! X (t Sn- 1 / n) = Lmite superior y Lmite inferior
Problemas Ejemplo: En una muestra aleatoria de 20 sujetos, extrada de una poblacin normal, se ha
obtenido una media de 24 puntos y una cuasi desviacin tpica de 10,8 puntos. Averiguar los lmites del
intervalo de confianza para la varianza de la poblacin, suponiendo = 0,05.
Segn las tablas 2n-1 (219) ! para ( / 2 = 0,025) ! 8,91 y para (1 - / 2 = 0,975) ! 32,9
(19 10,82) / 32,9 < 2 < (19 10,82) / 8,91 ! Lmites del intervalo de confianza ! [67,36 y 248,7]
Con un margen de error del 8% el tratamiento ser efectivo entre el 69% y el 87% de los casos.
La amplitud del intervalo de confianza depende de dos factores: el nivel de confianza y el error tpico de
la distribucin muestral del estadstico (La suma de ambos E = Error mximo de estimacin). Cuanto
mayor es el tamao de la muestra mayor es la precisin del intervalo y mayor la precisin de la
estimacin. Cuanto menor es el error tpico, menor es el intervalo de confianza y, por tanto, ms preciso
(para reducirlo se aumenta el tamao muestral)
Problemas Ejemplo: Por experiencias anteriores se sabe que las estaturas de los soldados tienen una
varianza de 64 cm. Qu tamao debe tener la muestra para que la media estimada no se aleje ms de
1, 5 puntos de la media poblacional?: considere ( = 0,02).
Con un margen de error del 2% debemos tomar una muestra de 154 soldados.
" Un estudio sobre la proporcin de fumadores entre el personal de un hospital estableci que slo
fumaban el 35%. Si el anlisis se efectu con un nivel de confianza del 95%, Qu tamao debi
tener la muestra para que la proporcin estimada no se aleje ms de 0,15 puntos de la proporcin
poblacional?: considere ( = 0,05).
Hiptesis estadstica: proposicin (afirmacin) sobre algn aspecto de la distribucin de una poblacin
(parmetro, forma, etc.) que puede someterse a prueba a travs de una muestra aleatoria de esa
poblacin. No tiene por qu suponerse inters cientfico.
Contraste de hiptesis: Procedimiento por el cual decidimos si una propuesta sobre la poblacin
puede aceptarse o no. Su finalidad es generalizar un resultado muestral a la poblacin de la que procede
la muestra. Siempre se formulan dos hiptesis (exhaustivas y mutuamente excluyentes); de tal modo,
que el rechazo de una implica la aceptacin de la otra.
H0 (hiptesis nula): se acepta provisionalmente como verdadera y se somete a contraste.
H1 (hiptesis alternativa): se acepta al rechazar la hiptesis nula.
" La media () es algn valor " La media () es algn valor " La media () es algn valor
Igual o distinto a (X) No inferior a (X). No superior a (X).
Ho : = X Ho : X Ho : X
H1 : X H1 : < X H1 : > X
Se trata de averiguar la discrepancia entre los datos empricos observados en la muestra y los datos
tericos que planteamos en la H0.
Regla de decisin: Tomando en consideracin el valor o los valores crticos (mxima diferencia
que cabe esperar por simple azar entre los datos empricos y los tericos) y a partir del nivel de
significacin. Acumulado en los contrastes unilaterales () y dividido por dos en los bilaterales (/2)
Nivel crtico (p) ! Calcular la probabilidad de obtener unos resultados como los observados en la
muestra bajo el supuesto de que la H0 es cierta.
Zona de rechazo (depende de que el contraste sea bilateral o unilateral). Teniendo en cuenta el riesgo
adoptado se determinan los valores del estadstico y se decide si la hiptesis nula es verdadera o falsa.
Nunca puede afirmarse categricamente que la hiptesis es cierta o falsa, se afirma con un determinado
nivel de probabilidad. As, Cmo decidir sobre la hiptesis nula? ! Dos mtodos equivalentes:
Ho (Cierta) ! (p) es mayor que () ! El valor se encuentra en el intervalo de confianza. El valor del
estadstico est entre los valores crticos.
Ho (Falsa) ! (p) es menor o igual que () ! El valor est fuera del intervalo de confianza. El valor del
estadstico supera o es inferior a los valores crticos.
4.- Fijar (regla de decisin). La zona de rechazo de la H0 estar formada por todos los valores del
estadstico cuya probabilidad de ser obtenidos es muy pequea bajo el supuesto de que la H0 es
cierta.
5.- Clculo del estadstico de contraste con los datos obtenidos en la muestra.
Queremos contrastar la hiptesis que supone que la media poblacional en un test de atencin de los
estudiantes de la ESO es de 35 puntos. La distribucin de la variable en la poblacin es normal con
varianza = 225. Extraemos una muestra aleatoria de 144 alumnos y obtenemos: una media = 32 puntos.
Fijamos un nivel de significacin = 0,05.
Los contrastes de hiptesis estn basados en estadsticos (medidas de discrepancia) y tienen una
distribucin de probabilidad conocida; as, todas las decisiones llevan aparejadas una probabilidad de
ocurrencia. Al tomar una decisin sobre una H0 pueden darse cuatro situaciones (dos de ellas son
decisiones acertadas y dos errneas). Siempre debemos proponernos que (1 - ) y (1 - ) sean altos
y que y sean bajos.
Siempre se cumple ! + (1 - ) = 1 y + (1 - ) = 1
Tamao del efecto: Expresa la magnitud de la diferencia observada entre la H0 (el valor terico) y la
H1 (el valor observado)
Un contraste de hiptesis es un procedimiento para decidir si una hiptesis se acepta como vlida
o se rechaza. Los principales pasos para tomar la decisin son:
MEDIA POBLACIONAL
2
PARAMTRICOS CONOCIDA
2
DESCONOCIDA
Hiptesis Estadsticas: 0 es el valor concreto de la media poblacional acerca del cual queremos
comprobar si es diferente, menor o mayor // Se aconseja formular primero H1
Estadstico de contraste:
_ __
Conocida la varianza de la poblacin ! Z = (Y - 0) / / n
_ _
Y es la media muestral // / n es el error tpico de la media
0 es el valor propuesto para la media poblacional por H0
El Estadstico de Contraste sigue la distribucin N (0,1)
_ __
Desconocida la varianza de la poblacin ! T = (Y - 0) / S n-1 / n
_
S2n-1 = (Y Y)2 / n 1 es la cuasi varianza muestal (estimador insesgado de varianza poblacional)
El Estadstico de Contraste sigue la distribucin T de Student con n 1 gl. (Cuando gl > 30 la
distribucin T de Student se aproxima a la normal).
n S2
Relacin entre la varianza y la cuasi varianza muestral ! (n-1) S n-1 = n S // Luego S n-1 = ---------
2 2 2
n-1
Intervalo de confianza: _ _
Y + Z /2 / n = LS y LI (conocida 2 poblacional)
_ ______
Y + T n-1; /2 Sn-1 / n = LS y LI (desconocida 2 poblacional)
PRUEBA DE LOS SIGNOS: Considera que el valor de la mediana bajo la H0 es correcto; por tanto,
en la poblacin, existirn similares valores por encima y por debajo (mismo nmero de signos
positivos y negativos al calcular la diferencia entre cada valor y la mediana propuesta en la H0)
Hiptesis Estadsticas:
Contraste Bilateral: H0: = 0
H1: 0
Contraste Unilateral Izquierdo H0: 0
H1: < 0
Contraste Unilateral Derecho H0: 0
H1: > 0
Estadstico de contraste: (S+ S-) se obtienen al restar cada una de las observaciones del valor
de la mediana propuesto por la H0. Si alguna diferencia es nula, se elimina, reducindose el tamao
de la muestra. ____
Cuando la muestra es grande se aproxima a la normal mediante [S+ ( S-) n/2] / n/4
PRUEBA DE WILCOXON: Conocida como prueba de rangos y signos, gana en precisin con
respecto a la prueba de los Signos, ya que aprovecha mejor la informacin disponible; tiene en
cuenta, a la vez, el signo de las diferencias y la magnitud de las mismas. Wilcoxon es una prueba
ms precisa.
Clculo del Estadstico de Contraste: (R+ R-) suma de rangos positivos y negativos.
Conocemos los datos obtenidos en la muestra // Calculamos las diferencias entre cada observacin
y la mediana propuesta por la H0. Se eliminan las diferencias nulas, reduciendo el tamao muestral
n // Estas diferencias, en valor absoluto, se ordenan de menor a mayor, y se sustituye cada una de
ellas por el rango que le corresponde // Si hay empates, se adopta el criterio del rango medio; es
decir, se le atribuye a cada una el rango promedio de los rangos que les hubieran correspondido de
ser diferentes // A cada rango se le aade el signo + o de la puntuacin de diferencia
correspondiente y se suman, obteniendo R+ y R-
Distribucin muestral del estadstico: distribucin de valores de Wilcoxon. Para utilizar la tabla W
de Wilcoxon se selecciona el sumatorio ms pequeo y se toma la decisin mediante los valores
crticos.
PROBLEMAS EJEMPLO
CONTRASTE SOBRE LA MEDIA (VARIANZA POBLACIONAL CONOCIDA)
Vamos a plantear otro supuesto que modificara la definicin de las hiptesis ! Sospechamos,
antes de realizar el experimento, que la modificacin en el proceso de fabricacin aumenta el
grado alcohlico.
Supuestos: Similares; Hiptesis (Contraste unilateral derecho): H0: = 125 y H1: > 125
Estadstico de contraste: Similar
Valores crticos: con = 005 y un contraste unilateral derecho ! 165
Decisin estadstica: El valor del estadstico de contraste (0217) se sita en la regin de
aceptacin (por debajo del valor crtico 165); por tanto aceptamos H0.
El nivel crtico (p): asociado al estadstico de contraste (0217) es 04129 (1-05871) que resulta
mayor que el nivel de significacin fijado ( = 005); por tanto, aceptamos H0
Conclusin: El cambio en la fabricacin no ha modificado significativamente el grado alcohlico.
Interpretacin: Con la informacin de la que disponemos no hemos encontrado evidencia
suficiente de que la media no sea igual a 12.5
Siguiendo con el ejemplo del grado alcohlico de los vinos de la denominacin de origen de
Ribera de Duero, los resultados del contraste bilateral desconocida la varianza de la poblacin
(suponiendo que no nos hubieran facilitado este parmetro), seran:
Problema ejemplo: Una determinada empresa utiliza, desde hace muchos aos, un test de aptitudes
para seleccionar a sus empleados. Para dicho test tiene establecido que la mediana est en 180. El
psiclogo de la empresa quiere probar que efectivamente la mediana sigue siendo correcta (probar la
H0 de que la mediana en la poblacin es igual a 180). Para ello obtiene una muestra de 15
trabajadores y les aplica el test obteniendo los siguientes resultados:
189 233 195 160 212 176 231 202 193 174 166 248 199 213 185
Estadsticos de Contraste: #
Signos: Previamente ordenamos las puntuaciones (la mediana es un ndice de posicin). Restando
180 a cada una de las 15 puntuaciones obtenidas por los sujetos, obtenemos 11 (S+) y 4 (S-)
160 166 174 176 185 189 193 195 199 202 212 213 231 233 248 ORDEN
-20 -14 -6 -4 5 9 13 15 19 22 32 33 51 53 68 RESTA
- - - - + + + + + + + + + + + SIGNOS
Wilcoxon: Ms precisa. Despus de ordenar las puntuaciones de menor a mayor y ordenar las
diferencias con la mediana en valor absoluto, obtenemos:
160 166 174 176 185 189 193 195 199 202 212 213 231 233 248 ORDEN
-20 -14 -6 -4 5 9 13 15 19 22 32 33 51 53 68 RESTA
-4 5 -6 9 13 -14 15 19 -20 22 32 33 51 53 68 ORDEN
- + - + + - + + - + + + + + + SIGNOS
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 RANGOS
Decisin estadstica:
Signos: Funcin de distribucin Binomial (Tabla II); para n = 15 y probabilidad = 0,50, encontramos el
valor 0,0592 ! P (S- 4) = 0,0592. Para averiguar el nivel crtico p, multiplicamos por 2 la
probabilidad asociada al estadstico de contraste (00592 2 = 01184) dado que es bilateral.
Wilcoxon: Tablas ! para un contraste bilateral con /2 = 0,025 y n = 15; el valor crtico es ! 26
Conclusin:
Signos: Como p (01184) es mayor que (0,05) Mantenemos H0. Tambin tabla (Test de signos dos
direcciones) para n =15 y = 0,05, y un contraste bilateral, el valor crtico es igual a 3 ! como S- = 4 >
3 (Mantenemos H0)
Wilcoxon (ms precisa): Como 19 (se toma la suma menor) < 26 ! Rechazamos la H0
Interpretacin:
Signos: Teniendo en cuenta los resultados, es posible seguir manteniendo que la Mediana de la
poblacin de referencia es 180, con un = 0,05.
Wilcoxon: Teniendo en cuenta los resultados, no es posible seguir manteniendo que la Mediana de la
poblacin de referencia es 180, con un = 0,05.
Hiptesis Estadsticas:
2 2
Contraste Bilateral: H0: = 0
2 2
H1: 0
2 2
Contraste Unilateral Izquierdo H0: 0
2 2
H1: < 0
2 2
Contraste Unilateral Derecho H0: 0
2 2
H1: > 0
2o es el valor propuesto para la varianza poblacional por H0 y S2n-1 = la cuasi varianza muestral. El
Estadstico de Contraste sigue una distribucin Chi-Cuadrado con (n-1) gl.
Hiptesis Estadsticas:
Contraste Bilateral: H0: = 0
H1: 0
Contraste Unilateral Izquierdo Ho: 0
H1: < 0
Contraste Unilateral Derecho H0: 0
H1: > 0
PROBLEMAS EJEMPLO
Contraste de hiptesis sobre la varianza: Los resultados de un reciente estudio indican que 81
estudiantes de primero de Psicologa de la UNED, elegidos mediante muestreo aleatorio simple,
estudian una media de 6 horas a la semana, con una cuasi desviacin tpica de 3. La poblacin
universitaria europea estudia, tambin, una media de 6 horas a la semana, pero con una desviacin
tpica de 2. Queremos saber si la variabilidad encontrada en nuestra muestra es estadsticamente
diferente de la de la poblacin de estudiantes europeos. Trabajaremos a un nivel de confianza del
95 %.
_
Supuestos: Muestra aleatoria de 81 estudiantes de la UNED (X = 6 y SX = 3). Datos de la poblacin
de estudiantes europea ( = 6 y = 2) para = 0,05. La variable dependiente est medida, al
menos, a nivel de intervalo. Se plantea un CH sobre la varianza.
Decisin estadstica:
$ A partir de los valores crticos (80 gl; /2 = 0,025 y 1-/2 = 0,975) ! 5715 y 10663.
Rechazamos la H0 porque el valor muestral del estadstico de contraste (180) > el valor
crtico superior (2 = 10663)
$ Si tenemos en cuenta el nivel crtico p (2 = 180 con 80 gl ! encontramos que p es < 0005)
y dado que p < (005) ! Rechazamos H0.
$ Considerando el intervalo de confianza: Rechazamos H0 (2 = 4 no est en el intervalo)
80 9 80 9
Intervalo de confianza ! ---------------- < 2 < ----------------- (675 y 1261)
10663 5711
Hiptesis: Contraste bilateral (no se especifica ninguna direccin a favor o en contra). Sabemos
que = 3/5 = 0,6 y la hiptesis nula se centra si nuestros datos son compatibles con este resultado
(tericamente poblacional). Luego ! H0: = 06; H1: 06
Estadstico de contraste: Nuestra proporcin es ! 435/750 = 058. Con estos datos aplicamos la
frmula del estadstico de contraste ! Z = (058 06) / ( 0604 / 750) = - 002 / 00179 = - 112.
Valores crticos: Al tratarse de un contraste bilateral deben ser dos valores. Buscando en las tablas
de la curva normal con = 004 (bilateral /2 = 002 y 1-/2 = 098) encontramos las puntuaciones
tpicas (- 205 y 205)
Decisin estadstica:
$ Teniendo en cuenta los anteriores valores crticos (- 205 y 205), Aceptamos la H0 porque el
valor muestral del estadstico de contraste (- 112) > el valor crtico inferior (- 205)
$ Si tenemos en cuenta el nivel crtico p (Z (-112) = 01314; luego 2 01314 = 02628). Como p
(02628) > que (004) ! Aceptamos H0.
$ Considerando el intervalo de confianza: Aceptamos H0 (06 est en el intervalo)
____________ __________________
P |Z/2| (0 (1 - 0) / n ! 058 205 (058 (1 058) / 750 = (0543 y 0617)
Conclusin e interpretacin: Dado que hemos aceptado la hiptesis nula ( = 06) podemos
afirmar que el 60% de la poblacin espaola estn en contra de la inmigracin ilegal; por tanto, el
40% estar a favor.
Problema ejemplo: La aplicacin de un test entre docentes tiene, por experiencias anteriores, una
media de 55 y una varianza de 121, N (55, 121). Un psiclogo educativo considera que en la actualidad
el promedio se ha incrementado, pasando a ser de 60 puntos. Para contrastar esta hiptesis somete al
test a 50 individuos extrados aleatoriamente de la poblacin y obtiene una media de 58. Fijando un
nivel de significacin = 0,01. Puede aceptarse la hiptesis del psiclogo?
Descripcin de la variable y de los datos muestrales: Variable medida a nivel de intervalo, distribucin
normal, con varianza conocida N (55, 121) y observaciones aleatorias e independientes.
Estadstico de contraste y clculo: Bajo la H0: 0 = 55, tipificamos la media muestral = 58.
_ ___
Z = (Y 0) / Y ! Z = (58 - 55) / (11 / 50) = 1,93
Decisin estadstica:
$ A partir del valor crtico (para = 0,01. Se trata de un contraste unilateral, acumula en una
sola cola ! Z = 2,33). Como 193 (valor del estadstico de contraste) < 233 (valor crtico) ! Se
acepta la H0.
$ A partir del nivel crtico p (al valor del estadstico de contraste 193 le corresponde en las tablas
una probabilidad de p (Z < 1,93) = 0,9732 ! 1-09732 = 00268). Al tratarse de un contraste
unilateral p = 00268 > = 001; Por tanto, Se acepta la H0
Interpretacin de los resultados: Para un nivel de significacin = 0,01, no podemos afirmar que la
media poblacional se ha incrementado en la actualidad.
Bajo la Hiptesis nula (H0: 0 = 55) se determina el lmite entre la regin de aceptacin y rechazo
(Contraste unilateral derecho)
_ -----------------------------------|-----
Z = (Yc 0) / Y ! Z = 2,33 Z = (Yc - 55) / (11 / 50); Yc = 58,62
_ ------------------|------------------------------
Z = (Yc 1) / Y Z = (58,62 - 60) / (11 / 50); Z = (- 0,89)
Probabilidad de obtener una Z (- 0,89) ! Z (-0,89) = 0,1867 ! = 0,1867 (error tipo II)
Potencia de Contraste ! (1 ) = 0,8133
TIPOS DE MUESTRAS
CONTRASTE DE HIPTESIS
Estadstico
de
Contraste
Dos centros de Educacin Especial vienen utilizando, desde hace dos aos, mtodos diferentes
para estimular las funciones superiores de los nios con retraso mental. El director de uno de los
centros sostiene que su mtodo (Mtodo A) logra mejores resultados que el del otro centro (Mtodo
B). Para estudiar esta cuestin, fijamos = 0,03, extraemos aleatoria e independientemente dos
muestras de nios, una en cada centro (nA = 120 y nB = 50) y les medimos el cociente intelectual (CI)
en una escala de intervalo. Los nios de ambos centros iniciaron el programa de estimulacin con
un CI medio igual a 70 y los CI medios tras el programa fueron 79 para los nios estimulados con el
mtodo A y 74 para los estimulados con el mtodo B. La distribucin de los CI es normal en las
poblaciones con A = 18 y B = 12 y todas las observaciones son independientes entre s.
Regla de decisin:
Valores crticos (para un nivel de confianza del 97% y un contraste unilateral, el valor crtico es !
Z097 = (188)
Nivel crtico p (el estadstico de contraste 212 se asocia a una probabilidad p = P (Z 2,12)
! 1 0,983 = 0,017
Conclusin: Se rechaza H0 [el estadstico de contraste 212 > 188 (valor crtico) y tambin p =
0,017 (nivel crtico) < = 0,03 (nivel de significacin)].
Interpretacin: El programa de estimulacin del CI ha sido eficaz con un nivel de confianza del
97% (mejor el mtodo A que el mtodo B)
Intervalo de confianza: Para realizarlo suponemos que se trata de un contraste bilateral; por tanto,
habra que reformular las hiptesis:
_ _
(Y1 Y2) | Z /2 | Error tpico ! Lmite superior y Lmite inferior
(79 74) (0,03/2 = Z (-217) 2,36 (denominador e. contraste) = 5 512 ! (- 012 y 1012)
Decisin: Aceptamos H0 (el intervalo de confianza contiene el valor 0, luego asumimos que la
diferencia de medias en la poblacin puede tomar ese valor
En una investigacin psicopedaggica se pas la misma prueba de nivel de lectura a dos grupos de
nios: los participantes haban sido elegidos de forma aleatoria de entre los alumnos de EGB de dos
provincias espaolas. Los datos se muestran en la tabla. La variable se midi en una escala de
intervalo y se supone que 2A = 2B
Supuestos: Disponemos de dos muestras independientes (dos grupos de nios) que se someten a
una prueba de lectura. La variable dependiente medida a nivel de intervalo. Varianzas
poblacionales desconocidas y supuestamente iguales (2A = 2B). Muestras grandes (121 y 61).
Hiptesis: Planteamos un contraste bilateral para ver si las diferencias se deben al azar.
_________________________________________________
Error tpico = [( n1 1) S21 + (n2 1) S22 / (n1 + n2 2)] (1 / n1 ) + (1 / n2 )
______
Error tpico = 01665 = 0,408
Regla de decisin:
Valores crticos (tabla t de Student con 121 + 61 2 = 180 grados de libertad y = 0,05). Se trata
de un contraste bilateral y son muestras grandes; por tanto, utilizamos Z0025 (- 196) y Z0975 = (196)
Nivel crtico p (el estadstico de contraste 490 se asocia a una probabilidad < 00005 que es ms
pequea que )
Conclusin: Rechazamos H0 (el estadstico de contraste 490 no est entre los valores crticos
196 y de igual forma, considerando el nivel p crtico, p < )
Interpretacin: El rendimiento medio en la prueba de lectura no es igual en los dos grupos con un
nivel de significacin = 0,05.
Intervalo de confianza:
_ _
(Y1 Y2 ) | t (n1 + n2 2) | Error tpico = (Lmites inferior y superior)
(40 38) 196 0408 = 2 08 = (12 y 208) ! Rechazamos H0 (el intervalo de confianza no
contiene el valor 0, luego asumimos que la diferencia de medias en la poblacin no puede tomar
ese valor)
Distintos estudios muestran que la relajacin es eficaz para reducir la ansiedad precompetitiva.
Siguiendo esta lnea de investigacin y habiendo hipotetizado una reduccin de la ansiedad en las
escaladoras tratadas con relajacin, extraemos aleatoria e independientemente 12 escaladoras y
les asignamos aleatoriamente a las dos condiciones del experimento: la mitad de las escaladoras se
somete a un programa de relajacin durante seis meses y la otra mitad no realiza ningn tipo de
relajacin (suponemos que las poblaciones se distribuyen normalmente con distinta varianza). Al
finalizar el programa de relajacin, medimos la ansiedad precompetitiva de todas las escaladoras,
obteniendo una ansiedad media de 8 y una varianza insesgada de 150 en el grupo sin relajacin y
una ansiedad media de 65 y una varianza sesgada de 100 en el grupo con relajacin. El nivel de
significacin alfa se fij en 0,05, la variable dependiente est medida a nivel de intervalo y a mayor
puntuacin mayor ansiedad. Podemos afirmar que realmente la ansiedad precompetitiva de las
escaladoras se reduce utilizando tcnicas de relajacin?
(150 / 6 + 83 / 6)2
gl = ----------------------------------------------------- =
[(150 / 6)2 / (6 1) + (83 / 6)2 / (6 1)
Regla de decisin:
Valor crtico para = 0,05 ! Segn la tabla t de Student (contraste unilateral derecho), con 9 gl
encontramos el valor ! t9; 005 = 1833
Nivel crtico p ! el valor del E. Contraste T = 024, con 9 gl se encuentra entre 055 < p < 060
Conclusin e interpretacin: Se acepta H0 para un nivel de confianza del 95%. Segn el valor
crtico (contraste unilateral derecho) T (024) < 1833 ! Aceptamos H0.
Segn el nivel p crtico (055 < p < 060) > que el valor de = 0,05. La ansiedad precompetitiva de
las escaladoras no disminuye utilizando tcnicas de relajacin.
U1 = S1 - n 1 (n1 + 1) // U2 = S2 - n 2 (n2 + 1)
Distribucin
Muestral Utilizamos la tabla U de Mann-Whitney-Wilcoxon
PROBLEMA EJEMPLO
En una investigacin de Psicologa Social sobre valores, se han extrado dos muestras aleatorias de
personas. Una muestra se extrajo de una regin del interior de la Pennsula (n=5) y la otra de la
costa (n=6). Los participantes cumplimentaron un cuestionario de xenofobia, que ofrece
puntuaciones en una escala ordinal, obteniendo los resultados que se presentan en la Tabla 1 (a
mayor puntuacin mayor xenofobia). Se desea saber si la tendencia central de los habitantes de la
costa es ms baja que la de los del interior. Se asume que las distribuciones de la variable en las
dos poblaciones tienen la misma forma (si difieren slo lo hacen en su tendencia central)
Interior 6 14 10 18 20
Costa 16 12 4 8 2 22
Hiptesis: La hiptesis nula siempre es aquella que afirma lo contrario de lo que el investigador
desea probar. Desea probar que la tendencia central (contraste no paramtrico, mediana) en
habitantes de la costa es menor que en habitantes del interior. Contraste unilateral izquierdo
Estadstico de contraste:
1.- Ordenamos el total de las puntuaciones de menor a mayor (puntuaciones de interior en negrita)
2 4 6 8 10 12 14 16 18 20 22
2 4 6 8 10 12 14 16 18 20 22
1 2 3 4 5 6 7 8 9 10 11
3.- Sumamos los rangos de cada grupo: Rangos de interior (negrita) S1 = 3+ 5+ 7+ 9 +10 = 34
Rangos de costa S2 = 1+2+4+6+8+11 = 32
Regla de decisin:
Conclusin: Dado que el nivel crtico p (0268) es mayor que (005) ! Aceptamos H0
Interpretacin: Las distribuciones del interior y las de la costa no difieren en cuanto a las medianas
en sus apreciaciones sobre la xenofobia.
D=0 D0
_____________________
Z = (P1 P2 ) - 0 / P (1 - P ) (1 / n1 ) + (1 / n2 ) ___________________________
Estadstico Z = (P1 P2) - . / P1 (1 P1 ) / n1 + P2 (1 P2 ) / n2
Contraste Donde P = (n1 P1 ) + (n2 P2 ) / (n1 + n2 )
Distribucin
Muestral Normal tipificada N (0, 1)
PROBLEMAS EJEMPLO
El grado de dificultad de las preguntas de un test se suele medir por el nmero de los sujetos que
los aciertan, o ms exactamente, por la proporcin de aciertos. Para averiguar si dos preguntas de
un determinado test de aptitud general difieren en dificultad, hemos seleccionado una muestra
aleatoria simple de 200 sujetos y los hemos repartido aleatoriamente en dos grupos de 100. Un
grupo de sujetos ha respondido a la pregunta 1 y el otro a la pregunta 2. La pregunta 1 la han
acertado 70 sujetos y la 2 la han acertado 60. El nivel de significacin se fij en 0,05.
Supuestos: Tenemos una muestra aleatoria de n = 200 sujetos, repartidos en dos grupos
independientes de 100 (cada uno responde a una pregunta y se considera el acierto o el error !
variable dicotmica). Se fija = 0,05. Se dan los supuestos para realizar un Contraste de
Proporciones al comparar el grado de dificultad de las dos preguntas del test.
Hiptesis: Planteamos un contraste bilateral para ver si las preguntas difieren en dificultad.
H0: 1 = 2 // H1: 1 2
P = (n1 G1) + (n2 G2) / (n1 + n2) ! (100 0,7) + (100 0,6) / (100 + 100) = 0,65
_______________________________
Z = (0,7 0,6) / 0,65 (1 0,65) (1 / 100) + (1 / 100) = 1,48
Regla de decisin:
Valores crticos (para un nivel de confianza del 95% y un contraste bilateral, los valores crticos
son ! 196 ! Z0025 (- 196) y Z0975 = (196)
Nivel crtico p [el estadstico de contraste (Z = 1,48) en la tabla de la curva normal deja por debajo
0,9306] ! Probabilidad (Z 1,48) = 1 - 0,9306 = 0,0694; al ser bilateral ! 2 0,069 = 0,1388.
Conclusin: Aceptamos H0 (el estadstico de contraste 148 est entre los valores crticos 196 y
de igual forma, considerando el nivel p crtico, p (01388) > (005)
Interpretacin: Para un nivel de confianza del 95%, aceptamos la hiptesis nula (las preguntas no
difieren en dificultad)
Aceptamos H0 (el intervalo de confianza contiene el valor 0, luego asumimos que la diferencia de
medias en la poblacin puede tomar ese valor)
2 2 2 2
Estadstico F =S 1 / S 2 Donde S 1 S 2 (varianzas insesgadas)
Contraste
Intervalo
2 2 2 2 2 2
confianza (f / 2 ; n1 1 y n2 1) 1 / 2 < 1 / 2 < (f 1 / 2 ; n1 1 y n2 1) 1 / 2
PROBLEMAS EJEMPLO
Deseamos contrastar si las pacientes anorxicas (PA) son ms variables, en cuanto a su nivel de
estrs, que las pacientes bulmicas (PB). Para ello, extraemos dos muestras aleatorias de dichas
pacientes y se obtienen los siguientes datos sobre su nivel de estrs (donde a mayor puntuacin
mayor estrs), considere = 0,05:
PA 4 6 8 12 16
PB 3 5 7 9 14
Sabemos que la variable nivel de estrs est medida a nivel de intervalo y distribuida normalmente en
ambas poblaciones.
Hiptesis: H0: 2PA / 2PB 1 y H1: 2PA / 2PB > 1. Contraste Unilateral Derecho.
Conclusin e interpretacin: No se rechaza H0 porque 1,3 (estadstico de contraste) < 6,39 (valor
crtico). Por tanto, las pacientes anorxicas (PA) no son ms variables que las bulmicas (PB) en
cuanto a su nivel de estrs considerando un nivel de confianza del 95%.
(f / 2 ; n1 1 y n2 1) 21 / 22 < 21 / 22 < (f 1 / 2 ; n1 1 y n2 1) 21 / 22
0,10) (23,2 / 17,8) = 0,13 < 21 / 22 < (9,60) (23,2 / 17,8) = 12,48
Siendo los valores crticos: f 0,025; 4 y 4 gl = 9,60 y f 0,975; 4 y 4 gl = 1 / 9,60 ! 0,10 (propiedad recproca).
Decisin: Como la H0 debe plantear que las varianzas son iguales (21 / 22 = 1) y apreciamos que
uno est dentro del intervalo de confianza (0,13 y 12,48). Se aceptara la H0 (las varianzas de
ambas poblaciones son iguales)
La magnitud o tamao del efecto alude al ndice que mide el efecto que tiene un tratamiento. Deben
estar implicados al menos dos grupos (el experimental y el control). Es independiente del tamao
muestral.
|YTRATAMIENTO YCONTROL |
ndice d = -------------------------------------------------------
[( n1 1) 21 + (n2 1) 22 / (n1 + n2 2)]
Segn Cohen (1988) ! Magnitud del efecto [pequeo (d = 02); mediano (d = 05) y grande (d =
08 o superior)
ENTRENAMIENTO PSICOLGICO 37 14 38 43 35
ENTRENAMIENTO TCNICO 29 36 11 17 13
La d = 135 es la distancia estandarizada entre las medias de los dos grupos y su probabilidad
asociada (09115) ! El 9115% de los sujetos con entrenamiento psicolgico mejoran respecto a
los que nicamente reciben entrenamiento tcnico.
Las muestras relacionadas nos ayudan a reducir la varianza de error. As, cuanto mayor sea la
relacin entre ambas muestras, menor ser la varianza de la distribucin muestral de las diferencias
y, por tanto, mayor el estadstico de contraste.
CONTRASTES DE HIPTESIS:
_ __ _ __
2
Estadstico Z = (D d) / (d / n ) T = (D d) / ( d / n )
Contraste
Distribucin
Muestral Normal Tipificada: (0, 1) t de Student: gl = n-1
_ __ _ __
Intervalo D | Z /2 | D / n = (Lm. infer y sup) D | t /2; n 1 | SD / n = (Lm. infer y sup)
confianza Distribucin Muestral Z con N (0,1) Distribucin Muestral T con (n 1) gl
MEDIDA PREVIA 12 9 11 10 9 6 7
MEDIDA POSTERIOR 7 5 6 6 5 6 7
Sabiendo que para aplicar el estadstico de contraste se resta la medida posterior de la previa, que
la concentracin es una variable medida a nivel de intervalo y que se distribuye normalmente en
ambas poblaciones, tmese un nivel de significacin = 0,05 y compruebe si los alumnos se
concentran ms al finalizar la terapia.
Hiptesis: La hiptesis alternativa es la hiptesis del investigador. Del planteamiento del problema
se deduce de que se trata de un contraste unilateral izquierdo donde:
2
Medida Medida Diferencia D - DMedia (D - DMedia)
Previa Posterior Posterior - Previa
12 7 -5 - 1,86 3,4596
9 5 -4 - 0,86 0,7396
11 6 -5 - 1,86 3,4596
10 6 -4 - 0,86 0,7396
9 5 -4 - 0,86 0,7396
6 6 0 3,14 9,86
7 7 0 3,14 9,86
= 64 = 42 = (- 22) = 28,86
_
Averiguamos la media (D) y la varianza insesgada (2d) de las puntuaciones diferencia:
_ __ __
Desconocida la varianza de la poblacin: T = (D 0) / (2d) / n) ! T = (- 3,14) / (4,81 / 7) = - 1,7
__________________ _ _ _
Donde: 2d = (Di DMedia)2 / (n 1) y D = Y1 Y2 = Di / n
________ _
2d = 28,86 / 6 = 4,81 y D = (- 22) / 7 = (- 3,14)
Regla de decisin:
Valor crtico (contraste unilateral izquierdo) ! - 1,943 (valor crtico T0, 05 y 6 gl)
Nivel crtico p slo puede obtenerse el valor aproximado, porque 1,7 no figura en la tabla T de
Student para n1 = 6 gl. El valor 1,7 est entre 0,10 (1,4) y 0,05 (1,9).
(-314) 1943 481 / 264 ! (- 314) 354 ! (04 y 668) ! No contiene el 0, Rechazamos H0
Unos psiclogos hipotetizan que los hombres (H) con ms de 20 aos son ms afectuosos hacia su
pareja que las mujeres (M). Extrae una muestra aleatoria de 8 parejas casadas y les mide el grado
de afectividad hacia la pareja, obteniendo los datos que aparecen a continuacin (a mayor
puntuacin mayor afectividad hacia la pareja). Se sabe que la puntuacin en afectividad es una
variable medida a nivel de intervalo que se distribuye normalmente y que las observaciones entre
las muestras no son independientes. Se fija alfa en 001. Suponemos conocida la varianza de las
diferencias (2d = 5).
PAREJAS 1 2 3 4 5 6 7 8
HOMBRES 13 5 6 9 10 7 11 8
MUJERES 1 9 8 6 5 8 3 5
Supuestos: Se sabe que la puntuacin en afectividad es una variable medida a nivel de intervalo,
que se distribuye normalmente en ambas poblaciones y que conocemos la varianza de las
diferencias (2d = 25). Se fija en 0,04. Segn el enunciado ! Diferencia de medias (muestras
relacionadas)
Estadstico de contraste:
H M D
13 1 12
5 9 -4
6 8 -2
9 6 3
10 5 5
7 8 -1
11 3 8
8 5 3
Media = 8,7 Media = 5,7 = 24
_ _ _ _
D = H M = Di / n ! D = 24 / 8 = 3 // 2d = 5
_ __ _
Z = (D 0) / (2d / n) ! T = 3 / (5 / 8) = 3 / 177 = 1,69
Regla de decisin:
El nivel crtico p (probabilidad de obtener un valor del estadstico, al menos, tan extremo como el
hallado) se obtiene a partir del valor muestral del estadstico de contraste (1,69) que buscando en la
tabla de la curva normal ! p = 1 P (T 169) ! 1-0`9545 = 00455.
El valor crtico para un contraste unilateral derecho y un alfa = 001 es ! 233
Distribucin
Muestral Utilizamos la tabla U de Mann-Whitney-Wilcoxon
PROBLEMA EJEMPLO
Un investigador desea comparar el grado de hiperactividad en obesos cuando estn en un
programa para bajar de peso (dieta) y sin programa para bajar de peso. Dispone de 10 sujetos a los
que somete a las dos condiciones experimentales (con dieta y sin dieta). Las puntuaciones se
reflejan en la tabla. Sabiendo que la distribucin de las diferencias es simtrica, con un nivel de
confianza del 95%, se puede afirmar que hay diferencias en hiperactividad en obesos cuando
estn o no en un programa de dieta?
Estadstico de contraste:
Regla de decisin: Con /2 = 005 (contraste bilateral) y n = 10, acudimos a la tabla de Wilcoxon y
obtenemos un valor crtico = W0025; 10 = 9
Conclusin e interpretacin: Dado que el estadstico de contraste (W = 155) > el valor crtico (W = 9)
no podemos rechazar la H0 con un nivel de confianza del 95%. Las diferencias en el incremento o
disminucin de la hiperactividad en personas obesas con dieta o sin dieta, no son significativas.
Estadsticamente resultan iguales, en razn de que pueden ser diferencias dadas al azar.
_______
2 2
Z = (b - c) / (b + c) = (b c) / (b + c)
Estadstico
Contraste b ! (sujetos que puntan 1 en la primera medida y 2 en la segunda).
c ! (sujetos que puntan 2 en la primera medida y 1 en la segunda)
Distribucin
Muestral Normal tipificada N (0, 1) Chi Cuadrado con 1 grado de libertad
2 2
Regla (C. Bilateral) ! Z Z / 2 y Z Z 1 - / 2 < 1; 1- Mantener H0
decisin (C. Unilateral Izquierdo) ! Z Z
2 2
(C. Unilateral Derecho) ! Z Z 1 > 1; 1- Rechazar H0
_______
Intervalo (P1 P2 ) | Z /2 | (b + c) = (Lmites inferior y superior)
confianza
PROBLEMA EJEMPLO
Supuestos: Muestra grande de 102 sujetos sometidos a dos medidas de la misma variable
(cometer o no cometer infraccin)! Variable dependiente dicotmica. [b + c] > 25 Se trata de
contrastar las proporciones en dos muestras de observaciones relacionadas.
Estadstico de contraste:
Regla de decisin:
Conclusin e interpretacin:
Como p (0,3078) > (0,01) ! Aceptamos H0. Tambin como 102 (valor muestral del estadstico de
contraste) < 258 (el mayor de los valores crticos). Tambin 102 est entre los valores crticos (-
258 y 258).
Para = 001, podemos afirmar que la proporcin poblacional de los sujetos que se saltan el
semforo es la misma antes de la proyeccin de imgenes que despus.
Tambin con el test de McNemar: 2 = (b c)2 / (b + c) ! 2 = (34 43)2 / (34 + 43) = 105
Para 2con un grado de libertad, el valor 105 se encuentra entre (010 < p < 090) por lo que el nivel p
crtico > que (0,01) ! Aceptamos H0
Anlisis de Varianza (ANOVA ANVAR) ! es una tcnica paramtrica de anlisis estadstico que
se utiliza para comparar las medias de ms de dos grupos.
El diseo de ms de dos grupos tiene por objeto estudiar la influencia de ms de dos valores de la
variable independiente sobre la variable dependiente y, por tanto, tiene ms posibilidades de establecer
la relacin precisa entre ellas. Una de las caractersticas ms importantes del diseo de experimentos
es la aleatoriedad: eleccin de un grupo (muestra) y su distribucin en tres o ms grupos de forma
aleatoria.
Al comparar distintos grupos para realizar un estudio tenemos en cuenta la variabilidad que aparezca
entre los sujetos en la variable dependiente que se considera formada por dos componentes: la que se
debe al factor estudiado (atribuible a los distintos tratamientos experimentales; variable independiente) y
la que se debe a factores extraos y no controlados (Error Experimental)
El Anlisis de Varianza se fundamenta en el estudio de estas variabilidades. La varianza general o
comn se divide en: varianza intergrupos (atribuible a los distintos niveles del factor estudiado) y
varianza intragrupos (atribuible al error experimental). Al comparar ambas varianzas obtenemos la
aceptacin o rechazo de la hiptesis nula (que consiste en afirmar que no existe diferencia entre las
medias de los distintos grupos)
Lgica del mtodo: Los sujetos se distribuyen aleatoriamente en los mencionados grupos (para
minimizar la influencia de las variables extraas); por tanto, son semejantes en cuanto a la variable
estudiada dentro de cada grupo y entre los distintos grupos. Si despus de aplicar el tratamiento
experimental existen diferencias, se puede pensar que son debidas a los procedimientos aplicados.
TERMINOLOGA:
Factores = Var. Independientes que se estudian. Niveles = categoras en que dividimos los factores.
Efectos Fijos = slo nos interesan unos niveles concretos, los establecidos. Los resultados slo afectan
a estos niveles. Efectos Aleatorios = los niveles actan como una muestra y las conclusiones se pueden
generalizar en el sentido de los datos de la muestra.
Modelo Equilibrado = igual nmero de sujetos en los grupos. Modelo no Equilibrado = distinto nmero
de sujetos en los grupos.
1.- Probar los supuestos (independencia de las observaciones, normalidad de las distribuciones y
homogeneidad de las varianzas)para asegurarnos que se puede aplicar el ANOVA
2.- Enunciar las hiptesis estadsticas
3.- Decidir el estadstico de contraste que vamos a utilizar para probar la H0
4.- Con qu nivel de confianza vamos a trabajar (establecer la regin crtica de rechazo de la H0
5.- Calcular el estadstico de contraste (Tabla del ANOVA)
6.- Tomar la decisin sobre la H0 (comparar el valor F obtenido con el valor crtico)
7.- Interpretacin en el contexto de la investigacin
Hiptesis estadsticas:
H0: Las observaciones y las muestras son independientes
H1: Las observaciones y las muestras no son independientes
Clculo del Estadstico de Contraste: Para poder aplicar el Test hemos de dicotomizar la variable
observada. Para ello: A partir de la Mediana (Md) de todas las puntuaciones tomadas conjuntamente
(si una puntuacin es mayor que la Md se sustituye por un signo + y si es menor por un signo )
Valores Crticos: Si el estadstico es r ! U/2 y U1-/2 (en la tabla de valores crticos del Test de
Rachas, buscamos los valores de n1 y n2) // Si el estadstico es T ! Z/2 y Z1-/2
PROBLEMA EJEMPLO
Un seleccionador de baloncesto desea averiguar como incide la hora del da a la que se entrena en el
rendimiento de los jugadores durante los partidos. Para ello selecciona 18 sujetos y los distribuye
aleatoriamente en turnos de maana (M), tarde (T) y noche (N); seis en cada turno. Al final de la
temporada el seleccionador los convoca a un torneo y hace el recuento de canastas conseguidas por los
jugadores, obteniendo los siguientes resultados:
Para contrastar la independencia (Test Rachas) ! las observaciones pueden dicotomizarse, utilizando la
mediana (asignando un + cuando la puntuacin sea mayor y un - cuando la puntuacin sea menor)
Canastas 15 12 14 10 11 16 7 9 12 17 10 12 13 15 20 17 16 18
Signo + - + - - + - - - + - - - + + + + +
Rachas 1 2 3 4 5 6 7 8 9
r ! (n de rachas) = 9 // n + = 9 (signos positivos) // n - = 9 (signos negativos)
Con un nivel de significacin = 0,05, buscamos los valores crticos en la tabla del test de Rachas
n - = 9; n + = 9; / 2 = 0,025 y 1 - / 2 = 0975 (bilateral)
T (0,025) = 5 y T (0,975) = 14 ! Como (rachas = 9) est dentro del intervalo (entre 5 y 14), se acepta H0. Las
observaciones son independientes.
Hiptesis estadsticas:
H0: 21 = 22 = 23 = (Las varianzas poblacionales son iguales)
H1: 21 22 23 . (Para alguna 2i)
Decisin:
Zona de Rechazo: R R r,n, Si R < R r,n, ! Aceptamos Ho
Si R R r,n, ! Rechazamos Ho
PROBLEMA EJEMPLO
Con el enunciado del problema utilizado para el test de rachas (Modelo equilibrado):
Sabiendo que se cumple el supuesto de normalidad de las distribuciones, comprobar si las varianzas
son homogneas ! H0: Las varianzas son iguales // H1: No todas las varianzas son iguales
Para contrastar la homocedasticidad (Test de Cochran) ! R = mx 2I / 2I
Con un nivel de significacin = 0,05, buscamos los valores crticos de las tablas de Cochran ! n = 6
// r (grupos) = 3 // R = 0,7071
Decisin ! Como 0,504 < 0,7071, se acepta H0 (Las varianzas no difieren significativamente)
Decisin:
2 2 2 2
Zona de Rechazo: X X (r-1)(1-) Si X < X (r-1)(1-) ! Aceptamos Ho
2 2
Si X X (r-1)(1-) ! Rechazamos Ho
PROBLEMA EJEMPLO
ESTADSTICO DE CONTRASTE !
2 r-1 = 2,3026 / {1,0291 [23 log 2,515 (8 log 1 + 7 log 2,55 + 8 log 4)]} = 3,45
MODELO "Yij = + ij + ij // Cualquier puntuacin (Y) tiene tres componentes: () que es la media de
la poblacin. () el nivel en que se encuentra, comn a todos los componentes adscritos a ese nivel.
() el error experimental o factores no controlados en el experimento (se asume que es una variable
aleatoria distribuida segn N (0, ). Ejemplo ! Y17 = puntuacin del sujeto 7 del grupo 1.
HIPTESIS " Efectos fijos (sobre las medias poblacionales) // Efectos aleatorios (sobre las
varianzas ! cuando son = 0, las medias son iguales).
SC TOTAL = Y2 {( Y)2 / N}
SC INTRA = SC TOTAL - SC INTER
SC INTER = ( Y)2 / n {( Y)2 / N}
El Numerador del estadstico de contraste contiene la Varianza de error + Efecto real de la VI. El
Denominador contiene la Varianza de error. Por tanto, cuanto menor es el efecto real de la VI ms se
acerca el cociente a uno.
Valor Crtico: F (I-1) (N-I) (1-) Zona de Aceptacin: F < F ((I-1) (N-I) (1-)
Decisin:
Zona de Rechazo: F F (I-1) (N-I) (1-) Si F < F crtico ! Aceptamos H0
Si F F crtico ! Rechazamos H0
Clculos abreviados (Utilizamos el sistema de notacin propuesto por Keppel): El clculo de las
Sumas de cuadrados se realiza sumando y restando las razones bsicas: [Y] (relacionada con las
puntuaciones individuales); [A] con los totales de los niveles y [T] con la suma total.
Frmulas para las razones bsicas Sumas Cuadrados a partir de razones bsicas
SCS | A = (Y YA)2
PROBLEMA EJEMPLO
Un seleccionador de baloncesto desea averiguar cmo incide la hora del da a la que se entrena en el
rendimiento de los jugadores durante los partidos. Para ello selecciona 18 sujetos y los distribuye
aleatoriamente en turnos de maana (M), tarde (T) y noche (N); seis en cada turno. Al final de la
temporada el seleccionador los convoca a un torneo y hace el recuento de canastas conseguidas por los
jugadores, obteniendo los siguientes resultados:
2
SUMATORIOS () N DE CASOS MEDIAS
MAANA 78 1042 6 13
TARDE 67 807 6 11,17
NOCHE 99 1663 6 16,5
TOTAL 244 3512 18 13,55
Decisin ! Comparando los resultados F (tablas) = 3,68 < F (experimental) = 5,68, por tanto
rechazamos la hiptesis nula. Existen diferencias significativas entre el rendimiento de los jugadores
dependiendo de la hora del da a la que entrenan a un nivel de confianza del 95%.
Permiten obtener informacin sobre las diferencias entre los distintos tratamientos considerados uno a
uno. El objetivo de las comparaciones mltiples es reducir la cantidad de Error Tipo I () que
cometeramos si se compararan sin ms, dos a dos, todas las muestras posibles. Dos tipos:
! Comparaciones planificadas o a priori (no interesan todas las comparaciones, slo algunas)
! Comparaciones no planificadas, a posteriori o post hoc.
Las que vamos a utilizar se denominan no planificadas, a posteriori o post hoc (se llevan a cabo
cuando se ha realizado el Anlisis de Varianza y la F ha sido significativa / hemos rechazado la H0). Las
ms importantes ! TUKEY // SECHEFF.
___________
PRUEBA TUKEY (HSD) ! HDS TUKEY = q , gl, K MC error / n
q ! valor crtico en la tabla de rango studentizado. Se averigua considerando el nivel de confianza fijado
(), los grados de libertad de la MC error y el nmero de grupos o tratamientos a comparar en el ANOVA.
MC ERROR ! media cuadrtica error del Anova (MCINTRA / MCS | A)
n ! tamao de cada grupo (los modelos han de ser equilibrados). Cuando el modelo no es equilibrado,
se sustituye n por n ! n = k / (1 / n1) + (1 / n2)...
_ _
Rechazamos H0 cuando (| Yi Yj | HDS TUKEY
PRUEBA SCHEFF (CR) ! Permite, adems, realizar comparaciones complejas (una media con otras
dos consideradas en conjunto). Los coeficientes c (pesos) ! (2), (- 1) y (-1). Cuando se utiliza en lugar
de Tukey, para comparaciones dos a dos, es menos potente y ms conservadora que Tukey, lo que
significa que, en igualdad de condiciones, el valor crtico de Scheff es ligeramente superior al de
Tukey, por lo que resulta ms difcil rechazar la hiptesis nula de la igualdad de medias.
_________________ ___________________
CR SCHEFF = (k - 1) F (k - 1), gl ERROR MC ERROR [ (c2j / nj)]
k ! Nmero de grupos
ni = nmero de sujetos de cada grupo.
F (k - 1), gl ERROR ! F experimental del ANOVA.
MC ERROR ! Media cuadrtica error.
c2j ! Coeficiente de las combinaciones lineales (en cada combinacin la suma de coeficientes = 0)
_ _ _
1 = 2 Y1 (Y2 + Y3) ! Entonces: c1 = 2, c2 = (-1), c3 = (-1) ! Dado que (cj = 0)
Para hallar los cj, se debe tener en cuenta que siempre deben sumar 0. Es ms fcil calcular primero
los cj de los que se combinan conjuntamente, que siempre sern negativos, y luego el del que se
compara frente a todos, que ser la suma de los otros, pero con signo positivo.
Decisin:
Si 1 CR ! Existen diferencias significativas entre el nivel y los otros tomados conjuntamente.
Si 1 < CR ! No existen diferencias significativas entre el nivel y los otros tomados conjuntamente
PROBLEMAS EJEMPLO !
Valor q para = 0,05; 15 grados de libertad y tres grupos ! 3,67 MCINTRA ! 7,75
_______
HDS TUKEY = 3,67 7,75 / 6 = 4,17 (modelo equilibrado)
Decisin ! Existen diferencias significativas entre entrenar por la tarde y por la noche, siendo el mejor
rendimiento por la noche (media ms alta)
Prueba Scheff (CR) ! Comparacin entre la media del turno de noche con las de maana y tarde
consideradas conjuntamente.
__________________ __________________
CR SCHEFF = (k - 1) F (k - 1), gl ERROR MC ERRROR [ (c2j / nj)
Decisin ! Como 8,83 > 6,15 ! Rechazamos H0 (existen diferencias significativas entre el turno de
noche y los de maana y tarde considerados conjuntamente.
HIPTESIS ! H0: 1 = 2 = = K
H1: 1 2 K Al menos para una
Clculo: Se ordenan todas las puntuaciones en una sola serie, (es decir, tomndolas todas en cuenta),
asignamos rangos de 1 a n, dando a la puntuacin menor el rango 1. En caso de empate ! (rango
medio); es decir, asignndoles la media aritmtica de los rangos que les hubieran correspondido de ser
distintas.
Decisin: Cuando se rechaza la H0, se procede a realizar comparaciones mltiples (tratamientos entre
los que se producen las diferencias)
_________________
Diferencia mnima crtica ! MVKV = Z adj N(N+1) /12 (1/ai)
PROBLEMA EJEMPLO
En un estudio sobre antojo por el chocolate varios autores queran determinar si la distribucin
poblacional del consumo de chocolate en una semana era igual en una muestra de nios (N), que en una
muestra de mujeres adultas (MA) y que en una de hombres adultos (HA). Para ello se seleccionaron
aleatoriamente 5 sujetos de cada grupo y se midi su consumo de chocolate contabilizando (segn se
recoge en la tabla) el nmero de alimentos con chocolate consumidos en una semana (C):
= 30,5 / 5 = 61
Rango Medio Rango Medio =
31 / 5 = 62 Rango Medio =
58,5 / 5 = 117
2 2 2
RANGOS = 930,25 RANGOS = 961 RANGOS = 3422,25
2 2 2
R / 5 = 186,05 R / 5 = 192,20 R / 5 = 684,45
Hiptesis !
H0: No existen diferencias poblacionales en el consumo semanal de chocolate entre N, MA y HA.
H1: Existen diferencias poblacionales en el consumo semanal de chocolate entre, al menos dos grupos.
El estadstico de contraste sigue la distribucin X2 con (3-1) gl y = 0,10 ! X22; 090 = 461
Decisin ! Como 5,135 > 4,61 Se Rechaza la Hiptesis Nula (Comparaciones mltiples ! Las tres
muestras son equilibradas)
_________________ _______________
MVKV = Z adj N(N+1) /12 (1/ni) ! MVKV = 213 15(16) /12 (1/5) ! MVKV = 426