Beruflich Dokumente
Kultur Dokumente
461
�··
1fHI Introducción
En el capítulo anterior enfocamos nuestra atención sobre una variedad de proce
dimientos de prueba de hipótesis de uso común, que tenían que ver con una sola
muestra de datos numéricos tomados de una población. En el presente capítulo,
extenderemos nuestro estudio de la prueba de hipótesis al análisis de proce
dimientos de uso común que nos permiten comparar estadísticas calculadas a par
tir de dos muestras de datos numéricos, con el propósito de hacer inferencias con
respecto a posibles diferencias en los parámetros de las dos poblaciones respecti
vas. En particular, como se puede ver en el diagrama resumen de este capítulo,
página 519, describiremos varios procedimientos de prueba de hipótesis útiles que
pueden ser empleados, dependiendo de la situación que se tenga. Se analizan pro
cedimientos de muestras independientes y de muestras relacionadas. Se pone énfa
sis en las suposiciones que se encuentran detrás del uso de las diferentes pruebas.
Después de terminar el capítulo, usted será capaz de:
l. Diferenciar entre los diferentes criterios utilizados en la selección de
un procedimiento de prueba de hipótesis en particular.
2. Saber cuándo y cómo utilizar la prueba t de varianza conjunta para
examinar diferencias posibles en las medias de dos poblaciones
independientes.
3. Saber cuándo y cómo utilizar la prueba t' de varianza independiente
para examinar diferencias posibles en las medias de dos poblaciones
independientes.
4. Saber cuándo y cómo utilizar la prueba de sumas de rangos de
Wilcoxon para examinar posibles diferencias en las medianas de dos
poblaciones independientes.
S. Saber cuándo y cómo utilizar la prueba F para examinar posibles difer
encias en las varianzas de dos poblaciones independientes.
6. Saber cuándo y cómo utilizar la prueba t para una posible diferencia
media, µD, en dos poblaciones relacionadas.
7. Saber cuándo y cómo utilizar la prueba de rangos con signo de
Wilcoxon para una posible diferencia mediana, M0, en dos poblaciones
relacionadas.
1 3.3.1 Introducción
Primero extendamos los conceptos de la prueba de hipótesis desarrollados en los
capítulos 11 y 12 a situaciones en las que nos gustaría determinar si existe alguna
diferencia emre las medias de dos poblaciones independientes. Suponga que con
sideramos dos poblaciones independientes, cada una con una media y una desvia
ción estándar (representadas simbólicamente de la manera siguiente):
Población 1 Población 2
en donde
y
5p2 varianza aunada
X1 media de la muestra tomada de la población 1
5¡ varianza de la muestra tomada de la población 1
n1 tamaño de la muestra tomada de la población 1
X1 media de la muestra tomada de la población 2
5; varianza de la muestra tomada de la población 2
n2 tamaño de la muestra tomada de la población 2
Figura 13.1
Regiones de rechazo para una
prueba de dos extremos entre dos
media.
1 3.3.3 Aplicación
Para demostrar el uso de la prueba tde varianza conjunta, suponga que un analista
financiero desea comparar los réditos de dividendo promedio de las acciones nego
ciadas en la Bolsa de Valores de Nueva York con los producidos por las acciones
negociadas directamente en el listado del mercado nacional NASDAQ. Se selec
ciona una muestra aleatoria de 21 compañías de la Bolsa de Valores de Nueva York
y otra de 25 acciones del listado NASDAQ, y los resultados se presentan en la tabla
13.1 de la página 466.
Si el analista financiero desea determinar si existe evidencia de una diferencia
en los réditos de dividendo promedio entre las dos poblaciones de acciones, las
hipótesis nula y alternativa serían:
Ho: µ 1= µ2 o µ 1 - µ2 = O
H1: µ1 * µ2 o µ1 - µz * O
Suponiendo que las muestras fueron tomadas de poblaciones normales con
varianzas iguales, se puede hacer uso de la prueba t de varianza conjunta. Si la
prueba se efectuara al nivel de significación de a= .05, la estadística de prueba t
seguiría
Figura 13.2
Prueba de dos extremos entre la
hipótesis concerniente a la
diferencia entre las medias, al
nivel de significación de .05.
en la que
20(1.30 ) 2 + 24(1.16) 2
21 + 25 - 2
66.432
44
= 1.510
y, por consiguiente
3.27 - 2.53
t = --;=======
1.s10(_!_ + _!_)
21 25
0.74
-Jo.132
0.74
0.364
= 2.03
Utilizando un nivel de significación de .05, la hipótesis nula (Ho) es rechazada debido
a que t = + 2.03 > t44 = +2.0154. Si la hipótesis nula fuera verdadera se tendría una
r
probabilidad de a = O.OS de obtener una estadística de prueba t ya sea mayor a
+2.0154 desviaciones estándar del centro de la distribución to menor que -2.0154
desviaciones estándar del centro de la distribución t. El valor p, que es la probabili
dad de obtener una diferencia entre las dos medias de muestra mayor que el valor
de O. 7 4 observado en este caso, que se traduce a una estadística de prueba t con una
distancia todavía mayor a ±2.03 desviaciones estándar, a partir del centro de la dis
tribución t, tendría un valor ligeramente menor a .05, si la hipótesis nula de no
diferencia fuera verdadera. (Utilizando el paquete MINITAB, el valor p realmente
se calcula en .048.) Puesto que el valor pes menor que a, tenemos suficiente evi
dencia de que la hipótesis nula no es verdadera y la rechazamos.
La hipótesis nula es rechazada porque la estadística de prueba t ha caído en la
región de rechazo. El analista financiero llegaría a la conclusión de que existe evi
dencia de una diferencia en los réditos de dividendo promedio de los dos grupos.
Las compañías inscritas en la Bolsa de Valores de Nueva York parecen tener réditos
de dividendo un poco mayores que las compañías cuyas acciones se comercializan
directamente en el lista de mercado nacional de NASDAQ.
Observemos que en nuestro estudio del analista financiero, los dos grupos poseen
tamaños de muestra distintos. Cuando las dos muestras son del mismo tamaño (es
decir, n1 = n2), la fórmula para la varianza conjunta puede simplificarse a:
5p2 = sf + s�
2
1 3. 3.4 Resumen
En la prueba de la diferencia entre las medias, hemos supuesto que estamos tomando
las muestras de poblaciones distribuidas normalmente que tienen la misma varianza.
Debemos examinar las consecuencias que tienen las violaciones a esta suposición
sobre la prueba t de varianza conjunta. En situaciones en las que no podemos o no
deseamos hacer la suposición de que las dos poblaciones con igual varianza realmente
están distribuidas de manera normal, la prueba tde varianza conjunta es robusta (es
decir, no sensible) con respecto a violaciones moderadas de la suposición de norma
lidad, siempre y cuando el tamaño de las muestras sea grande. En tales situaciones, la
prueba t de varianza conjunta puede utilizarse sin que se vea seriamente afectada en
su potencia. Por otro lado, si el tamaño de las muestras es pequeño y no podemos o
no deseamos hacer la suposición de que los datos de cada grupo fueron tomados de
una población normalmente distribuida, se tienen dos alternativas. Ya sea que se lleve
a cabo, en cada uno de los resultados, alguna transfonnación nonnalizante (véase refe
rencia 11), y después se utilice la prueba t de varianza conjunta, o que se siga un pro
cedimiento libre de distribución, como la prueba de suma de rangos de Wilcoxon (que
se estudiará en la sección 13.5), que no depende de la suposición de normalidad de
las dos poblaciones.
En situaciones en las que no podamos o no deseemos hacer la suposición de
que las dos poblaciones, normalmente distribuidas, de las cuales se tomaron las
muestras tienen varianzas iguales, se dice que se tiene un problema de Behrens-Fisher
(véase referencia 9), y se puede utilizar la prueba tde varianza separada, desarrollada
por Satterthwaite (véase referencia 8) y que describiremos en la siguiente sección.
1 3 .4. 1 Introducción
En nuestro análisis de la prueba de la diferencia entre medias de dos poblaciones
independientes, hecho en la sección anterior, juntamos las varianzas de muestra
en una sola estimación, sJ, porque supusimos que las varianzas de población eran
iguales (es decir, crf = cri). Esta situación se presenta en el panel A de la figura 13.3,
para el caso en el cual la población 1, normalmente distribuida, tiene una media
mayor que la de la población 2, también distribuida de manera normal. Sin
embargo, si, como se muestra en el panel B de la figura 13.3, no estamos dispuestos
a suponer que las dos poblaciones, distribuidas normalmente, tienen varianzas
iguales, o si tenemos evidencia de que éstas en realidad no lo son, entonces se pre
senta el problema de Fisher-Behrens (véase referencia 9) y la prueba t de varianza
conjunta resulta inapropiada en este caso; por consiguiente, podemos emplear una
prueba t' de varianzas independientes, desarrollada por Satterthwaite (véase
referencia 8). En el procedimiento de aproximación de Satterthwaite, se incluyen
las dos varianzas de muestra independientes en el cálculo de la estadística de
prueba t' de ahí el nombre de prueba t' de varianzas independientes.
1 3 .4.2 Desarrollo
Para probar la hipótesis nula de no diferencias en las medias de dos poblaciones in
dependientes
Ho: µ ¡ = µz o µ1 - µz = O
contra la hipótesis alternativa de que las medias no son iguales
*
H1: µ1 µz o µ1 - µz O *
se puede calcular la siguiente estadística de prueba t' de varianzas independientes:
en la que
XJ media de la muestra tomada de la población 1
S¡ varianza de la muestra tomada de la población 1
n1 tamaño de la muestra tomada de la población 1
X2 media de la muestra tomada de la población 2
s; varianza de la muestra tomada de la población 2
n2 tamaño de la muestra tomada de la población 2
Figura 13.4
Regiones de rechazo de una
prueba de dos extremos para la
diferencia entre dos medias.
1 3.4.3 Aplicación
La prueba t' de varianzas independientes puede mostrarse refiriéndonos al pro
blema de interés para el analista financiero (véase la página 465). Recordamos que
el analista financiero desea determinar si existe cualquier diferencia en los réditos
de dividendo medios de las acciones negociadas en la Bolsa de Valores de Nueva
York en comparación con los valores negociados "al contado" en el listado del mer
cado nacional NASDAQ. Para comparar las diferencias en los réditos de dividendo
promedio entre las dos poblaciones de listas de acciones, las hipótesis nula y alter
nativa serían:
Ho: µ1 = µz o µ1 - µz = O
H1: µ1 * µz o µ1 - µz * O
Los réditos de dividendo para una muestra aleatoria de 21 compañías inscritas
en la Bolsa de Valores de Nueva York y otra de 25 acciones del listado de mercado
nacional NASDAQ se muestran en la tabla 13.1 (página 466), y las estadísticas
sumarias se presentan en la tabla 13.2 (página 467).
Si podemos suponer que las muestras son tomadas de poblaciones dis
tribuidas normalmente, pero no estamos dispuestos a suponer que tales pobla
ciones tienen la misma varianza, entonces podemos emplear la prueba t' de
varianzas independientes. Si la prueba fuera llevada a cabo al nivel de signifi
cación a= O.OS, utilizando la ecuación 13.4, la estadística de prueba t' puede ser
aproximada por una distribución t con v= 40 grados de libertad, la parte entera
de los cálculos siguientes:
r ( !: r
2
J
+
n1 nz
V=-------
(!:
---+- -
nl - 1 n2 - 1
r ( 1.i: r
2
1.698 1.353
( + )
21 25
(1·1�8 3
- - - -+- - - -
20 24
.018219
.006538 .002929
+ -- -
20 24
.018219
.000449
= 40.58
De la tabla E.3 del apéndice E, los valores críticos superior e inferior para esta
prueba de dos extremos son, respectivamente, +2.0211 y-2.0211, y, como se mues
tra en la figura 13.5, la regla de decisión es
Figura 13.S
Prueba de dos extremos de la
hipótesis concerniente a la
diferencia entre las medias, al
nivel de significación de .OS.
(X 1 -Xz )- (µ 1 -µz)
t'
Sz Sz
_! + i
n1 n2
Figura 13.6
Resultado obtenido con
MINITAB en el que se
ilustra una comparación
descriptiva entre dos
grupos de muestra.
sesgos y gráficas de probabilidad normal para los dos grupos. De este análisis de
datos exploratorio, podemos cuestionar la validez de la suposición de normalidad
de la primera población: los réditos de dividendo de las compañías inscritas en la
Bolsa de Valores de Nueva York. La muestra tomada de este grupo solamente es de
21, y puede ser que sea demasiado pequeña para suponer que el teorema del límite
central (véase sección 9.2) se puede aplicar. Si este es el caso, debería utilizarse la
prueba de suma de rangos de Wilcoxon.
Farmingdale Levittown
x 191.33 172.34
s 32.60 16.92
n 60 99
Línea A Línea B
x 8.005 7.997
s 0.012 0.005
n 11 16
Hospitales Hospitales
urbanos suburbanos
76.5 73.3 71.5 63.0
75.9 77.4 73.4 76.0
79.6 79.0 74.6 75.5
77.5 79.9 74.3 70.7
79.4 70.4 71.2 67.4
78.7 77.7 67.8 62.6
78.6 78.1 76.9 73.0
79.3 75.9 60.0 76.5
(a) Suponga que las varianzas en la población de los dos tipos de hospital (es
decir, urbanos y suburbanos) no son iguales. Utilizando el nivel de .OS,
¿existe evidencia de una diferencia en las tasas promedio de ocupación
entre hospitales urbanos y suburbanos en el estado?
(b) ¿Qué otras suposiciones deben hacerse con el fin de realizar el inciso (a)
de este problema?
13.21 La directora de entrenamiento de una compañía fabricante de equipo
electrónico está interesada en determinar si diferentes métodos de
entrenamiento tienen un efecto sobre la productividad de los empleados de la
línea de ensamblaje. La directora asignó aleatoriamente 42 empleados recién
contratados en dos grupos de 21, de los cuales los primeros siguieron un
programa de entrenamiento basado en el trabajo individual y asistido por
computadora, y los otros 21 siguieron un programa basado en el trabajo de
equipo. Después de terminar el entrenamiento, los empleados fueron
evaluados con respecto al tiempo (en segundos) que les llevó ensamblar un
componente. Los resultados son los siguientes:
Prueba de sumas de rangos de Wilcoxon para diferencias entre dos medianas 481
1 3.S.2 Procedimiento
Para efectuar la prueba de suma de rangos de Wilcoxon debemos sustituir las obser
vaciones de las dos muestras de tamaños n 1 y n2 por sus rangos combinados (a
menos que los datos obtenidos, inicialmente, incluyan a los rangos). Los rangos
son asignados de tal manera que el rango 1 se asigna a la más pequeña de las
n = n 1 + n2 observaciones combinadas, el rango 2 se le asigna a la siguiente más alta
y así sucesivamente, de modo que el rango n queda asignado a la observación más
grande. Si varias observaciones tienen el mismo valor, asignamos a cada una de
éstas el promedio de los rangos que, en otra circunstancia, se les habría asignado.
Por cuestiones de comodidad, siempre que los dos tamaños de muestra sean
distintos, haremos que n 1 represente el de la muestra más pequeña y que n2 corres
ponda al de la más grande. La estadística de prueba de suma de rangos de Wilcoxon,
T1, es simplemente la suma de los rangos asignados a las n 1 observaciones de la
muestra más pequeña. (En el caso de muestras de igual tamaño, cualquiera de los
grupos puede elegirse para determinar T1 .)
Para cualquier valor entero n, la smna de los n primeros enteros consecutivos
puede calcularse fácilmente como n(n + 1)/2. La estadística de prueba, T1, más la
suma de los rangos asignados a los n 2 elementos de la segunda muestra, T2, por
consiguiente, debe ser igual a este valor; es decir,
de modo que la ecuación (13.5) puede servir como una verificación del proce
dimiento de asignación de rangos.
La prueba de la hipótesis nula puede ser de dos extremos o de un extremo,
dependiendo de si estamos probando si las dos medianas de población son exclu
sivamente diferentes o si una de ellas es mayor que la otra.
Cuando los tamaños de ambas muestras n 1 y n2 son::; 10, se puede usar la tabla
E.11 para obtener los valores críticos de la estadística de prueba T1 para pruebas de
uno y dos extremos, a varios niveles de significación. Para una prueba de dos
extremos y para un nivel particular de significación, a, si el valor calculado de T1
es igual o mayor que el valor crítico superior o si es menor o igual que el valor
crítico inferior, la hipótesis nula puede ser rechazada. Para pruebas de un extremo
que tienen la hipótesis alternativa H1: M1 < M2, la regla de decisión consiste en re
chazar la hipótesis nula si el valor observado de T1 es menor o igual que el valor
crítico inferior. Para las pruebas de un extremo cuya hipótesis alternativa sea H1:
M1 > M2, la regla de decisión consiste en rechazar la hipótesis nula si el valor obser
vado de T1 es igual o mayor que el valor crítico superior.
A fin de mostrar cómo utilizar la tabla E.11 para obtener los valores críticos de
la estadística de prueba T11 supongamos que los tamaños de muestra de nuestros
dos grupos son 8 y 10, y que deseamos escoger un nivel de significación de a= .05.
De la tabla 13.3, que es una réplica de la tabla E.11, si n 1 = 8, n2= 10 y a= .05, obser-
a n1
4 5 6 7 8 9 10
n2 Un extremo Dos extremos
9 .025 .os 14,42 22,53 31,65 40,79 62,109
.01 .02 13,43 20,55 28,68 37,82 59,112
.005 .01 11,45 18,57 26,70 35,84 56,115
vamos que los valores críticos inferior y superior para una prueba de dos extremos
son 53 y 99, respectivamente. Si el valor calculado de la estadística de prueba T1
cae entre estos valores críticos, la hipótesis nula podría no ser rechazada. Sin
embargo, si el valor calculado de la estadística de prueba es igual o mayor que 99
o es igual o menor que 53, la hipótesis nula sería rechazada.
Para tamaños de muestra grandes, la estadística de prueba, T11 está distribuida
de manera aproximadamente normal. Se puede emplear la siguiente fórmula de
aproximación de muestra grande para probar la hipótesis nula cuando los tamaños
de muestra se encuentran fuera del alcance de la tabla E.11:
donde
suma de los rangos asignados para las observaciones n, en la muestra 1
valor medio de T1
cry1 desviación estándar de T1
n1 (n + 1)
2
Prueba de sumas de rangos de Wilcoxon para diferencias entre dos medianas 483
Basándonos en a, el nivel de significación seleccionado, la hipótesis nula
puede ser rechazada si el valor Z calculado cae en la región de rechazo apropiada,
dependiendo de si se trata de una prueba de dos extremos o de uno solo (véase
figura 13.7).
Figura 13.7
Determinación de la región de rechazo: panel A prueba de dos extremos (M 1 * M2); panel B, prueba de un extremo
(M 1 < M2); panel C, prueba de un extremo (M 1 > M2).
13.5.3 Aplicación
Para mostrar el uso de la prueba de suma de rangos de Wilcoxon, refirámonos de
nuevo al problema que tiene que enfrentar nuestro analista financiero (véase
página 465) quien desea determinar si existe alguna diferencia en los réditos de
dividendo promedio de valores comercializados en la Bolsa de Valores de Nueva
York con respecto a las negociadas directamente en el listado de mercado nacional
NASDAQ. En la tabla 13.1 se muestran los réditos de dividendo de una muestra
aleatoria de 21 acciones de la Bolsa de Valores de Nueva York y de otra muestra alea
toria de 25 acciones del listado de mercado nacional NASDAQ (página 466), y en
la tabla 13.2 se presentan las estadísticas sumarias (página 467).
Si, como resultado de un análisis de datos exploratorio (véase figura 13.6 en las
páginas 477-478), el analista financiero no desea hacer la suposición limitante de
que las muestras fueron tomadas de poblaciones que están distribuidas normal
mente, se puede utilizar la prueba de suma de rangos de Wilcoxon para evaluar
posibles diferencias en las medianas de los réditos de dividendo. 1 Puesto que el
analista financiero no especifica cuál de los dos grupos es más probable que posea
una mediana de réditos de dividendo mayor, la prueba es de dos extremos, y se
establecen las siguientes hipótesis nula y alternativa:
n(n + 1)
2
46(47)
585.5 + 495.5 = 1,081
2
L Para probar la hipótesis nula de no diferencia en las medianas de los réditos de
dividendo de las dos poblaciones, utilizamos la fórmula de aproximación de mues-
Prueba de sumas de rangos de Wilcoxon para diferencias entre dos medianas 48S
'
1
tra grande [ecuación (13.7)]. Escogiendo el nivel de significación de O.OS, los va
lores críticos de la distribución normal estándar (tabla E.2) son ±1.96 (véase figura
13.8). La regla de decisión sería
Figura 13.8
Prueba de dos extremos de la
hipótesis concerniente a la
diferencia de medianas, al nivel
de significación de .OS.
n 1 n 2 (n + 1)
12
- 21(47)
585. 5
2
21(25)(47)
12
585.5 - 493.5
45.35
= 2.03
Puesto que Z = +2.03 > +1.96, la decisión es rechazar H0• El valor p, o la probabili
dad de obtener una estadística de prueba W incluso mayor que el valor observado
de 585.5, que se traduce en una estadística de prueba Z con una distancia todavía
más grande, medida del centro de la distribución normal estándar, que ±2.03
desviaciones estándar, es de .0424, si la hipótesis nula de no diferencia en las media
nas fuera verdadera. Como el valor de pes menor que a= .05, no creemos que la
hipótesis nula sea verdadera y la rechazamos.
La hipótesis nula es rechazada porque la estadística de prueba Z ha caído en la
región de rechazo. Así pues, sin tener que hacer la suposición limitante de nor
malidad en las poblaciones originales, el analista financiero puede llegar a la con
clusión de que existe evidencia de una diferencia en las medianas de los réditos de
dividendo de los dos grupos. Las compañías que se comercializan en la Bolsa de
Valores de Nueva York parecen tener réditos de dividendo ligeramente mayores
1 3. 5 .4 Reflexiones
Esta conclusión concuerda con el resultado obtenido con la prueba t de varianzas con
juntas, no con la prueba t' de varianzas separadas. Si ahora podemos demostrar que no
hay evidencia de una diferencia en la variabilidad de los dos grupos, podríamos tener
razones suficientes para llegar a la conclusión de que los resultados de la prueba t y de
la prueba de suma de rangos de Wilcoxon son plausibles. La prueba de la diferencia
entre dos varianzas de población será el tema a tratar en la sección 13.6.
Candidatos MC Candidatos MF
1 2 3 6
4 5 7 10
8 9 13 14
11 12 16 18
15 17 19 20
21 22
¿Existe evidencia de que los candidatos con maestría en ciencias sean más
idóneos que los candidatos con maestría en filosofía? (Utilice el nivel a= O.OS.)
13.27 La directiva de una estación televisiva de Nueva York decidió realizar una
historia en la que se compararan dos rutas de trenes del área: el Long Island
Rail Road (LIRR) y el New Jersey Transit (NJT). Los investigadores tomaron una
muestra en la estación del funcionamiento de varias de las corridas programadas
de los trenes de cada línea, 10 de la LIRR y 12 de la NJT. Los datos con respecto
al tiempo (en minutos) adelantado (números negativos) o atrasado (números
positivos) de cada tren se presentan a continuación:
LIRR: 5 -1 39 9 12 21 15 52 18 23
NJT: 8 4 10 4 12 5 4 9 15 33 14 7
Prueba de sumas de rangos de Wilcoxon para diferencias entre dos medianas 487
'
(a) ¿Existe evidencia de que las líneas difieren en sus medianas de la tendencia
a llegar tarde (Utilice el nivel a. = .01.)
(b) ¿A qué conclusiones con respecto a los retrasos de las dos líneas se pueden
llegar?
13.28 Refiérase a los datos del problema 13.7 de la página 470. Utilizando un nivel
de 0.01 de significación, ¿existe evidencia de que los incentivos salariales (a
través de comisiones) produzcan una mediana mayor en el volumen de
ventas?
e 13.29 Refiérase a los datos del problema 13.8 de la página 470.
(a) Utilizando un nivel de significación de .05, ¿existe evidencia de una difer
encia en los dos tipos de baterías con respecto a la mediana del tiempo de
comunicación (en minutos) antes de necesitar recargárselas?
(b) ¿Qué suposiciones deben hacerse con el fin de llevar a cabo el inciso (a)
de este problema?
(c) Compare los resultados obtenidos en el inciso (a) con los obtenidos en el
problema 13.8 de la página 470 y con los obtenidos en el problema 13.18
de la página 479. Discuta el resultado.
13.30 Refiérase al problema 13.9 de la página 471.
(a) Utilizando un nivel de significación de .05, ¿existe evidencia de una difer
encia en la mediana de los réditos efectivos sobre las cuentas de
mercado de dinero en los dos tipos de bancos del área de Nueva York?
(b) ¿Qué suposiciones deben hacerse con el fin de llevar a cabo el inciso (a)
de este problema?
(c) Compare los resultados obtenidos en el inciso (a) con los obtenidos en el
problema 13.9 de la página 471 y con los obtenidos en el problema 13.19
de la página 479. Discuta el resultado.
13.31 Refiérase al problema 13.20 de la página 480.
(a) Utilizando un nivel de significación de .05, ¿existe evidencia de una difer
encia en la mediana de las tasas de ocupación entre hospitales urbanos y
suburbanos del estado?
(b) ¿Qué otras suposiciones deben hacerse con el fin de llevar a cabo el inciso
(a) de este problema?
(c) Compare los resultados obtenidos en el inciso (a) con los obtenidos en el
problema 13.20. Discuta el resultado.
13.32 Refiérase al problema 13.21 de la página 480.
(a) Utilizando un nivel de significación de .05, ¿existe evidencia de una
diferencia en la mediana de los tiempos de ensamblado (en segundos)
entre los empledos entrenados con un programa asistido por computadora
y de índole individual y los entrenados en un programa basado en el
trabajo en equipo?
(b) ¿Qué otras suposiciones deben hacerse con el fin de llevar a cabo el inciso
(a) de este problema?
(c) Compare los resultados obtenidos en el inciso (a) con los obtenidos en el
problema 13.21. Discuta el resultado.
1 3.6. 1 Introducción
En las tres secciones anteriores, examinamos algunos procedimientos para probar
las diferencias en la tendencia central (es decir, diferencias en las medias o en las
medianas) entre dos poblaciones independientes. En muchas situaciones, sin
embargo, podemos estar interesados también en probar si dos poblaciones inde
pendientes tienen la misma variabilidad. Podemos estar interesados en estudiar las
varianzas de dos poblaciones como un "medio para llegar a un fin", es decir, pro
bar la suposición de varianzas iguales con el propósito de determinar si la prueba t
de varianzas conjuntas o la prueba t' de varianzas independientes es la más
apropiada para utilizarse en la comparación de dos medias (secciones 13.3 y 13.4);
o podemos estar realmente interesados en el estudio de las varianzas de dos pobla
ciones como un "fin en sí mismo".
1 3.6.2 Desarrollo
Con el fin de probar la igualdad de las varianzas de dos poblaciones indepen
dientes, se ha diseñado un procedimiento estadístico basado en el cociente de dos
varianzas de muestra. Si se supone que los datos obtenidos de cada población están
distribuidos normalmente, entonces el cociente Si/5� sigue una distribución cono
cida como distribución F (véase la tabla E.5), llamada así en honor al famoso
estadístico R. A. Fisher. De la tabla E.5 (una réplica de la cual, la tabla 13.5, aparece
en la página 491), podemos ver que los valores críticos de la distribución F depen
den de dos conjuntos de grados de libertad. Los grados de libertad que aparecen en
el numerador del cociente se refieren a la primera muestra, y los del denominador
pertenecen a la segunda muestra. La estadística de prueba F para probar la igual
dad entre dos varianzas sería
r
1
Figura 13.9
Determinación de la región de rechazo de la prueba de hipótesis con respecto a la igualdad de dos varianzas de población:
panel A, prueba de dos extremos, panel B, prueba de un extremo; panel C, prueba de un extremo
1 3.6.3 Aplicación
Con el propósito de mostrar cómo probaremos la igualdad de dos varianzas, po
demos regresar al estudio del analista financiero de los réditos de dividendo de dos
grupos de acciones. Los datos del ejemplo se muestran en la tabla 13.1 de la página
466, y las medidas sumarias de las dos muestras se presentan en la tabla 13.2 de la
página 467.
H1: cr1
2
* crz2
Debido a que se trata de una prueba de dos extremos, la región de rechazo se
divide en los extremos inferior y superior de la distribución F. Si se selecciona un
nivel de significación de a= .05, cada región de rechazo contendrá 0.025 de la dis
tribución.
El valor crítico de extremo superior de la distribución F, con 20 y 24 grados de
libertad se puede obtener directamente de la tabla E.S, de la cual la tabla 13.5 es
una réplica. Puesto que hay 20 grados de libertad en el numerador y 24 en el
denominador, el valor crítico de extremo superior puede encontrarse buscando en
la columna etiquetada con "20" y en la hilera etiquetada con "24", que pertenece
a un área de extremo superior de .025. Por consiguiente, el valor crítico de extremo
superior de esta distribución Fes 2.33.
Tabla 13.5 Obtención del valor crítico de F con 20 y 24 grados, para un área de extremo superior de 0.025.
Numerador df1
Denominador
dfz 1 2 3 15 24 30
1 647.8 799.5 864.2 984.9 997.2 1001
2 38.51 39.00 39.17 39.43 39.46 39.46
3 17.44 16.04 15.44 14.25 14.12 14.08
4 12.22 10.65 9.98 8.66 8.51 8.46
•
23
s.n
Fuente: Tomado de la tabla E.5.
5.75 4.35
4.32
3.75
3.n
2.47
2.44
2.30
2.27
2.24
2.21
1
FL(20 , 24) : f
U(24, 20)
1 1
FL(20, 24) = --- = -- = 0.415
FU(24, 20) 2.41
Figura u.10
Regiones de rechazar y de no
rechazar de una prueba de dos
extremos para la igualdad de dos
varianzas, al nivel de significación
de .05 y con 20 y 24 grados de
libertad.
Utilizando la ecuación (13.8) para los datos del analista financiero (véase la
tabla 13.2 página 467), calculamos la siguiente estadística de prueba F:
F = s;
52
2
1.698
= = 1.25
1.353
Por consiguiente, puesto que Fic2o, 24i = 0.415 < F = 1.25 < Fuc2o, 24i = 2.33, no
rechazamos la hipótesis nula, H0. El analista financiero llegaría a la conclusión de
que no hay evidencia de una diferencia en la variabilidad de los réditos de divi
dendo de las dos poblaciones. Así pues, si podemos suponer que las dos pobla
ciones están distribuidas de manera normal, la prueba t de varianzas conjuntas
sería más apropiada que la prueba t' de varianzas independientes, para la com
paración de diferencias entre los réditos de dividendo promedios, debido a que no
1 3 .6.4 Precaución
Al probar la igualdad de dos varianzas de población, debemos tener en cuenta que
la prueba supone que cada una de las dos distribuciones están distribuidas de ma
nera normal. Esto es, si se cumple con la suposición de normalidad para cada
población, la estadística de prueba F sigue una distribución F con n 1 - 1 y n2 - 1
grados de libertad. Desafortunadamente, esta estadística de prueba F no es robusta
con respecto a violaciones a esta suposición (referencia 2), en particular cuando los
tamaflos de muestra de los dos grupos no son iguales. Por tanto, si las poblaciones
no están, por lo menos, distribuidas de manera aproximadamente normal, la pre
cisión del procedimiento puede verse afectada seriamente (las referencias 2 a 4
presentan otros procedimientos para probar la igualdad de dos varianzas).
e 13.36 Suponga que se tiene disponible la siguiente información para dos grupos:
n 1 = 10 Si= 13.7 s� = 16.9
Figura 13.11
Resultado obtenido con MINITAB de las medidas sumarias.
Nota: Deberíamos estar familiarizados con todas las medidas sumarias obtenidas con el programa MINITAB,
excepto TRMEAN (que está más allá del propósito del presente extremo).
Uso de la computadora para la prueba de hipótesis con dos muestras independientes 495
Figura 13.12
Resultado obtenido con STATISTIX de las gráficas de caja y sesgo y las gráficas de probabilidad
normal.
Nota: Los externos y los posibles externos están representados separadamente fuera de los sesgos de la gráfica
de caja y sesgo. El símbolo"o" se utiliza para externo; el símbolo"*" se utiliza para posibles externos.
Figura 13.14
Resultado obtenido con
SPSS para la prueba de
suma de rangos de Wilcoxon
para investigar diferencias
en la antigüedad mediana
basados en el sexo del
trabajador.
Uso de la computadora para la prueba de hipótesis con dos muestras independientes 497
Figura 13.1 S
Resultado obtenido con
STATISTIX en el que se
ilustran las gráficas de caja
y sesgo y las gráficas de
probabilidad normal,
correspondientes a los
datos sobre antigüedad en
el trabajo de los dos
grupos, seguidas de una
transformación
normalizante con
logaritmos naturales.
Uso de la computadora para la prueba de hipótesis con dos muestras independientes 499
500 Capítulo 13 Pruebas de dos muestras con datos numéricos
Proyecto de base de datos/encuesta de la sección 13. 7
Los siguientes problemas se refieren a los datos de muestra obtenidos del cuestionario de
la figura 2.6, páginas 28 y 29, y presentados en la tabla 2.3 de las páginas 33 a 40.
Deben resolverse con la ayuda de algún paquete de computación que se tenga disponible.
Suponga que usted fue contratado como asistente de investigación de Bud
Conley, el vicepresidente de recursos humanos de Kalosha Industries. Éste le ha
dado una lista de preguntas (véanse problemas 13.48 a 13.60) cuya respuesta
necesita tener antes de la reunión con el representante de la empresa B&L
Corporation, la firma asesora sobre prestaciones laborales que él ha
contratado. Un análisis estadístico confirmatorio, basado en las respuestas a las
preguntas relativas a las variables numéricas de la Encuesta de Satisfacción de
los Empleados, le proporcionará un mejor entendimiento de la composición de
la fuerza de trabajo de tiempo completo de Kalosha Industries, y le será de
utilidad en sus deliberaciones con el representante de la B&L Corporation
orientadas a la obtención de un paquete de prestaciones para los empleados.
De las respuestas a las preguntas que tratan sobre variables numéricas de la
Encuesta de Satisfacción de los Empleados (véanse páginas 33 a 40), en los
problemas 13.48 a 13.60 que se presentan a continuación,
Elección del procedimiento de prueba apropiado al comparar dos muestras relacionadas 503
un experimento en el que proyectos de aplicación financiera particulares deben ser
tratados con el nuevo paquete así como por el paquete líder actual. Mediante el uso
de un conjunto particular de proyectos de aplicación financiera en ambos paquetes,
de hecho estamos utilizando cada proyecto como su propio control. Por consi
guiente, sencillamente podemos evaluar diferencias en los tiempos requeridos para
lograr los resultados deseados mediante la comparación de la media (o de la me
diana) de las diferencias de los dos registros de tiempo, en vez de comparar la dife
rencia en la media (o en la mediana) de los tiempos de terminación de dos muestras
independientes de los proyectos de aplicación financiera, una de las cuales debe
accesarse en el nuevo paquete de software y la otra en el paquete líder. Este último
planteamiento de comparación de dos muestras independientes fue visto en nuestro
análisis de las secciones 13.3 a 13.6. En este caso, sin embargo, debemos observar
que la obtención de los dos registros de tiempo (uno para el nuevo paquete de compu
tación y otro para el paquete líder) para cada proyecto de aplicación financiera sirve
para reducir la variabilidad en las lecturas de tiempo comparada con la que se pre
sentaría si se utilizaran dos conjuntos independientes de proyectos de aplicación
financiera. También nos permite enfocar nuestra atención en las diferencias entre los
dos registros de tiempo para cada proyecto de aplicación financiera con el propósito
de medir la efectividad del nuevo paquete de software.
Independientemente de si se emplean muestras equilibradas (apareadas) o me
diciones repetidas, el objetivo es estudiar la diferencia entre dos mediciones median
te la reducción del efecto de la variabilidad debido a los elementos o individuos
mismos. En las dos secciones siguientes, desarrollaremos dos procedimientos amplia
mente utilizados: la prueba t para la diferencia media en muestras relacionadas y la
prueba de rangos con signo de Wilcoxon para la diferencia mediana en muestras rela
cionadas. Como se estudió en la sección 13.2, se pueden emplear varios criterios para
la selección de un procedimiento en particular. Parte de un buen análisis de datos
consiste en entender las suposiciones que subyacen en cada una de las técnicas de
prueba de hipótesis y en seleccionar la más apropiada para un conjunto dado de con
diciones. Otros criterios para la elección de la prueba tienen que ver con la sencillez
del procedimiento, la capacidad de generalización de las conclusiones a las que se
llegue, la accesibilidad de las tablas de valores críticos para la estadística de prueba,
la disponibilidad de paquetes de software de computación que contengan el pro
cedimiento de prueba, y la potencia estadística del procedimiento.
LD,
fj = _,=_!_
n
µn = diferencia media supuesta
crn = desviación estándar de población de los resultados de diferencia
n = tamaño de la muestra
Table 1 3 .e Determinación de la diferencia
entre dos grupos relacionados
Grupo
Observación 1 2 Diferencia
1 X¡¡ X21 D1 =X11 - X21
2 X¡ z Xzz Dz =X1 2 - Xzz
contra la alterndtiva de que las medias no son iguales (es decir, la diferencia media
de población, µv, no es O)
[) = _i-_1_
j = 1
n-l
y
suma de los cúadrados de cada résultádo de diferencia
i = 1
L D; = -15.60, L D( = 38.1676,
n n
n = 10
í =1 i =1
Así pues
ID ¡
i =1 -15.60 = -1.56
n 10
de modo que
SD = 1.24
H O: µD � O O µnueva � µ.¡eja
Figura 13.18
Prueba de un extremo para la
diferencia apareada, al nivel de
significación de .O 1, con nueve
grados de libertad.
de modo que
-l.56 - O = -
t = 3.978
1.24
fw
Como t= -3.978 < t9 = -2.8214, rechazamos Ha ,
Problemas de la sección I 3. 9
13.61 El gerente de una conocida agencia nacional de bienes raíces acaba de
terminar una sesión de entrenamiento sobre evaluaciones de inmuebles de dos
agentes recién contratados. Para evaluar la eficacia de su entrenamiento, el
gerente desea determinar si existe alguna diferencia en los valores estimados
de casas que hicieron estos dos agentes. El gerente seleccionó una muestra de
12 casas y a cada uno de los agentes se le asignó la tarea de evaluar (en miles
de dólares) las 12 casas.
Los resultados se presentan a continuación:
13.62 Suponga que una compañía fabricante de zapatos desea probar el material que
se destina a la suela de los zapatos. En cuanto a cada par de zapatos, el material
nuevo fue colocado en un zapato y el material viejo en el otro. Después de un
periodo dado, se seleccionó una muestra aleatoria de 10 pares de zapatos y se
les midió el desgaste con una escala de 10 puntos (el más alto es mejor) con
los siguientes resultados
Número de par
Material 11 III IV V VI VII VIII IX X
Nuevo 2 4 5 7 7 5 9 8 8 7
4
-=r
Viejo 4 5 3 8 9 7 8 5 6
Diferencias -1 +2 -=T -2 +1 +2 o +3 +1
Automóvil
Tipo de
gasolina #1 #2 #3 #4 #5 #6 #7 #8 #9 #10
Regular 15 23 21 35 42 28 19 32 31 24
Alto octanaje 18 21 25 34 47 30 19 27 34 20
13.10.1 Introducción
En situaciones que implican elementos pareados o mediciones repetidas del mis
mo elemento, se puede utilizar la prueba de rangos con signo de Wilcoxon
para la diferencia mediana, cuando su respectiva contraparte paramétrica, la
prueba t para la diferencia media, que fue descrita en la sección anterior, no es
apropiada. Esto es, la prueba de rangos con signo de Wilcoxon puede elegirse sobre
la prueba t cuando somos capaces de obtener datos medidos a un nivel superior
que la escala ordinal, pero no creemos que las suposiciones del procedimiento pa
ramétrico sean lo suficientemente verdaderas. Cuando las suposiciones de la prue
ba t son violadas, es probable que el procedimiento de Wilcoxon (que hace pocas
y menos suposiciones limitantes que la prueba t) sea más poderoso en detectar la
existencia de diferencias significativas que su contraparte paramétrica. Aún más,
incluso en condiciones apropiadas para la prueba paramétrica, la prueba de rangos
con signo de Wilcoxon ha probado ser casi tan poderosa que la prueba t.
13.10.2 Desarrollo
La prueba de la hipótesis nula con respecto a que la diferencia mediana de la
población, Mv, es cero, puede ser de dos extremos o de un extremo:
Puesto que la suma de los primeros n' enteros (1, 2, ..., n') está dada por n'(n' +
1)/2, la estadística de prueba de Wilcoxon, W, puede tener un valor que va desde
un mínimo de cero (en el que todos los resultados de diferencia observados son
negativos) hasta un máximo de n'(n' + 1)/2 (en el cual todos los resultados de dife
rencia observados son positivos). Si la hipótesis nula fuera verdadera, esperaríamos
que la estadística de prueba, W, tomara un valor cercano a su media, µw = n'(n' +
1)/4. Si la hipótesis nula fuera falsa, esperaríamos que el valor observado de la
estadística de prueba estuviera cercano a uno de los extremos.
Del mismo modo que con la prueba de rangos con signo de Wilcoxon (de una
muestra), analizada en la sección 12.4, se puede utilizar la tabla E.10 para obtener
los valores críticos de la estadística de prueba, W, para pruebas de un extremo y
para pruebas de dos extremos a varios niveles de significación, para muestras con
n' :5; 20. Para una prueba de dos extremos y un nivel de significación particular, si
el valor observado de W es igual o mayor que el valor crítico superior o es igual o
en la que
W es la suma de los rangos positivos; W= L R¡ >
n'
+
i = 1
n'(n' + 1)
µ w es él valor medio de.W; µ w = --'----
4
n'(n' + 1)(2n' + 1)
cr w es la desviación estándar W; cr w =
24
n' es el tamaño real después de eliminar las observaciones que tienen resultados
de diferencia absolutos de cero
que es,
Prueba de hipótesis de rangos con signo de Wilcoxon para la diferencia de medias S13
Panel A PanelB PanelC
Procedimiento de diferencias apareadas: (prueba de dos (prueba de un (prueba de un
extremos) extremo) extremo)
M0 =0 M0 <0 M0 >0
Figura 13. 1 9
Determinación de la región de rechazo utilizando la prueba de rangos con signo de Wilcoxon.
Ho: MD �o
H1: MD>Ü
y la prueba es de un extremo.
Tiempo de terminación
(en segundos)
Usuario de Con líder Con paquete
proyecto de actual en el de software
aplicaciones mercado nuevo
C.B. 9.98 9.88
T.F. 9.88 9.86
M.H. 9.84 9.75
R.K. 9.99 9.80
M.O. 9.94 9.87
D.S. 9.84 9.84
s.s. 9.86 9.87
C.T. 10.12 9.86
K.T. 9.90 9.83
s.z. 9.91 9.86
Para llevar a cabo la prueba de muestra apareada, el primer paso del procedi
miento de seis consiste en obtener un conjunto de resultados de diferencia, D¡,
entre cada una de las n observaciones apareadas:
D¡= Xu - X2;
en donde i = 1, 2, ... , n
L R¡ )
n'
+
W = 7 + 2 + 6 + 8 + 4.5 + 9 + 4.5+ 3 = 44
i= 1
Prueba de hipótesis de rangos con signo de Wilcoxon para la diferencia de medias 515
Tabla 11.9 Determinación de la prueba de rangos con signoWilcoxon para la diferencia
de medias
Tiempo de procesamiento
(en segundos)
Usuarios de Líder Paquete
proyecto actual nuevo Signo
de aplicaciones X11 Xz¡ D1 =X11 - X21 ID1 1 R, deD1
Preparación de
devolución de impuestos
Contribuyente Despacho Por el
contribuyente
José 1,459 1,910
Marcia 3,250 2,900
Alexis 1,190 1,200
Harry 8,100 7,650
Jean 13,200 15,390
Marc 9,120 9,100
JR 255,970 33,120
Billy 210 140
Richard 1,290 1,320
Ted 130 o
Bruce 5,190 6,123
'
(a) ¿Existe evidencia de que la afirmación del despacho es válida? (Utilice a =
0.05.)
(b) Analice las implicaciones de sus resultados.
13.67 El reportero del tiempo de un canal de televisión estadounidense local
informó, el miércoles lo. de junio de 1994, por la mañana, que se esperaba
que en aquel país, ese día, el clima estuviera más cálido que el martes 31 de
°
Temperatura alta ('F) Temperatura alta ( F)
Mayo 31 Junio 1 Mayo 31 Junio 1
Ciudad (real) (predicha) Ciudad (real) (predicha)
Albany 84 86 Little Rock 84 87
Albuquerque 93 89 Louisville 82 83
Austin 93 95 Miami 85 89
Birmingham 83 81 Nashville 82 83
Boise 79 83 Norfolk 79 79
Boston 84 84 Omaha 93 80
Cleveland 84 85 St. Louis 82 86
Dallas-Ft. Worth 88 92 San Diego 65 70
Denver 91 78 SanJose 80 82
Indianapolis 85 82 Seattle 69 73
Jacksonville 82 85 Tulsa 88 91
Fuente: Nueva York Times, Mayo 31, 1994, p. D8.
(a) ¿Existe evidencia que apoye la afirmación hecha por el reportero del
tiempo el miércoles primero de junio, acerca de que ese día estaría más
.1
caliente?
(b) Analice las implicaciones de sus resultados.
13.68 Los siguientes datos representan las calificaciones obtenidas en los exámenes
de medio semestre y de finales de semestre tomados de una muestra aleatoria
de los exámenes de 11 estudiantes del curso Introducción a la Economía.
Ambos exámenes tuvieron una duración de dos horas y el examen final cubría
el material visto después de la aplicación del examen de medio semestre.
Estudiante
N.A. A.B. L.B. M.B. W.B. S.D. T.). L.K. J.M. H.R. D.R.
Examen de
medio semestre 80 82 47 75 80 69 83 73 SS 70 81
Examen de
final de semestre 81 85 40 75 83 79 91 72 66 76 79
'
(a) ¿Existe evidencia de un aumento en el desempeño de los estudiantes
en la segunda mitad del semestre? (Utilice a = .05.)
(b) Analice las implicaciones de sus resultados.
e 13.69 Refiérase al problema 13.63 de la página 510.
(a) Al nivel de significación de O.OS, ¿existe evidencia de una diferencia
en la mediana del kilometraje de gasolina?
(b) ¿Existe alguna diferencia en sus resultados presentes con respecto
a los resultados obtenidos al usar la prueba t? Discuta la respuesta.
13.70 Refiérase al problema 13.64 de la página 510.
(a) Al nivel de significación de O.OS, ¿puede el director de investigación
llegar a la conclusión de que hay evidencia de que la campaña de ventas
ha aumentado la mediana de las ventas de los productos que no se han
vendido?
(b) ¿Existe alguna diferencia en sus resultados presentes con respecto a los
resultados obtenidos al usar la prueba t? Discuta la respuesta.
Prueba de hipótesis de rangos con signo de Wilcoxon para la diferencia de medias S17
..
. 1IN11 Trampas potenciales de la prueba de
hipótesis y cuestiones éticas
1 3. 1 1 • 1 Trampas potenciales
En el presente capítulo, introdujimos cuatro procedimientos de prueba estadística
que pueden ser empleados cuando se analizan posibles diferencias entre los pará
metros de dos poblaciones independientes, basándonos en muestras que con
tienen datos numéricos. Además, desarrollamos dos procedimientos de prueba que
pueden utilizarse cuando analizamos posibles diferencias entre los parámetros de
dos poblaciones relacionadas, basándonos en muestras que contienen datos nu
méricos. De nuevo, parte de un buen análisis de datos consiste en entender las
suposiciones que subyacen en cada uno de los procedimientos de prueba de
hipótesis, y utilizándolas, así como otros criterios, seleccionar el procedimiento
más apropiado para un conjunto dado de condiciones. Como se observa en el dia
grama resumen del capítulo, la principal distinción en la comparación de dos gru
pos que contienen datos numéricos está basada en el hecho de si las poblaciones
de donde se tomaron las muestras son independientes o están relacionadas. No
deberíamos utilizar procedimientos de prueba diseñados para poblaciones inde
pendientes cuando tratamos con datos apareados, y no deberíamos utilizar pro
cedimientos de prueba diseñados para poblaciones relacionadas cuando tratamos
con dos muestras independientes. Después de centrar nuestra atención en agrupa
mientos apropiados de procedimientos de prueba parecidos, necesitamos exami
nar con cuidado las suposiciones y los otros criterios antes de seleccionar un
procedimiento en particular.
Una selección de la prueba y/o el modelo adecuados es de suma importancia
para un buen investigador, y es un asunto bastante serio. Hace poco (véase refe
rencia 1), dos profesores de diferentes univers�dades levantaron cargos por mala
conducta científica ante los Institutos Nacionales de Salud (estadounidenses), en
•
contra de un profesor de una tercera universidad por haber escogido un modelo
estadístico en un artículo que había escrito sobre envenenamiento con plomo .
1 3. 1 1 • l Cuestiones éticas
Consideraciones éticas surgen cuando un investigador manipula el proceso de
prueba de hipótesis en cierto modo que le permita obtener una ganancia personal.
Resulta interesante saber que el investigador acusado de mala conducta científica
no fue acusado de fraude, plagio, alteración de datos o falsificación de resultados.
Los cargos se derivaron a partir de su elección del modelo estadístico y de los pro
cedimientos de prueba, así como del análisis de datos resultante que presentaba un
punto de vista divergente. Para que la ética llegue a ser algo de consideración; se
debe tener en cuenta si ese aspecto en el comportamiento del investigador fue con
conocimiento de causa o no. Para un mayor análisis sobre las cuestiones éticas y la
prueba de hipótesis, refiérase a la sección 11.11.2 (páginas 412 a 415) y a la sección
12.8.2 (páginas 455 a 456).
••
Diagrama resumen del capítulo 13
Juntando todo
TÉRMINOS CLAVE
diferencia media 504 prueba de suma de rangos de Wilcoxon
elementos aparedos o balanceados 503 para diferencias en dos medianas 481
mediciones repetidas 503 prueba t de varianza combinadas para
muestras relacionadas 503 diferencias en dos medias 464
poblaciones Independientes 463 prueba t' de varianza separadas pa
poblaciones relacionadas 503 diferencias en dos medias 472
problemas de Behrens-Fisher 472 prueba Z para diferencias en dos medias
prueba F para diferencias en dos 463
varianzas 489 prueba Z para la diferencia media 504
prueba de rangos con signo de Wilcoxon resultado de diferencia, D1 504
para la diferencia mediana 511 robusta 468
Condado I Condado 11
X $115 $98
s $30 $18
n 25 21
'
(f) ¿Qué suposición o suposiciones son necesarias para llevar a cabo el inciso (e)?
(g) Calcule los límites inferior y superior de los valores p de los incisos (b), (c)
y (e), e interprete su significado.
(h) Basándose en los resultados obtenidos en los incisos (a) a (g), ¿qué debería
escribir el gerente en su informe al director de sistemas de información
con respecto a los dos departamentos?
' 13.75 Una profesora de computación está interesada en estudiar la cantidad de
tiempo que le llevaría a los estudiantes inscritos en el curso Introducción a las
Computadoras escribir y correr un programa en PASCAL. La profesora le
contrata a usted para analizar los siguientes resultados (en minutos) obtenidos
de una muestra aleatoria de nueve estudiantes:
10 13 9 15 12 13 11 13 12
Notas finales
l. Para probar las diferencias en los réditos de dividendo 3. Las mediciones originales (es decir, la antigüedad de los
medianos, se debe suponer que las distribuciones de réditos empleados en años) son reemplazadas por el correspondiente
de dividendo de ambas poblaciones de las cuales se logaritmo natural de la "medición más uno", de modo que,
tomaron las muestras aleatorias son idénticas, excepto, por ejemplo, un empleado de tiempo completo con cuatro
posiblemente, en cuanto a diferencias en la localización (es años de servicio en Industrias Kalosha tendría una
decir, las medianas). "medición" transformada de 1.61, el logaritmo natural de 5.
2. Puesto que los 232 y 166 grados de libertad no se muestran 4. La fórmula de aproximación de muestra grande [ecuación
en la tabla E.S, redondeando a los valores tabulares más (13.14)] tendría como resultado un valor de Z de +2.55,
cercanos de 120 y 120 grados de libertad, el valor crítico de que es mayor que +1.645, el valor crítico de extremo
extremo superior, Fu, es 1.43 y el valor crítico de extremo superior de la distribución normal estándar con un nivel de
inferior, Fv es 1/1.43 = 0.699. Puesto que F = 1.65 >Fu= 1.43, significación de Ó de O.OS. En consecuencia, la hipótesis
la hipótesis nula es rechazada. nula sería rechazada.
Referencias
l. Begley, S., "Lead, Lies and Data Tape", Newsweek, 16 de 7. SAS User's Manual Version 6 (Raleigh, NC: SAS Institute,
marzo, 1992, p. 62. 1988).
2. Bradley, J.V., Distribution-Free Statistical Tests (Englewood 8. Satterthwaite, F.E., 11 An Approximate Distribution of
Cliffs, NJ: Prentice-Hall, 1968). Estimates of Variance Components", Biometrics Bulletin,
3. Conover, W.J., Practica/ Nonparametric Statistics, Za. ed. 1946, vol. 2, pp. 110-114.
(Nueva York: W iley, 1980). 9. Snedecor, G.W. y W.G. Cochran, Statistical Methods, 7a.
4. Daniel, W., Applied Nonparametric Statistics, Za. ed. ed. (Ames, IA: Iowa State University Press, 1980).
(Boston, MA: Houghton Mifflin, 1990). 10. STATISTIX Version 4.0 (Tallahassee, FL: Analytical
S. MINITAB Reference Manual Release 8 (State College, PA: Software, Inc., 1992).
MINITAB, Inc., 1992). 11. W iner, B.J., Statistical Principies in Experimental Design, Za.
6. Norusis, M., SPSS Guide to Data Analysis far SPSS-X with ed. (Nueva York: McGraw-Hill, 1971).
Additional Instructions far SPSS/PC+ (Chicago, IL: SPSS Inc.,
1986).