Sie sind auf Seite 1von 24

11.

FUNCIONES DE DISTRIBUCIN ESPECIALES


DISTRIBUCIN CHI
2
CUADRADO DE PEARSON
Si (X
1
,X
2
,...,X
n
) son n variables aleatorias normales independientes de media 0 y
varianza 1, la variable definida como

=
= + + =
n
1 i
2
i
2
n
2
1 n
X X X Y
se dice que tiene una distribucin !" con n #rados de libertad. Su funcin de
densidad es
0 $ e $
2
2
n
1
) $ ( f
2 % $ 2 % ) 2 n (
n
>

=

siendo


=
0
$ 1 &
d$ e X ) & ( la funcin #amma de 'uler, con &(0. )a funcin de
distribucin viene dada por

= =
x
0
dx ) x ( f ) x X ( P ) x ( F
)a media de esta distribucin es '(X)*n y su varianza +(X)*2n. 'sta distribucin es
b,sica en un determinado n-mero de pruebas no param.tricas.
Si consideramos una variable aleatoria /01(0,1), la variable aleatoria X*/
2
se
distribuye se#-n una ley de probabilidad distribucin !" con un #rado de libertad
Si tenemos n variable aleatoria independientes /
i
01(0,1), la suma de sus cuadrados
respectivos es una distribucin !" con n #rados de libertad,

=

n
1 i
2
n
2
i i
/ ) 1 , 0 ( 1 /

)a media y varianza de esta variable son respectivamente, '(X)*n y +(X)*2n
Ejemplo, 'l espesor de un semiconductor se controla mediante la variacin est,ndar
no mayor a *0.20 mm. &ara mantener controlado el proceso se toman muestras
aleatoriamente de tama3o de 20 unidades, y se considera que el sistema est, fuera de
control cuando la probabilidad de que 2 tome valor mayor o i#ual al valor de la
muestra observado es que es 0.01. 4ue se puede concluir si s*0.56mm7
1
Solucin. '$iste fuera de control si
2 2
% s ) 1 n ( con n*20 y *0.20, e$cede
181 . 92
2
18 , 01 . 0
=
'ntonces, 26 . 9:
20 . 0
56 . 0 ; 18 s ) 1 n (
2
2
2
2
= =

&or tanto, el sistema est, fuera de control


)a funcin de distribucin !" tienen importantes variaciones de acuerdo con los
#rados de libertad y del tama3o muestral (menor tama3o muestral y mayor tama3o
muestral respectivamente),

'n consecuencia, si tenemos X1,..,Xn, variable aleatoria independientes, donde cada
) , ( 1 X
i i i
, se tiene


n
1 i
2
n
2
i
i i
X
)a distribucin <i muestra su importancia cuando queremos determinar la
variabilidad (sin si#no) de cantidades que se distribuyen en torno a un valor central
si#uiendo un mecanismo normal.
Teorema (Co!ra"). Sean X
1
,=,X
n
con distribucin 1( , ), la variable aleatoria
independiente, entonces


=
n
1 i
2
1 n
2
i
n
1 i
i
X X
y
n
, 1
n
X
X
2
)a funcin <i>cuadrado es i#ual a la funcin normal elevada al cuadrado. 'sto es, el
producto de dos distribuciones de ?auss es una distribucin de <i>cuadrado. Si de
una poblacin normal, o apro$imadamente normal, se e$traen muestras aleatorias e
independientes, y se le calcula el estad@#rafo A
2
usando el valor muestral de la
varianza y el poblacional conB
2
2
2
s ) 1 n (

=
'sta funcin matem,tica est, caracterizada por el valor del n-mero de #rados de
libertad C*n>1 (donde n es el tama3o muestral). Dl i#ual que la t>Student, el valor
total del ,rea baEo la curva es i#ual a la unidad, pero la diferencia principal es que esta
no es sim.trica respecto al ori#en, sino que se e$tiende desde 0 <asta F G porque no
puede ser ne#ativa.
D medida que los #rados de libertad aumentan, la curva cambia de forma y sus
valores se <an tabulado en el ane$o de tablas estad@sticas, donde se muestran los
valores del ,rea baEo la curva, para los principales valores de A
2
, a la derec<a de .ste.
H sea, se muestra la zona de rec<azo para diferentes niveles de si#nificacin y de
#rados de libertad, lo cuales var@an entre 1 y 100. I,s all,, conviene usar
directamente la funcin de ?auss.
&ara cada #rado de libertad <ay una tabla de valores que pueden obtenerse variando el
nivel de si#nificacin, parecida a la de ?auss. 'l problema de calcular los valores
cr@ticos, para un nivel de confianza dado, se resuelve de dos manerasB usando
computadoras para resolver los c,lculos, y la otra m,s com-n, usando tablas
resumidas, en forma an,lo#a a la vista para el modelo de t>Student. )a distribucin de
A
2
se usa principalmente para analizar dispersiones. Se compara la dispersin muestral
9
e$presada a trav.s de sus cuadrados medios contra la dispersin poblacional
cuantificada a trav.s de la varianza (J
2
).
'$isten otros criterios, como el de K<onLs, que usa un error relativo admisible
m,$imo, y se calcula como un cuarto del ran#o de los valores normales de referencia,
dividido por el valor medio de dic<o intervalo (referido a la ma#nitud cl@nica en
cuestin y e$presado en porcentaEes). Kambi.n se emplea a este modelo para realizar
la llamada prueba de c<i>cuadrado en las comparaciones de frecuencias observadas
contra las frecuencias esperadas, con datos de recuento. I,s adelante se desarrolla
meEor este tema, lo mismo que su so para testear la independencia de dos o m,s
factores en una Kabla de ontin#encia.
'n la industria farmac.utica se la usa para analizar la dispersin de los componentes
de los productos terminados. Kodo remedio fabricado debe cumplir estrictas normas
de calidad, #eneralmente referidas al contenido en peso de sus principales
componentes. Se usan dos l@mitesB el superior e inferior, dentro de los cuales se los
debe mantener controlados. 'ste ran#o de valores define la dispersin m,$ima
admisible y lo ideal es que la dispersin de los productos terminados sea bastante
inferior a dic<o ran#o. 'se control de la dispersin es muy similar al e$plicado m,s
arriba, para los bioqu@micos.
Ejemplo. Mn bioqu@mico sospec<a que su micro>centr@fu#a no mantiene constante su
velocidad mientras trabaEa, lo cual le da una variabilidad indeseada en sus
determinaciones. &ara controlarla, consi#ue un tacmetro re#ulado y mide cada
minuto la velocidad durante 10 minutos. )os resultados fueronB una velocidad
promedio en las 10 mediciones de 9085 rpm con una desviacin de 100,6 rpm.
Kestear para un error relativo m,$imo del 2N o menos, si la centr@fu#a es estable.
)a desviacin est,ndar es
ma$
*2N;9085*22 rpm, lue#o,
!
0
B
ma$
O22 rpm
!
1
B
ma$
P22 rpm
6
2 . 29
22
6 . 100 ; ) 1 10 ( s ) 1 n (
2
2
2
2
2
=

=
Qe la Kabla de valores cr@ticos sur#eB A
2
0,88R8
*21,222 y A
2
0,881R8
*2:,5::. &or lo tanto, el
bioqu@mico <a encontrado una muy fuerte evidencia que la velocidad del equipo
oscila en forma indeseada, tal como sospec<aba. S deber, aEustarlo si desea disminuir
la variabilidad de sus mediciones. )os resultados fueron muy si#nificativos A
2
* 29,2
Ejemplo. Mn farmac.utico Tefe del Qpto. ontrol de alidad en una industria
alimenticia, descubre que en su proceso de produccin el contenido de ciclamato en
su l@nea de mermeladas diet.ticas var@a en forma indeseada. Sospec<ando que se trata
de una falla en el dosificador, decide tomar 10 muestras se#uidas del mismo.
'ncuentra un promedio de 20 #ramos con una desviacin de 5 #ramos. Si en su
protocolo de fabricacin la variacin m,$ima permitida es del 9N, determinar si el
dosificador debe ser corre#ido.
'l desviacin est,ndar aceptable esB
m,$
* 9N de 20 # * 2 #. )ue#oB
!
0
B
m,$
OU2 #.B el dosificador funciona correctamente
!
1
B
m,$
( 2 #.B el dosificador debe ser cambiado
12
2
5 ; ) 1 10 ( s ) 1 n (
2
2
2
2
2
=

=
Qe la Kabla de valores cr@ticos sur#eB
2
0,8VR8
*12,8. &or lo tanto, el farmac.utico no
<a encontrado evidencia que respalde sus sospec<as. Sin embar#o, el valor <allado es
muy cercano al cr@tico, por lo que le convendr@a <acer m,s pruebas.
'n estad@stica, la distribucin <i>cuadrado, tambi.n denominada <i>cuadrado de
&earson, es una distribucin de probabilidad continua con un par,metro L que
representa los #rados de libertad de la variable aleatoriaB
2
L
2
2
2
1
/ / / X + + + =
donde /
i
son variables de distribucin normal, 1(0,1) o de media cero y varianza uno.
Se suele usar la denominada prueba <i>cuadrado como test de independencia y
como test de bondad de aEuste. )a funcin de densidad <i>cuadrado es
0 $ e $
) 2 % L (
) 2 % 1 (
) $ ( f
2 % $ 1 2 % L
2 % L
L

=

W es la funcin #amma. )a funcin de distribucin es
) 2 % L (
) 2 % $ , 2 % L (
) $ ( X
L

=
V
donde Y(L,z) es la funcin #amma incompleta.
'l valor esperado y la varianza de una variable aleatoria X con distribucin <i>
cuadrada son
'ZX[ * L +ZX[ * 2L
)a distribucin <i>cuadrado tiene muc<as aplicaciones en inferencia estad@stica, por
eEemplo en el test <i>cuadrado y en la estimacin de varianzas. Kambi.n est,
involucrada en el problema de estimar la media de una poblacin normalmente
distribuida y en el problema de estimar la pendiente de una recta de re#resin lineal, a
trav.s de su papel en la distribucin t>Student, y participa en todos los problemas de
an,lisis de varianza, por su papel en la distribucin X>Snedecor, que es la distribucin
del cociente de dos variables aleatorias de distribucin <i>cuadrado e
independientes.
Rela#$" o" o%ra& '#&%r#()#o"e&. )a <i cuadrado es una distribucin binomial
inversa cuyo coeficiente de variabilidad es 10.1, esta tiene un intervalo de
confianza de 2.9 #rados en la escala de desviaciones est,ndar. &osee una
distribucin de &oisson elevada la cual asciende a V2.V m 'q en los tres
primeros cuartiles de la recta. &ara *+2 la distribucin es una distribucin
e$ponencial.
)a prueba de <i>cuadrado es una prueba no param.trica que mide la discrepancia
entre una distribucin observada y otra terica (bondad de aEuste), indicando en qu.
medida las diferencias e$istentes entre ambas, de <aberlas, se deben al azar. Kambi.n
se utiliza para probar la independencia de dos muestras entre s@, mediante la
presentacin de los datos en tablas de contin#encia. )a frmula que da el estad@stico
es la si#uienteB
( )


=
K e r i c o + a l o r
K e \ r i c o + a l o r H b s e r v a d o + a l o r
2
2
)os #rados de libertad nos vienen dados porB #l* (r>1)(L>1). Qonde r es el n-mero de
filas y L el de columnas.
2
riterio de decisinB Se acepta !
0
cuando
2
1 n ,
2

<
. 'n caso contrario se rec<aza.
Qonde representa el valor proporcionado por las tablas, se#-n el nivel de
si#nificacin ele#ido. uanto m,s se apro$ima a cero el valor de <i>cuadrado, m,s
aEustadas est,n ambas distribuciones.
CORRECCIN DE YATES
)a correccin de Sates se aplica a la prueba <i>cuadrado cuando la frecuencia de las
observaciones en al#una de las celdas es menor de 10. )a <i>cuadrado corre#idaB
( )


=
K e r i c o + a l o r
V . 0 K e \ r i c o + a l o r H b s e r v a d o + a l o r
2
2
'n #eneral, se aplica la correccin de Sates o tambi.n correccin por continuidad
cuando apro$imamos una variable discreta a una distribucin continua. )a correccin
consiste en a3adir y substraer 0,V a la variable en cuestin. &or eEemplo, obtener 9
caras al lanzar una moneda es una medida discreta (nominal) que se aEusta a la
distribucin binomial. Iientras que si la apro$im,ramos a la distribucin normal, su
valor oscilar, entre 2,V y 9,V.
DISTRIBUCIN F SNEDECOR O F,FISHER
Si M y + son dos variables aleatorias independientes que tienen distribucin <i
uadrada con n
1
y n
2
#rados de libertad, respectivamente, entonces, la variable
aleatoria
2
1
n +
n M
X =
tiene funcin de distribucin X>Snedecor
( ) ( )
( ) ( )
( )
2 % ) n n (
2 1
2 % ) 2 n (
2 1
2 % n
2 1 2 1
2 1
1
1
n % f n 1
f
2 % n 2 % n
n % n 2 % ) n n (
) f ( <
+

+

+
=
4ue es la llamada funcin de distribucin X>Snedecor o X>Xis<er con n
1
y n
2
#rados
de libertad
:
Ejemplo, Mn valor de f con 2 y 10 #rados de libertad para un ,rea de 0.8V a la
derec<a es,
f
0.8V,2,10
*1%(f
0.0V,10,2
)*1%6.02*0.262
Si de dos poblaciones normales, o apro$imadamente normales, se e$traen dos
muestras aleatorias e independientes, y a cada una se le calcula su respectiva
varianza, el cociente de ambos valores
2
2
2
1
s s X = (con X(1, esto es, siempre se
coloca el m,s #rande como numerador) tendr, una distribucin de Xis<er, cuyos
valores cr@ticos fueron obtenidos por ]. Snedecor en una tabla que se caracteriza por
tener dos #rados de libertadB el correspondiente al numerador C
1
*n
1
>1 y el del
denominador C
2
*n
2
>1. &ro#ramas de computacin permiten calcular los valores
cr@ticos respectivos
'n las Kablas se presenta una <oEa para cada nivel de confianza, se eli#en los m,s
apropiados comoB 8VN R 8:,VN R 88N R 88,VN y 88,8N. omo siempre, el ,rea total
baEo la curva es la unidad y se e$tiende desde 0 a F G. )a forma es muy parecida a la
<i>cuadrado. se muestran tres casos, con diferentes #rados de libertad, y se marca el
valor de X*2,V con una ,l@nea punteada vertical.
'l principal uso de esta funcin es el Dn,lisis de +arianza, que se ver, m,s adelante,
y es para cuando se necesita comparar m,s de dos medias mu.strales a la vez. 'n
estos casos la idea es detectar si el efecto de uno o m,s tratamientos afecta a las
muestras testeadas. 'n cambio, cuando se tiene el caso de dos muestras, la idea es
testear si <ay <omocedasticidad en las dos poblaciones en estudio. Mna vez verificado
este supuesto, se puede avanzar m,s verificando si <ay diferencia entre las medias
mu.strales, y as@ verificar si ambas muestras tienen i#ual media y varianza, porque
eso si#nifica que en realidad provienen de la misma poblacin normal. 'so probar@a
que no <ay efecto de un tratamiento si se lo compara con un placebo, o que dos
t.cnicas de laboratorio son equivalentes.
5
Si el e$perimento no verifica esto, entonces se deber, ele#ir el caso que presente
menor varianza, para tener menor variabilidad en las mediciones. 'n ?en.tica se
puede verificar si una #eneracin de cr@as es m,s variable en un car,cter que la de sus
padres. 'n Sistem,tica se puede testear si dos poblaciones locales tienen la misma
variabilidad. 'n ^ioqu@mica y Xarmacia el uso m,s frecuente es comparar el error
casual de mediciones de laboratorio, al introducir al#-n efecto o cambiar el m.todo
de medicin. 'n el caso de testear si dos t.cnicas de laboratorio tienen i#ual
dispersin, o bien, para ele#ir aquella con mayor precisin, conviene pensar el
problema como la incidencia de un factor en estudio en lu#ar de dos t.cnicas
totalmente diferentes entre s@. &or eEemplo, se trata de una misma pr,ctica, pero se
usan dos espectrofotmetros diferentes, y se trata de determinar si la modificacin de
la varianza se debe al uso de un aparato diferente. 'l factor ac, ser@aB tipo de
espectros.
Kambi.n se puede estudiar la incidencia del factor <umano, realizando las mismas
mediciones a dos personas diferentes. Qe esa forma se puede ima#inar que las dos
muestras provienen de diferentes poblaciones, o que el efecto del factor analizado no
es despreciable cuando se rec<aza la <iptesis nula. 'n la fi#ura se muestra el caso de
dos poblaciones. 'n el caso (a) ambas poblaciones tienen la misma media, pero por
efecto del error casual sus varianzas son diferentes. Si esta diferencia es si#nificativa,
resulta evidenciada por el Iodelo de Xis<er que permite la comparacin de ambas.
'n el caso (b) <ay un error sistem,tico que desplaza la media, pero sus varianzas
permanecen i#uales. 's lo mismo que sumar una constante a todos los valoresR ocurre
un desplazamiento <acia la derec<a. t>Student se usa para detectar esto cuando se
<ace el test de comparacin de dos medias independientes. omo se ver, m,s
adelante, se puede construir todo un ba#aEe de m.todos para efectuar un ontrol de
alidad interno en un laboratorio de medicin cl@nica. &or a<ora, basta decir que se
puede controlar la e$actitud con los modelos de t>Student y la precisin con los de
<i>cuadrado y Xis<er.
on esto se pueden comenzar a controlar y calibrar los sistemas de medicin. )as
limitaciones de todo esto son dosB la primera es que se puede estudiar el efecto del
factor analizado en solo dos muestras y no en m,s de dos. )a se#unda es que si la
8
calidad se entiende como e$actitud y precisin, solo se pueden emplear estos modelos
para ma#nitudes de tipo cuantitativas como las de la 4u@mica l@nica, pero no en
ma#nitudes cualitativas como las usuales en Iicrobiolo#@a, ^acteriolo#@a, Iicolo#@a,
etc. 'n ma#nitudes cuantitativas, por calidad se entiende precisin y e$actitud, en
lu#ar de la capacidad de una prueba cl@nica para dia#nosticar. Sin embar#o, a pesar de
estas limitaciones si#ue siendo una <erramienta sencilla y poderosa de control.
&ara poder aplicar este modelo se deben tener en cuenta los requisitos si#uientesB
> )as muestras fueron e$tra@das de una poblacin normal o apro$imadamente
normal.
> )a seleccin de las muestras se <izo en forma aleatoria.
> )as muestras son independientes entre s@.
Ejemplo, 'l Eefe de un laboratorio se encuentra con una t.cnica de medicin fuera del
control estad@stico. &ara investi#ar las causas decide investi#ar si el factor <umano
tiene incidencia, y toma una muestra de suero cualquiera la divide en 20 al@cuotas.
)ue#o eli#e 10 de ellas al azar y se las entre#a al laboratorista 1 para que <a#a las
determinacionesR las restantes las encomienda al laboratorista 2 para que las mida.
)os resultados obtenidos sonB s
1
2
*2,6 es la varianza obtenida por el laborista, 1 y
s
2
2
*0,5 para el otro. Qecidir si <ay diferencia en dispersin entre ambos.
!
0
B
2
2
2
1
=
!
1
B
2
2
2
1

'l estad@#rafo es
0 . 9
5 . 0
6 . 2
X
2
2
2
1
= =

=
omo se trata de un ensayo de dos colas, para un nivel del 8VN de confianza, se
busca en las tablas paraB C
1
*C
2
*n
1
>1*8 #rados de libertad, mientras que _ * 0,02V para
el l@mite inferior y _ * 0,8:V para el superior. 'stos valores son X
0,8:VR(8,8)
* 6,09.
)ue#o, para calcular el valor no tabulado _ * 0,02V se aprovec<a una propiedad que
tiene la funcin X usando la inversaB X
0,02VR(8,8)
*1%X
0,8:V
R (8,8) *1%6,09 * 0,265 omo el
valor <allado X*9 cae dentro de la zona de aceptacin, no <ay evidencia si#nificativa
10
como para decir que el factor <umano tiene incidencia en la dispersin de las
mediciones.
)a distribucin X de Snedecor aparece en los contrastes asociados a comparaciones
entre las varianzas de dos poblaciones normales. Si (X
1
,X
2
,...,X
m
) y (/
1
,/
2
,...,/
n
) son
mFn variables aleatorias normales independientes de media *0 y varianza
2
, la
variable

=
=
=
n
1 i
2
i
n
1 i
2
i
n
Z
n
1
X
m
1
Y
tiene una distribucin X
m,n
>Snedecor de m y n #rados de libertad. Su funcin de
densidad es
2 % ) 2 m (
2 % ) 2 m (
2 % m
n
m $
1 $
2
n
2
m
n
m
2
n m
) $ ( f
+

=
con $ ( 0, siendo


=
0
$ 1 &
d$ e X ) & ( la funcin #amma de 'uler con &(0.
Xinalmente, la funcin de distribucin viene dada por

= =
$
0
dt ) t ( f ) $ X ( & ) $ ( X
11
y sus momentos por la media y la varianza son
) 6 n ( ) 2 n ( m
) 2 n m ( n 2
) X ( + y
2 n
n
) X ( '
2
2

+
=

=
Qefini.ndole de otra manera, sean
2
m
2
n
S y X variables aleatorias
independientes, entonces,
m , n
X
S
X
n
m
X =
si#ue una distribucin de probabilidad X>Snedecor, con (n,m) #rados de libertad.
Hbs.rvese que X
n,m
`X
m,n
's claro que la distribucin X>Snedecor no es sim.trica, pues slo tienen densidad de
probabilidad distinta de cero, y adem,s
n , m
1
m , n
X X e n t o n c e s X X


DISTRIBUCIN %,STUDENT
Si (X,X
1
,X
2
,...,X
n
) son nF1 variables aleatorias normales independientes de media 0 y
varianza 2, la variable

=
=
n
1 i
2
i
n
X
n
1
X
S
tiene una distribucin t>Student con n #rados de libertad. Su funcin de densidad es
12
0 $
n
$
1
2
n
2
1 n
n
1
) $ ( f
2
1 n
2
>

=
+
siendo


=
0
$ 1 &
d$ e X ) & ( la funcin #amma de 'uler con &(0. )a media de la
distribucin t>Student es '(X)*0 y su varianza +(X)*n%(n>2), la cual no e$iste para
#rados de libertad menores que 2.
'sta distribucin aparece en al#unos contrastes del an,lisis normal.
)a distribucin t>Student se construye como un cociente entre una normal /01(0,1) y
la ra@z de una <i
2
n
independientes. Qe modo preciso, llamamos distribucin t>
Student con n #rados de libertad, t
n
a la de una variable aleatoria K,
n
2
n
t
n
1
/
K

=
y adem,s,
n
n
1 i
2
i
i i
t
X
n
1
X
K

=

&ara calcular
d$
n
$
1
n
2
n
2
1 n
dt ) t ( f ) t K ( &
t t
2 % ) 1 n (
2


+

= =
Sea un estad@#rafo t calculado para la media con la relacin
19
( )
n
$
t


=
0,375 n=120
n=2
n=11
0,125
-3,50 0 +3,50
Ejemplo, 'n 12 recorridos de prueba de una <ora cada uno, el consumo de #asolina
de un motor es de 12.6 #al, con una desviacin est,ndar de 2.1 #al. Qemuestre que la
afirmacin que el consumo promedio de #asolina de este motor es 12.0 #al%<ora
Solucin, Sustituyendo n*12, *12.0, $ *12.6 y s*2.1 en la formula de t>Student,
se tiene
95 . 5
12 1 . 2
0 . 12 6 . 12
n s
$
t =

=

=
&ara el cual en las tablas, para *VN y 1V #l es insi#nificante, y por tanto se puede
concluir que el consumo de 12 #al%< es real
Ejemplo, 'ncuentre los valores de la funcin paraB
a. 16 #l, *8:.VNat
0.8:V
*>t
2.VN
*>2.16V
b. &(>t
0.02V
bKbt
0.0V
)*0.82V
Si de una poblacin normal, o apro$imadamente normal, se e$traen muestras
aleatorias e independientes y a cada una se le calcula dic<o estad@#rafo usando los
valores mu.strales de la media y el desviacin est,ndar, entonces se obtiene una
distribucin muestral t. 'sta funcin matem,tica tiene un par,metro que la define en
forma un@vocaB el n-mero de #rados de libertad C*n>1 (donde n es el tama3o
muestral). 'l concepto matem,tico de C est, relacionado con la cantidad de
observaciones independientes que se <a#an y se calcula con el tama3o muestral n,
menos la cantidad L de par,metros poblacionales que deban ser estimados a trav.s de
ellas. H seaB C*n.L. Si se observa la ecuacin superior, se ve que el -nico par,metro
poblacional que fi#ura es c, por lo tanto L*1 y as@ resulta C*n.1. uando el tama3o
muestral es mayor que 90 la distribucin de t>Student se apro$ima muc<o a la de
?auss, en el l@mite ambas son i#uales.
16
's decir que la funcin t>Student tiende asintticamente a la funcin de ?auss. &ara
cada #rado de libertad <ay una tabla de valores que pueden obtenerse variando el
nivel de si#nificacin, parecida a la de ?auss. )a distribucin de t>Student, al i#ual
que la de ?auss, es sim.trica respecto al ori#en de coordenadas y se e$tiende desde d
G <asta F G. &ero a diferencia de la normal, puede adoptar diferentes formas
dependiendo del n-mero de #rados de libertad. &or eEemplo, la que tiene un solo
#rado de libertad (n*2 y C*1), se desv@a marcadamente de la normal, como se puede
ver en la fi#ura anterior. )ue#o, a medida que los #rados van aumentando, se acerca
cada vez m,s, <asta i#ualarla en el infinito.
)os intervalos de confianza para esta distribucin se arman en forma an,lo#a a la
vista para el caso de ?auss. on la -nica diferencia en cmo se calcula el valor cr@tico
t
_RC
en lu#ar de z_.
) ; t (
e , e


)a teor@a de decisiones se usa en forma an,lo#a, empleando los intervalos de
confianza visto m,s arriba. &ero para poder aplicar este modelo se deben tener en
cuenta los requisitos si#uientesB
> )as muestras fueron e$tra@das de una poblacin normal o apro$imadamente
normal.
> )a seleccin de las muestras se <izo en forma aleatoria.
> )as muestras son independientes entre s@.
Si al#uno de ellos no se cumple, las conclusiones que se obten#an no son v,lidas. )os
supuestos se pueden resumir as@B para poder usar t>Student, se deben tener muestras
normales, aleatorias e independientes. 1otar que el error est,ndar de estimacin es J
e
.
> %,S%)'e"% para me'#a& m)e&%rale&. 'n este caso e *.$ lue#oB c
e
*c y J
e
2
*s
2
%n . &or
lo tanto el valor de comparacin se calcula,
( )
n s
$
t

=
Ejemplo. Se desea saber si un instrumento de medicin cualquiera est, calibrado,
desde el punto de vista de la e$actitud. &ara ello se consi#ue un valor patrn y se lo
mide 10 veces (por eEemploB una pesa patrn para una balanza, un suero control para
un m.todo cl@nico, etc.). Suponiendo que el resultado de estas mediciones arroEa una
media de V2,8 y una desviacin de 9, usando un patrn de valor V0, se debe
determinar si el instrumento est, calibrado y la estimacin de su error sistem,tico, si
es que se prueba su e$istencia (no se usan unidades para #eneralizar este eEemplo).
!
o
B U* V0 el instrumento est, calibrado en e$actitud
!
1
B U`UV0 no est, calibrado. !ay un error sistem,tico
1V
Se trata de un ensayo de dos colas donde <ay U *10d1*8 #rados de libertad. Qe la
Kabla t>Student se obtienen los valores cr@ticos para el 8VN de t
0,0V;U8
= U2,222, para el
88N de t
0,01;U8
= U9,2V y para un nivel del 88,8N es t
0,001;U8
= U6,:51. )o que permite
establecer las zonas de aceptacin y rec<azoB
( )
9
10 9
0 . V0 8 . V2
t =

=
QibuEando las zonas con los valores cr@ticos, el valor de t cae en la de rec<azo para el
8VN y no alcanza para las otras. )a conclusin es que se <a probado la e$istencia de
un error sistem,tico con una confianza del 8VN.
Ejemplo. Se midi colesterol total a 11 pacientes varones adultos esco#idos al azar
los resultados obtenidos arroEan una media de 29V m#%dl y un desviacin est,ndar de
9V m#%dl. 'nsayar la <iptesis de que se mantienen por debaEo del valor l@mite de
referencia de 220 m#%dl
.
!
o
B O220 m#%dl
!
1
B P220 ,#%dl
'l valor t>Student para una sola cola es,
12
( )
62 . 1
11 9V
220 29V
t =

=
+alor no si#nificativo pues t
0.0V,10
*1.51, entonces cae dentro del intervalo del 8VN
&ara el caso de una cola, el valor de tablas para el 8VN debe ser el que est, en la
Kabla t>Student para el 80N en dos colas. )a idea es que el 10N en dos colas
si#nifica el VN en cada una, por la simetr@a de la curva de t>Student. )ue#o, para
U*10, el l@mite para el 8VN ser, t * 1,512 en una cola y t * 2,225 para dos colas. )a
conclusin es que no puede rec<azar la <iptesis nula, por lo que debe considerarse
un colesterol total admisible desde el punto de vista cl@nico, por estar por debaEo del
l@mite de referencia.
, %,S%)'e"% para propor#o"e&. 'n este caso e*& y c
p
*c*e lue#o con se puede
obtener el valor del estad@#rafo de comparacin con la relacin,
( )
( ) n 1
&
t


=
Ejemplo. Mn anal#.sico de plaza, afirma en su propa#anda que alivia el dolor en el
80N de los casos antes de la primera <ora lue#o de su in#esta. &ara validar esa
informacin, se <ace un e$perimento en 20 individuos con cefalea. Se observa que
fue efectivo en 1V de ellos.
!
o
B P0.8
!
1
B O0.8
'l valor t>Student para una sola cola es, siendo & el porcentaEe de .$itos
&*1V%20*0.:V y la media de *0.80 con desviacin 02: . 0 20 % 1 . 0 ; 8 . 0 = =
( )
26 . 2
02: . 0
80 . 0 :V . 0
t =

=
1:
+alor es si#nificativo pues t
0.888,18
*>9.V:8 o t
0.88,18
*>2.V98 o t
0.8V,18
*>1.:28, entonces
cae fuera del intervalo del 8VN. Qe todas formas la evidencia no alcanza para
rec<azar la <iptesis a los niveles del 88N y 88,8N. Se la rec<aza al nivel de 8VN
-nicamente. Si bien no es tan terminante, se puede afirmar que la aseveracin es falsa
con un 8VN de confianza.
, %,S%)'e"% para 'o& m)e&%ra& #"'epe"'#e"%e&. 'l modelo de t>Student tambi.n
se puede usar cuando se desean comparar dos muestras entre s@, para detectar si
<ay diferencia si#nificativa entre ellas, debido a al#-n factor analizado. 'n primer
lu#ar se analizar, el caso de dos muestras independientes comoB aplicar dos tipos
de remedios a dos #rupos de pacientes esco#idos al azar, o las mediciones
repetidas de una misma ma#nitud, etc. 'l otro caso, cuando las muestras no son
independientes sino apareadas, se ver, en el pr$imo tema. Mna vez m,s, los
supuestos para poder aplicar este modelo se resumen enB para poder comparar con
t>Student, las dos muestras deben ser normales, aleatorias e independientes.
Se sacan muestras aleatorias e independientes, de dos poblaciones normales. )a idea
es averi#uar si ambas muestras provienen de la misma poblacin o de poblaciones
diferentes. on eso se puede ver si el efecto de los ftratamientosg aplicados a las
muestras es apreciable, en cuyo caso las muestras parecer,n provenir de diferentes
poblaciones. Se usa en los casos donde se compara el efecto de una dro#a aplicada a
un #rupo de pacientes, contra otro #rupo al cual se le suministra un placebo. Kambi.n
para comparar dos t.cnicas cl@nicas y detectar si <ay diferencias, por eEemploB dos
marcas comerciales de plaza, dos instrumentos de medicin, dos individuos, dos
t.cnicas diferentes (la nueva contra la vieEa), dos protocolos, etc. on estas
comparaciones se pueden realizar muc<os controles internos en el laboratorio para
<acer calibraciones, medir eficacia, etc. !ay una limitacinB solo se pueden comparar
dos muestras entre s@ a la vez y nada m,s. &ara el caso de tener m,s de dos muestras,
se recurre a los modelos de Dnova.
, Compara#$" 'e me'#a&. &ara estos casos, el valor de t>Student para validaciones
de medias se calcula conB
( ) ( )
2
2
2
1
2
1
2 1 2 1
n
s
n
s
$ $
t
+

=
'l cual se contrasta con t
_RC
donde C*n
1
Fn
2
>2 #rados de libertad. !ay casos
particulares cuandoB las muestras son de i#ual tama3o y%o las muestras son
<omoced,sticas (tienen i#ual varianza). 'n ambos casos se simplifican las frmulas
de c,lculo.
15
Ejemplo. Se aplica un medicamento a 1V pacientes que padecen cierta enfermedad,
esco#idos al azar, y un placebo a 20 pacientes. 'n el primer #rupo, la desaparicin del
estado febril se observa a las 18 <oras de tratamiento en promedio (con una
desviacin de 2 <.). 'n el #rupo control, la meEor@a se observa en promedio las 2V
<oras con un desviacin de 9 <oras. Qecidir si el medicamento modifica el tiempo de
curacin.
!
o
B
1
*
2
!
1
B
1
`
2
'l valor t>Student para dos colas para 99 #l, siendo
( )
02 . :
1V
6
20
8
0 18 2V
t =
+

=
+alor cae fuera del intervalo, como el valor <allado de t es muc<o m,s #rande que el
valor cr@tico de tablas para 99 #rados de libertadB t
_RC
*t
0,888R99
*9,66 (ensayo de dos
colas y un 88,8N de confianza), por tanto se obtuvieron resultados altamente
si#nificativos como para rec<azar la <iptesis nula. Se tiene una prueba cient@fica del
efecto del medicamento.
Ejemplo. Se desea verificar si <ay diferencia en las mediciones a trav.s de dos
m.todos cl@nicos diferentes. Se toma una muestra de suero lo suficientemente #rande
como para obtener 10 al@cuotas. Se distribuyen al azar V al@cuotas para cada m.todo.
'fectuadas las mediciones, con el primero se tuvo una media de 5V m#%dl con un
desviacin de 5 m#%dl. Iientras que con el se#undo se tuvo una media de 59 m#%dl
con un desviacin de 2 m#%dl.
18
!
o
B
1
*
2
!
1
B
1
`
2
'l valor t>Student para dos colas para 99 #l, siendo
( )
66 . 0
V
92
V
26
0 59 5V
t =
+

=
&or tanto, no se puede rec<azar !
0
, pues <ay diferencia entre ambos m.todos
> Compara#$" 'e propor#o"e&. &ara estos casos, el valor de t>Student para
validaciones de proporciones se calcula la misma frmula, pero reemplazando los
valores esperados con
2
2 2
1
1 1 2
2 1 2 1 2 1
n
) 1 (
n
) 1 (
) (

+

= =

'ntonces, el valor de comparacin del modelo t>Student para este caso es,
2
2 2
1
1 1
2 1 2 1
n
) 1 (
n
) 1 (
) ( ) p p (
t

+


=
ontrastando con el valor de tablas dado por t
_RC
R con C* n
1
Fn
2
>2 #rados de libertad.
Ejemplo. Se esco#en al azar dos #rupos formados por 20 individuos cada uno, entre
los que padecen cierta aler#ia. Se administra una dro#a curativa al primer #rupo y se
observa una meEor@a en 1V de los casos. Dl se#undo #rupo se le administra un placebo
y meEoran 19 de ellos. 'nsayar la <iptesis que la dro#a sirve para curar ese tipo de
aler#ia. Se emplean las <iptesis si#uientesB
!
0
B c
1>2
* 0 las diferencias observadas se deben al azar
!
1
B c
1>2
` 0 la dro#a produce efecto.
20
Si se supone que ambas muestras fueron e$tra@das de la misma poblacin, y por lo
tanto no <ay diferencias entre las muestras observadas (!
0
) c
1>2
* 0, eso si#nifica que
el porcentaEe de curados en dic<a poblacin ser, e*e
1
*e
2
y <abr, que estimarlo con
los datos mu.strales, calculando la proporcin ponderada conB
p*( total de curados en las muestras % total muestral ) * (1VF19) % 60 * 0,:
'ntonces, sacando factor com-n en la frmula de la varianza, esta resultaB
2
(e) * e
(1.e) Z2 / n[ *(0,: . 0,9) (2%20) * 0,021
S es (e) * 0,16VR de los datos del problema sur#en &
1
*1V%20 * 0,:V y &
2
* 19%20 *
0, 2V
t * ( 0,:V d 0,2V ) % (0,021)1%2* 0,28 b t
0,8V R 95
*2,02. c
1>2
* 0 cae dentro de 8VN.
Mn resultado no si#nificativo. )as diferencias observadas no se deben a la dro#a sino
al azar.
, Te&% 'e e-)#.ale"#a (#ol$/#a. !ay ocasiones donde la !o no busca establecer si
<ay o no diferencia entre dos muestras, como las del eEemplo anterior, sino que se
trata de establecer si un m.todo cl@nico o tratamiento nuevo es lo suficientemente
bueno como para reemplaza al que se ven@a usando <asta entonces, el m.todo
vieEo. )as ventaEas de este nuevo m.todo pueden serB un costo menor, m,s r,pido,
menos da3ino o peli#roso para el paciente, etc. )a cuestin b,sica aqu@ es ver si,
en promedio, la diferencia entre ambos es menor que un cierto valor l@mite para la
ma#nitud estudiada. 's decir que tal diferencia no implique una inferioridad del
nuevo m.todo, desde un punto de vista cl@nico.
&ara estos casos la !
o
B )a diferencia entre ambos promedios es mayor o i#ual al valor
aceptable y la alternativa es !
1
B 'sta diferencia de medias es menor al valor cr@ticoR
en cuyo caso ambos m.todos pueden ser considerados cl@nicamente equivalentes. )a
idea es que, si se rec<aza la !
o
se puede usar el m.todo nuevo en lu#ar del vieEo y
aprovec<ar las ventaEas que este posee. &ero la decisin se basa m,s en
consideraciones m.dicas que estad@sticas. 'ntonces, si se trata de ma#nitudes
continuas, se puede usar el test de t>Student para comparar la diferencia de las dos
medias contra el valor cr@tico h o m,$imo aceptable desde el punto de vista cl@nico.
'l planteo se <ace as@B !
o
B c
+
d c
1
* . ( h. Qonde c
+
es el valor poblacional que se
obtiene con el m.todo vieEo y c1 con el m.todo nuevo, . es la diferencia real entre
ambos m.todos y h es la diferencia m,$ima admisible entre ambos m.todos. Qe esta
manera, cuando !o pueda rec<azarse se tendr, evidencia suficiente como para
efectuar el reemplazo, esto es cuando !
1
B c
+
d c
1
* . b h.
Se trata de un ensayo de una sola cola. &ero cuando se trate de ver si en valor
absoluto la diferencia entre ambos m.todos no supere a un cierto valor h, porque aqu@
21
no interesa tanto que sea menor, sino que tambi.n interesa que no sea mayor
(dependiendo de la ma#nitud cl@nica analizada)R entonces la !o ser, B c
+
dc
1
*h y el
ensayo ser, de dos colas. Dn,lo#o al visto en el punto anterior. &ara ilustrar este
procedimiento se usar, un eEemplo tomado de la obra de Drmita#e
Ejemplo. Sea el @ndice card@aco " (respuesta cardiaca normalizada para la superficie
del cuerpo) el cual se mide con un procedimiento invasivo como es el colocar un
cat.ter en el corazn del paciente llamado Kermo>dilucin (el m.todo vieEo) y la
unidad de medicin son litros por minuto tomado por m2 de superficie del cuerpo
<umano. Se <a propuesto una nueva manera de medir esa ma#nitud con una t.cnica
no invasiva, llamada el m.todo de la ^ioimpedancia, en la cual se le adosa un
instrumento al cuerpo de paciente en forma e$terna, y mide en forma el.ctrica el
valor del " usando una escala adecuada (el m.todo nuevo). 'l criterio cl@nico de
aceptacin esB el nuevo m.todo se considerar, equivalente al vieEo cuando, en
promedio, el valor obtenido difiera en un 20N respecto al promedio aceptado de 2,:V
l % min. % m2 para el m.todo del cat.ter. 'sto si#nifica que el 20N de tal valor es h *
0,VV. )ue#o el planteo se <ace as@B
!
o
B .c
+
d c
1
. * ... ( h * 0,VV o lo que es lo mismo (c
+
d c
1
) * h * 0,VV
!
1
B .c
+
d c
1
. * ... b h * 0,VV cuyo equivalente es (c
+
d c
1
) * h ` 0,VV
Se toma una muestra de 1*82 individuos a los cuales se le aplica el m.todo nuevo,
los valores encontrados fueron un promedio de 2,25 l % min. % m2, y un desviacin
est,ndar de 0,22 l % min. % m2 lue#o ser,,
( )
262 . 2
82
22 . 0
:V . 2 25 . 2
n
$
t =


=
omo se observa t*>2.262 es mayor que t
0.88,8V
*>2.22, lo que indica que <ay evidencia
si#nificativa como para rec<azar a !
0
22
)a conclusin final es que se puede usar el m.todo nuevo en lu#ar del vieEo, con una
#ran ventaEa para el paciente, pues a<ora ya no tendr, que ser cateterizado para
efectuarle su medicin del @ndice card@aco. D este procedimiento estad@stico
aparecido en los -ltimos a3os en Iedicina se lo conoce tambi.n con el nombre de
test de equivalencias m.dicas o biol#icas.
> %,S%)'e"% para 'o& m)e&%ra& aparea'a&. 'l modelo de t>Student se puede usar
para el caso especial de muestras apareadas, esto es, cuando se le efect-an dos
tratamientos a la misma muestraR por eEemplo, del tipo antes d despu.s donde al
mismo individuo se lo mide dos veces para ver el efecto del tratamiento realizado,
o el caso de m.todo nuevo contra el m.todo vieEo, donde al mismo #rupo de
pacientes se le <acen dos mediciones a cada uno, la del m.todo de rutina <abitual y
una e$tra con el nuevo m.todo a probar para decidirse entre ambos. )a idea b,sica
es como si#ueB se sacan n muestras aleatorias e independientes de una poblacin
normal. D cada muestra se le aplican dos tratamientos D y ^ diferentes y lo que
interesa detectar es si producen al#-n efecto apreciable.
'ste caso es muy diferente al anterior si bien las muestras son independientes entre s@,
los tratamientos no lo son, porque a un mismo individuo se le aplican ambos
tratamientos. 'ntonces, la misma persona aparecer, dos veces en los resultadosB uno
en el #rupo D y el otro en el #rupo ^.
'l truco para resolver este problema de la independencia es trabaEar con la diferencia
de los resultados de cada par de mediciones efectuadasB d*$
D
>$
^
. )ue#o se tendr,n n
diferencias d
1
Rd
2
Rd
9
...d
n
, que son independientes entre s@, puesto que cada valor di
corresponde a un solo individuo. )ue#o, se le aplica el modelo t>Student para una
sola muestra, ensayando la <iptesis de que no <ay diferencias entre ambos #rupos. H
sea, efectuando
n
H d
t

=
)as <iptesis "nicial y alterna implica un efecto diferente para cada #rupo, !
0
Bc
d
*0
!
1
Bc
d
`0. Si se prueba que el valor esperado del promedio de las diferencias es
diferente de cero, entonces el tratamiento aplicado produce un efecto demostrable.
&ara aclarar estas ideas se presenta el si#uiente casoB
Ejemplo. Se esco#en V pacientes al azar, del #rupo que concurre diariamente al
)aboratorio de Dn,lisis l@nicos a efectuarse una determinacin de Mremia. )as
muestras e$tra@das se miden con el procedimiento <abitual y adem,s con una nueva
t.cnica cl@nica que se desea probar. +er si <ay diferencia entre ambas t.cnicas. )os
resultados e$presados en #%l fueronB
29
&aciente 1 2 9 6 V
+ieEa 0.95 0.V6 0.22 0.11 0.29
1ueva 0.99 0.6V 0.1V 0.08 0.22
Qiferencia 0.0V 0.08 0.0: 0.02 0.01
&romedio y desviacin est,ndar, respectivamenteB 0.065 y 0.099
on los valores de las diferencias se calculan
099 . 0 y 065 . 0 d = =
, lue#o
2V . 9
V 099 . 0
065 . 0
t = =
4ue obviamente es mayor que t
0.8V,6
*2.::2, entonces H cae por fuera del intervalo, y
entonces se tienen evidencia si#nificativa de que <ay diferencia entre ambas t.cnicas
TABLAS
'n el Dne$o de incluyen las tablas de las funciones 1ormal, <i uadrado, t>Student
y X>Snedecor
26