Sie sind auf Seite 1von 20

Introduccin

Esta distribucin fue investigada originalmente por Willian S. Gosset (1908) quien
publico sus escritos con el seudnimo Student (Estudiante) y en su memoria
suele llamarse Distribucin t de Student
Para obtener la funcin de esta distribucin, Gosset supuso que las muestras eran
tomadas de una poblacin normal. Luego, pudo demostrarse que an cuando la
poblacin no sea normal, si su distribucin tiene forma de campana, sigue
proporcionando valores que se aproxima bastante a la t de Student.
El principal campo de aplicacin de la distribucin t se refiere a la inferencia
acerca de una media y dos medias poblacionales cuando el tamao de la muestra
es pequeo, se desconoce la desviacin estndar de la poblacin y al aplicarla, se
supone que la poblacin de donde se selecciona la muestra es normal o
aproximacin normal. En este captulo se estudian los procedimientos de
inferencia acerca de una media y dos medias poblacionales cuando e tienen esas
condiciones.
A continuacin se va a introducir el concepto de grados de libertad, que se
necesita `para comprender la definicin de la variable alectoria t.
CONCEPTO DE GRADOS DE LIBERTAD
Recurdese que la varianza de una muestra de una muestra requiere del clculo
n

de :

( X i X )
i=1

Por lo tanto, para calcular S2 se necesita conocer primero el valor de la media

muestral ( X ). Por consiguiente se puede decir que solo n-1 de los valores de la
muestra estn libres ara variar, es decir hay n-1 grados de libertad.
Los grados de libertad se denotan por la letra griega (nu) y se determinan por e
nmero de comparaciones linealmente independientes que se pueden hacer entre
las n observaciones.
Definiciones:
La distrbuciones t de student , surgen como el cociente de dos variables alectorias
independientes: una normal estadantarizada en el numerador (Z) y la raz
cuadrada de una JI- cuadrada(2) entre sus grados de libertad () en el
denominador. Es decir

a. La variable alectorizada Z, definida por:


Z=

Tiene distribucin N(0,1)


b. La variable alectoria U, definida por:
n

X X
U= i

i=1

Tiene distribucin Ji cuadrado (2) con (un) grados de libertad.


Las variables Z
independientes.

2 definidas

anteriormente

son

variables

alectorias

Tomando en cuenta consideraciones, matemticamente, la variable alectorias:


t=

X2
v

Tiene distribucin t de student con grados de libertad.


Una variable alectoria continua X se distribuye segn una t con grados de
libertad si su funcin de densidad est dada por:

[ ]

+1
2
2
f ( x )=
1+

()

( +1) /2

< x<

Donde el parmetro es un entero positivo.


Caractersticas:
1. Parmetro: una distribucin t queda completamente descrita por su nico
parmetro, el nmero de grados de libertad ( ).
2. Es una variable alectoria continua.
3. Forma: es una distribucin unimodal y simtrica con respecto a su media.
4. Rango: el campo de variacin de esta variable es ( < x < .

5. La media de la distribucin t es:


E(T)=0
Varianza de la distribucin t , cuando 3 es:
v
V ( t )=
v2
6. La familia de distribucin: Existe una distribucin t diferente, para cada
grado de libertad, cada una de las cuales tiene la misma media (0) pero una
desviacin tpica diferente, dependiendo de los grados de libertad.
7. Aproximacin a la normal: A medida que aumenta el nmero de grados
de libertad, la distribucin T se aproxima en forma gradual a la distribucin
normal hasta que las dos son prcticamente iguales

Comparacin entre la distribucin normal estandarizada y la


distribucin t

La distribucin t es similar a la distribucin normal estandarizada (Z) en los


siguientes procesos:
Son distribucin continuas, unimodales y simtricas con respecto a su
media.
Tiene forma de campana.
El recorrido abarca dese menos infinito hasta mas infinito.
El valor esperado de una variable t coincide con el valor esperado de una
variable Z, es decir E(t)=0 y E(z)=0.
La distribucin t se diferencia de la distribucin Z en los siguientes aspectos.
Cuando los grados de libertad son pequeos, la distribucin t tienen mayor
variabilidad que la distribucin Z, debido a que

V ( t )=

v
>1
v2

y Var(Z)=1

independientemente del tamao de la muestra por lo tanto la curva t est


ms extendida en la parte de las colas y ms aplanada en la zona del
centro.

Existen muchas distribuciones t, mientras que slo hay una distribucin


normal estndarizada.
Mientras que la forma de la distribucin normal general depende del valor
de la media () y de la desviacin tpica (), la forma de la t depende
nicamente de los grados de libertad.

Uso de la Tabla
La tabla estadstica da la informacin concerniente a la distribucin t de student.
En la tabla 1.1 se muestra una reproduccin parcial de la tabla.

Tabla 1,1 reproduccin parcial de la tabla 9 de las tablas estadsticas.


En la primera fila de esta tabla (Q) se presenta las probabilidades que se
sitan en la cola superior (o inferior) de la distribucin.
En la segunda fila (2Q) se especifican las probabilidades ubicadas en los
dos extremos de la distribucin. Cada una de las probabilidades
presentadas en las filas 2Q es igual a la suma de ambas reas, la de la cola
superior y la de la cola inferior de la distribucin.
En la primera columna de esta tabla se enuncian los valores de los grados
de libertad, que van de (1,2,,30,40,60,120, ).
Los valores de la variables t se dan ene l cuerpo de la tabla, estos valores
indican el valor de t tal que a su derecha (o su izquierda), o en los dos
extremos se encuentran un rea especificada, segn se muestra en la
figura

Se observa que en la tabla solamente aparecen los valores positivos de la t, los


valores negativos quedan debido al hecho de que la distribucin t es simtrica con
respecto a su media que es igual a cero, por lo tanto, el valor t que deja a su
derecha un rea es igual al valor de t que deja a su izquierda un rea ; pero
con signo cambiado.

Ejemplos relacionados con el uso de la tabla T


Dada una variable alectoria t de student con 12 grados de libertad, hallar el
valor t que deja un rea de 0,05 a su derecha.

Solucin: En la tabla 9 se ubica en la primera columna el N de grados de libertad


que en este caso es 12, en la primera fila se localizan el valor de Q=0,05 y se halla
que el valor de t es igual a 1,782.
Dada una variable alectoria t de student con 12 grados de libertad, hallar el
valor t que deja un rea de 0,05 a su izquierda.

Solucin: debido a la simetra de la distribucin se tiene que el valor es el mismo


que en el ejemplo anterior, pero con signo cambiado, es decir t=-1,782.
Dada una variable alectoria t de student con 12 grados de libertad, hallar el
valor t que deja un rea total es de 5% en ambos lados extremos de su
valor.

Solucin: En la tabla 9 se ubica en la primera columna el N de grados de libertad


=12, en la segunda fila se localizan el valor 2Q=0,05 y se halla que el valor t para
la cola derecha es igual a 2,179, debido a la simetra de la distribucin el valor t
para la cola izquierda es el mismo, pero con signo cambiado, es decir t=-2.179
Nota:
Observando la tabla, puede verse que la distribucin t cuando los grados de
libertad son grandes se acerca a la distribucin Z. por ejemplo, el valor Z que corta
el 5% superior de la distribucin es 1.645 y los valores t que cortan el 5%superior
de la distribucin para v =10,20,30 y 60 son 1,812; 1,725;1,697 y 1,671,
respectivamente. El valor t se vuelve cada vez ms cercano a 1,645 conforme el
valor de los grados de libertad se vuelve cada vez ms grande. Cuando tienden
a infinito, el valor t que corta el 5% superior de la distribucin es igual que
coinciden con el valor Z.

APLICACIONES

En este captulo se va a utilizar la distribucin t para hacer inferencia acerca de


una y dos medias poblacionales en los siguientes casos:
Estimacin y prueba de hiptesis acerca de una media poblacional (cuando
el tamao de la muestra es pequeo, seleccionada de una poblacin
normal y aproximacin normal y la varianza poblacional desconocida).
Estimacin y prueba de hiptesis acerca de dos medias poblacionales
cuando:
Las muestras son independientes, varianzas poblacionales
desconocidas y las muestras de tamao pequeo, seleccionadas de
poblaciones normales o aproximadamente normales.
Las muestras son dependientes, varianzas poblacionales
desconocidas y las muestras de tamao pequeo, seleccionadas de
poblaciones normales o aproximadamente normales.
INFERENCIA ESTADSTICA CON RESPECTO A UNA MEDIA POBLACIONAL
Se puede realizarla inferencia estadstica con respecto a una media poblacional,
utilizando la estimacin o la prueba de hiptesis.
Recurdese que la estimacin es el proceso mediante el cual utiliza los resultados
de una muestra representativa para estimar el valor del parmetro poblacional
desconocido, y la prueba de hiptesis los utiliza para tomar decisiones acera de
poblaciones o sus para metros.
En la asignatura se estudiaron los procedimientos a seguir para hacer inferencia
acerca de una media poblacional, en los siguientes casos:
Cuando se conoce la desviacin estndar poblacional() sin importar que el
tamao de la muestra sea grande o pequeo y la poblacin de donde se
extrae la muestra es normal, el estadstico apropiado es:

Z=

X
X
=
x

El cual tiene distribucin N(0,1).


Cuando no se conoce la desviacin estndar poblacional () pero el tamao
de la muestra es grande (n30), entonces, la desviacin estndar muestral
(S) es una buna estimacin de la desviacin estndar poblacional (); es
decir: S , y el estadstico apropiado es:

Z=

X
X
=
x

El cual tiene distribucin N(0,1).


Sin embargo, la distribucin normal no es apropiado, cuando no se conocen la
desviacin estndar de la poblacin (), el tamao de la muestra es pequeo
(n<30) y la poblacin de donde se selecciona la muestra es normal o
aproximadamente normal. Cuando se tienen estas condiciones la distribucin
apropiada es la distribucin t.
Se demuestran que la desviacin estndar muestral es tanto ms pequea que la
desviacin estndar poblacional, cuanto menor sea el tamao de la muestra.
S si n 30 (muestra grande)
S si n < 30 (muestra pequea)
Cuando () es desconocida y n< 30, se puede sustituir a por S en la
estandarizacin, es decir:

X
S
n

Ahora bien, al sustituir por S, la distribucin resultante ya no es normal, ya que


en la razn

X
S
n

se le ha aadido un elemento ms de incertidumbre (el

estimador S). Se demuestra que el cociente

X
S
n

variable alectoria se denota de la siguiente manera:


t=

X
X
=
S
S x
n

sigue una distribucin t y su

El cual tiene distribucin t con = n-1


ESTIMACIN PARA LA MEDIA DE UNA POBLACIN ()
Estimacin puntual: El mejor estimador puntual de la media poblacional ()
X
est dado por la media muestral (

Estimacin por intervalo: Se utiliza para obtener los limite del intervalo de
confianza para la media de una poblacin en los siguientes casos:
Cuando se conoce la desviacin estandar poblacional (), sin
importar que el tamao de la muestra sea grande o pequea y la
poblacin de donde se extrae la muestra es normal. Bajo estas
condiciones, los lmites del intervalo de confianza para la media de
una poblacin son:
Z
X Z x = X
2
2 n
Cuando no se conoce la desviacin estndar poblacional () pero el
tamao de la muestra es grande (n30), entonces, la desviacin
estndar de la muestra (S) es un buen estimador de la desviacin
estndar poblacional (). Bajo estas condiciones, los lmites del
intervalo de confianza para la media de la poblacin son:
Z ^
X Z ^ x = X
2
2 n
Sin embargo, existen situaciones en la vida real en las cuales se desea estimar
una media poblacional () cuando se desconoce la desviacin estndar
poblacional () y el tamao de la muestra es pequeo (n < 30), debido a que
existen limitaciones operativas que frecuentemente limitan el tamao de la
muestra. En este caso, se pueden calcular los lmites del intervalo de confianza
utilizando la distribucin t, cuando la poblacin de donde se selecciona la muestra
tiene distribucin normal o aproximadamente normal.
Como la distribucin t, al igual que la distribucin normal estndar, es simtrica
con respecto a su media =0, se puede utilizar para calcular un intervalo de
confianza de (1- )% para la media poblacional, usando la distribucin t, el mismo
procedimiento que se sigui con la distribucin normal, la nica diferencia es que
t /2 toma el lugar de Z /2 y S el lugar de , por lo tanto, los lmites del intervalo de
confianza para la media poblacional () son:

X t

n1 ;

S
n

Dnde:
X

: Es la media de la muestra y se utiliza como el estimador puntual de la

media poblacional. Se calcula mediante la siguientes formula.

X =
n
t

n1 ;

Xi

=
X

Xi f i
n

:Es un valor que se busca en la tabla estadstica con n-1 grados e libertad

y una probabilidad de /2 , si se utilizan la primera fila de la tabla (Q) o una


probabilidad de , si se utilizan directamente la segunda fila de la tabla (Q2)
porque en ella se recoge el total del problema.
S: Es la desviacin estndar de la muestra y se calcula mediante una de la
siguientes formulas.
S=

( X i X ) = X 2i n X 2
n1

n1

( para datos agrupados)

Ejemplo:
El gerente de un supermercado esta interesado en estimar el tiempo promedio de
espera de los clientes en una caja en las horas piso. Para ello, se toma una
muestra aleatoria de 18 clientes y se anota sus tiempos de espera, obtenindose

un tiempo promedio de espera de 6 minutos, con una desviacin estndar de 2


minutos. En base a esta informacin encuentre:
a. La mejor estimacin puntual para el verdadero tiempo promedio de espera
de los clientes.
b. Un intervalo de confianza del 95% para estimar el verdadero tiempo
promedio de espera de los clientes.
c. Interprete el intervalo de confianza obtenido en la parte (b).
d. Cules supuestos son necesarios para realizar la estimacin de la parte (b)?
Solucin:
N=18
X =6 Minutos
media muestral
S= 2 minutos

desviacin estndar de la muestra.

a. La mejor estimacin puntual para el verdadero tiempo promedio de espera

de los clientes es X =6 minutos.


b. En este ejercicio se utilza la distribucin t, porque el tamao de la muestra
es pequeo (n< 30), la desviacin estndar poblacional desconocida y se
supone que el tiempo de espera de los clientes se distribuye normalmente.
Por lo tanto, los lmites del intervalo de confianza para la media poblacional
() son:

X t

n1 ;

S
n

El primer paso para calcular el intervalo es obtener la estimacin puntual del

parmetro de inters, que en este ejercicio es la media muestral ( X = 6


minutos ( estimacin puntual).

El segundo paso es buscar en la tabla el valor

n1 ;

que en este ejercicio

seria:
t

181 ;

o, o5
2

=t 17; o ,o 25 =2,110

El tercer paso es calcular el error estndar de la media muestral.

S x =

S
2
2
=
=
=0,47
n 18 4,24

Los lmites serian:

X t

n1 ;
2

S
n

6 2,110(0,47)
6 0,99
Por lo tanto, el intervalo de confianza seria:
(5,01 < <6,99)
c. Interpretacin del intervalo de confianza: El gerente puede establecer que
el verdadero tiempo promedio de espera de todos los clientes entre (5,01 y
6,99) minutos con un 95% de confianza.
d. Se supone que el tiempo de espera de los clientes es normal o
aproximadamente normal.
Ejemplo: Se selecciona una muestra aleatoria de 8 restaurantes en la cuidad de
Mrida
y
se
obtiene
que
las
ventas
mensuales
han
sido
de:170,160,140,180,140,200,150, y 250 (en miles de bolvares). Usando esta
informacin se pide:
a. Calcular la media muestral

( X ) y la desviacin estndar muestral (S).

b. Calcule el error estndar de la media muestral

( S x ) .

c. Construya un intervalo de confianza del 90% para estimar las ventas


mensuales promedio en todos los restaurantes del mismo tipo en la Cuidad
de Merida.
Solucin:
Xi ( ventas miles de

Xi 2

bolvares)

140
140
150
160

19.600
19.600
22.500
25.600

170
180
200
250
1.390

X =
n

Xi

28.900
32.400
40.000
62.500
251.100

1.390
=173,75 miles de bolivares
8

Como la media muestral no es un numero entero, la desviacin estndar muestral


de los valores dados se calcula por medio de la formulas:
S=

X 2i n X 2 =
n1

251.1008(173.75)2
251.100241.512,50
=
81
7

b.Error estndar de la media muestral

S x =

=37,01

( S x ) .

S 37,01
=
=13.09
n 8

c. Como el tamao de la muestra es pequeo, la desviacin estndar

Poblacional desconocida y se supone que la poblacin de donde se seleccion la


muestra es normal o aproximacin normal, los limtes del intervalo de confianza
para las ventas mensuales promedio en todos los restaurantes del mismo tipo de
ciudad de Mrida son:
X t

n1 ;

El

S
n
estimador

puntual

esta

X =173,75miles de bolivares

dado

la

media

(estimacin puntual)

muestral,

es

decir

Los valores crticos

n1 ;

se obtiene en la tabla estadstica usando n-

1=8-1=7 grados de libertad y Q= 0,05 y se halla que


El error estndar de la media muestral

S x =13,90

(b)). Sustituyendo estos valores en la expresin

n1 ;

=1,895

(valor calculado en la parte


X t

n1 ;
2

S
n

se obtiene:

173,751,895(13,09)
Lmite inferior 173,75 24,81=148,94
173,7524,81
Lmite superior 173,75 + 24,81=198,56
Por lo tanto, el intervalo de confianza del 90% para las ventas mensuales
promedio de todos los restaurantes sera:
(148,94 < < 198,56) miles de bolvares.
d. Se espera con una confianza del 90% que las ventas mensuales promedio
en todos los restaurantes del mismo tipo en la cuidad de Mrida se
encuentran en el intervalo hallado.

PRUEBA DE HIPTESIS PARA MEDIA DE UNA POBLACIN ()


Cuando se desconoce la desviacin estndar poblacional(), el de la tamao de
la muestra es pequea (n<30) y la poblacin es normal o aproximacin normal, se
utiliza la distribucin t para probar hiptesis con respecto a la media de una
poblacin utilizando el siguiente el procedimiento:
Paso 1: Se plantea la hiptesis nula y la alternativa. Se debe escoger una de las
siguientes opciones.
(a)
Ho:=o o
H1= > o

(b)
Ho:=o o
H1=< o

Paso 2 : Se escoge el nivel de significacin

(c)
Ho:=o
H1= o

Paso 3: Se determina el estadstico de prueba apropiado. La distribucin t de


student, es la distribucin a utilizar en este caso, y el estadstico apropiado bajo la
hiptesis nula Ho:=o es el siguiente.
t=

X
o
S
n

Que tiene distribucin t con n-1 grado de libertad.


Paso 4: Se determinan la regin crtica y el valor crtico.

Cuando la H1 es unilateral derecha (H1= > o ), entonces la regin critica


se localiza en la cola superior de la distribucin t y el valor critico se localiza
en la tabla con v=n-1 y =Q.

Cuando la H1 es unilateral izquierda (H 1= <o ), entonces la regin critica


se localiza en la cola inferior de la distribucin t y el valor critico se localiza
en la tabla con v=n-1 y =Q, teniendo presente de cambiarle el signo,
porque en la tabla solamente aparecen los valores positivos de la t, ya que
la distribucin t es simtrica con respecto a su media.

Cuando la H1 es unilateral izquierda (H1= o), las regin critica se localiza


en los extremos superiores e inferiores de la distribucin t y los valor critico
se localiza en la tabla con v=n-1 y =2Q.

Paso 5: Se calcula el valor del estadstico de prueba.


Paso 6:
Decisin e interpretacin: Si el valor calculado del estadstico de prueba cae
en la regin de rechazo, entonces se decide ta o se rechazar la hiptesis nula y
aceptar lo planteado en la hiptesis alternativa al nivel de significacin .
Cuando el valor calculado cae en la regin de aceptacin se decide no
rechazar Ho al nivel de significacin , Se interpreta o se concluye de acuerdo a
lo planteado en el problema.
Ejemplo: En una planta de armado, el gerente sospecha que el tiempo
promedio que tarda el operador para realizar una operacin es mayor que 5
minutos. Seleccionan una muestra aleatoria de 10 tiempo de operaciones y
obtiene los siguientes resultados ( en minutos). 5,8; 5,6; 5,3 ; 5,2; 4,9; 4,7; 5,7;
4.9; 5,7; 6,0. Se supone que el tiempo de operacin se aproxima a una
distribucin normal se pide:
a. Se encuentran la sospecha del gerente apoyada por la evidencia en la
muestra con =0,01.
b. Obtenga un intervalo de confianza del 99% para estimar el verdadero tiempo
promedio de operacin. Interprete el resultado.
Datos:
> 5 Sospecha del gerente: el tiempo promedio que tarda el operador para realizar
una operacin especfica es mayor de cinco minutos.
n=10 tamao de la muestra.
Xi (tiempo de operaciones en minutos): 5,8; 5,6; 5,3 ; 5,2; 4,9; 4,7 ; 5,7 ; 4.9; 5,7;
6,0.
Solucin: parte (a)
1. Ho:=5

(los datos muestrales no apoyan la sospecha del gerente)

H1= > 5 (los datos muestrales no apoyan la sospecha del gerente).


2. Nivel de significacin: = 0,01

3. Estadistico

de prueba apropiado: Como n< 30, la desviacin estndar


poblacional se desconoce y se supone que el tiempo de operacin se

aproxima a la distribucin normal, el estadstico apropiado ser:

t=

X
o
S
n

4. Regin crtico y valor crtico:

5. Calcular el valor del estadstico de prueba: para calcular el valor del


estadstico de prueba es necesario obtener los valores de x y S

xi
4,7
4,9
4,9
5,2
5,3
5,6
5,7
5,7
5,8
6,0
53,8

Xi 2
22,09
24,01
24,01
27,04
28,09
31,36
32,49
32,49
33,64
36,00
291,22

La media muestral de los valore dados es:


X =
n

Xi

153,8
=5,38 minutos
10

La desviacin estndar muestral de los valores dados es:


X 2i n X 2

291,2210(5,38)2
291,22289,44

=
=
=0,44
n1
101
9

Y el valor del estadstico seria:


t=

X
5,385
o
=
=2,714
S
0,44
n
10

6. Regin crtica y valor critico

7. Decisin o interpretacin: Como el valor calculado t =2,714 cae en al regin


de aceptacin, se decide no rechazo H o l nivel de significacin de 0,01. Se
concluye que los datos muestrales no apoyan la sospecha del gerente.
Parte (b):
1-=0,99

= 0,01

Los lmites del intervalo de confianza para son:

X t

n1 ;

S
n

X =5,38 minutos

101 ;

0,01
= t 9 ;0,005=3,25
2
t
=t
n1 ;

S 0,44
=
=0,14
n 10
Sustituyen estos valores en los lmites del intervalo nos queda:
5,38 3,25(0,14)
5,380,46
Interpretacin:
Se espera con un 99% de confianza de que el verdadero tiempo promedio que
tarda el operador en realizar una operacin especifica se encuentran entre 4,92 y
5,84 minutos.

Das könnte Ihnen auch gefallen