Sie sind auf Seite 1von 10

CAPITULO II

1.1) LA DISTRIBUCIÓN T DE STUDENT


Tiene características similares a la distribución normal, su diferencia principal radica en las áreas de los
extremos las cuales son más amplias, como consecuencia de que usualmente se trabaja con muestras
pequeñas. La sintaxis en Excel es: DISTR.T(x; grados_de_libertad; colas) X es el valor numérico al que
se ha de evaluar la distribución. Grados_de_libertad es un entero que indica el número de grados de
libertad. Colas especifica el número de colas de la distribución que se ha de devolver. Toma los valores
de 1 o 2.

El nombre de la distribución se debe a su autor W.S. Gosset, quien le dio el seudónimo de T de Student
ante la imposibilidad de presentar sus trabajos so pena de perder su empleo, esto sucedió a principio
del siglo XX.

Esta distribución es recomendada cuando se requiere estimar la media poblacional y no se conoce la


desviación estándar y por lo tanto, hay que estimarla, eso si, siempre y cuando la distribución original
sea aproximadamente normal. Suponga que se toma una muestra aleatoria de tamaño n<30 de una
población con distribución normal con media  y varianza 2. Se ha establecido anteriormente que la

2
media muestral X también tendrá distribución normal con media  X   y varianza  2X  . Por lo
n
x
tanto, la variable z tendrá distribución normal estándar.Sin embargo, si la varianza de la

n
población es desconocida, entonces la variable anterior ya no tiene distribución normal estándar y debe
usarse otro estadístico denominado estadístico T o de “Student”:

x
T
S
n

pág. 1
La distribución de este estadístico también tiene forma tipo “campana simétrica” dependiendo del valor
de n. Este parámetro determina la forma particular de la distribución con la siguiente definición:  = n -
1 grados de libertad, ( léase “nu”)

Este estadístico es útil cuando por consideraciones prácticas, no se puede tomar una muestra aleatoria
grande. Pero, para usar este estadístico, es necesario que la población tenga distribución normal.

Fig. Distribución T para  = 2, 5, 30 grados de libertad.

Para usar esta distribución, si no se dispone de un utilitario informático, se usan tablas que contienen
algunos valores de T para diferentes grados de libertad mediante la siguiente definición:

t : valor de t tal que P(Tt) = , como se se muestra en el siguiente gráfico:

2.2) Tabla De La Distribucion T - Student

pág. 2
La tabla da áreas 1 - a , para valores menores o iguales a t y n g.l, se construyó con Excel.

1-a

n 0.75 0.80 0.85 0.90 0.95 0.975 0.99 0.995


1 1.000 1.376 1.963 3.078 6.314 12.706 31.821 63.657
2 0.816 1.061 1.386 1.886 2.920 4.303 6.965 9.925
3 0.765 0.978 1.250 1.638 2.353 3.182 4.541 5.841
4 0.741 0.941 1.190 1.533 2.132 2.776 3.747 4.604
5 0.727 0.920 1.156 1.476 2.015 2.571 3.365 4.032

6 0.718 0.906 1.134 1.440 1.943 2.447 3.143 3.707


7 0.711 0.896 1.119 1.415 1.895 2.365 2.998 3.499
8 0.706 0.889 1.108 1.397 1.860 2.306 2.896 3.355
9 0.703 0.883 1.100 1.383 1.833 2.262 2.821 3.250
10 0.700 0.879 1.093 1.372 1.812 2.228 2.764 3.169

11 0.697 0.876 1.088 1.363 1.796 2.201 2.718 3.106


12 0.695 0.873 1.083 1.356 1.782 2.179 2.681 3.055
13 0.694 0.870 1.079 1.350 1.771 2.160 2.650 3.012
14 0.692 0.868 1.076 1.345 1.761 2.145 2.624 2.977
15 0.691 0.866 1.074 1.341 1.753 2.131 2.602 2.947

16 0.690 0.865 1.071 1.337 1.746 2.120 2.583 2.921


17 0.689 0.863 1.069 1.333 1.740 2.110 2.567 2.898
18 0.688 0.862 1.067 1.330 1.734 2.101 2.552 2.878
19 0.688 0.861 1.066 1.328 1.729 2.093 2.539 2.861
20 0.687 0.860 1.064 1.325 1.725 2.086 2.528 2.845

21 0.686 0.859 1.063 1.323 1.721 2.080 2.518 2.831


22 0.686 0.858 1.061 1.321 1.717 2.074 2.508 2.819
23 0.685 0.858 1.060 1.319 1.714 2.069 2.500 2.807
24 0.685 0.857 1.059 1.318 1.711 2.064 2.492 2.797
25 0.684 0.856 1.058 1.316 1.708 2.060 2.485 2.787

26 0.684 0.856 1.058 1.315 1.706 2.056 2.479 2.779


27 0.684 0.855 1.057 1.314 1.703 2.052 2.473 2.771
28 0.683 0.855 1.056 1.313 1.701 2.048 2.467 2.763
29 0.683 0.854 1.055 1.311 1.699 2.045 2.462 2.756

pág. 3
30 0.683 0.854 1.055 1.310 1.697 2.042 2.457 2.750

40 0.681 0.851 1.050 1.303 1.684 2.021 2.423 2.704


60 0.679 0.848 1.046 1.296 1.671 2.000 2.390 2.660
120 0.677 0.845 1.041 1.289 1.658 1.980 2.358 2.617
¥ 0.674 0.842 1.036 1.282 1.645 1.960 2.326 2.576

Es importante resaltar que al ser una distribución simétrica al tener información sobre un valor positivo,
se obtiene el dato para el mismo valor con signo negativo.

Un hecho de relevancia significativa, es que se utiliza para calcular probabilidades con respecto al
promedio, en estos casos, el divisor al estandarizar los valores se divide sobre S/ Ö n, término que se
conoce como el error estándar de la media y mide la variabilidad de la media entre muestra y muestra.
A mayor tamaño de muestra, menor es el error estándar de la media.

Por último, se puede afirmar, la distribución t es útil para realizar inferencias acerca de la media
poblacional cuando no se conoce s y la población es normal, independiente del n, no obstante, aún
cuando la distribución sea un tanto sesgada, la t sigue siendo apropiada, esto se conoce como una
distribución robusta, es decir, a cambios moderados de los supuestos, el modelo sigue siendo valido.
Como en el caso de la distribución normal, ésta distribución también usa valores tabulados, tal como se
aprecian en la tabla precedente, teniendo en cuenta, que a medida que los g.l aumenten los valores
tienden a ser igual a los encontrados en la tabla Z.

Ejercicio 01.

Los valores de las matriculas de estudiantes en una universidad privada tienen un comportamiento
aproximadamente normal, donde el promedio es de 2.100.000. Se seleccionan 8 liquidaciones, siendo
los valores los siguientes: 1.950.000, 2.100.000, 2.250.000, 1.890.000, 2.250.000, 1.950.000, 2.050.000,
2.350.000. Determine la probabilidad de que:

· El promedio sea menor de 2.000.000.

· El promedio se encuentre entre 2.000.000 y 2.200.000

· El promedio sea mayor o igual a 2.500.000

Solución manual:

pág. 4
Sea X = Liquidación matriculas.

m = 2.100.000 ; s = ?

=2.098.750 s=168.644.8085 n=8

a) P( <2.000.000)=P( <2.000.000)

P(t<(2.000.000-2.100.000)/(168644.8085/2.8284)= P(t<-1.677)

La probabilidad se encuentra entre 0.9 y 0.95, según la tabla T que se encuentra más adelante,
no obstante, al t ser negativo, la probabilidad está entre 0.1 y 0.05, es decir, los valores
complementarios..

Para buscar en la tabla, se tiene en cuenta la fila con 7 g.l y se ubica el 1.677, el cual se
encuentra entre los valores mencionados. De ahí que sea importante utilizar el Excel, que nos
permite calcular la probabilidad exacta.

b) P (2.000.000 < < 2.200.000)= P( <2.200.000) ? P( £ 2.000.000).

Luego de tipificar, se tiene:

P(t<3.35) ? P(t<-1.677) = 0.995 ?0.075= 0.92

Existe una alta probabilidad de que el promedio de las matriculas se encuentre entre 2.000.000
y 2.200.000.

c) P( >2.500.000)= P(t> 6.70) = 1- P(t< 6.70)= 1-1=0

Dado que el valor de 6.70 es mucho mayor que el ubicado en la tabla de 3.49 y corresponde a
0.995, es claro, entonces, que para valores mayores de 3.49, la probabilidad será de 1.

Por lo tanto, la probabilidad de que el promedio de matrícula sea superiora a 2.500.000 es cero.

pág. 5
Ejercicio 02

Un fabricante de focos afirma que us producto durará un promedio de 500 horas de trabajo. Para
conservar este promedio esta persona verifica 25 focos cada mes. Si el valor y calculado cae entre –t
0.05 y t 0.05, él se encuentra satisfecho con esta afirmación. ¿Qué conclusión deberá él sacar de una
muestra de 25 focos cuya duración fue?:

Se puede concluir que la media poblacional no es 500, porque la muestra poblacional está por encima
de esta, y por lo tanto debería estar por encima de 500.

Ejercicio 03

La compañía USALUZ produce focos. El presidente de la Cía. dice que sus focos duran 300 días.
Entonces la competencia va a varios (nótese) supermercados y compra 15 focos para probar esa
afirmación. Los focos de la muestra duran en promedio 290 días con una desviación estándar de 50
días. Entonces, si quieren desmentir al presidente de USALUZ necesita saber cúál es la probabilidad
probabilidad de que 15 focos seleccionados seleccionados al azar tengan una vida promedio promedio
no mayor de 290 no mayor de 290 días.

pág. 6
Solución

Primero necesitamos calcular el valor t usando nuestra fórmula

Donde es la media de la muestra, μ la media de la población, s es la desviación estándar de la muestra


y n el tamaño de la muestra.

Gráficamente.

Ejercicio 04

Supongamos que las calificaciones de una prueba están distribuidos normalmente con una media de
100. Ahora supongamos que seleccionamos 20 estudiantes y les hacemos un exámen. La desviación
estándar de la muestra es de 15.

¿Cuál es la probabilidad probabilidad de que el promedio promedio en el grupo de muestra muestra sea
más 110?

Solución:

pág. 7
Primero calculamos el valor t como en el caso anterior ya sea en tablas o con ayuda de herramientas
tipo Minitab, Excel, etc. Nuestros datos son: Número de grados de libertad: n-1 = 20 -1 = 19 La media
de la población es igual a 100 La media de la muestra es igual a 110 La desviación estándar de la
muestra es igual a 15 El valor t es

Usando estos valores nos da un resultado de probabilidad acumulada de 0.00496. Esto implica que hay
una probabilidad de 0.45% de que el promedio en una muestra sea mayor de 110.

Gráficamente.

Fuente de ejercicios:

http://juancarlosvergara.50webs.org/Apuntes/Ejercicios%20Parte%20I.pdf

http://www.geociencias.unam.mx/~ramon/EstInf/Clase7.pdf

pág. 8
CONCLUSIONES

1) Del trabajo presentado anteriormente puedo decir que La distribución t de Student es la


distribución de probabilidad del cociente donde Z tiene una distribución normal de media
nula y varianza 1 V tiene una distribución chi-cuadrado con ν grados de libertad Z y V
son independientes.

2) El procedimiento para el cálculo del intervalo de confianza basado en la t de Student


consiste en estimar la desviación típica de los datos S y calcular el error estándar de la
media= S/(raíz cuadrada de n), siendo entonces el intervalo de confianza para la media
= x media +- t (alfa/2) multiplicado por (S/(raíz cuadradada de n)).

3) Es una distribución de probabilidad que se usa cuando el tamaño de la muestra es


menor de 30 datos, no se conoce la desviación estándar de la población y cuando
la población de ue se extrae la muestra es normal.

pág. 9
BIBLIOGRAFÍA

 http://www.kramirez.net/ProbaEstad/Material/Presentaciones/DistribucionesProbabilida
dContinuas.pdf

 www3.uah.es/.../Aproximacion%20de%20una%20binomial%20por%20una%20norm...

 Libro Estadística Básica


Para Estudiantes De Ciencias
Autor: Javier Gorgas García
Nicolás Cardiel López
Jaime Zamorano Calvo
Edición: Versión 17 de febrero de 2011
Página: del 89 ala pág. 99

pág. 10