Sie sind auf Seite 1von 14

Inferencias para una Varianza Poblacional Las pruebas presentadas con anterioridad se centraban en la estimacin de medias y proporciones poblacionales,

pero en muchas circunstancias quienes toman las decisiones no slo estn interesados en la media de una distribucin, sino tambin en el grado de dispersin en torno a la media y la varianza es una magnitud importante para determinar el comportamiento de un proceso. Dada la importancia de la varianza para mantener estndares de produccin, se han ideado pruebas para estimar la varianza de una distribucin. La prueba del valor de una 2 sola varianza se basa en una distribucin conocida como distribucin ji). Distribucin ji-cuadrada La distribucin ji-cuadrada es, como la distribucin t, una familia completa de distribuciones; hay una distribucin diferente para cada valor de los grados de libertad (g.l.= n 1).
 

Esta distribucin est sesgada positivamente, pero a medida que aumentan los grados de libertad, la distribucin se hace ms simtrica y se aproxima a la normal. Por otra parte, al ser una distribucin de probabilidad, el rea total bajo la curva es 1. As como en el caso de la distribucin normal, que sirvi para estandarizar medias muestrales, la distribucin 2 cumple la misma misin para las varianzas. Intervalo de confianza para la varianza de una poblacin El intervalo de confianza de una varianza poblacional se calcula por la frmula: (n 1) * s 2 (n 1) * s 2 2 2 superior i2 nferior
2

Ejemplo: Se desea estimar la precisin de un instrumento de medicin. Al realizar tres mediciones con el instrumento encontr una varianza muestral de 10.57 unidades. Usando un nivel de confianza del 95%, Calcule un intervalo de confianza para la variacin real del instrumento.
1 = 0.9 = 0.05 2 2 0.95 = 0.1025 2 0.05 = 5.99147

)('&$#!  % %  "    

son los tomados a partir de la tabla.

Sustituyendo en la frmula del Intervalo de Confianza obtenemos: 2 * 10.57 2 *10.57 2 5.99 0.1025 2 3.53 206.1 Note que este intervalo es de una longitud muy grande, es decir la estimacin es muy imprecisa, lo cual se debe a que el tamao de la muestra es muy pequea. Pruebas de hiptesis Para realizar esta pruebas necesitamos, igual que hicimos en el caso de pruebas de hiptesis para media y proporciones, comparar el valor de un estadstico de prueba con el percentil adecuado de la distribucin muestral del estadstico. En este caso el estadstico de prueba es:

(n 1) * S 2 20 2 0 es la varianza hipottica de la poblacin, s2 es la varianza muestral y n el tamao de la muestra.

2 prueba =

1.Pruebas unilaterales. a) H 0 : 2 0
2

H 1 : 2 < 0

Regla de Decisin: Se Rechaza H 0 si 2 prueba > 2 2 b) H 0 : 2 0


H 1 : 2 > 0

Regla de Decisin: Se Rechaza H 0 si 2 prueba < 21 2 2. Prueba bilateral


H 0 : 2 = 0
2

H 1 : 2 0

Regla de Decisin: Se Rechaza H 0 si 2 prueba < 21 2 o 2 prueba > 2 2

Ejemplo(continuacin) Suponga ahora que lo estndar es que la desviacin de este tipo de instrumento sea de dos unidades, y se ha decidido probar si con los resultados obtenidos de esta muestra puede refutarse la hiptesis planteada. Con el mismo nivel de significacin tenemos que:

Hiptesis:
H 0 : 2 = 4 H1 : 2 4

Estadstico:

(n 1) S 2

02

= 5.29

Percentil: 2 0.95 = 0.1025 2 0.05 = 5.99147 Decisin: Debemos comprobar si el valor del estadstico cae o no en la regin de rechazo. 0.1025<5.29<5.99, por lo que no cae en la regin de rechazo, as que podemos concluir que no existen evidencias suficientes para plantear que haya variado la varianza del instrumento. Note que nuevamente a pesar de que la varianza hipottica 0 2 = 4 y S 2 = 10.57 son diferentes aparentemente, esta diferencia no result ser significativa, como para rechazar la hiptesis nula, debido a que la muestra es slo de 3 observaciones.

5. Pruebas no Paramtricas Con anterioridad se ha trabajado con muchas pruebas de hiptesis, se hicieron pruebas de medias poblacionales y de proporciones poblacionales. En algunos casos el tamao muestral era mayor que 30, mientras que en otros la muestra era pequea; tambin se trabaj con pruebas de una sola poblacin y otras que comparaban dos poblaciones. Ahora bien, todas estas situaciones de prueba presentaban una caracterstica comn: exigan hacer determinadas hiptesis sobre la poblacin. Como estas pruebas dependen de postulados sobre la poblacin y sus parmetros, se denominan pruebas paramtricas. Sin embargo, en la prctica, surgen muchas situaciones en que no es posible formular una hiptesis segura sobre el valor de un parmetro o la forma de la distribucin poblacional. Por este motivo se deben utilizar otro tipo de pruebas llamadas pruebas no paramtricas. Pruebas no Paramtricas Las pruebas no paramtricas (o libres de distribucin) son procedimientos estadsticos que se pueden utilizar para contrastar hiptesis cuando no es posible fijar ningn supuesto sobre parmetros o distribuciones poblacionales. Son muchos los tipos diferentes de pruebas no paramtricas que se pueden utilizar, dependiendo de la necesidad determinada. Sin embargo, slo se considerar la distribucin ji-cuadrada como manera de contrastar: (a) La bondad de ajuste, para determinar si una distribucin sigue una estructura determinada. (b) Tablas de Contingencia y pruebas de independencia. Prueba de Bondad de Ajuste Prueba estadstica para determinar si existe una diferencia significativa entre una distribucin de frecuencias observadas y una distribucin terica hipotetizada para describir a la distribucin observada. Si la diferencia entre las estructuras de aparicin de los sucesos observados y de los esperados es demasiado grande para poderla atribuir a un error de muestreo, se tiene que llegar a la conclusin de que la poblacin presenta una distribucin distinta de la especificada en la hiptesis nula. La prueba de bondad de ajuste siempre es de una cola, con la regin de rechazo en la cola superior de la distribucin ji-cuadrada. Pasos generales: (a) Establecer H0 y H1 (b) Seleccionar el nivel de significancia. 2 que depende del nivel de significancia y cuyo grado de libertad es k m 1, en donde m es el nmero de parmetros a estimar que se calculan a partir de la informacin muestral. Si en el enunciado ya dan los parmetros, entonces los grados de libertad se obtienen mediante k 1. Se determina la regin de aceptacin y rechazo. 2 k f o i f ei 2 (d) Determinar el valor de prueba = f ei i =1 k = nmero de categoras o clases
%  "  % $  

% % 

foi = frecuencias observadas de los sucesos en los datos muestrales fei = frecuencias esperadas de los sucesos si la hiptesis nula es correcta 2 2 y prueba (e) Se hace la comparacin Observaciones: 1. Hay casos en los cuales las frecuencias esperadas son iguales y en otros las frecuencias se contrastan con cierta estructura en la cual no todas las frecuencias esperadas son iguales, sino que vienen determinadas por fei = n * pi, en la cual pi es la probabilidad de cada categora que especifica la hiptesis nula. 2. En el caso de las frecuencias esperadas desiguales, si hay una frecuencia esperada inusitadamente pequea en una celda, la ji cuadrada puede llevar a una conclusin errnea. Esto se debe a que fe aparece en el denominador y la divisin entre un nmero muy pequeo produce un cociente demasiado grande. 3. Hay dos reglas de aceptacin general respeto a pequeas frecuencias en una celda: (a) Si slo hay 2 celdas, la frecuencia esperada en cada celda debe ser igual a 5 o mayor. (b) Para ms de dos celdas, no debe aplicarse la 2 si ms del 20% de las celdas de fe tienen frecuencias esperadas menores que 5. Ahora bien, es posible recombinar las celdas para garantizar que todas las categoras tienen una frecuencia esperada mayor o igual que 5 Ejemplo 5.1.1 1. Se supone que el nmero de defectos en las tarjetas de circuito impreso sigue una distribucin Poisson. Se rene una muestra aleatoria de 60 tarjetas de circuito impreso y se observa el nmero de defectos. Los resultados obtenidos son los siguientes: Nmero de defectos 0 1 2 3 ms Frecuencia observada 32 15 9 4

Muestran estos datos suficiente evidencia para decir que provienen de una distribucin Poisson?. Haga la prueba de la bondad del ajuste con un = 0.05.

Solucin:

H0; La distribucin de los defectos es Poisson H1; La distribucin de los defectos no es Poisson. La media de la distribucin Poisson propuesta en este ejemplo es desconocida y debe estimarse a partir de los datos contenidos en la muestra.

32 * 0 + 15 * 1 + 9 * 2 + 4 * 3 = 0.75 60

A partir de la distribucin Poisson con parmetro 0.75, pueden calcularse las probabilidades asociadas con el valor de x.

e 0.75 0.75 0 e k P( x = k ) = por ejemplo si x = 0 P( x = 0) = = 0.472 k! 0!


Con esta frmula se calculan las probabilidades las que se que se multiplican por 60 para obtener los valores esperados, ya que: f ei = n * pi Nmero de defectos 0 1 2 3 ms Frecuencia esperada 28.32 21.24 7.98 2.46 Frecuencia observada 32 15 9 4

Probabilidad 0.472 0.354 0.133 0.041

Puesto que la frecuencia esperada en la ltima celda es menor que 5, se combinan las dos ltimas celdas. Nmero de defectos 0 1 2 ms Frecuencia esperada 28.32 21.24 10.44 Frecuencia observada 32 15 13

Los grados de libertad seran 3-1-1=1, debido a que la media de la distribucin Poisson fue estimada a partir de los datos.

2. Clculo del estadstico de prueba:

2 prueba =

(32 28.32) 2 (15 21.24) 2 (13 10.44) 2 + + = 2.94 28.32 10.44 10.44

Como el 2.94 <3.84, no se rechaza H0 y se concluye con un =0.05 que la distribucin de defectos en las tarjetas de circuito impreso es Poisson. Ejemplo 5.2: Solucin: Pruebe la hiptesis de que la distribucin de frecuencia de las duraciones de bateras dadas en la siguiente tabla, se puede aproximar mediante una distribucin normal con media = 3.5 y desviacin estndar =0.7. Utilice un = 0.05.

Lmites de clase Menor de 1.95 1.95 2.45 2.45 2.95 2.95 3.45 3.45 3.95

Frecuencias observadas 2 1 4 15 10

3.95 4.45 4.45 4.95

5 3

Observemos que si realizamos el histograma, para visualizar los datos:

tiene una forma que aparenta ser normal lo cual se probar estableciendo las hiptesis: H0; Los datos provienen de una distribucin normal. H1; Los datos no provienen de una distribucin normal. En este ejercicio en particular se cuenta con la media y desviacin estndar de la poblacin, por lo que no se tiene que estimar. En caso de que no se tuviera, se estimaran a partir de los datos agrupados con las frmulas que se vieron en el curso de Estadstica I, tomando en cuenta que para los grados de libertad el valor de m sera 2, ya que se estimara la media y la desviacin estndar. Se proceder a calcular los valores de z para encontrar las probabilidades en la tabla. Ejemplo:

1.95 3.5 P( x < 1.95) = P Z < = P( Z < 2.21) = (2.21) = 0.01355 0.7
A continuacin se muestra la curva normal con sus respectivas probabilidades

P(1.95 x 2.45) = 0.0668-0.013553 = 0.053254 P(2.45 x 2.95) = 0.21476-0.0668 = 0.147953 P(2.95 x 3.45) = 0.4721-0.21476 = 0.25734 P(3.45 x 3.50) = 0.50-0.4721 = 0.0279 P(3.50 x 3.95) = 0.50-0.26109= 0.23891 P(3.95 x 4.45) = 0.26109-0.086915 = 0.17417 Con estas probabilidades se calcularn los valores esperados, multiplicando cada probabilidad por 40. Lmites de clase 1.45 1.95 1.95 2.45 2.45 2.95 2.95 3.45 3.45 3.95 3.95 4.45 4.45 4.95 85 3 Frecuencias observadas 2 71 4 15 10 Probabilidad 0.01355 0.05325 0.14795 0.25734 0.26681 0.17417 0.08691 Frecuencia esperada 0.54212 2.13016 5.91812 10.29360 10.67240 6.96680 3.47660

Grados de libertad: k-1-m = 4-1-0 = 3

Estadstico de Prueba: (7 8.5904) 2 (15 10.2936) 2 (10 10.6724) 2 (8 10.4434) 2 2 + + + = 3.06 prueba = 8.5904 10.2936 10.6724 10.4434

Como el 3.06 >.815, no se rechaza H0 y se concluye con un = 0.05 los datos siguen una distribucin normal.

5.1 Prueba de Independencia La distribucin ji-cuadrada nos permite tambin comparar dos atributos o caractersticas para determinar si hay alguna relacin entre ellos. Consideremos, por ejemplo, que un especialista en marketing quisiera determinar si hay alguna conexin entre los niveles de renta de los consumidores y su preferencia por el producto que l vende. Este procedimiento implicara comparar dos atributos: rentas y preferencias. La comparacin de dos atributos para determinar si son independientes se realiza de la misma forma que antes: analizando la diferencia entre frecuencias observadas reales y frecuencias esperadas. Tabla de contingencia Es una tabla que contiene F filas y C columnas. Cada fila corresponde a un nivel de una variable; cada columna, a un nivel de otra variable. Las entradas del cuerpo de las tablas son las frecuencias con que cada combinacin de variables se presenta. Observaciones: 1. Para calcular el nmero de grados de libertad de una prueba de independencia jicuadrada se multiplica el nmero de filas (menos uno) por el nmero de columnas (menos 1) g. l = (nmero filas 1) * (nmero columnas 1) 2. La expresin para calcular la frecuencia esperada para cualquier celda de un tabla de contingencia viene dada por: Total de la fila * Total de la columna fe = Total de observaciones

4. Las frecuencias esperadas deben ser de 5 o ms para todas las categoras. 5. La prueba de independencia siempre es de una cola, con la regin de rechazo en la cola superior de la distribucin ji-cuadrada. Pasos generales para las pruebas de independencia: (a) Establecer H0 y H1 (b) Seleccionar el nivel de significancia. 2 que depende del nivel de significancia y de los grados de libertad. (d) Se determina la regin de aceptacin y rechazo. (f o f e )2 2 (e) Determinar el valor de prueba = fe

     

3.

se determina por (f o f e )2 2 prueba = fe

' D 2 C@ 9 B @ ' 2 9 75 4 2 ') ' % # ! A386"310(&$"

(la expresin se aplica para cada celda y la suma total de cada uno de los valores es el 2 prueba ) (f) Se hace la comparacin entre Ejemplo 5.1 Una asociacin de profesores universitarios quiere determinar si la satisfaccin en el trabajo es independiente del rango acadmico. Para ello realiz un estudio nacional entre los profesores universitarios y encontr los resultados mostrados en la tabla siguiente. Con =0.05, haga una prueba para saber si son dependientes la satisfaccin en el trabajo y el rango. Rango Profesor Instructor Satisfaccin en el trabajo asistente Mucha Regular Poca Solucin: Ho: La satisfaccin en el trabajo y el rango son independientes. H1: La satisfaccin en el trabajo y el rango son dependientes. Grados de libertad: (r-1)(c-1) = (3-1)(4-1)=(2)(3) = 6 40 78 57 60 87 63 asociado 52 82 66 63 88 64 Profesor Profesor
2
2 y prueba

Se proceder a calcular los valores esperados de cada celda. Como los grados de libertad son 6, esto quiere decir que necesitamos calcular nicamente 6 frecuencias esperadas, y las faltantes se encuentran por diferencia.

1. Se calcularn los valores esperados necesarios. 2. Como se necesitan los totales de rengln y columna se mostrarn en la tabla: Rango Profesor Instructor asistente Satisfaccin en el trabajo Mucha Regular Poca Total 40 78 57 175 60 87 63 210 asociado 52 82 66 200 63 88 64 215 215 335 250 800 Profesor Profesor Total

f e11 =

215 *175 335 * 200 = 47.03 .... f e23 = = 83.75 800 800

Las frecuencias esperadas las colocaremos entre parntesis en cada una de las casillas de la tabla, los que no se calcularon por frmula se obtuvieron por diferencia con respecto a los totales.

Profesor Satisfaccin Instructor asistente 40 Mucha (47.03) 78 Regular (73.28) 57 Poca (54.69) Total 175 (65.62) 210 (87.94) 63 (56.44) 87 60

Profesor Profesor asociado 52 (53.75) 82 (83.75) 66 (62.50) 200 63 215 (57.78) 88 335 (90.03) 64 250 (67.19) 215 800 Total

los que no se calcularon por frmula se obtuvieron por diferencia con respecto a los totales. Valor del estadstico:

2 prueba =

(40 47.03) 2 (64 67.19) 2 + ...... + = 2.75 47.03 67.19

Como el valor de 2.75 es menor que el de tabla 12.592 no se rechaza Ho y se concluye con un a confianza del 95% que la satisfaccin en el trabajo y el rango son independientes.

Das könnte Ihnen auch gefallen