Beruflich Dokumente
Kultur Dokumente
- Enumerar las caractersticas de la distribucin F. - Realizar una prueba de hiptesis para determinar si 2 varianzas mustrales provienen de poblaciones iguales. - Cuando se desea comparar simultneamente 2 o mas medias poblacionales. - Establecer y organizar datos en una tabla ANOVA en 1 y 2 direcciones. - Efectuar una prueba de Hiptesis entre 3 o mas medias de Tratamiento.
1 16/04/2013 ESTADISTICA INDUSTRIAL 2
DISTRIBUCION F
Esta distribucin de probabilidad se utiliza como estadstico de prueba : Para demostrar si dos variancias mustrales proviene de la misma poblacin o de poblaciones iguales . Cuando se desean comparar simultneamente varias medias poblacionales. La comparacin simultnea de varias medias poblacionales se denomina Anlisis de Varianza (ANOVA de analisys of variance).
16/04/2013 ESTADISTICA INDUSTRIAL 3
Caractersticas de la distribucin F
1.- Existe una familia de distribucin F. Un miembro especifico de la familia queda determinado por dos parmetros: los grados de libertad en el numerador y los grados de libertad en el denominador.
Se puede observar que la forma de las curvas cambia conforme se modifican los grados de libertad.
16/04/2013 ESTADISTICA INDUSTRIAL 4
Grado de libertad.- Por grados de libertad entendemos el nmero efectivo de observaciones que contribuyen a la suma de cuadrados en un ANOVA, es decir, el nmero total de observaciones menos el nmero de datos que sean combinacin lineal de otros. 2.- La distribucin F es continua.- Esto significa que puede tomar una cantidad infinita de valores entre 0 y mas infinito. 3.- La distribucin F no puede ser negativa.-El menor valor que puede asumir F es cero. 4.- La distribucin F tiene un sesgo positivo.- -La cola larga de la distribucin se encuentra a la derecha. Conforme el nmero de grados de libertad aumenta, tanto en el numerador como en el denominador, la distribucin se aproxima a una distribucin normal.
16/04/2013 ESTADISTICA INDUSTRIAL 5
5.- La distribucin F es asinttica.- Conforme los valores de X aumentan, la curva de la distribucin F se aproxima al eje X, pero nunca la toca. Esto es parecido al comportamiento de la distribucin normal.
16/04/2013
ESTADISTICA INDUSTRIAL
16/04/2013
ESTADISTICA INDUSTRIAL
16/04/2013
ESTADISTICA INDUSTRIAL
PROBLEMA
Los valores crticos de F estn dado por: Prueba de dos colas F (/2,n1-1,n2-1) : (tabla) .El otro valor esta dado por la inversa: 1/ (F (/2,n2-1,n1-1) = Prueba de una cola: F ( ,n1-1,n2-1) :( tabla) n1-1: Grados de libertad en el numerador n2-1: Grados de libertad del denominador
16/04/2013 ESTADISTICA INDUSTRIAL 9
Un corredor de valores de la bolsa de lima estudia los porcentajes de rendimiento de las empresas del sector minero y el sector financiero. Se sabe que tasas de rendimiento independientes tienen distribucin normal. Dos muestras aleatorias de las tasas de 8 empresas del sector minero (M) y de 6 empresas del sector financiero han dado los siguientes valores de rendimientos de porcentajes.
16/04/2013 ESTADISTICA INDUSTRIAL 10
Sector M:17,23,25,18,24,20,21,16 Sector F: 13,16,14,12,15,14. Con un nivel de significancia del 0.05. Se puede concluir que hay mas variacin en los valores del sector minero?. Se X1 Y X2 las variables que representa los valores de rendimiento de los sectores M y F respectivamente
Procedimiento
Estas variables tienen distribuciones normales con varianzas desconocida respectivas 1.-
16/04/2013
ESTADISTICA INDUSTRIAL
11
16/04/2013
ESTADISTICA INDUSTRIAL
12
4.- Con n1-1 y n2-1 grados de libertad .n1=8 .n2=6, Fc(0.05, 7,5) = 4.88 5.Fk= 11.1429/2= 5.5714 S= (x - ) 2/ (n-1) Como el Fk pertenece a la regin critica se rechaza la hiptesis nula y se acepta la hiptesis alternativa,
13 16/04/2013 ESTADISTICA INDUSTRIAL 14
16/04/2013
ESTADISTICA INDUSTRIAL
PROBLEMA
Esto quiere decir que la varianza de la muestra 1(sector minero) son mayores que las varianzas de la muestra 2 (sector financiero). Una muestra de 16 observaciones tomada de la poblacin 1 con una varianza de 3.75, y una muestra de 10 observaciones tomada de la poblacin 2 con una varianza de 5.38. Realizar una prueba de hiptesis para probar si las varianzas son diferentes.
16/04/2013
ESTADISTICA INDUSTRIAL
15
16/04/2013
ESTADISTICA INDUSTRIAL
16
Ho: 12=22 Ha: 1222 2Nivel de significacin: = 0.10 3Se utiliza la distribucin de prueba Grados de libertad: numerador: 16-1=15 y denominador: 10-1=9 y /2 por ser de dos colas F(0.025,9,15)= 3.12 y F(0.025,15,9) = 3.77 F2 = 1/F(0.05,15,9) =01/3.77= 0.265 Analizando varianzas: s22=3.75 y s12=5.38 Luego: Fk= 5.38/3.75 = 1.43 1Hiptesis:
16/04/2013 ESTADISTICA INDUSTRIAL 17
4Regin Crtica: Tenemos la regin critica con [F<0.27 o F> 3.12] 5 Decisin: Se observa que Fk = 1.43 pertenece a la regin de aceptacin por lo tanto se acepta la hiptesis nula. Es decir, no se puede afirmar que existe diferencia en las varianzas de las dos poblaciones.
16/04/2013
ESTADISTICA INDUSTRIAL
18
ANOVA
Otro uso de la distribucin F es la tcnica del anlisis de varianza (ANOVA), con la que se comparan tres o mas medias poblacionales para determinar si son iguales. Para usar el ANOVA se considera lo siguiente: 1.- Las poblaciones estn distribuidas normalmente. 2.- Las poblaciones tienen desviaciones estndar iguales (S). 3.- Las muestras se seleccionan independientemente.
16/04/2013
ESTADISTICA INDUSTRIAL
19
16/04/2013
ESTADISTICA INDUSTRIAL
20
Otra aplicacin: Se tiene la medicin de las seales de recepcin en el medio ambiente de celulares lo que se intenta es probar si existe o no diferencias en las diferentes lecturas tomados en diferentes distritos. (Variable nominal). Para analizar si existe diferencia en los promedios se procede a realizar una prueba F, cuando se toma tres o mas muestras
16/04/2013 ESTADISTICA INDUSTRIAL 21
Definicin. Tcnica fundamental que, en su diseo ms sencillo, desarrolla un contraste de hiptesis estadsticas, que afecta simultneamente a las medias de k poblaciones (variables aleatorias) con distribucin normal y homoscedsticas, es decir, con idnticas varianzas.
16/04/2013
ESTADISTICA INDUSTRIAL
22
Paso 5. Seleccionar la muestra, realizar los clculos y tomar una decisin. Se resume los clculos del estadstico F en una tabla ANOVA. El formato de tabla ANOVA es el siguiente:
Donde: SStotal: Es la variacin total. SST: Suma de cuadrados debido a los tratamientos SSE: Suma de cuadrados debido al error. MST: Cuadrado medio de los tratamientos. MSE: Cuadrado medio del error.
16/04/2013 ESTADISTICA INDUSTRIAL 23 16/04/2013 ESTADISTICA INDUSTRIAL 24
Despus se determina SST, la suma de cuadrados debidos al tratamiento. La formula parea encontrar SST es:
Donde: Donde: X2 es la suma de los valores X elevados al cuadrado. (X)2 es el cuadrado de la suma de los valores X. N es el nmero total de observaciones. Tc es el total de la columna de cada tratamiento. nc es el nmero de observ. (Tamao de la muestra) de cada tratamiento. Finalmente se determina SSE, la suma de los cuadrados del error, por substraccin. La formula es:
16/04/2013
ESTADISTICA INDUSTRIAL
25
16/04/2013
ESTADISTICA INDUSTRIAL
26
ANOVA EN DOS DIRECCIONES En un ANOVA de dos direcciones se considera una segunda variable de tratamiento. a) La segunda variable de tratamiento se denomina la variable de bloqueo.
d) El valor estadistico F para la variable de tratamiento y la variable de bloqueo, se determina en la siguiente tabla:
16/04/2013
ESTADISTICA INDUSTRIAL
27
16/04/2013
ESTADISTICA INDUSTRIAL
28
Problema Un analista financiero desea determinar si hay diferencia en la tasa media de rendimiento de tres tipos de acciones: de servicios pblicos, de comercio al menudeo y bancarios. Se obtuvo la siguiente informacin muestral (Tabla 1). Utilizando el nivel de significancia de 0.05. Existe alguna diferencia entre los tres tipos de acciones, en la tasa media de rendimiento?
16/04/2013 ESTADISTICA INDUSTRIAL 29 16/04/2013 ESTADISTICA INDUSTRIAL 30
16/04/2013
ESTADISTICA INDUSTRIAL
31
16/04/2013
ESTADISTICA INDUSTRIAL
32
16/04/2013
ESTADISTICA INDUSTRIAL
33
16/04/2013
ESTADISTICA INDUSTRIAL
34
Paso 4.- Ahora tenemos que Fk =18.09 y el valor critico con (2,15) grados de libertad , 2 en el numerador (fila) y 15 en el denominador (columna) Fc=3.68, como Fk es mayor que el valor critico entonces se rechaza la hiptesis nula. Paso 5.- El analista financiero puede concluir que existe diferencia en los tres tipos de acciones, en la tasa de rendimiento.
16/04/2013 ESTADISTICA INDUSTRIAL 35 16/04/2013 ESTADISTICA INDUSTRIAL 36
INFERENCIA ACERCA DE DOS MEDIAS La distribucin T se utiliza como base de esta prueba. Un intervalo de confianza para la diferencia entre dos medias poblacionales se logra mediante. (X1-X2) +/ - t MSE ( 1/n1+ 1/n2) X1: Es la media del primer tratamiento X2: Es la media del segundo tratamiento
16/04/2013 ESTADISTICA INDUSTRIAL 37
T student se obtiene de tabla t con lo grados de libertad N-K. y alfa/2 MSE : Es el cuadrado medio de error que se obtiene de la tabla de anova SSE/(n-k) .n1: Es el nmero de observaciones en el primer tratamiento .n2: Es el nmero de observaciones del segundo tratamiento
16/04/2013 ESTADISTICA INDUSTRIAL 38
(X1-X2) +/- 2.131 2.88 ( 1/6 + 1/6) Ahora remplazamos los valores de.
16/04/2013
ESTADISTICA INDUSTRIAL
39
16/04/2013
ESTADISTICA INDUSTRIAL
40
PROBLEMA
Se sabe que un egresado (con licenciatura) de una escuela de administracin gana ms que un egresado de la enseanza preparatoria sin instruccin adicional; y que una persona con maestra o doctorado, gana an ms. Para probar esto, se tom una muestra aleatoria de 25 ejecutivos de compaas cuyos activos eran superiores a un milln de dlares. A continuacin se muestran sus ingresos, clasificados segn el nivel ms alto de educacin.
16/04/2013 ESTADISTICA INDUSTRIAL 41 16/04/2013 ESTADISTICA INDUSTRIAL 42
Pruebe al nivel de significancia 0.05 que no hay diferencia en los salarios medios de los tres grupos. Realizamos nuestra prueba de Hiptesis 1. Hiptesis: H0: 1 = 2 = 3 Ha: No todas las medias son iguales 2. Nivel de significacin: = 0.05 3. Estadstico de prueba: F 4. F de tabla se halla con k 1 grados de libertad en el numerador y n k grados de libertad para el denominador. Para el numerador se tiene 2 grados de libertad y para el denominador 22. F(0.05,2,22) = 3.44
16/04/2013
ESTADISTICA INDUSTRIAL
43
16/04/2013
ESTADISTICA INDUSTRIAL
44
16/04/2013
ESTADISTICA INDUSTRIAL
45
16/04/2013
ESTADISTICA INDUSTRIAL
46
5.- TOMA DE DECISION El FK=10.184 es mayor a 3.44. Por lo tanto, rechazamos la hiptesis nula y aceptamos la hiptesis alternativa. Entonces no todas las medias de los ingresos de los ejecutivos son iguales ya que depende del grado que tengan.
= =
16/04/2013
ESTADISTICA INDUSTRIAL
47
16/04/2013
ESTADISTICA INDUSTRIAL
48
16/04/2013
ESTADISTICA INDUSTRIAL
49
16/04/2013
ESTADISTICA INDUSTRIAL
50
16/04/2013
ESTADISTICA INDUSTRIAL
52
Problema
Un organismo de investigacin quiere comparar los rendimientos en milla por galn, de gasolinas regular sin plomo, semigrado y sper Premium. Debido a la diferencia en el funcionamiento en los diferentes automviles, se seleccionaron 7 de ellos y se les trato como bloques. Por lo tanto cada clase de gasolina se prob con cada tipo de vehculo, los resultados de las pruebas, en millas por galn, se muestra en la siguiente tabla. A nivel de significancia de 0.05. Existe alguna diferencia entre las gasolinas y los automviles?
53 16/04/2013 ESTADISTICA INDUSTRIAL 54
B 2 ( X ) 2 SSB = r n k
16/04/2013
ESTADISTICA INDUSTRIAL
Datos
16/04/2013
ESTADISTICA INDUSTRIAL
55
16/04/2013
ESTADISTICA INDUSTRIAL
56
Procedemos a determinar cada una de nuestras variables de la Tabla Anova. Para los Tratamientos
16/04/2013
ESTADISTICA INDUSTRIAL
57
16/04/2013
ESTADISTICA INDUSTRIAL
58
5.-Decisin: Como se puede apreciar en el grafico anterior, el valor de F calculado (26.71), es mayor que el F tabla (3.89), y se encuentra en la regin critica, por lo tanto se rechaza la hiptesis nula y se acepta la alternativa. Se puede concluir que los rendimientos medios que ofrece cada tipo de gasolina en miles por galn no son iguales. Para los automviles 1.- Hiptesis: H0: 1 = 2 = 3 = 4 = 5 = 6= 7 Ha: No todas las medias son iguales 2.-Nivel de significancia: = 0.05 3.- Estadstico: Con el estadstico de prueba F
16/04/2013
ESTADISTICA INDUSTRIAL
59
16/04/2013
ESTADISTICA INDUSTRIAL
60
10
4.- Regin Crtica: Para = 0.05 y sabiendo que: Grados de libertad del numerador = k 1 = 6 Grados de libertad de denominador = (k 1)(b 1) = 12 En tablas se ubica: F(0.05 ; 6, 12) = 3.00 La regin crtica est dada por: Regin Critica = {F > 3.00} 5.- Decisin: Como el valor de F calculado (15.60), es mayor que el F=3 ( tabla) , entonces se encuentra en la regin de rechazo, por lo tanto, rechazamos la hiptesis nula y se acepta la hiptesis alternativa Puede concluirse, entonces, que efectivamente existe alguna diferencia entre los rendimientos medios en cada tipo de automvil.
16/04/2013 ESTADISTICA INDUSTRIAL 61 16/04/2013 ESTADISTICA INDUSTRIAL 62
Problema Cada una de las tres cadenas de supermercados en la regin de Denver indica que ofrece los precios mas bajos .Como parte de su estudio de investigacin sobre publicidad de supermercados, el diario Denver Daily News realiz un estudio. Primero selecciono una muestra aleatoria de nueve artculos comestibles. Despus reviso el precio da cada uno de estos productos en cada una de las tres cadenas, el mismo da. Al nivel de significancia de 0.05 Hay alguna diferencia en los precios medios de los supermercados y de los artculos?
16/04/2013 ESTADISTICA INDUSTRIAL 63 16/04/2013 ESTADISTICA INDUSTRIAL 64
16/04/2013
ESTADISTICA INDUSTRIAL
65
16/04/2013
ESTADISTICA INDUSTRIAL
66
11
16/04/2013
ESTADISTICA INDUSTRIAL
67
16/04/2013
ESTADISTICA INDUSTRIAL
68
16/04/2013
ESTADISTICA INDUSTRIAL
69
16/04/2013
ESTADISTICA INDUSTRIAL
70
PROBLEMA
Una compaa de inversiones en bienes races, est considerando invertir en un centro comercial en las afueras de Atlanta, Georgia. Se evalan tres terrenos. Es de particular importancia el ingreso monetario de los habitantes del rea que rodea el centro comercial en consideracin. Se selecciona una muestra aleatoria de cuatro familias que viven cerca de cada centro . A continuacin se presentan los resultados muestrales. Al nivel de significancia de 0.05, La compaa puede concluir que hay una diferencia en el ingreso promedio? (Por supuesto, en la prctica se seleccionaran ms de cuatro familias)
16/04/2013 ESTADISTICA INDUSTRIAL 71 16/04/2013 ESTADISTICA INDUSTRIAL 72
12
DATOS
1 Ho: Los ingresos promedio son las mismas para cada centro . Ha: Los ingresos promedio no son las mismas para cada centro . 2.- Nivel de significancia =0.05 3.- Distribucin F. 4.K= # tratamientos=3 G.L numerador=k-1= 3-1=2 G.L. denominador=n-k=12-3=9
16/04/2013
ESTADISTICA INDUSTRIAL
73
16/04/2013
ESTADISTICA INDUSTRIAL
74
CALCULOS
16/04/2013
ESTADISTICA INDUSTRIAL
75
16/04/2013
ESTADISTICA INDUSTRIAL
76
16/04/2013
ESTADISTICA INDUSTRIAL
77
16/04/2013
ESTADISTICA INDUSTRIAL
78
13
16/04/2013
ESTADISTICA INDUSTRIAL
79
16/04/2013
ESTADISTICA INDUSTRIAL
80
Intervalos
Como ambos extremos tienen el mismo signo, esto indica que son diferentes significativamente Southwyck y el Parque Franklin. Southwyck y Old Orchard G.L.=n-k=12-3=9 , en tablas t con dos colas
16/04/2013
ESTADISTICA INDUSTRIAL
81
16/04/2013
ESTADISTICA INDUSTRIAL
82
PROBLEMA
Como ambos extremos tienen el mismo signo, esto indica que son diferentes significativamente Parque Franklin y el Old Orchard. Por lo tanto hay evidencia suficiente, en un nivel de significancia de 0.05, de que el ingreso promedio no es igual en los tres centros.
16/04/2013 ESTADISTICA INDUSTRIAL 83
En el desarrollo de nuevas medicinas para el tratamiento de la ansiedad, es importante verificar el efecto de los medicamentos sobre varias funciones motrices, una de las cuales es conducir un automvil. La compaa farmacutica LEVIFARM est probando cuatro ansiolticos diferentes respecto a su efecto sobre las capacidades para conducir. Los sujetos toman una prueba de manejo simulada y su calificacin refleja los errores cometidos. Los errores ms graves producen calificaciones ms altas. Los resultados de estas pruebas se presentan en la siguiente tabla:
16/04/2013 ESTADISTICA INDUSTRIAL 84
14
Medicina 1
245
258
239
241
A un nivel de significancia de 0.05. los cuatro medicamentos afectan de manera diferente las habilidades de manejo?.
Medicina 2
277
276
263
274
Medicina 3
215
232
225
247
226
Medicina 4
16/04/2013
241
253
237
246
240
85 16/04/2013 ESTADISTICA INDUSTRIAL 86
ESTADISTICA INDUSTRIAL
15