Sie sind auf Seite 1von 15

OBJETIVOS DEL CAPITULO

- Enumerar las caractersticas de la distribucin F. - Realizar una prueba de hiptesis para determinar si 2 varianzas mustrales provienen de poblaciones iguales. - Cuando se desea comparar simultneamente 2 o mas medias poblacionales. - Establecer y organizar datos en una tabla ANOVA en 1 y 2 direcciones. - Efectuar una prueba de Hiptesis entre 3 o mas medias de Tratamiento.
1 16/04/2013 ESTADISTICA INDUSTRIAL 2

ESTADISTICA INDUSTRIAL ANALISIS DE VARIANZA MG.. ROSMERY MAYTA H 2013


16/04/2013 ESTADISTICA INDUSTRIAL

DISTRIBUCION F
Esta distribucin de probabilidad se utiliza como estadstico de prueba : Para demostrar si dos variancias mustrales proviene de la misma poblacin o de poblaciones iguales . Cuando se desean comparar simultneamente varias medias poblacionales. La comparacin simultnea de varias medias poblacionales se denomina Anlisis de Varianza (ANOVA de analisys of variance).
16/04/2013 ESTADISTICA INDUSTRIAL 3

Caractersticas de la distribucin F
1.- Existe una familia de distribucin F. Un miembro especifico de la familia queda determinado por dos parmetros: los grados de libertad en el numerador y los grados de libertad en el denominador.

Se puede observar que la forma de las curvas cambia conforme se modifican los grados de libertad.
16/04/2013 ESTADISTICA INDUSTRIAL 4

Grado de libertad.- Por grados de libertad entendemos el nmero efectivo de observaciones que contribuyen a la suma de cuadrados en un ANOVA, es decir, el nmero total de observaciones menos el nmero de datos que sean combinacin lineal de otros. 2.- La distribucin F es continua.- Esto significa que puede tomar una cantidad infinita de valores entre 0 y mas infinito. 3.- La distribucin F no puede ser negativa.-El menor valor que puede asumir F es cero. 4.- La distribucin F tiene un sesgo positivo.- -La cola larga de la distribucin se encuentra a la derecha. Conforme el nmero de grados de libertad aumenta, tanto en el numerador como en el denominador, la distribucin se aproxima a una distribucin normal.
16/04/2013 ESTADISTICA INDUSTRIAL 5

5.- La distribucin F es asinttica.- Conforme los valores de X aumentan, la curva de la distribucin F se aproxima al eje X, pero nunca la toca. Esto es parecido al comportamiento de la distribucin normal.

16/04/2013

ESTADISTICA INDUSTRIAL

COMPARACION DE DOS VARIANZAS POBLACIONALES

16/04/2013

ESTADISTICA INDUSTRIAL

16/04/2013

ESTADISTICA INDUSTRIAL

PROBLEMA
Los valores crticos de F estn dado por: Prueba de dos colas F (/2,n1-1,n2-1) : (tabla) .El otro valor esta dado por la inversa: 1/ (F (/2,n2-1,n1-1) = Prueba de una cola: F ( ,n1-1,n2-1) :( tabla) n1-1: Grados de libertad en el numerador n2-1: Grados de libertad del denominador
16/04/2013 ESTADISTICA INDUSTRIAL 9

Un corredor de valores de la bolsa de lima estudia los porcentajes de rendimiento de las empresas del sector minero y el sector financiero. Se sabe que tasas de rendimiento independientes tienen distribucin normal. Dos muestras aleatorias de las tasas de 8 empresas del sector minero (M) y de 6 empresas del sector financiero han dado los siguientes valores de rendimientos de porcentajes.
16/04/2013 ESTADISTICA INDUSTRIAL 10

Sector M:17,23,25,18,24,20,21,16 Sector F: 13,16,14,12,15,14. Con un nivel de significancia del 0.05. Se puede concluir que hay mas variacin en los valores del sector minero?. Se X1 Y X2 las variables que representa los valores de rendimiento de los sectores M y F respectivamente

Procedimiento
Estas variables tienen distribuciones normales con varianzas desconocida respectivas 1.-

16/04/2013

ESTADISTICA INDUSTRIAL

11

16/04/2013

ESTADISTICA INDUSTRIAL

12

2.- Nivel de significancia:0.05 3.-

4.- Con n1-1 y n2-1 grados de libertad .n1=8 .n2=6, Fc(0.05, 7,5) = 4.88 5.Fk= 11.1429/2= 5.5714 S= (x - ) 2/ (n-1) Como el Fk pertenece a la regin critica se rechaza la hiptesis nula y se acepta la hiptesis alternativa,
13 16/04/2013 ESTADISTICA INDUSTRIAL 14

16/04/2013

ESTADISTICA INDUSTRIAL

PROBLEMA
Esto quiere decir que la varianza de la muestra 1(sector minero) son mayores que las varianzas de la muestra 2 (sector financiero). Una muestra de 16 observaciones tomada de la poblacin 1 con una varianza de 3.75, y una muestra de 10 observaciones tomada de la poblacin 2 con una varianza de 5.38. Realizar una prueba de hiptesis para probar si las varianzas son diferentes.

16/04/2013

ESTADISTICA INDUSTRIAL

15

16/04/2013

ESTADISTICA INDUSTRIAL

16

Ho: 12=22 Ha: 1222 2Nivel de significacin: = 0.10 3Se utiliza la distribucin de prueba Grados de libertad: numerador: 16-1=15 y denominador: 10-1=9 y /2 por ser de dos colas F(0.025,9,15)= 3.12 y F(0.025,15,9) = 3.77 F2 = 1/F(0.05,15,9) =01/3.77= 0.265 Analizando varianzas: s22=3.75 y s12=5.38 Luego: Fk= 5.38/3.75 = 1.43 1Hiptesis:
16/04/2013 ESTADISTICA INDUSTRIAL 17

4Regin Crtica: Tenemos la regin critica con [F<0.27 o F> 3.12] 5 Decisin: Se observa que Fk = 1.43 pertenece a la regin de aceptacin por lo tanto se acepta la hiptesis nula. Es decir, no se puede afirmar que existe diferencia en las varianzas de las dos poblaciones.

16/04/2013

ESTADISTICA INDUSTRIAL

18

ANOVA
Otro uso de la distribucin F es la tcnica del anlisis de varianza (ANOVA), con la que se comparan tres o mas medias poblacionales para determinar si son iguales. Para usar el ANOVA se considera lo siguiente: 1.- Las poblaciones estn distribuidas normalmente. 2.- Las poblaciones tienen desviaciones estndar iguales (S). 3.- Las muestras se seleccionan independientemente.

USO DEL ANALISIS DE VARIANZA


El anlisis de varianza (ANOVA) es una prueba, un clculo que nos permite medir la variacin de las respuestas numricas como valores de evaluacin de diferentes variables nominales. La prueba a realizar en el Anlisis de Varianza es s existe diferencia en los promedios para los diferentes valores de las variables nominales; esta prueba se realiza para variables donde una tiene valores nominales y la otra tiene valores numricos.

16/04/2013

ESTADISTICA INDUSTRIAL

19

16/04/2013

ESTADISTICA INDUSTRIAL

20

ANOVA EN UNA DIRECCION

Otra aplicacin: Se tiene la medicin de las seales de recepcin en el medio ambiente de celulares lo que se intenta es probar si existe o no diferencias en las diferentes lecturas tomados en diferentes distritos. (Variable nominal). Para analizar si existe diferencia en los promedios se procede a realizar una prueba F, cuando se toma tres o mas muestras
16/04/2013 ESTADISTICA INDUSTRIAL 21

Definicin. Tcnica fundamental que, en su diseo ms sencillo, desarrolla un contraste de hiptesis estadsticas, que afecta simultneamente a las medias de k poblaciones (variables aleatorias) con distribucin normal y homoscedsticas, es decir, con idnticas varianzas.

16/04/2013

ESTADISTICA INDUSTRIAL

22

Paso 5. Seleccionar la muestra, realizar los clculos y tomar una decisin. Se resume los clculos del estadstico F en una tabla ANOVA. El formato de tabla ANOVA es el siguiente:

Donde: SStotal: Es la variacin total. SST: Suma de cuadrados debido a los tratamientos SSE: Suma de cuadrados debido al error. MST: Cuadrado medio de los tratamientos. MSE: Cuadrado medio del error.
16/04/2013 ESTADISTICA INDUSTRIAL 23 16/04/2013 ESTADISTICA INDUSTRIAL 24

Normalmente se comienza determinado SStotal. La formula para determinar SStotal es:

Despus se determina SST, la suma de cuadrados debidos al tratamiento. La formula parea encontrar SST es:

Donde: Donde: X2 es la suma de los valores X elevados al cuadrado. (X)2 es el cuadrado de la suma de los valores X. N es el nmero total de observaciones. Tc es el total de la columna de cada tratamiento. nc es el nmero de observ. (Tamao de la muestra) de cada tratamiento. Finalmente se determina SSE, la suma de los cuadrados del error, por substraccin. La formula es:

16/04/2013

ESTADISTICA INDUSTRIAL

25

16/04/2013

ESTADISTICA INDUSTRIAL

26

ANOVA EN DOS DIRECCIONES En un ANOVA de dos direcciones se considera una segunda variable de tratamiento. a) La segunda variable de tratamiento se denomina la variable de bloqueo.

c) El termino SSE, o error de suma de cuadrados, se evala mediante la siguiente ecuacin.

d) El valor estadistico F para la variable de tratamiento y la variable de bloqueo, se determina en la siguiente tabla:

. b) Se determina usando la siguiente ecuacin:

16/04/2013

ESTADISTICA INDUSTRIAL

27

16/04/2013

ESTADISTICA INDUSTRIAL

28

PROBLEMAS DE ANOVA EN UNA DIRECCIN

Problema Un analista financiero desea determinar si hay diferencia en la tasa media de rendimiento de tres tipos de acciones: de servicios pblicos, de comercio al menudeo y bancarios. Se obtuvo la siguiente informacin muestral (Tabla 1). Utilizando el nivel de significancia de 0.05. Existe alguna diferencia entre los tres tipos de acciones, en la tasa media de rendimiento?
16/04/2013 ESTADISTICA INDUSTRIAL 29 16/04/2013 ESTADISTICA INDUSTRIAL 30

16/04/2013

ESTADISTICA INDUSTRIAL

31

16/04/2013

ESTADISTICA INDUSTRIAL

32

16/04/2013

ESTADISTICA INDUSTRIAL

33

16/04/2013

ESTADISTICA INDUSTRIAL

34

Paso 4.- Ahora tenemos que Fk =18.09 y el valor critico con (2,15) grados de libertad , 2 en el numerador (fila) y 15 en el denominador (columna) Fc=3.68, como Fk es mayor que el valor critico entonces se rechaza la hiptesis nula. Paso 5.- El analista financiero puede concluir que existe diferencia en los tres tipos de acciones, en la tasa de rendimiento.
16/04/2013 ESTADISTICA INDUSTRIAL 35 16/04/2013 ESTADISTICA INDUSTRIAL 36

INFERENCIA ACERCA DE DOS MEDIAS La distribucin T se utiliza como base de esta prueba. Un intervalo de confianza para la diferencia entre dos medias poblacionales se logra mediante. (X1-X2) +/ - t MSE ( 1/n1+ 1/n2) X1: Es la media del primer tratamiento X2: Es la media del segundo tratamiento
16/04/2013 ESTADISTICA INDUSTRIAL 37

INFERENCIA ACERCA DE DOS MEDIAS

T student se obtiene de tabla t con lo grados de libertad N-K. y alfa/2 MSE : Es el cuadrado medio de error que se obtiene de la tabla de anova SSE/(n-k) .n1: Es el nmero de observaciones en el primer tratamiento .n2: Es el nmero de observaciones del segundo tratamiento
16/04/2013 ESTADISTICA INDUSTRIAL 38

INFERENCIA ACERCA DE DOS MEDIAS CONCLUSION:


Si ambos extremos del intervalo de confianza tienen el MISMO SIGNO, esto indica que las medias de tratamiento son DIFERENTES significativamente.

(X1-X2) +/- 2.131 2.88 ( 1/6 + 1/6) Ahora remplazamos los valores de.

Para el ejemplo: N-k = 18-3 = 15 g.l y = 0.05 Tc= 2.131

16/04/2013

ESTADISTICA INDUSTRIAL

39

16/04/2013

ESTADISTICA INDUSTRIAL

40

PROBLEMA
Se sabe que un egresado (con licenciatura) de una escuela de administracin gana ms que un egresado de la enseanza preparatoria sin instruccin adicional; y que una persona con maestra o doctorado, gana an ms. Para probar esto, se tom una muestra aleatoria de 25 ejecutivos de compaas cuyos activos eran superiores a un milln de dlares. A continuacin se muestran sus ingresos, clasificados segn el nivel ms alto de educacin.
16/04/2013 ESTADISTICA INDUSTRIAL 41 16/04/2013 ESTADISTICA INDUSTRIAL 42

Pruebe al nivel de significancia 0.05 que no hay diferencia en los salarios medios de los tres grupos. Realizamos nuestra prueba de Hiptesis 1. Hiptesis: H0: 1 = 2 = 3 Ha: No todas las medias son iguales 2. Nivel de significacin: = 0.05 3. Estadstico de prueba: F 4. F de tabla se halla con k 1 grados de libertad en el numerador y n k grados de libertad para el denominador. Para el numerador se tiene 2 grados de libertad y para el denominador 22. F(0.05,2,22) = 3.44

16/04/2013

ESTADISTICA INDUSTRIAL

43

16/04/2013

ESTADISTICA INDUSTRIAL

44

16/04/2013

ESTADISTICA INDUSTRIAL

45

16/04/2013

ESTADISTICA INDUSTRIAL

46

5.- TOMA DE DECISION El FK=10.184 es mayor a 3.44. Por lo tanto, rechazamos la hiptesis nula y aceptamos la hiptesis alternativa. Entonces no todas las medias de los ingresos de los ejecutivos son iguales ya que depende del grado que tengan.

= =

16/04/2013

ESTADISTICA INDUSTRIAL

47

16/04/2013

ESTADISTICA INDUSTRIAL

48

16/04/2013

ESTADISTICA INDUSTRIAL

49

16/04/2013

ESTADISTICA INDUSTRIAL

50

ANOVA EN DOS DIRECCIONES


En anova de una direccin se considera solo dos fuentes de variacin , una la causada por el tratamiento y otro debido al azar. Seria mejor considerar otros factores inmersos en el problema . La ventaja de considerar otros factores reside en que se puede reducir la varianza del error . Es decir , si se reduce el la suma de cuadrado del error o el SSE el valor de F ser mayor ,haciendo que se rechace la hiptesis nula que las medias son iguales.
16/04/2013 ESTADISTICA INDUSTRIAL 51

ANOVA EN DOS DIRECCIONES


Para ANOVA de dos factores se prueba si existe una diferencia significativa entre el efecto de tratamiento y si existe una diferencia en la variable de bloqueo. Sea Br el total de bloque (r segn las filas) SSB representa la suma de los cuadrados de los bloques, donde:

16/04/2013

ESTADISTICA INDUSTRIAL

52

Problema
Un organismo de investigacin quiere comparar los rendimientos en milla por galn, de gasolinas regular sin plomo, semigrado y sper Premium. Debido a la diferencia en el funcionamiento en los diferentes automviles, se seleccionaron 7 de ellos y se les trato como bloques. Por lo tanto cada clase de gasolina se prob con cada tipo de vehculo, los resultados de las pruebas, en millas por galn, se muestra en la siguiente tabla. A nivel de significancia de 0.05. Existe alguna diferencia entre las gasolinas y los automviles?
53 16/04/2013 ESTADISTICA INDUSTRIAL 54

B 2 ( X ) 2 SSB = r n k

16/04/2013

ESTADISTICA INDUSTRIAL

Datos

16/04/2013

ESTADISTICA INDUSTRIAL

55

16/04/2013

ESTADISTICA INDUSTRIAL

56

Procedemos a determinar cada una de nuestras variables de la Tabla Anova. Para los Tratamientos

Error La tabla ANOVA:

Para los Bloques

Suma de cuadrados totales

16/04/2013

ESTADISTICA INDUSTRIAL

57

16/04/2013

ESTADISTICA INDUSTRIAL

58

Para cada tipo de gasolina


1.- Hiptesis: H0: 1 = 2 = 3 Ha: No todas las medias son iguales 2.- Nivel de significancia: = 0.05 3.-Estadstico: El estadstico de prueba es F 4.-Regin Crtica:
Para = 0.05 y sabiendo: Grados de libertad del numerador = k 1 = 2 Grados de libertad de denominador = (k 1)*(b 1) = 12 En tablas encontramos que: F(0.05 ; 2, 12) = 3.89 La regin crtica est dada por: Regin Critica = {F > 3.89}

5.-Decisin: Como se puede apreciar en el grafico anterior, el valor de F calculado (26.71), es mayor que el F tabla (3.89), y se encuentra en la regin critica, por lo tanto se rechaza la hiptesis nula y se acepta la alternativa. Se puede concluir que los rendimientos medios que ofrece cada tipo de gasolina en miles por galn no son iguales. Para los automviles 1.- Hiptesis: H0: 1 = 2 = 3 = 4 = 5 = 6= 7 Ha: No todas las medias son iguales 2.-Nivel de significancia: = 0.05 3.- Estadstico: Con el estadstico de prueba F

16/04/2013

ESTADISTICA INDUSTRIAL

59

16/04/2013

ESTADISTICA INDUSTRIAL

60

10

4.- Regin Crtica: Para = 0.05 y sabiendo que: Grados de libertad del numerador = k 1 = 6 Grados de libertad de denominador = (k 1)(b 1) = 12 En tablas se ubica: F(0.05 ; 6, 12) = 3.00 La regin crtica est dada por: Regin Critica = {F > 3.00} 5.- Decisin: Como el valor de F calculado (15.60), es mayor que el F=3 ( tabla) , entonces se encuentra en la regin de rechazo, por lo tanto, rechazamos la hiptesis nula y se acepta la hiptesis alternativa Puede concluirse, entonces, que efectivamente existe alguna diferencia entre los rendimientos medios en cada tipo de automvil.
16/04/2013 ESTADISTICA INDUSTRIAL 61 16/04/2013 ESTADISTICA INDUSTRIAL 62

PROBLEMAS DE ANOVA EN DOS DIRECCIONES

Problema Cada una de las tres cadenas de supermercados en la regin de Denver indica que ofrece los precios mas bajos .Como parte de su estudio de investigacin sobre publicidad de supermercados, el diario Denver Daily News realiz un estudio. Primero selecciono una muestra aleatoria de nueve artculos comestibles. Despus reviso el precio da cada uno de estos productos en cada una de las tres cadenas, el mismo da. Al nivel de significancia de 0.05 Hay alguna diferencia en los precios medios de los supermercados y de los artculos?
16/04/2013 ESTADISTICA INDUSTRIAL 63 16/04/2013 ESTADISTICA INDUSTRIAL 64

16/04/2013

ESTADISTICA INDUSTRIAL

65

16/04/2013

ESTADISTICA INDUSTRIAL

66

11

16/04/2013

ESTADISTICA INDUSTRIAL

67

16/04/2013

ESTADISTICA INDUSTRIAL

68

16/04/2013

ESTADISTICA INDUSTRIAL

69

16/04/2013

ESTADISTICA INDUSTRIAL

70

PROBLEMA
Una compaa de inversiones en bienes races, est considerando invertir en un centro comercial en las afueras de Atlanta, Georgia. Se evalan tres terrenos. Es de particular importancia el ingreso monetario de los habitantes del rea que rodea el centro comercial en consideracin. Se selecciona una muestra aleatoria de cuatro familias que viven cerca de cada centro . A continuacin se presentan los resultados muestrales. Al nivel de significancia de 0.05, La compaa puede concluir que hay una diferencia en el ingreso promedio? (Por supuesto, en la prctica se seleccionaran ms de cuatro familias)
16/04/2013 ESTADISTICA INDUSTRIAL 71 16/04/2013 ESTADISTICA INDUSTRIAL 72

12

DATOS

1 Ho: Los ingresos promedio son las mismas para cada centro . Ha: Los ingresos promedio no son las mismas para cada centro . 2.- Nivel de significancia =0.05 3.- Distribucin F. 4.K= # tratamientos=3 G.L numerador=k-1= 3-1=2 G.L. denominador=n-k=12-3=9

16/04/2013

ESTADISTICA INDUSTRIAL

73

16/04/2013

ESTADISTICA INDUSTRIAL

74

CALCULOS

16/04/2013

ESTADISTICA INDUSTRIAL

75

16/04/2013

ESTADISTICA INDUSTRIAL

76

Corrido con Minitab

16/04/2013

ESTADISTICA INDUSTRIAL

77

16/04/2013

ESTADISTICA INDUSTRIAL

78

13

INFERENCIA DE DOS MEDIAS


Se rechaza la Ho, por tanto los ingresos promedios no son iguales. Para hallar el intervalo de confianza Southwyck y Parque Franklin G.L.=n-k=12-3=9 , en tablas t con dos colas

16/04/2013

ESTADISTICA INDUSTRIAL

79

16/04/2013

ESTADISTICA INDUSTRIAL

80

Intervalos
Como ambos extremos tienen el mismo signo, esto indica que son diferentes significativamente Southwyck y el Parque Franklin. Southwyck y Old Orchard G.L.=n-k=12-3=9 , en tablas t con dos colas

16/04/2013

ESTADISTICA INDUSTRIAL

81

16/04/2013

ESTADISTICA INDUSTRIAL

82

PROBLEMA
Como ambos extremos tienen el mismo signo, esto indica que son diferentes significativamente Parque Franklin y el Old Orchard. Por lo tanto hay evidencia suficiente, en un nivel de significancia de 0.05, de que el ingreso promedio no es igual en los tres centros.
16/04/2013 ESTADISTICA INDUSTRIAL 83

En el desarrollo de nuevas medicinas para el tratamiento de la ansiedad, es importante verificar el efecto de los medicamentos sobre varias funciones motrices, una de las cuales es conducir un automvil. La compaa farmacutica LEVIFARM est probando cuatro ansiolticos diferentes respecto a su efecto sobre las capacidades para conducir. Los sujetos toman una prueba de manejo simulada y su calificacin refleja los errores cometidos. Los errores ms graves producen calificaciones ms altas. Los resultados de estas pruebas se presentan en la siguiente tabla:
16/04/2013 ESTADISTICA INDUSTRIAL 84

14

Medicina 1

245

258

239

241

A un nivel de significancia de 0.05. los cuatro medicamentos afectan de manera diferente las habilidades de manejo?.

Medicina 2

277

276

263

274

Medicina 3

215

232

225

247

226

Medicina 4
16/04/2013

241

253

237

246

240
85 16/04/2013 ESTADISTICA INDUSTRIAL 86

ESTADISTICA INDUSTRIAL

15

Das könnte Ihnen auch gefallen