Sie sind auf Seite 1von 69

INSTITUTO TECNOLOGICO

SUPERIOR DE ALVARADO
Campus Lerdo.
INGENIERA
INDUSTRIAL
Materia:
Mercadotecnia
.
Semestre - Grupo - Sistema:
6 Semestre - Grupo A Semi-Escolarizado.
Producto Acadmico:
Investigacion Unidad 1
Presenta:
Oscar rodrguez Hernndez.
Docente:
Ingrid Dianet
LERDO DE TEJADA, VER. FEB-JULIO. 2015

Primera Unidad
1.1 El trmino "regresin" fue acuado por Sir Francis Galton
(1822-1911), primo de Charles Darwin. Galton estudiaba la eugnica,
trmino tambin introducido por s mismo para definir el estudio de la
mejora de la raza humana a partir de los caracteres hereditarios.
Galton estudi la altura de los hijos con relacin a la altura de sus
padres, y prob que la altura de hijos altos regresaba hacia la media
de la altura de la poblacin a lo largo de sucesivas generaciones. En
otras palabras, hijos de padres extraordinariamente altos tendan a ser
en promedio ms bajos que sus padres, e hijos de padres muy bajos
tendan a ser en promedio ms altos que sus padres. En la actualidad, el
trmino de regresin se utiliza siempre que se busca predecir una
variable en funcin de otra, y no implica que se est estudiando si se
est produciendo una regresin a la media. Anteriormente a Galton se
debe mencionar a Legendre (1752-1833), quien introdujo el mtodo de
los mnimos cuadrados utilizndolos para definir la longitud de 1 metro
como una diez millonsima parte del arco meridional. Con posterioridad
a Galton, las propiedades de las tcnicas de regresin fueron estudiadas
por Edgeworth, Pearson y Yule.
La tcnica de regresin lineal simple est indicada cuando se pretende
explicar una variable respuesta cuantitativa en funcin de una variable
explicativa cuantitativa tambin llamada variable independiente,
variable regresora o variable predictora. Por ejemplo, se podra intentar
explicar el peso en funcin de la altura. El modelo intentara aproximar
la variable respuesta mediante una funcin lineal de la variable
explicativa.
Las suposiciones que se realizan al aplicar las tcnicas de regresin
lineal son:
-El modelo propuesto es lineal (es decir existe relacin entre la variable
explicativa y la variable explicada, y esta relacin es lineal). Es decir se
asume que:
var.respuesta0var. explicativa1

Siendo 0el trmino independiente (constante o intercept), 1el


coeficiente de regresin de la variable explicativa (pendiente o slope)
y es una variable aleatoria que se llama error residual.
-La variable explicativa se ha medido sin error.
-El valor esperado de del modelo es cero.
-La varianza de (y por lo tanto de la variable respuesta) es
constante.
-Los son independientes entre s.
-Si se desean realizar contrastes de hiptesis sobre los parmetros
(coeficientes) o sobre el modelo, tambin es necesario que la
distribucin de sea normal.
Para estudiar la validez del modelo es necesario confirmar estas
hiptesis mediante el estudio de los residuos (valores observados valores predichos): normalidad, tendencias, etc. Cuando no se cumplen
los criterios de aplicacin es necesario realizar transformaciones a las
variables, o bien para obtener una relacin lineal o bien para
homogeneizar la varianza.

Regresin lineal simple. Tiene como objeto estudiar cmo los cambios
en una variable, no aleatoria, afectan a una variable aleatoria, en el caso
de existir una relacin funcional entre ambas variables que puede ser
establecida por una expresin lineal, es decir, su representacin grfica
es una lnea recta. Cuando la relacin lineal concierne al valor medio o
esperado de la variable aleatoria, estamos ante un modelo de regresin
lineal simple. La respuesta aleatoria al valor x de la variable controlada
se designa por Yx y, segn lo establecido, se tendr

De manera equivalente, otra formulacin del modelo de regresin lineal


simple sera: si xi es un valor de la variable predictora e Yi la variable
respuesta que le corresponde, entonces

Ei es el error o desviacin aleatoria de Yi .


Definicin VALOR MEDIO. Constante que representa el centro de
gravedad de la ley de probabilidad de una variable aleatoria y que, en
casos de notable simetra en la funcin de densidad, puede interpretarse
que dicha constante nos seala la zona donde se sitan los valores de
mxima probabilidad de la variable aleatoria.

El valor medio o valor esperado de una variable aleatoria X se define


como

siempre que dicho valor exista, donde f es la funcin de densidad de la


variable.

Estimacin de parmetros.

En un grupo de 8 pacientes se miden las cantidades antropomtricas


peso y edad, obtenindose los siguientes resultados:
Resultado de las mediciones
edad
peso

12

10

11

10

14

58

42

51

54

40

39

49

56

Existe una relacin lineal importante entre ambas variables? Calcular la


recta de regresin de la edad en funcin del peso y la del peso en
funcin de la edad. Calcular la bondad del ajuste En qu medida, por
trmino medio, vara el peso cada ao? En cunto aumenta la edad por
cada kilo de peso?
Solucin:
Para saber si existe una relacin lineal entre ambas variables se calcula
el coeficiente de correlacin lineal, que vale:

ya que

Por tanto el ajuste lineal es muy bueno. Se puede decir que el ngulo
entre el vector formado por las desviaciones del peso con respecto a su
valor medio y el de la edad con respecto a su valor medio, , es:

es decir, entre esos vectores hay un buen grado de paralelismo (slo


unos 19 grados de desviacin).
La recta de regresin del peso en funcin de la edad es

La recta de regresin de la edad como funcin del peso es

que como se puede comprobar, no resulta de despejar en la recta de


regresin de Y sobre X.

La bondad del ajuste es

por tanto podemos decir que el

de la variabilidad del peso en

funcin de la edad es explicada mediante la recta de regresin


correspondiente. Lo mismo podemos decir en cuanto a la variabilidad de
la edad en funcin del peso. Del mismo modo puede decirse que hay un
de varianza que no es explicada por las rectas de

regresin. Por tanto la varianza residual de la regresin del peso en


funcin de la edad es

y la de la edad en funcin del peso:

Por ltimo la cantidad en que vara el peso de un paciente cada ao es,


segn la recta de regresin del peso en funcin de la edad, la pendiente
de esta recta, es decir, b1=2,8367 Kg/ao. Cuando dos personas difieren
en peso, en promedio la diferencia de edad entre ambas se rige por la
cantidad b2=0,3136 aos/Kg de diferencia.
1.1.1

1.1.2. Calidad del Ajuste en Regresin Lineal Simple.

1.1.3. Estimacin y Prediccin por Intervalo en regresin lineal simple.

Medicin de la adecuacin del modelo de regresin.


- Anlisis residual

1.1.4. Uso de un software estadstico.

1.2. Regresin Lineal Mltiple.

1.2.1. Pruebas de Hiptesis en Regresin Lineal Mltiple.

1.2.2. Intervalos de Confianza y Prediccin en regresin mltiple.

1.2.3. Uso de un software estadstico.

1.3. Regresin no lineal

Ejemplo de regresin no
lineal
En estadstica, la regresin no lineal es un problema de inferencia para
un modelo tipo:
y = f(x, ) +
Basado en datos multidimensionales x, , donde f es alguna funcin no
lineal respecto a algunos parmetros desconocidos . Como mnimo, se
pretende obtener los valores de los parmetros asociados con la mejor
curva de ajuste (habitualmente, con el mtodo de los mnimos
cuadrados). Con el fin de determinar si el modelo es adecuado, puede
ser necesario utilizar conceptos de inferencia estadstica tales como
intervalos de confianz a para los parmetros as como pruebas de
bondad de ajuste.
El objetivo de la regresin no lineal se puede clarificar al considerar el
caso de la regresin polinomial, la cual es mejor no tratar como un caso
de regresin no lineal. Cuando la funcin f toma la forma:
f(x) = ax2 + bx + c
la funcin f es no lineal en funcin de x pero lineal en funcin de los
parmetros desconocidos a, b, y c. Este es el sentido del trmino "lineal"
en el contexto de la regresin estadstica. Los procedimientos
computacionales para la regresin polinomial son procedimientos de
regresin lineal (mltiple), en este caso con dos variables predictoras x y
x2. Sin embargo, en ocasiones se sugiere que la regresin no lineal es
necesaria para ajustar polinomios. Las consecuencias prcticas de esta
mala interpretacin conducen a que un procedimiento de optimizacin
no lineal sea usado cuando en realidad hay una solucin disponible en

trminos de regresin lineal. Paquetes (software) estadsticos


consideran, por lo general, ms alternativas de regresin lineal que de
regresin no lineal en sus procedimientos.
Mtodos Numricos para Regresiones No Lineales
Regresin Exponencial
En determinados experimentos, en su mayora biolgicos, la
dependencia entre las variables X e Y es de forma exponencial, en cuyo
caso interesa ajustar a la nube de puntos una funcin del tipo:

Mediante una transformacin lineal, tomando logaritmos neperianos, se


convierte el problema en una cuestin de regresin lineal. Es decir,
tomando logaritmos neperianos:

ln( y ) b x ln( a)

a e[ln( y ) b x ]

Ejemplo

x
1
1,2
1,5
2
3
3,7
4
4,5
20,9

y
3
3,4
5
2
4,1
5
7
6,5
36

In y
1,0986
1,2237
1,6094
0,6931
1,4109
1,6094
1,9459
1,8718
11,4628

x2
1
1,44
2,25
4
9
13,69
16
20,25
67,63

x Iny
1,0986
1,4684
2,4141
1,3862
4,2327
5,9547
7,7836
8,4231
32,7614

In y2
1,2069
1,4974
2,5901
0,4803
1,9906
2,5901
3,7865
3,5056
17,6455

Numero de datos = n = 8

x
x promedio =

= 2,6125

ln( y )
y promedio =

ln( y)

= 1,43285

Usando la forma lineal de la Regresin Exponencial:

b=

[ x ln( y)] ln( y) x


x x x
2

= 0,216047

= 1,43285 - (0,216047)(2,6125) = 0,868427

a e[ln( y ) b x ]
a = eb = e0,216047 = 2,38316
La ecuacin final que modela el sistema es

y 2.38316 e 0.2166047x

Regresin Logartmica
La curva logartmica
es tambin una recta, pero en lugar
de estar referida a las variables originales
e
, est referida a
ya
Ejemplo
y

ln x

ln x2

3
3.4
5
2
4.1
5
7
6.5
36

0
0.1823
0.4054
0.6931
1.0986
1.3083
1.3862
1.5040
6.5779

0
0.0332
0.1643
0.4803
1.2069
1.7116
1.9215
2.2620
7.7798

x
1
1.2
1.5
2
3
3.7
4
4.5
20.9

ln x * y
0
0.6198
2.027
1.3862
4.5042
6.5415
9.7034
9.776
34.5581

y2
9
11.56
25
4
16.81
25
49
42.25
182.62

n=8

y 36 4.5
n

ln( x)

a=

ln( x) 6.5779 0.8222


n

y ln( x) y ln( x) 34.5581 4.5(6.5779) 2.090513


ln x ln( x) ln( x) 7.7798 0.8222(6.5779)
2

= 2.090513

b y a ln( x) 4.5 (2.090513)( 0.8222) 2.78117


b=

= 4.5 - (2.090513)(0.8222) = 2.78117

La ecuacin final que modela el sistema es

Regresin Polinomial
Algunas veces cuando la relacin entre las variables dependientes e
independientes es no lineal, es til incluir trminos polinomiales para
ayudar a explicar la variacin de nuestra variable dependiente.
Las regresiones polinomiales se pueden ajustar la variable
independiente con varios trminos

Ejemplo
x

xy

x2

y2

x2y

x3

x4

1
1.2
1.5
2
3
3.7
4
4.5
20.9

3
3.4
5
2
4.1
5
7
6.5
36

3
4.08
7.5
4
12.3
18.5
28
29.25
106.63

1
1.44
2.25
4
9
13.69
16
20.25
67.63

9
11.56
25
4
16.81
25
49
42.25
182.62

3
4.896
11.25
8
36.9
68.45
112
131.625
376.121

1
1.728
3.375
8
27
50.653
64
91.125
246.881

1
2.0736
5.0625
16
81
187.4161
256
410.0625
958.6147

Usando una Matriz para calcular valores de los coeficientes

Usando el mtodo de Eliminacin de Gauss-Jordan

La ecuacin final que modela el sistema es

Linealizacin
Algunos problemas de regresin no lineal pueden linealizarse mediante
una transformacin en la formulacin del modelo.

INSTITUTO TECNOLOGICO
SUPERIOR DE ALVARADO
Campus Lerdo.
INGENIERA
INDUSTRIAL
Materia:
Mercadotecnia

Semestre - Grupo - Sistema:


6 Semestre - Grupo A Semi-Escolarizado.
Producto Acadmico:
Investigacion de la segunda unidad
Presenta:
Oscar rodrguez Hernndez.
Docente:
Ingrid Dianet
LERDO DE TEJADA, VER. FEB-JULIO. 2015

2.1. Familia Diseos para comparar tratamientos

Se llaman Experimentos Factoriales a aquellos experimentos en los que


se estudia simultneamente dos o ms factores, y donde los
tratamientos se forman por la combinacin de los diferentes niveles de
cada uno de los factores.
Los experimentos factoriales en si no constituyen un diseo
experimental si no que ellos deben ser llevados en cualquiera de los
diseos tal como D.C.A. ; D.B.C.A.; D.C.L.
Los experimentos factoriales se emplean en todos los campos de la
investigacin, son muy utiles en investigaciones exploratorias en las que
poco se sabe acerca de muchos factores.

VENTAJAS:
1.- Permite estudiar los efectos principales, efectos de interaccin de
factores, efectos simples y efectos cruzados.
2.- Todas las unidades experimentales intervienen en la determinacin
de los efectos principales y de los efectos de interaccin de los factores,
por lo que el nmero de repeticiones es elevado para estos casos.
3.- El nmero de grados de libertad para el error experimental es alto,
comparndolo con los grados de libertad de los experimentos simples de
los mismos factores, lo que contribuye a disminuir la variancia del error
experimental, aumentando por este motivo la precisin del experimento.

DESVENTAJA:

1.- Se requiere un mayor nmero de unidades experimentales que los


experimentos simples y por lo tanto se tendr un mayor costo y trabajo
en la ejecucin del experimento.
2.- Como en los experimentos factoriales c/u de los niveles de un factor
se combinan con los niveles de los otros factores; a fin de que exista un
balance en el anlisis estadstco se tendr que algunas de las
combinaciones no tiene inters prctico pero deben incluirse para
mantener el balance.
3.- El anlisis estadistco es ms complicado que en los experimentos
simples y la interpretacin de los resultados se hace ms dificil a medida
de que aumenta el nmero de factores y niveles por factor en el
experimento.

CONCEPTOS GENERALES:
FACTOR.- Es un conjunto de tratamientos de una misma clase o
caracterstica. Ejemplo: tipos de riego, dosis de fertilizacin, variedades
de cultivo, manejo de crianzas, etc.
FACTORIAL.- Es una combinacin de factores para formar tratamientos.
NIVELES DE UN FACTOR.- Son los diferentes tratamientos que
pertenecen a un determinado factor. Se acostumbra simbolizar algn
elemento "i" por la letra minuscula que representa al factor y el valor del
respectivo subindice.
Ejemplo:
A: Tipos de riego: Secano Goteo Aspersin
Niveles: a0 a1 a2

TIPOS DE FACTORES:
1.- Factores Cuantitativos.
2.- Factores Cualitativos.

1.- FACTORES CUANTITATIVOS.- Son aquellos factores cuyos niveles son


cantidades numricas.
Ejemplo:
Factor A : Dosis de fertilizacin
Niveles : 10 Kg/Ha (ao), 20Kg/Ha (a1), 30Kg/Ha (a2).
2.- FACTORES CUALITATIVOS.- Son aquellos factores cuyos niveles son
procedimientos o cualidades.
Ejemplo:
Factor A: Variedades de cultivo
Niveles : Variedad 1, Variedad 2.

Ejemplo de formacin de factoriales:


Sea los factores A y B con sus respectivos niveles:
Factor A: a0 a1 a2
Factor B: b0 b1
La combinacin de los niveles de los factores ser:
a0

a1

b0 b1
a0 b0

a0 b1

b0 b1
a1 b0

a2
b0 b1
a1 b1

a2b0

a2 b1 } tratamientos

Al combinar ambos factores (A y B) se tiene:


3 x 2 = 6 tratamientos para ser evaluados
niveles de A x niveles de B

Si cada tratamiento se aplica a 4 unidades experimentales, se requiere


24 unidades experimentales, para realizar el experimento:

Repeticione
s

a0 b0

a0 b1

a1 b0

a1 b1

a1b0

a2 b 1

FORMACION DE FACTORIALES:
En la informacin de factoriales, se debe tener presente lo siguiente:
1.- Que factores deben incluirse.
2.- Que factores son fijos (modelo I) y que factores son al azar (modelo
II).
3.- Cuantos niveles se tiene por factor.
4.- Si son factores cuantitativos , cual debe ser el espaciamiento entre
los niveles del factor.
Por ejemplo:
0%, 5% y 10% de nitrgeno, significa igual espaciamiento.

TIPOS DE EXPERIMENTOS FACTORIALES:

Los experimentos factoriales para un determinado diseo se diferencian


entre si, por el nmero de factores y por la cantidad de niveles de estos
factores que intervienen en el experimento.
Para simbolizar se usa la letra del factor:

pA x qB dos factores "A y "B", con "p" niveles para "A" y "q" niveles para
"B"
Nmero de factores.

2A 2B = 2A x 2B 2 x 2 22 Nmero de niveles de c/factor (4


tratamientos).
Nmero de factores.

3A 3B = 3A x 3B 3 x 3 32 Nmero de niveles ( 9 tratamientos ).


Nmero de factores.

4A 4B = 4A x 4B 4 x 4 42 Nmero de niveles ( l6 tratamientos ).

EFECTOS DE LOS EXPERIMENTOS FACTORIALES:

1.- EFECTO PRINCIPAL.- Es una medida del cambio en el promedio entre


los niveles de un factor, promediado sobre los diferentes niveles del otro
factor. Ejemplo: Dosis de Nitrogeno en las U.E.
2.- EFECTO INTERACCION.- Es una medida de cambio que expresa el
efecto adicional resultante de la influencia combinada de dos o ms
factores.
Ejemplo: Efecto conjunto de nitrgeno y fosforo.
3.- EFECTO SIMPLE.- Es una medida de cambio en los promedios de los
niveles de un factor, manteniendo constante, uno de los niveles del otro
factor.
Ejemplo: Efecto de nitrogeno ante la presencia de 5% de fosforo.

2.2. El modelo de efectos fijos.

Anlisis de la varianza
En estadstica, el anlisis de la varianza (ANOVA, ANalysis Of VAriance,
segn terminologa inglesa) es una coleccin de modelos estadsticos y
sus procedimientos asociados, en el cual la varianza est particionada
en ciertos componentes debidos a diferentes variables explicativas.
Las tcnicas iniciales del anlisis de varianza fueron desarrolladas por el
estadstico y genetista R. A. Fisher en los aos 1920 y 1930 y es algunas
veces conocido como "Anova de Fisher" o "anlisis de varianza de
Fisher", debido al uso de la distribucin F de Fisher como parte del
contraste de hiptesis.
El anlisis de la varianza parte de los conceptos de regresin lineal.
El primer concepto fundamental es que todo valor observado puede
expresarse mediante la siguiente funcin:

Donde Y sera el valor observado (variable dependiente), y X el valor que


toma la variable independiente.
sera una constante que en la recta de regresin equivale a la
ordenada en el origen,

es otra constante que equivale a la pendiente

de la recta, y es una variable aleatoria que aade a la funcin cierto


error que desva la puntuacin observada de la puntuacin pronosticada.
Por tanto, a la funcin de pronstico la podemos llamar "Y prima":

Podemos resumir que las puntuaciones observadas equivalen a las


puntuaciones esperadas, ms el error aleatorio:
(1.1)
Sabiendo este concepto, podemos operar con esta ecuacin de la
siguiente forma:

1) Restamos a ambos lados de la ecuacin (para mantener la igualdad)


la media de la variable dependiente:

2) Substituimos el error por la ecuacin resultante de despejar la


ecuacin 1.1:

Por tanto...

Y reorganizando la ecuacin:

Ahora hay que tener en cuenta que la media de las puntuaciones


observadas es exactamente igual que la media de las puntuaciones
pronosticadas:

Por tanto:

Podemos ver que nos han quedado 3 puntuaciones diferenciales. Ahora


las elevamos al cuadrado para que posteriormente, al hacer el
sumatorio, no se anulen:

Y desarrollamos el cuadrado:

Podemos ver que tenemos los numeradores de las varianzas, pero al no


estar divididas por el nmero de casos (n), las llamamos Sumas de
Cuadrados., excepto en el ltimo trmino, que es una Suma Cruzada de
Cuadrados (el numerador de la covarianza), y la covarianza en este caso
es cero (por las propiedades de la regresin lineal, la covarianza entre el
error y la variable independiente es cero).
Por tanto:

O lo mismo que:

de un factor, que es el caso ms sencillo, la idea bsica del anlisis de la


varianza es comparar la variacin total de un conjunto de muestras y
descomponerla como:

Donde:
es un nmero real relacionado con la varianza, que mide la
variacin debida al "factor", "tratamiento" o tipo de situacin
estudiado.
es un nmero real relacionado con la varianza, que mide la
variacin dentro de cada "factor", "tratamiento" o tipo de
situacin.
En el caso de que la diferencia debida al factor o tratamiento no sean
estadsticamente significativa puede probarse que las varianzas
muestrales son iguales:

Donde:
es el nmero de situaciones diferentes o valores del factor se
estn comparando.
es el nmero de mediciones en cada situacin se hacen o nmero
de valores disponibles para cada valor del factor.
As lo que un simple test a partir de la F de Snedecor puede decidir si el
factor o tratamiento es estadsticamente significativo.
Visin general
Existen tres clases conceptuales de estos modelos:
1. El Modelo de efectos fijos asume que los datos provienen de
poblaciones normales las cuales podran diferir nicamente en sus
medias. (Modelo 1)
2. El Modelo de efectos aleatorios asume que los datos describen una
jerarqua de diferentes poblaciones cuyas diferencias quedan
restringidas por la jerarqua. Ejemplo: El experimentador ha

aprendido y ha considerado en el experimento slo tres de muchos


ms mtodos posibles, el mtodo de enseanza es un factor
aleatorio en el experimento. (Modelo 2)
3. El Modelo de efectos mixtos describen situaciones que ste puede
tomar. Ejemplo: Si el mtodo de enseanza es analizado como un
factor que puede influir donde estn presentes ambos tipos de
factores: fijos y aleatorios. (Modelo 3)
Supuestos previos
El ANOVA parte de algunos supuestos que han de cumplirse:

La variable dependiente debe medirse al menos a nivel de


intervalo.

Independencia de las observaciones.

La distribucin de los residuales debe ser normal.

Homocedasticidad: homogeneidad de las varianzas.

La tcnica fundamental consiste en la separacin de la suma de


cuadrados (SS, 'sum of squares') en componentes relativos a los factores
contemplados en el modelo. Como ejemplo, mostramos el modelo para
un ANOVA simplificado con un tipo de factores en diferentes niveles. (Si
los niveles son cuantitativos y los efectos son lineales, puede resultar
apropiado un anlisis de regresin lineal)

El nmero de grados de libertad (gl) puede separarse de forma similar y


corresponde con la forma en que la distribucin chi-cuadrado ( o Jicuadrada) describe la suma de cuadrados asociada.

Tipos de modelo
Modelo I: Efectos fijos
El modelo de efectos fijos de anlisis de la varianza se aplica a
situaciones en las que el experimentador ha sometido al grupo o
material analizado a varios factores, cada uno de los cuales le afecta
slo a la media, permaneciendo la "variable respuesta" con una
distribucin normal.
Este modelo se supone cuando el investigador se interesa nicamente
por los niveles del factor presentes en el experimento, por lo que

cualquier variacin observada en las puntuaciones se deber al error


experimental.
Modelo II: Efectos aleatorios (componentes de varianza)
Los modelos de efectos aleatorios se usan para describir situaciones en
que ocurren diferencias incomparables en el material o grupo
experimental. El ejemplo ms simple es el de estimar la media
desconocida de una poblacin compuesta de individuos diferentes y en
el que esas diferencias se mezclan con los errores del instrumento de
medicin.
Este modelo se supone cuando el investigador est interesado en una
poblacin de niveles, tericamente infinitos, del factor de estudio, de los
que nicamente una muestra al azar (t niveles) estn presentes en el
experimento.
Grados de libertad
Pruebas de significacin
El anlisis de varianza lleva a la realizacin de pruebas de significacin
estadstica, usando la denominada distribucin F de Snedecor.
Tablas ANOVA
Una vez que se han calculado las sumas de cuadrados, las medias
cuadrticas, los grados de libertad y la F, se procede a elaborar una
tabla que reuna la informacin, denominada "Tabla de Anlisis de
varianza o ANOVA", que adopta la siguiente forma:
Fuente de
variacin

Suma de
cuadrados

Grados de
libertad

Intergrupo

t-1

Intragrupo o
Error

N-t

Total

N-1

Cuadrado medio

Concepto de modelo economtrico


La econometra, igual que la economa, tiene como objetivo explicar una
variable en funcin de otras. Esto implica que el punto de partida para el
anlisis economtrico es el modelo econmico y este se transformar en
modelo economtrico cuando se han aadido las especificaciones

necesarias para su aplicacin emprica. Es decir, cuando se han definido


las variables (endgenas, exgenas) que explican y determinan el
modelo, los parmetros estructurales que acompaan a las variables, las
ecuaciones y su formulacin en forma matemtica, la perturbacin
aleatoria que explica la parte no sistemtica del modelo, y los datos
estadsticos.
A partir del modelo economtrico especificado, en una segunda etapa se
procede a la estimacin, fase estadstica que asigna valores numricos a
los parmetros de las ecuaciones del modelo. Para ello se utilizan
mtodos estadsticos como pueden ser: Mnimos cuadrados ordinarios,
Mxima verosimilitud, Mnimos cuadrados bietpicos, etc. Al recibir los
parmetros el valor numrico definen el concepto de estructura que ha
de tener valor estable en el tiempo especificado.
La tercera etapa en la elaboracin del modelo es la verificacin y
contrastacin, donde se someten los parmetros y la variable aleatoria a
unos contrastes estadsticos para cuantificar en trminos probabilsticos
la validez del modelo estimado.
La cuarta etapa consiste en la aplicacin del modelo conforme al
objetivo del mismo. En general los modelos economtricos son tiles
para:
1. Anlisis estructural y entender como funciona la economa.
2. Prediccin de los valores futuros de las variables econmicas.
3. Simular con fines de planificacin distintas posibilidades de las
variables exgenas.
4. Simular con fines de control valores ptimos de variables
instrumentales de poltica econmica y de empresa.
El mtodo de mnimos cuadrados ordinarios (estimacin MCO)
Tambin se conoce como teora de la regresin lineal, y estar ms
desarrollado en la parte estadstica de la enciclopedia. No obstante, aqu
se dar un resumen general sobre la aplicacin del mtodo de mnimos
cuadrados.
Se parte de representar las relaciones entre una variable econmica
endgena y una o ms variables exgenas de forma lineal, de la
siguiente manera:

"Y" es la variable endgena, cuyo valor es determinado por las


exgenas,
hasta
. Cuales son las variables elegidas depende de la
teora econmica que se tenga en mente, y tambin de anlisis
estadsticos y econmicos previos. El objetivo buscado sera obtener los
valores de los parmetros desde
hasta
. A menudo este modelo se
suele completar aadiendo un trmino ms a la suma, llamado trmino
independiente, que es un parmetro ms a buscar. As:
.
En el que

es una constante, que tambin hay que averiguar. A veces

resulta til, por motivos estadsticos, suponer que siempre hay una
constante en el modelo, y contrastar la hiptesis de si es distinta, o no,
de cero para reescribirlo de acuerdo con ello.
Adems, se supone que esta relacin no es del todo determinista, esto
es, existir siempre un cierto grado de error aleatorio (en realidad, se
entiende que encubre a todas aquellas variables y factores que no se
hayan podido incluir en el modelo) que se suele representar aadiendo a
la suma una letra representa una variable aleatoria.As:

Se suele suponer que es una variable aleatoria normal, con media cero
y varianza constante en todas las muestras (aunque sea desconocida).
Se toma una muestra estadstica, que corresponda a observaciones de
los valores que hayan tomado esas variables en distintos momentos del
tiempo (o, dependiendo del tipo de modelo, los valores que hayan
tomado en distintas reas o zonas o agentes econmicos a considerar).
Por ejemplo, en un determinado modelo podemos estar interesados en
averiguar como la renta ha dependido de los niveles de precios, de
empleo y de tipos de inters a lo largo de los aos en cierto pas,
mientras que en otro podemos estar interesados en ver como, a lo largo
de un mismo ao, ha dependido la renta de distintos pases de esas
mismas variables. Por lo que tendramos que observar, en el primer
caso, la renta, niveles de empleo, precios y tipos de inters del ao 1, lo
mismo, pero del ao 2, etctera, para obtener la muestra a lo largo de
varios aos, mientras que en el segundo caso tendramos que tener en
cuenta los valores de cada uno de los pases para obtener la muestra.
Cada una de esas observaciones para cada ao, o pas, se llamara

observacin muestral. Ntese que an se podra hacer un anlisis ms


ambicioso teniendo en cuenta pas y ao.
Una vez tomada la muestra, se aplica un mtodo, que tiene su
justificacin matemtica y estadstica, llamado mtodo de mnimos
cuadrados. Este consiste en, bsicamente, minimizar la suma de los
errores (elevados al cuadrado) que se tendran, suponiendo distintos
valores posibles para los parmetros, al estimar los valores de la
variable endgena a partir de los de las variables exgenas en cada una
de las observaciones muestrales, usando el modelo propuesto, y
comparar esos valores con los que realmente tom la variable
endgena. Los parmetros que lograran ese mnimo, el de las suma de
los errores cuadrticos, se acepta que son los que estamos buscando, de
acuerdo con criterios estadsticos.
Tambin, este mtodo nos proporcionar informacin (en forma de
ciertos valores estadsticos adicionales, que se obtienen adems de los
parmetros) para ver en qu medida los valores de los parmetros que
hemos obtenido resultan fiables, por ejemplo, para hacer contrastes de
hiptesis, esto es, ver si ciertas suposiciones que se haban hecho
acerca del modelo resultan, o no, ciertas. Se puede usar tambin esta
informacin adicional para comprobar si se pueden prescindir de algunas
de esas variables, para ver si es posible que los valores de los
parmetros hayan cambiado con el tiempo (o si los valores de los
parmetros son diferentes en una zona econmica de los de otra, por
ejemplo), o para ver en qu grado son vlidas predicciones acerca del
futuro valor de la variable endgena si se supone que las variables
exgenas adoptarn nuevos valores.

2.2. El modelo de efectos fijos.

Anlisis de la varianza
En estadstica, el anlisis de la varianza (ANOVA, ANalysis Of VAriance,
segn terminologa inglesa) es una coleccin de modelos estadsticos y
sus procedimientos asociados, en el cual la varianza est particionada
en ciertos componentes debidos a diferentes variables explicativas.
Las tcnicas iniciales del anlisis de varianza fueron desarrolladas por el
estadstico y genetista R. A. Fisher en los aos 1920 y 1930 y es algunas
veces conocido como "Anova de Fisher" o "anlisis de varianza de
Fisher", debido al uso de la distribucin F de Fisher como parte del
contraste de hiptesis.

El anlisis de la varianza parte de los conceptos de regresin lineal.


El primer concepto fundamental es que todo valor observado puede
expresarse mediante la siguiente funcin:

Donde Y sera el valor observado (variable dependiente), y X el valor que


toma la variable independiente.
sera una constante que en la recta de regresin equivale a la
ordenada en el origen,

es otra constante que equivale a la pendiente

de la recta, y es una variable aleatoria que aade a la funcin cierto


error que desva la puntuacin observada de la puntuacin pronosticada.
Por tanto, a la funcin de pronstico la podemos llamar "Y prima":

Podemos resumir que las puntuaciones observadas equivalen a las


puntuaciones esperadas, ms el error aleatorio:
(1.1)
Sabiendo este concepto, podemos operar con esta ecuacin de la
siguiente forma:
1) Restamos a ambos lados de la ecuacin (para mantener la igualdad)
la media de la variable dependiente:

2) Substituimos el error por la ecuacin resultante de despejar la


ecuacin 1.1:

Por tanto...

Y reorganizando la ecuacin:

Ahora hay que tener en cuenta que la media de las puntuaciones


observadas es exactamente igual que la media de las puntuaciones
pronosticadas:

Por tanto:

Podemos ver que nos han quedado 3 puntuaciones diferenciales. Ahora


las elevamos al cuadrado para que posteriormente, al hacer el
sumatorio, no se anulen:

Y desarrollamos el cuadrado:

Podemos ver que tenemos los numeradores de las varianzas, pero al no


estar divididas por el nmero de casos (n), las llamamos Sumas de
Cuadrados., excepto en el ltimo trmino, que es una Suma Cruzada de
Cuadrados (el numerador de la covarianza), y la covarianza en este caso
es cero (por las propiedades de la regresin lineal, la covarianza entre el
error y la variable independiente es cero).
Por tanto:

O lo mismo que:

de un factor, que es el caso ms sencillo, la idea bsica del anlisis de la


varianza es comparar la variacin total de un conjunto de muestras y
descomponerla como:

Donde:
es un nmero real relacionado con la varianza, que mide la
variacin debida al "factor", "tratamiento" o tipo de situacin
estudiado.
es un nmero real relacionado con la varianza, que mide la
variacin dentro de cada "factor", "tratamiento" o tipo de
situacin.

En el caso de que la diferencia debida al factor o tratamiento no sean


estadsticamente significativa puede probarse que las varianzas
muestrales son iguales:

Donde:
es el nmero de situaciones diferentes o valores del factor se
estn comparando.
es el nmero de mediciones en cada situacin se hacen o nmero
de valores disponibles para cada valor del factor.
As lo que un simple test a partir de la F de Snedecor puede decidir si el
factor o tratamiento es estadsticamente significativo.
Visin general
Existen tres clases conceptuales de estos modelos:
4. El Modelo de efectos fijos asume que los datos provienen de
poblaciones normales las cuales podran diferir nicamente en sus
medias. (Modelo 1)
5. El Modelo de efectos aleatorios asume que los datos describen una
jerarqua de diferentes poblaciones cuyas diferencias quedan
restringidas por la jerarqua. Ejemplo: El experimentador ha
aprendido y ha considerado en el experimento slo tres de muchos
ms mtodos posibles, el mtodo de enseanza es un factor
aleatorio en el experimento. (Modelo 2)
6. El Modelo de efectos mixtos describen situaciones que ste puede
tomar. Ejemplo: Si el mtodo de enseanza es analizado como un
factor que puede influir donde estn presentes ambos tipos de
factores: fijos y aleatorios. (Modelo 3)
Supuestos previos
El ANOVA parte de algunos supuestos que han de cumplirse:

La variable dependiente debe medirse al menos a nivel de


intervalo.

Independencia de las observaciones.

La distribucin de los residuales debe ser normal.

Homocedasticidad: homogeneidad de las varianzas.

La tcnica fundamental consiste en la separacin de la suma de


cuadrados (SS, 'sum of squares') en componentes relativos a los factores
contemplados en el modelo. Como ejemplo, mostramos el modelo para
un ANOVA simplificado con un tipo de factores en diferentes niveles. (Si
los niveles son cuantitativos y los efectos son lineales, puede resultar
apropiado un anlisis de regresin lineal)

El nmero de grados de libertad (gl) puede separarse de forma similar y


corresponde con la forma en que la distribucin chi-cuadrado ( o Jicuadrada) describe la suma de cuadrados asociada.

Tipos de modelo
Modelo I: Efectos fijos
El modelo de efectos fijos de anlisis de la varianza se aplica a
situaciones en las que el experimentador ha sometido al grupo o
material analizado a varios factores, cada uno de los cuales le afecta
slo a la media, permaneciendo la "variable respuesta" con una
distribucin normal.
Este modelo se supone cuando el investigador se interesa nicamente
por los niveles del factor presentes en el experimento, por lo que
cualquier variacin observada en las puntuaciones se deber al error
experimental.
Modelo II: Efectos aleatorios (componentes de varianza)
Los modelos de efectos aleatorios se usan para describir situaciones en
que ocurren diferencias incomparables en el material o grupo
experimental. El ejemplo ms simple es el de estimar la media
desconocida de una poblacin compuesta de individuos diferentes y en
el que esas diferencias se mezclan con los errores del instrumento de
medicin.
Este modelo se supone cuando el investigador est interesado en una
poblacin de niveles, tericamente infinitos, del factor de estudio, de los
que nicamente una muestra al azar (t niveles) estn presentes en el
experimento.

Grados de libertad
Pruebas de significacin
El anlisis de varianza lleva a la realizacin de pruebas de significacin
estadstica, usando la denominada distribucin F de Snedecor.
Tablas ANOVA
Una vez que se han calculado las sumas de cuadrados, las medias
cuadrticas, los grados de libertad y la F, se procede a elaborar una
tabla que reuna la informacin, denominada "Tabla de Anlisis de
varianza o ANOVA", que adopta la siguiente forma:
Fuente de
variacin

Suma de
cuadrados

Grados de
libertad

Intergrupo

t-1

Intragrupo o
Error

N-t

Total

N-1

Cuadrado medio

Concepto de modelo economtrico


La econometra, igual que la economa, tiene como objetivo explicar una
variable en funcin de otras. Esto implica que el punto de partida para el
anlisis economtrico es el modelo econmico y este se transformar en
modelo economtrico cuando se han aadido las especificaciones
necesarias para su aplicacin emprica. Es decir, cuando se han definido
las variables (endgenas, exgenas) que explican y determinan el
modelo, los parmetros estructurales que acompaan a las variables, las
ecuaciones y su formulacin en forma matemtica, la perturbacin
aleatoria que explica la parte no sistemtica del modelo, y los datos
estadsticos.
A partir del modelo economtrico especificado, en una segunda etapa se
procede a la estimacin, fase estadstica que asigna valores numricos a
los parmetros de las ecuaciones del modelo. Para ello se utilizan
mtodos estadsticos como pueden ser: Mnimos cuadrados ordinarios,
Mxima verosimilitud, Mnimos cuadrados bietpicos, etc. Al recibir los
parmetros el valor numrico definen el concepto de estructura que ha
de tener valor estable en el tiempo especificado.
La tercera etapa en la elaboracin del modelo es la verificacin y
contrastacin, donde se someten los parmetros y la variable aleatoria a

unos contrastes estadsticos para cuantificar en trminos probabilsticos


la validez del modelo estimado.
La cuarta etapa consiste en la aplicacin del modelo conforme al
objetivo del mismo. En general los modelos economtricos son tiles
para:
5. Anlisis estructural y entender como funciona la economa.
6. Prediccin de los valores futuros de las variables econmicas.
7. Simular con fines de planificacin distintas posibilidades de las
variables exgenas.
8. Simular con fines de control valores ptimos de variables
instrumentales de poltica econmica y de empresa.
El mtodo de mnimos cuadrados ordinarios (estimacin MCO)
Tambin se conoce como teora de la regresin lineal, y estar ms
desarrollado en la parte estadstica de la enciclopedia. No obstante, aqu
se dar un resumen general sobre la aplicacin del mtodo de mnimos
cuadrados.
Se parte de representar las relaciones entre una variable econmica
endgena y una o ms variables exgenas de forma lineal, de la
siguiente manera:

"Y" es la variable endgena, cuyo valor es determinado por las


exgenas,
hasta
. Cuales son las variables elegidas depende de la
teora econmica que se tenga en mente, y tambin de anlisis
estadsticos y econmicos previos. El objetivo buscado sera obtener los
valores de los parmetros desde
hasta
. A menudo este modelo se
suele completar aadiendo un trmino ms a la suma, llamado trmino
independiente, que es un parmetro ms a buscar. As:
.
En el que

es una constante, que tambin hay que averiguar. A veces

resulta til, por motivos estadsticos, suponer que siempre hay una
constante en el modelo, y contrastar la hiptesis de si es distinta, o no,
de cero para reescribirlo de acuerdo con ello.

Adems, se supone que esta relacin no es del todo determinista, esto


es, existir siempre un cierto grado de error aleatorio (en realidad, se
entiende que encubre a todas aquellas variables y factores que no se
hayan podido incluir en el modelo) que se suele representar aadiendo a
la suma una letra representa una variable aleatoria.As:

Se suele suponer que es una variable aleatoria normal, con media cero
y varianza constante en todas las muestras (aunque sea desconocida).
Se toma una muestra estadstica, que corresponda a observaciones de
los valores que hayan tomado esas variables en distintos momentos del
tiempo (o, dependiendo del tipo de modelo, los valores que hayan
tomado en distintas reas o zonas o agentes econmicos a considerar).
Por ejemplo, en un determinado modelo podemos estar interesados en
averiguar como la renta ha dependido de los niveles de precios, de
empleo y de tipos de inters a lo largo de los aos en cierto pas,
mientras que en otro podemos estar interesados en ver como, a lo largo
de un mismo ao, ha dependido la renta de distintos pases de esas
mismas variables. Por lo que tendramos que observar, en el primer
caso, la renta, niveles de empleo, precios y tipos de inters del ao 1, lo
mismo, pero del ao 2, etctera, para obtener la muestra a lo largo de
varios aos, mientras que en el segundo caso tendramos que tener en
cuenta los valores de cada uno de los pases para obtener la muestra.
Cada una de esas observaciones para cada ao, o pas, se llamara
observacin muestral. Ntese que an se podra hacer un anlisis ms
ambicioso teniendo en cuenta pas y ao.
Una vez tomada la muestra, se aplica un mtodo, que tiene su
justificacin matemtica y estadstica, llamado mtodo de mnimos
cuadrados. Este consiste en, bsicamente, minimizar la suma de los
errores (elevados al cuadrado) que se tendran, suponiendo distintos
valores posibles para los parmetros, al estimar los valores de la
variable endgena a partir de los de las variables exgenas en cada una
de las observaciones muestrales, usando el modelo propuesto, y
comparar esos valores con los que realmente tom la variable
endgena. Los parmetros que lograran ese mnimo, el de las suma de
los errores cuadrticos, se acepta que son los que estamos buscando, de
acuerdo con criterios estadsticos.
Tambin, este mtodo nos proporcionar informacin (en forma de
ciertos valores estadsticos adicionales, que se obtienen adems de los
parmetros) para ver en qu medida los valores de los parmetros que
hemos obtenido resultan fiables, por ejemplo, para hacer contrastes de
hiptesis, esto es, ver si ciertas suposiciones que se haban hecho
acerca del modelo resultan, o no, ciertas. Se puede usar tambin esta

informacin adicional para comprobar si se pueden prescindir de algunas


de esas variables, para ver si es posible que los valores de los
parmetros hayan cambiado con el tiempo (o si los valores de los
parmetros son diferentes en una zona econmica de los de otra, por
ejemplo), o para ver en qu grado son vlidas predicciones acerca del
futuro valor de la variable endgena si se supone que las variables
exgenas adoptarn nuevos valores.

2.4. Comparaciones o Pruebas de Rangos Mltiples


COMPARACIONES MLTIPLES
Con las pruebas F empleadas se demostraba si las diferencias
entre varias medias eran significativas, pero no informaban si una media
en particular (o medias) difieren en forma significativa de otra media
considerada (o grupo de medias). En el caso de los pesos de los
recubrimientos puede ser importante que los laboratorios difieran unos
de los otros.
Si un experimentador tiene ante s k medias, parece razonable
probar entre todos los pares posibles, esto es efectuar k.(k-1)/2 pruebas
t bimuestrales. Esto no es eficiente. Para ello se utilizan Pruebas de
Comparaciones Mltiples, y entre ellas la Prueba del Rango Mltiple de
Duncan.
Las suposiciones bsicas son, en esencia, las del anlisis de la
varianza en una dimensin para tamaos muestrales iguales.
La prueba compara el Rango de Mnima Significancia, Rp, dado por:
Rp

aqu

s r p
x

es una estimacin de:

y puede calcularse como:


s

MSE
n

donde MSE es la media de los cuadrados de error en el Anlisis de


Varianza. El valor de rp depende del valor deseado de significancia y del
nmero de grados de Libertad correspondiente a la MSE, que se

obtienen de tablas existentes en la bibliografa (Miller y Freund,


Estadstica para Ingenieros, tablas 12a, para =0.05 y 12b, para
=0.01, con p=2,3,,10 y para varios grados de libertad entre 1 y
120).
Ejemplo: Con respecto a los datos de los pesos de los recubrimientos de
estao, aplicar la prueba del Rango Mltiple de Duncan para probar
cules medias de los laboratorios difieren de las otras empleando un
nivel de significancia de 0.05.
Para ello se ordenan, en orden creciente, las cuatro medias
muestrales:
Laboratorio
B
C
D
A
Media
0.22 0.23 0.25 0.268
7
0
0
luego, se calcula
s

usando MSE = 0.0015 del Anlisis de Varianza:

0.0015
12

0.011

siendo el nmero de grados de libertad = k.(n-1) = 44. Por


interpolacin, en la Tabla 12-a, se obtienen los valores de rp:
p
rp

2
2.85

multiplicando rp por
P
Rp

3
3.00

4
3.09

= 0.011:

2
0.031

3
0.033

4
0.034

El rango de las cuatro medias es 0.268 0.227 = 0.041, que


excede a R4 = 0.034, que es el rango significativo mnimo.
Esto era de esperar, porque la prueba F indic que las diferencias
entre las cuatro medias eran significativas con a = 0.05.
Para probar que hay diferencias significativas entre tres medias
adyacentes, se obtienen los rangos de 0.038 y 0.023 respectivamente
para 0.230, 0.250, 0.268 y 0.227, 0.230, 0.250. Puesto que el primero de
estos valores sobrepasa a R3 = 0.033, las diferencias correspondientes
no son significativas.

Por ltimo en el caso de parejas adyacentes de medias, ningn par


adyacente tiene rango mayor que el rango significativo mnimo R 2 =
0.031. Esto se resume:

donde se ha dibujado una lnea bajo cualquier conjunto de medias


adyacentes para las cuales el rango es menor que un valor
correspondiente de Rp , esto es, bajo cualquier conjunto de medias
adyacentes, para las cuales las diferencias no son significativas.
Se concluye as que el Laboratorio A obtiene los pesos medios de
recubrimiento ms alto que los Laboratorios B y C.
2.5. Verificacin Supuestos del Modelo

Para estimar los parmetros , 1, 2, 3 y 4 se puede emplear


mnimos cuadrados minimizando:
k

yij i 2

i 1 j 1

con respecto a y a las i , sujetas a la restriccin

Esto se puede hacer por el mtodo de los Multiplicadores de


Lagrange. Derivando la penltima expresin respecto de e igualando
a cero:
k

i 1 j 1

2 yij i

yij

i 1 j 1
k

i 1 j 1

i 1 j 1

yij k n 0

i1 j 1

para un i dado:
n

2 yij i

j 1

j 1

yij

j 1

j1

Ejemplo: Estimar los parmetros del modelo con un criterio de


clasificacin para los revestimientos de estao del ejemplo anterior.

1
3

11.69

0.244

48

3.21 11.69

12
48
2.76
12

11.69
48

0.024

0.0135

2.5.1. Eleccin del Tamao de Muestra


TAMAOS MUESTRALES DISTINTOS

2.72 11.69

12
48
3.00
12

11.69
48

0.017
0.006

El Anlisis de Varianza descrito, se aplica a criterios de


clasificacin en que cada muestra tiene el mismo nmero de
observaciones. Si no es as, y los tamaos muestrales son n 1, n2, , nk se
tiene que sustituir N = ni por n.k en todo lo anterior, quedando el
siguiente esquema de partida:
Medias
y11
Muestra
1
Muestra y21
2
.

Muestra i yi1

y12

y1j

y22

y2j

yi2


yij

.
Muestra
k

yk2


ykj

yk1

Se obtiene la varianza dentro de la muestra:


2

si

ni 1

ni

y
ij i
j

la varianza de las k medias muestrales es:

con lo cual se determina:

La varianza muestral de las N observaciones est dada por:

se puede demostrar que:

SST = SSE + SS(Tr)


Con:
ni

SST

yij

Ti 2

SS ( Tr)

i1 j 1

i1

ni

siendo:

ni

i 1 j 1

yij

Ti

i 1

yij

Problema: El contenido de aflatoxina, en partes por milln, de algunas


muestras de crema de man se prueba y se consiguen los siguientes
resultados:
Total
Marca A 0.5 0.0 3.2 1.4 0.0 1.0 8.6 2.9 17.6
Marca B 4.7 6.2 0.0 10. 2.1 0.8
24.3
5
Total
41.9
a) Emplear Anlisis de Varianza para probar si las dos marcas difieren en
contenido de aflatoxina, con un nivel de significancia a=0.05.
b) Probar la misma hiptesis usando la prueba t-bimuestral.

Respuesta:
a)

y1 2.2

y2

SST

y1j 3

SS ( Tr)

y.

4.05

y2j 3 2

2.2

146.25

ni yi 3

8 ( 2.2 3) 6 ( 4.05 3)

11.74

SSE = SST SS(Tr) = 146.25 11.74 = 134.51


Fuentes
de
Variacin

Grados
de
Liberta
d
Tratamien
1
tos
Error
12
Total
13

Suma
Media Cuadrada F
de
Cuadra
dos
11.74
11.74
134.51
146.25

1.05

11.21

Dado que 1.05 < 4.75 (valor de F, de Tablas, con =0.05, =1 y


=12) se rechaza la Hiptesis de que las dos marcas difieren en el
contenido de aflatoxina.
b) El estadstico para esta prueba es:

x1 x2

n1 1 s1 2 n2 1 s2 2
s1

8.15

s2

n1 n2 n1 n2 2

n1 n2

15.48

2.2 4.05
( 8 1) 8.15 ( 6 1) 15.48

8 6 ( 8 6 2 )
8 6

1.0234

siendo t0.025= -2.18 con = n1 + n2 2 = 8 + 6 - 2=12 grados de


libertad, se aprecia que t > t0.025 por lo tanto se rechaza la Hiptesis de
que las dos marcas difieren en el contenido de aflatoxina.

Puede comprobarse que el estadstico t con grados de libertad


y el estadstico F con grados de libertad estn relacionados por:
F(1,t
lo se puede verificar para este caso:

2.6. Uso de un software estadstico


Ejemplo completo: