Sie sind auf Seite 1von 63

ESTATSTICA MULTIVARIADA

QUIMIOMETRIA uso da estatstica multivariada no estudo dos


fenmenos qumicos ou farmacuticos.
O termo quimiometria foi introduzido por Swede Svante Wold (Suo) e
Bruce R. Kowalski (Americano) em 1972.

Definio (International chemometrics society ICS, 1974)
QUIMIOMETRIA a disciplina qumica que usa mtodos matemticos e
estatsticos para:
1. Planejar e relacionar condies timas de experimentos;
2. Extrair o mximo de informaes dos dados qumicos.

USO DA ESTATSTICA MULTIVARIADA - QUIMIOMETRIA
1. Planejamento e otimizao de experimento;
2. Anlise exploratria de dados;
3. Classificao;
4. Calibrao multivariada;
5. Resoluo Multivariada de curvas.


DADOS
INFORMAO
CONHECIMENTO/ENTENDIMENTO
DECISO
ESTATSTICA MULTIVARIADA


2
SOFTWARES
1. Matlab (Mathworks);
2. PLS_toolbox (Eigenvector);
3. Unscrambler (Camo);
4. Pirouette (Infometric);
5. SIMCA (Umetric);
6. Statistica (Statroft);
7. Octave (Software livre);
8. Scilab (Software livre).

REVISTAS CIENTFICAS
1. Journal of Chemometrics (Wily);
2. Chemometrics and Intelligent Laboratory Systems (Elsevier).
3. Analytical Chemistry (ACS Publications);
4. The Analyst (RSC Publishing);
5. Analytical Chemical Acta (Elsevier);
6. Analytical and Bioanalytical Chemistry (Springer);
7. Talanta (Elsevier);
8. Applied Spectroscopy (Society for Applied Spectroscopy);
9. Journal of Near Infrared (NIR Publications);

SITES
1. http://www.spectroscopynow.com/ (Quimiometria e informtica)
2. http://pcserver.iqm.unicamp.br/%7Emarcia/Index.html ( Mrcia)
3. http://www.chemkeys.com/bra/index.htm ( Custdio & Andrade)
4. http://www.models.kvl.dk/users/rasmus/ ( Rasmus Bro)
5. https://listserv.umd.edu/archives/ics-l.html (Lista de discusso - ICS)




3
LIVROS
1. Como Fazer Experimentos (B. B. Neto, I. S. Scarmino; R. E. Bruns);
2. Chemometrics ( M. Otto);
3. Chemometrics: a pratical guide (B. P. Seasholtz);
4. Tutorial PLS_toolbox (Barry M. Wise)

ESTATSTICA MULTIVARIADA EM OUTRAS REAS
1. Psicometria ( Psicologia);
2. Biometria (Biologia);
3. Econometria (Economia)

PLANEJAMENTO EXPERIMENTAL E OTIMIZAO
1. Modelos mecansticos: o mecanismo por trs do comportamento do
modelo conhecido (por exemplo, as leis de Newton). um modelo
GLOBAL.
2. Modelos empricos: no se conhece todos os fatores que
influenciam o fenmeno que est sendo estudado. No vale fora da
regio experimentalmente investigada. um modelo LOCAL

INVESTIGAO EXPERIMENTAL
Objetivo: O que voc gostaria de saber quando o experimento terminar?










4
EVOLUO DO ESTUDO EMPRICO





OBJETIVO TCNICA
Triagem das variveis
Superfcie de resposta,
Simplex.
Avaliar a influencia
das variveis
Construo de modelos
empricos
Planejamento fracionrio
Otimizao
Modelagem por
mnimos quadrados
Planejamentos fatoriais
completos
Construo de modelos
mecansticos
C
O
N
H
E
C
I
M
E
N
T
O
Deduo a partir de
princpios gerais


5


EXEMPLO
Tabela 1. Resultado de 20 titulaes feitas no mesmo lote de vinagre.
Titulao n
o
Concentrao (%) Titulao n
o
Concentrao (%)
1 3.91 11 3.96
2 4.01 12 3.85
3 3.61 13 3.67
4 3.83 14 3.83
5 3.75 15 3.77
6 3.91 16 3.51
7 3.82 17 3.85
8 3.70 18 4.04
9 3.50 19 3.74
10 3.77 20 3.97


TIPOS
DE
ERROS
ERROS GROSSEIROS
Geralmente muito altos;
A medida deve ser eliminada;
A estatstica no se ocupa deles;
Exemplo: esquecer de colocar um
incador em uma titulao.
ERROS SISTEMTICOS
Atribudos a causas definidas;
Afetam o resultado sempre na
mesma direo;
Podem ser corrigidos;
Podem ser de mtodo, operacionais,
pessoais ou instrumentais;
Exemplo: balana no tarada, pipeta
no aferida, indicador errado em uma
titulao etc.
ERROS ALEATRIOS
No possuem valor definido;
No so mensurveis;
Flutuam aleatoriamente;
Devem ser tratados estatisticamente.


6

Comandos do MATLAB:
>> plot(y,o)

HISTOGRAMA
um grfico de barras em que a rea ou a altura representa a freqncia da
classe.
Amplitude do rol= valor mximo valor mnimo.
Amplitude da classe = Amplitude do rol/nmero de classe
Nmero de classe = raiz quadrada do nmero de amostra.

Intervalo (conc.
%)
Freqncia
Freqncia
Relativa
3.500 6 3.608 2 0.10
3.608 63.716 3 0.15
3.716 63.824 5 0.25
3.824 63.932 6 0.30
3.932 64.040 4 0.20
. .
Freqncia
F R
Nmero total de amostras
=
Amplitude da classe = 0.108


7

Comandos do MATLAB

| | 3.91 4.01 3.61 3.83 3.75 3.91 3.82 3.7 3.5 3.77 3.96 3.85 3.67 3.83 3.77 3.51 3.85 4.04 3.74 3.97 y =

>> [n, xout]=hist(y, 5)
n = 2 3 5 6 4 (Freqncia das classes)
xout =3.5540 3.6620 3.7700 3.8780 3.9860 (Centro de cada classe)

Clculo da freqncia relativa:
>> f=(1/20)*n;
>> f
0.1000 0.1500 0.2500 0.3000 0.2000
>> bar(xout,f) (Faz o historgrama)








8

POPULAO OU UNIVERSO ESTATSTICO o conjunto de todos
os elementos ou indivduos sobre os quais est desenvolvendo alguma
pesquisa.

AMOSTRA qualquer subconjunto de uma populao.
AMOSTRA REPRESENTATIVA
a) Os elementos so escolhidos ao acaso;
b) Todos os elementos tm a mesma chance de serem escolhidos;
c) Nmero suficiente de elementos, o qual depende da preciso das
estimativas.

TIPOS DE AMOSTRAGEM
1. Amostra Aleatria Simples (AAS): consiste em enumerar cada
elemento da populao e em seguida fazer o sorteio;
2. Amostragem Sistemtica: cria-se uma lei de formao para a
escolha dos elementos;
3. Amostra Por Conglomerado: sorteiam-se regies da populao e as
sorteadas, todos os elementos delas faro parte da amostra;
4. Amostragem Estratificada: divide a populao em sub-populaes
que tenham o maior grau de homogeneidade possvel e retira-se uma
amostra de cada sub-populao.

PARMETROS
So nmeros que representam caractersticas de uma populao:
1. Mdia;
2. Varincia;
3. Porcentagem;
4. Desvio padro etc.




9
MDIA ARITMTICA uma medida de tendncia central.
1
1
N
i
i
x x
N
=
=


x a mdia aritmtica;
i
x o i-simo valor;
N o nmero total de valores na mostra.
Comando do MATLAB para calcular a mdia:
>> media=mean(y)

VARINCIA AMOSTRAL uma medida do grau de disperso das
amostras em torno da mdia:
( )
2
2 2
1 1
1 1
1 1
N N
i i
i i
Varincia s d x x
N N
= =
= = =


x = mdia amostral;
i
x = i-simo valor;
N = nmero total de valores na
mostra.

Por que usamos N-1 na frmula acima?

( )
0
N N N N N
i i i i
i i i i i
d x x x x x Nx Nx Nx = = = = =

ou
( )
( )
( )
2
2 2 2
2 2 2 2 2
1 1
2
1 1
= 2 2 0
i
i
N N
i i
i i
N N N
i
i i i
s x x x x x x
N N
x x x x Nx Nx Nx
N N
= = +
| |
+ = + =
|
\ .



A amostra tem um grau de liberdade a menos, o que torna natural a diviso
por N-1.

Comando do MATLAB:
>> varincia = var(y)
variancia = 0.0228


10

DESVIO PADRO (s): usado para definir intervalos em torno da mdia.
2
s s =

>> std(y)
ans =0.1509



DISTRIBUIO ESTATSCA: uma funo que descreve o
comportamento de uma varivel aleatria.

DISTRIBUIO CONTNUA: a varivel pode assumir qualquer valor
em um intervalo.



FUNO DENSIDADE DE PROBABILIDADE: uma funo que
descreve a distribuio continua de uma varivel x.
Exemplo:

( )
2
2
x-
-
2
1
f(x) = e
2

Figura 1. Funo de distribuio normal

Uma varivel aleatria x que se distribui normalmente denotada por
( )
2
, x N . Se ( ) 0,1 x N , dizemos que x segue a distribuio normal
padro ou padronizada.



11

( )
2
2
2
1
0
0
z
f x e

=
=
=

68,26% => 1 desvio
95,44% => 2 desvios
99,73% => 3 desvios
Caractersticas:
1. Mximo em x =, valor mais
provvel;
2. Pequenos desvios so mais
provveis;
3. Simtrica em relao a ;
4. Ponto de inflexo em x = ;
5. Mudana em causa translao na
curva;
6. Mudana em causa o
estreitamento ou alargamento da
curva.


A probabilidade de encontrarmos x entre a e b :
( )
( )
( )
( )

2
b
b b x
-
a
2
a a
-
f x dx
1
P a < x < b = = f x dx e dx
2
f x dx










12
COMO PADRONIZAR VARIVEIS

Criar uma nova varivel z com mdia zero e varincia unitria.
x
z

=


Exerccio: Padronize os dados da titulao do vinagre.
y z
3.9100 0.7290
4.0100 1.3917
3.6100 -1.2592
3.8300 0.1988
3.7500 -0.3314
3.9100 0.7290
3.8200 0.1325
3.7000 -0.6627
3.5000 -1.9882
3.7700 -0.1988
3.9600 1.0604
3.8500 0.3314
3.6700 -0.8615
3.8300 0.1988
3.7700 -0.1988
3.5100 -1.9219
3.8500 0.3314
4.0400 1.5905
3.7400 -0.3976
3.9700 1.1266

Comandos do Matlab para calcula z:
>> m=mean(y);
>> s=std(y);
>> for i=1:20
z(i)=(y(i)-m)/s;
end
>> plot(z,'o')
2 2
z
3,8 0
0, 0228 1
=0,1509 1
x z
x z
x



= =
= =
=



13
Exerccio 1

Qual a probabilidade de que o resultado de uma titulao esteja entre 3,8
(%) e 3,9 (%)?
Procedimento:
1. Calcular z
1
para x
1
e z
2
para x
2
usando a frmula
x
z

=
:
1
0 0, 6627
2
z e z = =
2. Consultar a tabela de reas da funo de distribuio normal;
3. Somar as reas das caudas e subtrair de um. A probabilidade a rea
sob a curva normal entre z
1
e z
2
.
Resposta: 24,54% de probabilidade.

Exerccio 2
Qual a probabilidade de que uma titulao esteja entre 3,5 e 3,92?

Exerccio 3
Faa o grfico da funo de distribuio normal para os dados da titulao
do vinagre.







14
z f(z)
0.7290 0.3059
1.3917 0.1515
-1.2592 0.1806
0.1988 0.3911
-0.3314 0.3776
0.7290 0.3059
0.1325 0.3955
-0.6627 0.3203
-1.9882 0.0553
-0.1988 0.3911
1.0604 0.2274
0.3314 0.3776
-0.8615 0.2753
0.1988 0.3911
-0.1988 0.3911
-1.9219 0.0629
0.3314 0.3776
1.5905 0.1126
-0.3976 0.3686
1.1266 0.2115
>> for i=1:20
f(i)=(1/sqrt(2*pi))*exp(-z(i)*z(i)*0.5);
end;
>> plot(z,f,'o')


TEOREMA DO LIMITE CENTRAL

Se a flutuao total numa certa varivel aleatria for o resultado da
soma das flutuaes de muitas variveis independentes e de importncia
mais ou menos igual, a sua distribuio tender para a normalidade, no
importa qual seja a natureza das distribuies das variveis.
Premissas do TLC
Flutuaes independentes;
Igual importncia.






15
Exemplos:
1. O peso do feijo depende do grau de desidratao, ao das
pragas, carga gentica etc
2. Titulao: o erro final depende da leitura da bureta, tonalidade
final do indicador etc.

COMBINAES LINEARES DE VARIVEIS ALEATRIAS
Sejam x
1
e x
2
variveis aleatrias com parmetros
( )
2
1 1
, e
( )
2
2 2
, .
Ento,
1 1 2 2
y a x a x = +
( )
1 1 2 2 1 1 2 2
1 1 2 2
1 1 1 1
y y a x a x a x a x
N N N N
y a x a x
| | | |
= = + = +
| |
\ . \ .
= +


A mdia da combinao linear de variveis aleatria a combinao
linear das mdias

Varincia:
( )
( )
( ) ( )
( ) ( ) ( )( )
( ) ( ) ( )( )
2
2
2
1 1 2 2 1 1 2 2
2
1 1 1 2 2 2
2
2 2
2 2
1 1 1 2 2 2 1 2 1 1 2 2
2 2
2 2
1 1 1 2 2 2 1 2 1 1 2 2
2 2 2 2 2
1 1 2 2
1
1
1
1
1
1
1
2
1
1 1 1
2
1 1 1
2
y
y
s y y
N
a x a x a x a x
N
a x x a x x
N
a x x a x x a a x x x x
N
a x x a x x a a x x x x
N N N
s a s a s a
=

= +

= + (

(
= + +

( ( (
= + +
( ( (


= + +


( )
1 2 1 2 1 2
, a s s r x x

Para populaes, temos:
( )
1 1 2 2
2 2 2 2 2
1 1 2 2 1 2 1 2 1 2
2 ,
y
y
a a
a a a a x x


= +
= + +




16

Se as variveis se distriburem de modo independe, ento a correlao
entre as variveis zero:
2 2 2 2 2
1 1 2 2 y
a a = +


Para o caso de muitas variveis, podemos escrever
( )
( )
2 2 2 2
2
2 ,
,
i i
y i i
y i i i j i j i j
i j i
i i
i
y a x
a
a a a x x
mdia e varincia populacional da
varivel aleatria x



>
=
=
= +
=




Observe que,
1 2 3
1 1 1 1 1
i N
x x x x x x
N N N N N
= = + + + +

"


Se as variveis xs forem escolhidas aleatoriamente, ento
( )
, 0
i j
r x x = .
A varincia das distribuies das mdias
2 2 2
2
2 2 2 2
2
2
1 1 1
x
x
N
N N N N
N

| | | | | |
= = = =
| | |
\ . \ . \ .
=










17

Para obtermos a mdia das distribuies das mdias amostrais, fazemos:
1
1
1
1 1 1
N
i
i
N
x i i i
i
x x
N
a x x N
N N N

=
=
=
= = = = =




Como a varivel x foi retirada da populao, sua mdia
i
x a mdia da
populao .

INTERVALO DE CONFIANA
Intervalo em torno da mdia amostral
x
que, com certa probabilidade,
contm a mdia populacional .

TEOREMA
Sejam amostras aleatrias de N elementos extrados de uma populao que
se distribui normalmente com mdia e varincia
2
. Ento,
1. As mdias amostrais tambm se distribuem normalmente com a
mesma mdia , mas com varincia
2
N :
2
, x N
N

| |

|
\ .
;
2. A varivel aleatria t, definida por
x
t
s N

=
, segue a distribuio t
com N-1 graus de liberdade:
1 N
x
t
s N


;


18
3. A varivel
2
, definida por ( )
2
2
2
1
s
N

=
, segue a distribuio
qui-quadrado tambm com grau de liberdade N-1:
( )
2
2
1
2
1
N
s
N



.



Usando o teorema podemos calcular um intervalo de confiana para a
mdia populacional :
( )
x -
= z N 0,1
N
x -
-z < < z x - z < < x +z
N N N



O z dado em unidades de desvio padro. Na inequao acima, para
estimar precisamos de .

DISTRIBUIO DE STUDENT PARA ESTIMAR A MDIA POPULACIONAL
(W .S. Gosset, 1908)
Usando o item dois do teorema:
1
1 1 1 1
N
N N N N
x -
t
s N
x - s s
-t < <t x - t < < x +t
s N N N



1. Usada para estabelecer um intervalo de confiana para a ;
2. A distribuio t simtrica em relao mdia zero;
3. Usada para pequenas amostras (geralmente N<30)



19
Exerccio 4
Os pesos de 7 gros de feijo so: 0.1399 0.2790 0.1988 0.1904 0.1911
0.2186 0.1606. Determine, com 99% de confiana, quantos gros existem
em um quilograma. Resp.
2
0 1969 0 0445
0 1969 3 707 0 0445 7 0 1969 3 707 0 0445 7
0 1346 0 2593
1000 0 1346 1000 0 2593 3857 7431
x . s .
. . . . . .
. .
. .


= =
< < +
< <
< < < <

Exerccio 5
Retire uma amostra de sete titulaes da Tabela 1 e usando a distribuio
de Student estime, com 95% de confiana, um intervalo para a mdia das
titulaes.

DISTRIBUIO QUI-QUADRADO PARA ESTIMAR A
VARINCIA POPULACIONAL
A distribuio qui-quadrado assimtrica e devemos olhar duas colunas na
tabela.
Exemplo:
Para um intervalo de confiana de 95%, com 9 graus de liberdade, devemos
olhar a coluna de 0,025 correspondendo a cauda direita e a coluna de
0,975, cauda direita que corresponde a 0,025 da cauda esquerda, i.e.,
( )
( ) ( )
2
2
2
2 2
2
2, 70 19, 0 2, 70 1 19, 0
1 1 .
19, 0 2, 70
s
N
s s
N N

< < < <


< <

Exerccio 6
Use os dados do Exerccio 4 para estimar a varincia e o desvio padro dos
pesos dos feijes de um quilograma de feijo, com um intervalo de
confiana de 95%.






20
Exerccio 7
Use a distribuio qui-quadrado para estimar, com 99% de confiana, o
desvio padro do Exerccio 5.

Exerccio 8
O teor de carboidrato de uma glicoprotena foi determinado como sendo:
12.6; 11.9; 13.0; 12.7 e 12.5 de carboidrato por 100g de protena em anlise
repetidas.
a) Usando a distribuio de Student, calcule os intervalos de 50 e 95%
de confiana, para a mdia do teor de carboidrato.
1
5 12 5 0 4 4
12 5 0 741 0 4 5
N
N ; x , g; s , g; ; x t s N
, , , g


= = = = =
=


b) Calcule o intervalo para a mdia, com 95% de confiana, para uma
situao em que o valor populacional do desvio padro seja
conhecido como sendo igual a 0,2g.

0 2 95 1 96
0 2
12 5 1 96 12 5 0 2
5
, g; %; z ,
,
x z , , , , g
N

= =
= = =



COVARIANA AMOSTRAL DAS VARIVEIS x E y
uma medida no padronizada da relao entre duas variveis.

( ) ( )( )

N
i i
i =1
1
Cov x, y = x - x y - y
N - 1


Exerccio 9
Determine a matriz de covarincia da matriz A dada.

-1 1 2
-2 3 1
4 0 3
A
(
(
=
(
(

( )
10.3333 -4.1667 3.0000
-4.1667 2.3333 -1.5000
3.0000 -1.5000 1.0000
Cov A
(
(
=
(
(




21
Comando do matlab:
>> cov(A)

COEFICIENTE DE CORRELAO AMOSTRAL
a medida padronizada da relao entre duas variveis.

( )
( ) ( )
| |
| |
|
|
|
\ .
\ .

N
i i
i =1
x y
x - x y - y
1
r x, y =
N - 1 s s


Propriedades:
1.
| |
1,1 r ;
2. Variveis estatisticamente independentes tm r igual a zero, a
recproca no verdadeira;
3. Variveis perfeitamente correlacionadas tm r igual a um;
4. Mede a linearidade existente entre duas variveis;
5. O r(x,y) deve ser interpretado com cuidado.

Exerccio 10
Calcule a matriz de correlao da matriz B dada.

-1 1 1
-2 3 2
4 0 -4
B
(
(
=
(
(

( )
1.0000 -0.8486 -1.0000
-0.8486 1.0000 0.8486
-1.0000 0.8486 1.0000
r B
(
(
=
(
(


Comando do Matlab:
>> corrcoef(A)

Exerccio 11
Os volumes (em ml) de sete caroos de feijo so: 0.108; 0.214; 0.143;
0.195; 0.148; 0.144 e 0.174. Os seus respectivos pesos so: 0.1188;


22
0.2673; 0.1795; 0.2369; 0.1826; 0.1860 e 0.2045. Calcule a covarincia,
a correlao e interprete os resultados.


COMO DETERMINAR O TAMANHO DA AMOSTRA

Podemos usar o teste t para determinar o tamanho de uma amostra para
que o resultado tenha certa preciso menor ou igual a L:
( )
N-1 N-1
....... ........... ........... ............
t s t s
- +
N N



N-1
t s
L
N


Resolvendo a equao acima para N, temos:
2
t s s
t L N
L
N

| |

|
\ .

= grau de liberdade
s = varincia amostral
L = preciso desejada
O desvio padro amostral s deve ser obtido a partir de uma srie
histrica.
Exemplo:
Determinar o tamanho da amostra de titulao para que a mdia tenha
uma preciso de 0,1% com 95% de confiana. Usar o desvio padro de s
0,1509.
Como a desvio padro foi calculado a partir de 20 titulaes, temos 19
graus de liberdades.
2
19
2, 0930,1509%
2, 093 9, 98
0,1%
9, 98
t N
N
| |
= =
|
\ .


Neste caso podemos tomar N=10

Quando temos a estimativa do desvio padro obtido a partir de uma
srie histrica de tamanho razovel, a diferena entre a distribuio
normal e a de student pequena e poderemos usar a distribuio normal.
2
z
N
L
| |

|
\ .



23

Exerccio 12
Um laboratrio de anlise faz determinaes com um desvio padro
histrico de 0,5%. Um cliente envia uma amostra, cuja concentrao ele
quer saber com uma preciso de 0,2%. Estimar o nmero de
determinaes o analista dever fazer para dar a resposta desejada com
95% de confiana.


Exerccio 13
Suponha que queremos determinar um intervalo de 95% de confiana para
o peso de um caroo de feijo, de tal maneira que a diferena entre os
valores extremos do intervalo seja um desvio padro amostral. Quantos
caroos devemos pesar?

Exerccio 14

Com os dados fornecidos pelo professor faa:
1. Um grfico de linhas para as variveis e verifique se existe algum
valor anmalo. Se existir voc dever remov-lo.
>> plot(Sauto)

2. Calcule o valor mdio de cada varivel. Qual varivel tem maior
valor e qual tem menor valor?
>> Sbar=mean(S)

3. Faa um grfico de barras das mdias calculadas no item 2.
>> bar(Sbar)

4. Calcule a varincia de cada varivel e faa o grfico de barras. Qual
varivel apresenta maior varincia?
>> VarS=Var(S)
>> bar(VarS)



24
5. Calcule o desvio padro de cada varivel e faa o grfico de barras.
Quem apresenta maior desvio padro?
6. Faa um grfico de barras da varivel 17. Qual amostra apresenta
maior valor?
>> bar(S(:,17)
7. Voc julga necessrio autoescalar as variveis? Por qu?
8. Autoescale as variveis.
>> Sbar=mean(S)
>> stdS=std(S)
>> for j=1:17
for i=1:20
Sauto(i,j)=(S(i,j)-Sbar(j))/stdS(j)
end
end
>> plot(Sauto)

9. Calcule as matrizes de covarincia e de correlao.
a. Verifique se as matrizes so simtricas;
b. Quais variveis esto correlacionadas positivamente;
c. Quais variveis esto correlacionadas negativamente;
d. Na matriz de correlao, interprete a diagonal principal.

>> CovarS=cov(S)
>> CorreS=corrcoef(S)










25











COMO FAZER COMPARAO COM UM VALOR DE
REFERNCIA

Vamos supor que o valor mdio do cido actico exigido pela a
legislao seja de 4%. Suponha que foram feitas trs titulaes e os valores
encontrados foram: 3.91 4.01 3.61. De acordo com essa anlise, o teor de
cido actico na amostra est de acordo com a legislao?



HIPTESES
No existe diferena
estatisticamente
significativa entre a mdia
da amostra e o valor de
referncia
Os valores so
estaticamente diferentes
H
0
: Hiptese Nula
H
1
: Hiptese Alternativa


26
( )
( )
2
2 2
1
3.91+ 4.01+3.61 3 843 0 2082
3
4 303
3 843 3 843 3 32 4 36
3 3
x . % s . %
t . 95% de confiana
s s
. t . t . .
= = =
=
< < + < <

Como o intervalo contm a mdia, no podemos rejeitar a hiptese nula,
isto , de acordo com nossa anlise, a amostra est dentro da legislao.

Exerccio 15
Um qumico est testando um novo mtodo para determinar ferro. Fazendo
quatro anlises num padro certificado, cuja concentrao de referencia
14,3% em massa, ele obtm 13.7 14.0 13.9 14.1 de ferro. Como voc avalia
a exatido da nova metodologia no nvel de 95% de confiana? Ser que as
quatro determinaes vm de uma distribuio com mdia 14,3%?
( )
3 3
13 9 0.2 3 185
0 2 0 2
13 9 3 182 13 9 3 182
4 4
13 6 14 2
3
x . ; s= ; t . 95%
s s . .
x t x t . . . .
N N
. % . %

= =
< < + < < +
< <

Como o intervalo no contm o valor de referncia 14.3%, podemos
rejeitar a hiptese nula e concluir que as quatro determinaes no provm
de uma distribuio com mdia 14.3%. Portanto, a nova metodologia no
possui a exatido necessria.













27
COMO COMPARAR DUAS MDIAS

A tabela abaixo mostra a determinao da concentrao de acido actico de
cinco amostras de vinagre enviadas por cinco fabricantes diferentes usando
duas tcnicas diferentes: tcnica A e tcnica B.
Existe diferena estatstica nas mdias determinadas pelas duas tcnicas?
Amostra Tcnica A Tcnica B A- B d =
1 3.77 3.62 0.15
2 3.85 3.69 0.16
3 4.07 4.10 -0.03
4 4.83 4.70 0.13
5 5.05 4.89 0.16
x 4.314 4.200 0.114
s 0.5871 0.5772 0.0814

Para resolvermos este problema, usaremos o teste t para a diferena de duas
mdias:
Passo 1: Determinar a varincia e o desvio padro da diferena das duas
amostras:
( ) ( ) ( )
( )
2 2
2
1 1
1 1
A B
A B
A B A B
A B A B
x x
A B
A B
s s
Var x x Var x Var x s
N N N N
s
s s
N N
N N

| |
= + = + = +
|
\ .
= = +
+

Estamos supondo que
2 2
A B
s e s
so varincias da mesma populao. Logo,
( ) ( )
1 1
A B A B
v
A B
x x
t
s
N N

+

( ) ( )
1 1
2
A B
A B
v N N
v N N
= +
= +



28
Daqui chegamos ao intervalo de confiana:
( ) ( )
1 1
A B A B v
A B
x x t s
N N
= +

Para fazermos uma estimativa conjunta do desvio padro s, procedemos
assim:
( ) ( )
( ) ( )
2 2
2
1 1
1 1
A A B B
A B
N s N s
s
N N
+
=
+

No nosso exemplo, temos
0 5822 s . % =
e
( ) ( )
( ) ( )
( ) | |
8
1 1
4 314 4 200 0 5822
5 5
1 1
4 314 4 200 2 306 0 5822
5 5
0 114 0 849 0 735 0 963
A B
A B
A B
. . t .
. . . .
. % . % . %, . %



= +
= +
= =

Como o intervalo contm o valor zero, no podemos rejeitar a hiptese
nula, ou seja, no nvel de confiana de 95% no podemos afirmar que
exista diferena nas duas mdias obtidas pelos dois mtodos.


COMPARAES EMPARELHADAS
1. Na comparao anterior a origem da amostra pode afetar o resultado
da comparao;
2. A blocagem permite neutralizar essa influncia;
3. Na blocagem, cada amostra considerada como um bloco;
4. Fazemos anlise das diferenas d de cada amostra.

Na tabela anterior, fazemos um teste t da quarta coluna, ou seja, calculamos
um intervalo de confiana para as mdias das diferenas. Se o valor zero
estiver dentro do intervalo de confiana, ento no existe diferena. Se o
valor zero no estiver dentro do intervalo calculado, ento existe diferena
entre as duas tcnicas.


29
| |
1 1
4 4
5 5
0 0818 0 0818
0 114 2 776 0 114 2 776
5 5
0 014 0 215
0 014 0 215
d d
N N
d d
s s
d t d t
N N
s s
d t d t
, ,
, , , ,
, ,
, %, , %


< < +
< < +
< < +
< <

Como o valor zero no est no intervalo, podemos afirmar que existe uma
diferena entre as duas tcnicas com nvel de confiana de 95%.

Modo alternativo:
As duas tcnicas sero iguais quando 0% = ( Hiptese nula)
0 114 0
3 13
0 0814 5 d
d
, % %

t ,
s
,
N


= = =
O valor tabelado para t
4
(no nvel de confiana de 95%) 2,776 que
menor do que o valor estimado 3,13. Logo, devemos rejeitar a hiptese
nula ( 0% = ) de que no existe diferena entre as duas tcnicas.
























30

Exerccio 16
Determinao do teor de colesterol em seis amostras de plasmas
sanguneos, medidas por duas tcnicas diferentes. Cada amostra possui um
teor diferente de colesterol. O mtodo B apresenta um resultado menor do
que o mtodo A em cinco das seis amostras. Com 95% de confiana, o
mtodo B sistematicamente diferente do mtodo A?

Tabela 2 Teor de Colesterol (g/ml)
Amostra Mtodo A Mtodo B Diferena (d)
1 1.46 1.42 0.04
2 2.22 2.38 -0.16
3 2.84 2.67 0.17
4 1.97 1.80 0.17
5 1.13 1.09 0.04
6 2.35 2.25 0.10
Mdia 0.06
2
s



Resposta;
1 1
0 06 0
1 20
0 1225 6
d
d
, gml / ml gml

t ,
s
,
N


= = =
Como
5
2 571 t , = maior do que o estimado (1,20), no existe diferena
estatisticamente significante entre as duas tcnicas.






31
Exerccio 17
O teor de -PbO
2
numa placa de bateria de automvel foi determinado por
espectroscopia de raios-X. foram registrados vrios espectros repetidos,
fazendo-se (ou no) correo da linha de base. Os resultados so mostrados
abaixo. Existe diferena sistemtica entre os dois modos de analisar a
placa?

Espectros Com correo Sem correo
d
1 16.2 19.0 -2.8
2 16.7 19.8 -3.1
3 17.3 18.5 -1.2

Exerccio 18
A tabela abaixo mostra os resultados para o teste de bioequivalncia de um
medicamento genrico A em relao ao medicamento de referncia B. O
teste usado foi a rea sob curva da concentrao do medicamento no
plasma sanguneo. No nvel de confiana de 95%, verifique se o
medicamento A bioequivalente ao medicamento B.

rea sob a curva no perodo de 0-8h
Voluntrio Medicamento A Medicamento B Diferena
1 12.761 10.983 1.778
2 10.241 8.211 2.030
3 8.569 9.105 -0.536
4 13.321 12.508 0.813
5 11.481 12.114 -0.633
6 14.061 11.520 2.541
7 12.287 11.983 0.304
8 14.696 14.454 0.242
9 12.526 11.246 1.280
10 9.060 10.740 -1.680
11 12.329 10.840 1.489
12 13.244 13.818 -0.574
13 7.864 7.156 0.708
14 9.684 12.297 -2.613
15 11.811 12.279 -0.468
16 10.109 9.751 0.358
17 10.966 9.895 1.071
18 10.485 15.579 -5.094
19 11.899 9.296 2.603
20 13.200 16.163 -2.963
21 12.368 11.838 0.530


32


COMO COMPARAR DUAS VARINCIAS

1. O teste F usado para comparar duas varincias;
2. S faz sentido comparar varincias amostrais se forem estimativas
de uma mesma populao;
3. usada para distinguir se existe diferena significativa na preciso
de dois conjuntos de dados;
4. Compara-se a razo das varincias entre dois conjuntos de dados de
uma mesma populao:

2 2 2
2 2 2
A B A B
A A A
, v ,v
B B B
s s
F F
s s

=

Por conveno o maior valor
colocado no numerador

5. Quando
calculado Tabelado
F F > os dois conjuntos de dados apresentam
varincias com diferenas estatisticamente significativas.


Exerccio 19
Um qumico analtico novato fez 6 determinaes de Ca em calcrio, encontrando uma
mdia de 35,25% com um desvio de 0,34%. Um qumico analtico experiente obeve
35,35% com um desvio de 0,25% realizando 5 determinaes. Existe diferena
significativa na preciso dos dois analistas, com 95% de confinaa?

2
2
0 34
1 85
0 25
cal
,
F ,
,
= =

Valor tabelado
5 4
6 26
,
F , = (Olhar linha 4, coluna 5)
Como o valor calculado menor do que o tabelado, ento no existe diferena na
preciso.
















33
PLANEJAMENTO FATORIAL







PLANEJAMENTO EXPERIMENTAL

1. Cada fator analisado em vrios nveis;
2. Nvel o valor (ou classe) que cada fator pode assumir no experimento;
3. Mtodo univariado (ou clssico): estuda um fator de cada vez, os outros devem
ser mantidos constantes. A interao entre os fatores no so levados em conta;
4. Mtodo multivariado: todos os fatores estudados so variados ao mesmo tempo;



SISTEMA
PH
Concentrao
Catalisado
Rendimento
PLANEJAMENTO FATORIAL
OBJETIVOS
Estudar e/ou determinar a
influncia de vrias variveis
sobre uma outra varivel de
interesse.
FATOR
Varivel sob estudo, que pode ser
controlada: pode ser quantitativa ou
qualitativa.
SISTEMA
Pode ser representado por uma
funo, desconhecida a princpio,
que opera sobre os fatores e produz
as respostas observadas.
RESPOSTA
a varivel de sada, na qual
estamos interessados e que afetada
por modificaes nos fatores.


34
5. Efeito sinergtico: efeito de interao positiva, isto , o aumento de um fator
refora o outro;
6. Efeito antagnico: efeito de interao negativo.
7. Planejamento fatorial completo: os experimentos so realizados em todas as
possveis combinaes de nveis dos fatores.

Planejamento fatorial 2
K
: um planejamento fatorial de k fatores em dois nveis.
Exemplo.
Planejamento fatorial completo
2
2
Influncia da temperatura e do catalisador no rendimento de uma reao.
Fatores: temperatura e catalisador
Nveis: T=40 e 60 (dois nveis); catalisador A e catalisador B (dois nveis).
Resposta: Rendimento

Ensaio Temperatura Catalisador Rendimento (%)
Mdia y (%)
1 40 A 57 61 59
2 60 A 92 88 90
3 40 B 55 53 54
4 60 B 66 70 68


CALCULO DOS EFEITOS PRINCIPAIS
Frmula Geral para o Clculo dos Efeitos Principais dos Fatores

( )
2
2
K
y y
Efeito Pr incipal
+

=



1. Efeito principal da temperatura
( ) ( )
( ) ( )
2 4 1 3
+ -
y y y y
T = y y
2 2
90 68 59 54
T = 22 5
2 2
. %
+ +
=
+ +
=



35
2. Efeito Principal da Concentrao
( ) ( )
( ) ( )
3 4 1 2
+ -
y + y y + y
C = y y
2 2
54 +68 59 +90
C = 13 5
2 2
. %
=
=


3. Efeito da Interao entre Temperatura e Concentrao
( ) ( )
( ) ( )
1 4 2 3
y + y y + y
TC
2 2
59 +68 90 +54
TC 8 5
2 2
y y
. %
+
= =
= =


ESTIMATIVA DO ERRO EXPERIMENTAL
Os ensaios da tabela foram feitos em duplicata para que possamos estimar o erro
experimental;
As repeties devem ser autenticas (todas as etapas dos ensaios devem ser repetidas
rigorosamente);
Os ensaios devem ser feitos em ordem aleatria (aleatorizao);

ERRO PADRO DAS OBSERVAES: obtido a partir da varincia das replicatas
de cada amostra. Uma estimativa conjunta ou total da varincia pode ser obtida a partir
de todas as replicatas, com um nmero apropriado de grau de liberdade.


Ensaio Varincia ( ) ( )
2
2
1
i
s x x N =

Grau de liberdade v
1 8 1
2 8 1
3 2 1
4 8 1



36
VARINCIA CONJUNTA OU VARINCIA TOTAL: a mdia ponderada da
varincia de cada experimento pelo grau de liberdade. uma estimativa conjunta da
varincia a partir de todas as replicas.
2 2 2 2
2
1 1 2 2 3 3 4 4
1 2 3 4
1 8 1 8 1 2 1 8
6 5
1 1 1 1
Conjunta
v s v s v s v s
s ,
v v v v
+ + + + + +
= = =
+ + + + + +



ERRO PADRO DAS RESPOSTAS
2
6 5 2 55
Conjunta
s s , , % = = =

ERRO PADRO DE UM EFEITO
Cada efeito a combinao linear de quatro valores
i
y :
( ) ( )
2 4 1 3
3 2 4 1
+ -
y y y y
y y y y
T = y y
2 2 2 2 2 2
+ +
= = +

( ) ( )
3 4 1 2
3 4 1 2
+ -
y + y y + y
y y y y
C = y y
2 2 2 2 2 2
= = +

( ) ( )
1 4 2 3
3 1 4 2
y + y y + y
y y y y
TC
2 2 2 2 2 2
= = +

Como as variveis
i
y se distribuem de maneira independente (repeties autnticas e
ordem aleatria) temos que
( )
0
i j
r y , y = .
( ) ( ) ( ) ( )
2 2 2 2
2 2 2 2
2 2 2
Varincia do efeito 1 2 1 2 1 2 1 2
1 1 1 1
4 4 4 4
i
efeito i y y
efeito y y
s a s s
s s s
(
= = = + + +

| |
= + + + =
|
\ .


Lembrando que cada mdia obtida de uma duplicata e considerando que a varincia
2
y
s igual a varincia global ou agrupada, temos
2
2 Conjunta
efeito
Re plicatas
s
s
N
=

N o nmero de repeties (dois no nosso caso)
O erro padro do efeito com 4 graus de liberdade ser dado por


37
2
6 5
1 80
2
Conjunta
efeito
s
,
s , %
N
= = =


Intervalos de confiana para os valores dos efeitos
Construdo com o erro padro dos efeitos e usando a distribuio t de student.
efeito

t s

=

= efeito real;
= efeito estimado.

Erro padro da mdia global
2
2
6 5
0 8125
8 8
0 90
Conj
y
y
s
.
s ,
s , %
= = =
=

O nmero 8 porque o rendimento calculado a partir de 8 medidas.

Interpretao dos resultados
Mdia Global 67 75 0 9 , , %
Efeito principal da temperatura: T 22 5 1 8 , , %
Efeito principal do Catalisador: C 13 5 1 8 , , %
Efeito da interao TC 8 5 1 8 , , %

estatisticamente significante, com 95% de confiana, um efeito cujo valor absoluto for
superior a
4
2 776 1 8 5 0
efeito
t s , , % , % = =
. Neste caso, o intervalo no incluir o
valor zero. Observando a tabela anterior, vemos que todos so significativos.


38








ALGORITMO PARA O CLCULO DOS EFEITOS

1. Escrever a matriz de planejamento, substituindo os elementos pelos sinais
algbricos equivalentes:

T C T C
40 A
60 A
40 B
60 B


( (
( (
+
( (
=
( ( +
( (
+ +




2. Incluir uma coluna com sinais positivos, relativo mdia e outra coluna cujos
sinais so os produtos de T e C.
59 90
68 54
-5
A
B
40 60
+31
-22
+14


39
M T C TC
X

+ +
(
(
+ +
(
=
( + +
(
+ + + +


X uma matriz chamada de tabela de coeficiente de contraste.

3. Incluir a unidade em cada linha de X
M T C TC
1 1 1 1
1 1 1 1
1 1 1 1
1 1 1 1

+ +
(
(
+ +
(
( + +
(
+ + + +


4. Cada efeito calculado como o produto escalar entre o referente vetor coluna de
X e o vetor das respostas (y) e dividindo o resultado pelo nmero adequado ( no
caso de um planejamento 2
2
dividir por 2 para calcular os efeitos e por 4 para
calcular a mdia).
| |
C
t
C
1 59
1 90
X y
1 54
1 68
59
90
1
C X y = 1 1 1 1 13 50
54 2
68

,
( (
( (

( (
= =
( ( +
( (
+

(
(
(
= + + =
(
(


Generalizando para outros planejamentos de 2 nveis:
- Efeitos:
t
E
1
1
E X Y
2
k
=

- Mdia:
t
M
1
M X Y
2
k
=
, onde k o nmero de fatores.




40
CALCULANDO A MDIA E TODOS OS EFEITOS CONJUNTAMENTE

1 1 1 1 59 271
1 1 1 1 90 45
1 1 1 1 54 27
1 1 1 1 68 17
M 271 4 67 75
T 45 2 22 5
C 27 2 13 5
TC 17 2 8 5
t
X Y
,
,
,
,
+ + + +
( ( (
( ( (
+ +
( ( (
= =
( ( ( + +
( ( (
+ +

( ( (
( ( (

( ( (
= =
( ( (
( ( (




Construo do modelo:

( )
( )
0 1 2 12
T, C T C TC
T, C 67 75 11 25T- 6, 75C- 4, 25TC
y b b b b
y , ,
= + + +
= +


0
1
2
12
-1 -1 -1
M T C TC
b 1 1 1 1
b 1 1 1 1
X b = y =
b 1 1 1 1
b 1 1 1 1
Xb = y X Xb = X y b = X y =

59
90

54
68
67.75
11.25
-6.75
-4.25
+ + ( ( (
( ( (
+ +
( ( (
=
( ( ( + +
( ( (
+ + + +

(
(
(

(
(













41
Exerccio 20

Os dados abaixo se referem ao tempo de pega inicial do gesso, isto , o tempo em que o
gesso comea a endurecer, depois que o p misturado com a gua. Os ensaios foram
realizados em duplicata e em ordem aleatria. Determine todos os efeitos e seus erros
padro, interprete os resultados e construa um modelo.

Fator 1: Granulometria: 100-150 mesh (-), 150-200 mesh (+)
Fator 2: gua residual: 6,6% (-), 7,5% (+)

i Fator 1 Fator 2 Resposta
i
x
2

s
1 - - 12.33 13.00 12.67 0.224
2 + - 10.52 10.57 10.55 0.0013
3 - + 10.33 9.75 10.04 0.168
4 + + 9.00 8.92 8.96 0.0032



PLANEJAMENTO FATORIAL
3
2

Fatores
Fatores (-) (+)
1. Temperatura (
o
C) 40 60
2. Catalisador (Tipo) A B
3. Concentrao (M) 1,0 1,5

Ensaio 1 2 3 Rendimento (%) Mdia
1 - - - 56 52 54,0
2 + - - 85 88 86,5
3 - + - 49 47 48,0
4 + + - 64 62 63,0
5 - - + 65 61 63,0
6 + - + 92 95 93,5
7 - + + 57 60 58,5
8 + + + 70 74 72,0


Mdia 1 2 3 12 13 23 123
y
+ - - - + + + + 54.0
+ + - - - - + + 86.5
+ - + - - + - + 48.0
+ + + - + - - - 63.0
+ - - + + - - + 63.0
+ + - + - + - - 93.5
+ - + + - - + - 58.5
+ + + + + + + + 72.0





42
1 -1 -1 -1 1 1 1 -1
1 1 -1 -1 -1 -1 1 1
1 -1 1 -1 -1 1

X =
M 1 2 3 12 13 23 123
-1 1
1 1 1 -1 1 -1 -1 -1
1 -1 -1 1 1 -1 -1 1
1 1 -1 1 -1 1 -1 -1
1 -1 1 1 -1 -1 1 -1
1 1 1 1 1 1 1 1
54.0
86.5
48.0
63.0
y=
63.0
93.5
58.5
72.0
( (
( (
( (
( (
( (
( (
( (
( (
( (
( (
( (
( (




Clculo dos efeitos principais e da mdia geral:

538.5 67.31
91.5 22.88
-55.5 -13.88
35.5 8.88
Efeito dos fatores=C'*y=
-34.5 -8.63
-3.5 -0.88
3.5 0.88
0.5 0.13
( (
( (
( (
( (
( (
( (

( (
( (
( (
( (
( (
( (



Estimativa do Erro

( )
2
18+14, 5+12 +12 +18+14, 5+14, 5+18
5 2
1+1+1+1+1+1+1+1
i i 2
i
2
s
Varincia Conjunta s =
s ,

= =



5, 2 2, 28% Erro padro dasrespostas Varincia conjunta = = =

0 57
Varincia conjunta 5,2
Erro da mdia global= = , %
Total de experimento 16
=

( )
( )
1 1 1 1 1 1
5 2 1 30
2 16 16 16 2 2
1 30 114
2 2
efeito i
2
efeito
efeito
1
Varincia de um efeito V = a s
Nmero de replicata N
V s , , %
Erro padro de um efeito V , , %
| |
= + + + = =
|
\ .
= = =

"




43
Cada efeito a combinao linear de oito mdias y , com coeficientes iguais a
1
4
.
Resumo dos clculos
Mdia 63 3 0 57 , ,
Efeitos principais
1 (Temperatura) 22 9 114 , ,
2 (Catalisador) 13 9 114 , ,
3 (Concentrao) 8 9 114 , ,
Interaes
12 8 6 114 , ,
13 0 9 114 , ,
23 0 9 114 , ,
123 0 1 114 , ,

CALCULO DA SIGNIFICNCIA DAS RESPOSTAS

8
2 306 114 2 63
efeito
t s , , , = = (com 95% de confiana)

As interaes 13, 23 e 123 no so estatisticamente significantes com 95% de
confiana.



CONSTRUO DO MODELO ESTATISTICO

( ) ( )
1 2 3 0 1 1 2 2 3 3 12 1 2 13 1 3 12 1 2 123 1 2 3 1 2 3
y x , x , x b b x b x b x b x x b x x b x x b x x x x , x , x = + + + + + + + +

1
0
1
2
3
12
13
23
123
b
67.3
b
11.4
b -6.9
b 4.4
b X y
b -4.3
-0.4 b
0.4 b
0.1 b

(
(
(
(
(
(
(
(
(
(
(
(
= =
(
(
(
(
(
(
(
(
(
(
( (




Os coeficientes b
13
, b
23
e b
123
no so significantes e podem ser omitidos.











44
A tabela abaixo mostra o rendimento da reao de sntese do polipirrol em uma
matriz de EPDM. Foram estudados trs fatores: o tempo de reao (t), a concentrao
de oxidante (C) e o tamanho da partcula (P). A resposta observada foi o rendimento da
reao. Calcule os valores dos efeitos e seus erros padro, usando os dados a seguir,
mas antes examine cuidadosamente o conjunto de valores, levando em conta os sinais
da matriz de planejamento. possvel antecipar qual ser a varivel com maior
influncia no rendimento?

Ensaio t C P Rendimento %
i
x
2
i
s
1 - - - 4.39 4.73 4.56 0.058
2 + - - 6.21 5.75 5.98 0.106
3 - + - 14.51 13.45 13.98 0.562
4 + + - 19.57 21.11 20.34 1.186
5 - - + 2.09 1.93 2.01 0.013
6 + - + 3.15 3.39 3.27 0.029
7 - + + 11.77 12.69 12.23 0.423
8 + + + 19.40 17.98 18.69 1.008



































45
PLANEJAMENTO FATORIAL
4
2




Fatores (-) (+)
1. Temperatura (
0
C) 40 60
2. Catalisador (tipo) A B
3. Concentrao (M) 1,0 1,5
4. pH 7,0 6,0


Total de ensaios: 2.2.2.2=16

Ensaio 1 2 3 4 Resposta
1 - - - - 54
2 + - - - 85
3 - + - - 49
4 + + - - 62
5 - - + - 64
6 + - + - 94
7 - + + - 56
8 + + + - 70
9 - - - + 52
10 + - - + 87
11 - + - + 49
12 + + - + 64
13 - - + + 64
14 + - + + 94
15 - + + + 58
16 + + + + 73

M 1 2 3 4 12 13 14 23 24 34 123 124 134 234 1234
y
+ - - - - + + + + + + - - - - + 54
+ + - - - - - - + + + + + + - - 85
+ - + - - - + + - - + + + - + - 49
+ + + - - + - - - - + - - + + + 62
+ - - + - + - + - + - + - + + - 64
+ + - + - - + - - + - - + - + + 94
+ - + + - - - + + - - - + + - + 56
+ + + + - + + - + - - + - - - - 70
+ - - - + + + - + - - - + + + - 52
+ + - - + - - + + - - + - - + + 87
+ - + - + - + - - + - + - + - + 49
+ + + - + + - + - + - - + - - - 64
+ - - + + + - - - - + + + - - + 64
+ + - + + - + + - - + - - + - - 94
+ - + + + - - - + + + - - - + - 58
+ + + + + + + + + + + + + + + + 73


46

M 1 2 3 4 12 13 14 23 24 34 123 124 134 234 1234
y
1 -1 -1 -1 -1 1 1 1 1 1 1 -1 -1 -1 -1 1 54
1 1 -1 -1 -1 -1 -1 -1 1 1 1 1 1 1 -1 -1 85
1 -1 1 -1 -1 -1 1 1 -1 -1 1 1 1 -1 1 -1 49
1 1 1 -1 -1 1 -1 -1 -1 -1 1 -1 -1 1 1 1 62
1 -1 -1 1 -1 1 -1 1 -1 1 -1 1 -1 1 1 -1 64
1 1 -1 1 -1 -1 1 -1 -1 1 -1 -1 1 -1 1 1 94
1 -1 1 1 -1 -1 -1 1 1 -1 -1 -1 1 1 -1 1 56
1 1 1 1 -1 1 1 -1 1 -1 -1 1 -1 -1 -1 -1 70
1 -1 -1 -1 1 1 1 -1 1 -1 -1 -1 1 1 1 -1 52
1 1 -1 -1 1 -1 -1 1 1 -1 -1 1 -1 -1 1 1 87
1 -1 1 -1 1 -1 1 -1 -1 1 -1 1 -1 1 -1 1 49
1 1 1 -1 1 1 -1 1 -1 1 -1 -1 1 -1 -1 -1 64
1 -1 -1 1 1 1 -1 -1 -1 -1 1 1 1 -1 -1 1 64
1 1 -1 1 1 -1 1 1 -1 -1 1 -1 -1 1 -1 -1 94
1 -1 1 1 1 -1 -1 -1 1 1 1 -1 -1 -1 1 -1 58
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 73


67.1875
22.8750
-14.1250
8.8750
0.8750
-8.6250
-0.6250
0.8750
-0.6250
0.8750
0.3750
0.
(
(
(
(
(
(
(
(
(
(
(
(
=
(
(
(
(
(
(
(
(
(
(
(
(

M
1
2
3
4
12
13
14
23
24
34
123
124
134
234
1234
8750
-0.1250
-0.6250
0.3750
0.3750
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(


Como os ensaios no foram feitos em duplicatas, temos que
usar uma outra maneira para determinar o erro experimental.
Consideraremos significativos os EFEITOS PRINCIPAIS e as
INTERAES DE DOIS FATORES. As interaes de trs e
quatro fatores sero consideras como erros ou rudeos.

Varincia de um Efeito

( ) ( ) ( ) ( )
2 2 2 2
0, 875 0, 625 0,875 0, 375

0, 291
5
Efeito
V
+ + + +
= =
"

Erro padro de um Efeito

2

0, 54
Efeito
s V = =
Estimativa da significncia dos efeitos principais e das
interaes com 5 graus de liberdade e 95% de confiana:
5 efeito
t s = 2, 5710, 54 = 1, 39












47
MODELO ESTATSTICO






PLANEJAMENTO FATORIAL FRACIONRIO

FRAO MEIA

Construir um planejamento fracionrio
4-1
2

Procedimento
1. Construir um planejamento completo para os fatores 1, 2 e 3;
2. Atribuir ao fator 4 o produto das colunas 1, 2 e 3.

EXEMPLO

Resultado de planejamento fatorial 2
4
completo para estudar a ao cataltica do
Mo(IV).
Fator (-) (+)
1 [H
2
SO
4
] 0,016 0,32
2 [KI] 0,015 0,030
3 [H
2
O
2
] 0,0020 0,0040
4 Tempo (s) 90 130


67.1875
11.4375
-7.0625
4.4375
0.4375
-4.3125
-0.3125
0.4375
-0.3125
0.4375
(
(
(
(
(
(
(
(
(
(
(
(
=
(
(
(
(
(
(
(
(
(
(
(
(
(

1
2
3
4
12
13
14
23
24
34
123
124
134
234
1234
M
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
0.1875
0.4375
-0.0625
-0.3125
0.1875
0.1875
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(



48
Ensaio 1 2 3 4 Resp*.
1 - - - - 52
2 + - - - 61
3 - + - - 124
4 + + - - 113
5 - - + - 85
6 + - + - 66
7 - + + - 185
8 + + + - 192
9 - - - + 98
10 + - - + 86
11 - + - + 201
12 + + - + 194
13 - - + + 122
14 + - + + 139
15 - + + + 289
16 + + + + 286
*Sinal analtico x1000

143.3125
-2.3750
109.3750
54.3750
67.1250
-1.1250
2.8750
1.1250
25.6250
21.8750
9.8750
2.6
(
(
(
(
(
(
(
(
(
(
(
(
=
(
(
(
(
(
(
(
(
(
(
(
(

M
1
2
3
4
12
13
14
23
24
34
123
124
134
234
1234
250
-2.6250
5.3750
0.1250
-8.8750
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(














49
Como construir um planejamento 2
4-1
?

Ensaio M 1 2 3 4 12 13 14 23 24 34 Resp*.
1 + - - - - + + + + + + 52
2 + + - - + - - + + - - 86
3 + - + - + - + - - + - 201
4 + + + - - + - - - - + 113
5 + - - + + + - - - - + 122
6 + + - + - - + - - + - 66
7 + - + + - - - + + - - 185
8 + + + + + + + + + + + 286

M 138.8750
1 -2.2500
2 114.7500
3 51.7500
4 69.7500
12
13
14
23 26.
8.7500
24.7500
7500
24 24.7500
34
26.7500
8.7500
( (
( (
( (
( (
( (
( (
( (
( (
=
( (
( (
( (
( (
( (
( (
( (
( (


143.3125
-2.3750
109.3750
54.3750
67.1250
-1.1250
2.8750
1.1250
25.6250
21.8750
9.8750
2.6
(
(
(
(
(
(
(
(
(
(
(
(
=
(
(
(
(
(
(
(
(
(
(
(
(

M
1
2
3
4
12
13
14
23
24
34
123
124
134
234
1234
250
-2.6250
5.3750
0.1250
-8.8750
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(



Relao geradora ou geratriz: I=1234

A RESOLUO de um planejamento fatorial fracionrio igual ao nmero de fatores
na relao geradora. No exemplo acima, o fatorial de resoluo IV:

4-1
IV
2











50

EXERCCIO EM CLASSE


Otimizao de uma reao orgnica


Fatores (-) (+)
1. Temperatura Ambiente Refluxo
2. Base K
2
CO
3
/NAOH K
2
CO
3

3. Solvente CH
2
CL
2
CH
3
CN
4. Catalisador Nenhum TEBA


Ensaio 1 2 3 4 Rend.
1 - - - - 0
2 + - - + 70
3 - + - + 65
4 + + - - 0
5 - - + + 100
6 + - + - 85
7 - + + - 50
8 + + + + 95

1. Qual a relao geradora?
2. Quais contrastes de dois fatores esto confundidos?
3. Quais contrastes de trs fatores esto confundidos?
4. Os efeitos principais esto confundidos com quem?
5. Que concluses voc tira desses resultados?




















51

PLANEJAMENTO FATORIAL FRACIONARIO DE FRAO QUARTA
5-2
III
2


Estudo da resposta cataltica do Mo(IV)
Fator (-) (+)
1 [H
2
SO
4
] 0,016 0,32
2 [KI] 0,015 0,030
3 [H
2
O
2
] 0,0020 0,0040
4 Tempo (s) 90 130
5 Fluxo (ml/min) 1,2 3,0


Ensaio M 1 2 3 4 5 Resp*.
1 + - - - - + 52
2 + + - - + - 92
3 + - + - + - 198
4 + + + - - + 113
5 + - - + + + 122
6 + + - + - - 76
7 + - + + - - 189
8 + + + + + + 286


Relaes geradoras

4=123 e 5=12 ou I=1234 e I=125

RESOLUO: 3 porque a menor relao geradora tem 3 fatores.


141, 00
1 1, 5
2 111, 00
3 54, 50
4 67, 00
5 4, 50
M ( (
( (
( (
( (
=
( (
( (
( (
( (


M 138.8750
1 -2.2500
2 114.7500
3 51.7500
4 69.7500
12
13
14
23 26.
8.7500
24.7500
7500
24 24.7500
34
26.7500
8.7500
( (
( (
( (
( (
( (
( (
( (
( (
=
( (
( (
( (
( (
( (
( (
( (
( (


5-2
III
2

4-1
IV
2





52

MODELOS EMPRICOS: Y=F(T)

Redimento de uma reao em funo da temperatura
Temperatura (
0
C) 40 45 50 55 60
Rendimento (%) 60 70 77 86 91





Os dados parecem obedecer a uma relao linear. Vamos tentar um ajuste linear do tipo

0 1
y
i i i
T = + +


Notao matricial

y = X +


1
2
5
y
y
y
(
(
(
(
(

y =
#

1
2
5
1
1
1
T
T
T
(
(
(
=
(
(

X
# #

1
2
5

(
(
(
=
(
(

#

0
1

(
=
(








53

SOLUO POR MNIMOS QUADRADOS

( ) ( )
( )
( )

t t
-1 -1
t t t t
-1
t t
-1
t t
Xb = y
X Xb = X y
X X X Xb = X X X y
I b = X X X y
b = X X X y


1 40
1 45
1 50
1 55
1 60
(
(
(
( =
(
(
(

X

60
70
77
86
91
(
(
(
(
(
(
(

y =





( )
60
70
10.2000 -0.2000 1 1 1 1 1
77
-0.2000 0.0040 40 45 50 55 60
86
91
-1.2000
1.5600
(
(
(
( (
(
( (
(

(
(

(
=
(

-1
t t
b = X X X y =
b


A equao de regresso por mnimos quadrados :

1, 20 1, 56
i i
y T = +




54

Valores estimados:

1 40 61.2000
1 45 69.0000
-1.2000
1 50 76.8000
1.5600
1 55 84.6000
1 60 92.4000
( (
( (
( (
(
( ( =
(
( (

( (
( (

y = Xb =



60 61.2000 -1.2000
70 69.0000 1.0000
77 76.8000 0.2000
86 84.6000 1.4000
91 92.4000 -1.4000
( ( (
( ( (
( ( (
( ( ( =
( ( (
( ( (
( ( (

e = y - y =



Os erros distribuem-se ao acaso em torno da mdia.













55

ANLISE DA VARINCIA ANOVA

( ) ( ) ( )
( ) ( ) ( )
( ) ( ) ( )( ) ( )
( ) ( ) ( )
| | | | | |
| | | | | |
2 2
2 2 2
2 2 2


2

. . . . . .
i i i i
i i i i
i i i i i i i
i i i i
T R r
y y y y y y
y y y y y y
y y y y y y y y y y
y y y y y y
S Q em torno da mdia S Q devida a regresso S Q residual
SQ SQ SQ
= +
= + (

= + +
= +
= +
= +







Coeficiente de determinao do modelo:

( )
( )
2
2
2

i
R
T
i
y y
SQ
R
SQ
y y

= =




Pode-se demonstrar que:

Grau de liberdade da SQ
T
n-1
Grau de liberdade da SQ
R
p-1
Grau de liberdade da SQ
r
n-p

n o nmero de observaes;
p o nmero de parmetros da equao de regresso.


MDIAS QUADRTICAS
so obtidas dividindo as somas quadrticas pelos respectivos graus de liberdades.

MSQ
R
(Mdia quadrtica da SQ
R
)
( )
2

1 1
i
y y
p p

= =

R
R
SQ
MSQ
MSQ
r
(Mdia quadrtica da SQ
r
)
( )
2

i i
y y
n p n p

= =

r
r
SQ
MSQ








56
ANOVA para o nosso exemplo
Fonte de variao Soma Quadrtica Grau de liberdade Mdia Quadrtica
Regresso 608,4 1 608,4
Resduo 6,4 3 2,3
Total 614,8 4

Coeficiente de determinao do modelo:
2
608, 4
0, 9896
614, 8
R
T
SQ
R
SQ
= = =
Significa que 98,96% da variao total em torno da mdia explicada pela regresso,
ficando apenas 1,04% para os resduos.

A mdia quadrtica MSQ
r
uma boa estimativa da varincia dos pontos em torno da
equao de regresso.

Nosso exemplo:
2
2,13
r
MSQ s = =




CLCULO DAS ESTIMATIVAS DAS INCERTEZAS DOS PARMETROS


Matriz de covarincia de b
0
e b
1

( )
( ) ( )
( ) ( )
0 0 1
0 1 1
,
,
Var b Cov b b
Var
Cov b b Var b
(
=
(

b



FORMA MATRICIAL

( )
( )
1
2
Var s

=
t
X X b



No nosso exemplo:

( )
10, 2 0, 2 21, 73 0, 43
2,13
0, 2 0, 004 0, 43 0, 00852
Var

( (
= =
( (


b



( )
0
1
4, 66

0, 0923
b
erro padro
b
( (
= =
( (

b





57
TESTE F para testar a significncia estatstica da equao de regresso.

1,
R
p n p
r
MSQ
F
MSQ



Se 1,
R
p n p
r
MSQ
F
MSQ

>
, ento a equao de regresso estatisticamente significante.

No nosso exemplo:

1,3
608, 4
285, 6 10,13
2,13
R
r
MSQ
F
MSQ
= = > =


Portanto, nossa equao estatisticamente significativa.



Exemplo 2)


Redimento de uma reao em funo da temperatura
Temperatura (
0
C) 30 35 40 45 50 55 60 65 70
Rendimento (%) 24 40 60 70 77 86 91 86 84








58
Exerccios.
Faa um ajuste linear para estes dados.

Algoritmo
1. Escrever a matriz T e o vetor de rendimentos y;
2. Calcular o vetor de regresso b usando a equao
( )

-1
t t
b = T T T y
3. Calcular a soma quadrtica em torno da mdia SQ
T
, usando o seguinte lao

>> ybar=mean(y)

>> for i=1:9
SQT(i)=(y(i)-ybar)^2;
end
>> SQT=SQT'
>> SQT=sum(SQT)

SQ
T
=4298,0
4. Calcular a soma quadrtica devido a regresso SQ
R
( ( )
2

i
y y

), usando o
seguinte lao:

>> for i=1:9
SQR(i)=(y(i)-ybar)^2;
end
>> SQR=SQR'
>> SQR=sum(SQR)

SQ
R
=3465,6

5. Calcular a soma quadrtica dos resduos SQ
r
( ( )
2

i i
y y

), usando o seguinte
lao:

>> for i=1:9
SQr(i)=(y(i)-ypred(i))^2;
end

>> SQr=SQr'
>> SQr=sum(SQr)

SQr=832,4

6. Calcular as mdias quadrticas;
7. Calcular o R
2
(
2
R T
R SQ SQ = ) (0,806)
8. Realizar um teste F para ver a significncia estatstica da equao de regresso;
9. Calcular a varincia e o desvio padro do vetor b;
10. Interpretar os resultados.





59


Plot dos resduos (ypred y)

9 Os resduos no se distribuem aleatoriamente;
9 O valor de R
2
muito baixo;
9 Os dados no se distribuem linearmente;

Vamos tentar uma equao do tipo

2
0 1 2
y b bT b T = + +







60
2
1 1
2
2 2
2
9 9
1 30 900
1 35 1225
1 40 1600
1 45 2025
1 50 2500
1 55 3025
1
1
1
1
T T
T T
T T
(
(
(
= =
(
(
(

T
# # #
60 3600
1 65 4225
1 70 4900
1 35 1225
1 40 1600
1 45 2025
1 50 2500
1 55 3025
1 60 3600
1 65 4225
1 70 4900
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(



( )
-158.2424
7.9875
-0.0647
(
(
(
(

-1
t t
b = T *T *T *y =


2
158, 24 7, 99 0, 065 y T T = +





ANOVA
Fonte de variao Soma Quadrtica Grau de liberdade Mdia Quadrtica
Regresso 4270,8 2 2135,4
Resduo 27,2 6 4,53
Total 4298 8

2
4270,8
0, 9937
4298, 0
R
T
SQ
R
SQ
= = =


61
O modelo quadrtico explica 99,37% da variao dos dados originais contra 80,63% do
modelo linear.




Clculo da varincia dos parmetros

2
4, 53
r
MSQ s = =
( )
( )
1
2
136.1745 -5.6419 0.0549
-5.6419 0.2383 -0.0024
0.0549 -0.0024 0.000024
Var s

(
(
= =
(
(

t
X X b

11.6694
( ) 0.4882
0.0049
erro padro s
(
(
= =
(
(

b


Frmula clculo do intervalo de confiana:

( )
i n p
b t erro padro




Exemplo

0 9 3 0
1 9 3 1
2 9 3 2
158, 24 2, 447 11, 6694 158, 24 28, 56
7, 99 2, 447 0, 4882 7, 99 1,19
0, 065 2, 447 0, 0049 0, 065 0, 012
b t erro padro de b
b t erro padro de b
b t erro padro de b

= =
= =
= =


















62
Comparao entre os valores empricos e os preditos

24.0000 23.1758
40.0000 42.0939
60.0000 57.7784
70.0000 70.2290
77.0000 79.4459
86.0000 85.4290
91.0000 88.1784
86.0000 87.6939
84.0000
y y
83.9758
(
(
(
(
(
(
(
(
(
(
(
(
(






Distribuio aleatria dos erros










63
Exerccio

A tabela abaixo mostra a variao da presso de vapor do CCl
4
em funo da
temperatura. Ajuste uma curva a estes dados, calcule o R
2
, calcule a significncia da
equao obtida e determine intervalos de confiana para os parmetros.


Variao da presso de vapor do CCl
4
com a temperatura.
Ensaio T(K)
( )
vap
p torr
1 273 0,044
2 283 0,075
3 293 0,122
4 303 0,190
5 313 0,288
6 323 0,422
7 333 0,601
8 343 0,829
9 353 1,124

Sugesto:
2
0 1 2
1 1
vap
lnp b b b
T T
| | | |
= + +
| |
\ . \ .

Das könnte Ihnen auch gefallen