Beruflich Dokumente
Kultur Dokumente
Probabilidades e Estatstica
Programa
1. Revises de Estatstica Descritiva e de Anlise Combinatria 2. Noes de probabilidade 1. Experincias aleatrias. Espao de resultados. Acontecimentos. 2. Noo de probabilidade: interpretaes de Laplace, frequencista e subjectivista. Axiomtica de probabilidade e teoremas decorrentes. 3. Probabilidade condicional. 4. Teoremas da probabilidade composta e da probabilidade total. Teorema de Bayes. Acontecimentos independentes. 3. Variveis aleatrias 1. Varivel aleatria. Funo de distribuio. 2. Variveis aleatrias discretas. Funo (massa) de probabilidade. 3. Variveis aleatrias contnuas. Funo densidade de probabilidade. 4. Vectores aleatrios bidimensionais. Funes de distribuio conjunta e marginais. 5. Vectores aleatrios discretos e contnuos. Distribuies conjunta, marginais e condicionais. Independncia entre variveis aleatrias. 4. Distribuies de probabilidade e caractersticas 1. Valor esperado de uma varivel aleatria e de uma funo de uma varivel aleatria. 2. Momentos simples e centrais. Desvio padro e coeficiente de variao. 3. Moda e quantis. 4. Distribuies discretas: Uniforme, Bernoulli, Binomial, Hipergeomtrica, Geomtrica e Poisson. 5. Distribuies contnuas: Uniforme, Exponencial e Normal. 5. Complementos das distribuies de probabilidade 1. Valor esperado de uma funo de um par aleatrio discreto e contnuo. Covarincia e correlao. Valor esperado e matriz de covarincias de um par aleatrio. Valor esperado condicional e propriedades. 2. Relaes entre distribuies. 3. Convergncia em distribuio e Teorema Central do Limite. Aplicaes. 6. Amostragem e estimao pontual 1. Estatstica Descritiva e Inferncia Estatstica. Amostragem aleatria. Estatsticas. 2. Estimao pontual: estimador e estimativa. Propriedades dos estimadores. 3. Mtodo da mxima verosimilhana. 4. Momentos da mdia amostral e de varincias amostrais. Distribuies amostrais da mdia e varincia numa populao normal. Distribuies do qui-quadrado e t-Student. 7. Estimao por intervalos 1. Noes bsicas. Mtodo pivotal. 2. Intervalos de confiana para parmetros de populaes normais. 3. Intervalos de confiana para parmetros de populaes no normais uniparamtricas. 8. Testes de hipteses 1. Noes bsicas. 2. Testes de hipteses para parmetros de populaes normais. 3. Testes de hipteses para parmetros de populaes no normais uniparamtricas. 4. Teste de ajustamento do qui-quadrado de Pearson. 9. Introduo regresso linear simples 1. Modelos de regresso. 2. Mtodo dos mnimos quadrados em regresso linear simples. 3. Propriedades dos estimadores dos mnimos quadrados. 4. Inferncias no modelo de regresso linear simples. 5. Coeficiente de determinao e anlise de resduos na avaliao do modelo.
2. Noes de probabilidade
2.1 Experincias aleatrias. Espao de resultados. Acontecimentos.
Definio
Um procedimento ou conjunto de circunstncias que produza resultados observveis e para o qual: 1. se conhecem todos os resultados possveis previamente sua realizao, 2. mas no possvel prever o resultado de cada realizao, diz-se uma experincia aleatria.
Definio
O conjunto formado por todos os resultados possveis de uma experincia aleatria diz-se o seu espao de resultados ().
Definio
Um qualquer subconjunto de diz-se um acontecimento. Seja = {1 , , n , } um espao de resultados. Destaquemos alguns acontecimentos notveis: acontecimento impossvel
Definio
O conjunto de todos os acontecimentos definidos num espao de resultados diz-se o espao de acontecimentos de uma experincia aleatria ( ).
Definio
Uma funo P : diz-se uma funo de probabilidade . Para um qualquer acontecimento A , o nmero real P ( A) diz-se a probabilidade da ocorrncia de A.
Definio
O terno (, , P ) diz-se o espao de probabilidade de uma experincia aleatria.
2.2 Noo de probabilidade: interpretaes de Laplace, frequencista e subjectivista. Axiomtica de probabilidade e teoremas decorrentes.
Como definir uma funo de probabilidade ou como interpretar o conceito de probabilidade? No h uma definio de probabilidade! antes um conceito primitivo que tem tido, ao longo do tempo, diferentes interpretaes.
Interpretao frequencista
Considerem-se n repeties de uma experincia aleatria e seja n A o nmero de ocorrncias de um acontecimento A nessas n repeties. Ento nA P ( A) = lim . n + n
Limitaes S se aplica se a experincia for repetvel. apenas uma interpretao que no fornece uma regra de clculo.
0.8
0.6
0.4
0.2
200
400
600
800
1000
A partir destes axiomas pode-se provar um grande nmero de propriedades de uma funo de probabilidade. Alguns exemplos 1. 2. 3. 4. ) = 1 P ( A), A ; P( A A = P ( A) = 0; A, B : A B P ( A) P ( B); P ( A) 1, A ; ) = P ( A B) = P ( A) P ( A B), A, B ; 5. P ( A B 6. P ( A B) = P ( A) + P ( B) P ( A B), A, B .
Definio
Se P ( A) = 0(1) ento A diz-se um acontecimento quase impossvel (quase certo).
P ( A) = P
= P * * ( i = 1 { i }) i = 1 ({ i })
Definio
Seja B tal que P ( B) > 0. A probabilidade condicional da ocorrncia de A dado que B ocorreu definida por P ( A B) P( A , A . B) = P ( B) Toda a probabilidade condicional!
Teorema
Seja B tal que P ( B) > 0 e defina-se a funo P ( B) de em . Ento B)) um espao de probabilidade. (, , P ( Como consequncia do teorema anterior todas as propriedades de uma funo de probabilidade so satisfeitas por P ( B). Alguns exemplos B) = 1 P ( A B), A ; 1. P ( A 2. P ( B) = 0; 3. A1 , A2 : A1 A2 P ( A1 B) P ( A 2 B); 4. P ( A1 A2 B) = P ( A 1 B) + P ( A 2 B) P ( A 1 A 2 B), A1 , A2 .
independentes.
Uma aplicao das probabilidades condicionais = P ( A) P ( B P ( A B) A), se P ( A) > 0 = P ( B) P ( A B), se P ( B) > 0
Definio
Uma sucesso de acontecimentos A1 , , An tais que 1. Ai A j = , i j 2.
i=1
Ai =
Definio
Os acontecimentos A e B dizem-se independentes se e s se P ( A B) = P ( A) P ( B). Notas: 1. A e B independentes P ( A B) = P ( A), se P ( B) > 0 e P ( B A) = P ( B), se P ( A) > 0; 2. todo o acontecimento independente de e . 3. Podero dois acontecimentos disjuntos serem independentes?
Definio
Seja H tal que P ( H) > 0. Dois acontecimentos A e B dizem-se condicionalmente independentes (dado H) se e s se P ( A B H) = P ( A H) P ( B H). Para mais do que dois acontecimentos possvel definir vrias formas de independncia.
Definio
Os acontecimentos A1 , , An dizem-se completamente independentes se e s se P ( A1 An ) = P ( Ai );
i=1 n
anlogo para qualquer subconjunto com n 1 acontecimentos; quaisquer dois acontecimentos distintos so independentes.
3. Variveis aleatrias
3.1 Varivel aleatria. Funo de distribuio.
1. Em geral, h interesse apenas numa ou mais caractersticas dos resultados de uma experincia aleatria. 2. H ainda interesse em abandonar a formalizao particular de cada experincia aleatria e levar o clculo de probabilidades para um campo mais familiar a anlise de funes reais de varivel real. Variveis aleatrias
Exemplo
Considere uma caixa com 4 peas boas ( B) e 5 peas defeituosas ( D). Suponha que so retiradas 2 peas dessa caixa. Espao de resultados: = { BB, BD, DB, DD} P ( BB) = 4 3 = 9 8 P ( BD) = 4 5 9 8 4 P ( DD) = 5 9 8
1 6 5 = 18 5 = 18
=5 4 = P ( DB) 9 8
Exemplo (continuao)
Seja X ="nmero de peas defeituosas nas 2 extraces". P ( X = 0) = P ( BB) = P ( X = 2) = P ( DD) =
1 6 5 9
P ( X = 1) = P ( BD) + P ( DB) =
5 18
Note-se que P ( X = 0) + P ( X = 1) + P ( X = 2) = P () = 1.
Definio
Seja (, , P ) um espao de probabilidade. Uma funo X : diz-se uma varivel aleatria . A : P ( X A) = P ( X 1 ( A)) = P ( B) em que B = { : X () A}
Definio
Seja X uma varivel aleatria. A funo de distribuio de X definida por F X (x) = P ( X x), x .
x +
1.0
1.0
1.0
0.5
0.5
0.5
-1
-1
-1
Definio
A funo (massa) de probabilidade de X definida por f X (x) = P ( X = x), { 0, xD . xD
1. f X (x) 0, x 2. f X (x) = P () = 1
xD
Notas: 1. P ( X A) =
xi D A
f X (xi ), A
xi D : xi x
2. F X (x) = P ( X x) =
f X (xi ), x
Exemplo (continuao)
1.0 1.0
0.8
0.8
0.6
0.6
0.4
0.4
0.2
0.2
funo de probabilidade
funo de distribuio
Em muitas situaes o interesse recai sobre uma varivel aleatria que funo de uma outra varivel aleatria, Y = g( X ). Se X uma varivel aleatria discreta ento Y tambm o . Como determinar a funo de probabilidade de Y ?
Exemplo
Seja X uma varivel aleatria com funo de probabilidade 1 , x = 0, 1, 2 5 f X (x) = . 0, caso contrrio Qual a funo de probabilidade de Y = X 2 ?
Definio
Se existir uma funo f X (x) tal que
Algumas propriedades
1. f X (x) 0, x 2. P ( X A) = f X (x) dx, A A 3. P ( X ) = f X (x) dx = 1 4. P ( X = a) = 0, a 5. f X (x) =
dF X (x ) dx +
No caso contnuo uma varivel Y = g( X ) pode ser de qualquer tipo e , em geral, mais simples recorrer funo de distribuio.
Exemplo
Sejam X uma varivel aleatria contnua com funo densidade de probabilidade f X (x) = 1, { 0, x ]0, 1[ . caso contrrio
Quais as funes densidade de probabilidade de Y = log X e de Z = 3 X 2 ? No exemplo anterior ambas as transformaes so bijectivas. Mesmo quando no esse o caso, a funo de distribuio pode conduzir resoluo do problema.
Exemplo
Sejam X uma varivel aleatria contnua com funo densidade de probabilidade f X (x) > 0, x , e Y = X 2 . Qual a funo de distribuio de Y ?
Definio
Seja ( X , Y ) uma varivel aleatria bidimensional. Ento F X , Y (x, y) = P ( X x, Y y), (x, y) 2
A partir do conhecimento do comportamento conjunto de ( X , Y ) tambm possvel analisar separadamente X e Y uma vez que lim F X , Y (x, y) = FY ( y) e
x + y +
3.6 Vectores aleatrios discretos e contnuos. Distribuies conjunta, marginais e condicionais. Independncia entre variveis aleatrias.
Definio
Seja ( X , Y ) uma varivel aleatria bidimensional discreta. Ento f X , Y (x, y) = P ( X = x, Y = y), (x, y) 2 diz-se a funo de probabilidade conjunta de ( X , Y ).
Exemplo
Tiram-se duas cartas ao acaso de um baralho de 52 cartas. Sejam X o nmero de figuras (reis, damas ou valetes) e Y o nmero de ases obtidos. Determine a funo de probabilidade conjuntas do par aleatrio ( X , Y ) e calcule os valores da funo de distribuio conjunta nos pontos (0, 1.5), (3, 1) e (5, 4). Y/X 0 1 2 0 1 2
Definio
Seja ( X , Y ) uma varivel aleatria bidimensional contnua. Se existir uma funo f X , Y (x, y) tal que
F X , Y (x, y) = f X , Y (u, v) dv du, (x, y) 2 ento ela diz-se a funo densidade de probabilidade conjunta de ( X , Y ). Notas: 1. f X , Y (x, y) dy dx = 1 2. f X , Y (x, y) 0, (x, y) 2 F X , Y (x, y) = f X , Y (x, y), (x, y) 2 nos pontos onde F X , Y diferencivel 3. x y
Exemplo
Num sistema formado por duas componentes, sejam X e Y as variveis aleatrias que representam as duraes, em anos, da primeira e da segunda componentes, respectivamente. A funo densidade de probabilidade conjunta de ( X , Y ) dada por f X , Y (x, y) = ex y , x > 0 e y > 0 { 0, x 0 ou y 0
1. Qual a probabilidade de ambas as componentes durarem no mximo 2 anos? 2. Qual a probabilidade da primeira componente durar mais do dobro do tempo que a segunda?
Definio
Seja ( X , Y ) uma varivel aleatria bidimensional. Ento f X (x) = f X , Y (x, y) = f X , Y (x, y) dy , x y e = fY ( y) = f X , Y (x, y) f X , Y (x, y) dx , y x dizem-se as funes (densidade) de probabilidade marginais de X e Y , respectivamente.
Definio
Seja ( X , Y ) uma varivel aleatria bidimensional. Ento
f X Y = y (x) = e fY X = x ( y ) =
f X , Y (x, y) fY ( y )
, x e y : fY ( y ) > 0
f X , Y (x, y) f X (x)
, y e x : f X (x) > 0
Definio
Duas variveis aleatrias, X e Y , dizem-se independentes se para todo A, B os acontecimentos X A e Y B so independentes, isto , se P ( X A, Y B) = P ( X A) P (Y B).
Teorema
As variveis aleatrias X e Y so independentes se e s se F X , Y (x, y) = F X (x) FY ( y), (x, y) 2 .
Teorema
As variveis aleatrias X e Y so independentes se e s se f X , Y (x, y) = f X (x) fY ( y), (x, y) 2 . Qual o efeito da independncia sobre as distribuies condicionais das variveis aleatrias?
Teorema
Se X e Y so variveis aleatrias independentes ento as variveis aleatrias U = g( X ) e V = h(Y ) so tambm independentes.
Definio
O valor esperado ou esperana matemtica da varivel aleatria X definido por E[ X ] = xi f X (xi ) = xf X (x) dx , i caso exista. Nota: o valor esperado de uma varivel aleatria no necessariamente um valor dessa varivel assim como o centro de massa de um corpo pode no pertencer ao prprio corpo. Generalizao: E[g( X )] = g(xi ) f X (xi ) = g(x) f X (x) dx .
i
Definio
A varincia da varivel aleatria X definida por Var [ X ] = E[( X 1 ) 2 ] = E[( X E[ X ]) 2 ], caso exista. O desvio padro de X igual a + Var [ X ].
Definio
O coeficiente de variao da varivel aleatria X definido por + CV = Var [ X ] E[ X ] .
Definio
Para 0 < p < 1, o valor Qp diz-se o quantil de ordem p se P ( X Qp ) p e P ( X Qp ) 1 p. No caso contnuo o clculo de quantis simplifica-se: Quantil de ordem p de X = Qp : F X (Qp ) = f X (x) dx = p
Qp
Exemplo
O jogador A prope um jogo de dados ao jogador B com as seguintes regras: o jogador B paga 5 de aposta e lana um dado; se sair 4 ou 5 o jogador B recebe o valor da aposta;
se sair 6 o jogador B ganha 20. Qual o lucro mais provvel do jogador B numa jogada? Ser este um jogo justo?
Definio
Seja X uma varivel aleatria que toma valores em D = { x 1 , , x n }. Se esses valores forem equiprovveis ento diz-se que a varivel tem uma distribuio uniforme discreta nesse conjunto. 1, x D n X U ({ x 1 , , x n }) f X (x) = . 0, x D
n n
E[ X ] = xi f X (xi ) = xi
i=1 i=1
1 n
in= 1 xi n in= 1 xi ( n )
2
Var [ X ] = E[ X ] ( E[ X ]) =
in= 1 xi2 n
Distribuio binomial.
Definio
Uma experincia aleatria com apenas dois resultados diz-se um ensaio ou prova de Bernoulli. 1, { 0, se ocorreu um "sucesso"
Seja X =
. se no ocorreu um "sucesso"
A distribuio de X fica definida se conhecermos a probabilidade de "sucesso", 0 < p < 1. Ento, p, x=1 x = 0, 1 p x (1 p) 1 x , . f X (x) = 1 p, x = 0 { 0, caso contrrio 0, caso contrrio
Definio
Nas condies anteriores diz-se que a varivel aleatria X tem uma distribuio de Bernoulli ou X Ber (p), com 0 < p < 1. Facilmente se mostra que E[ X ] = E[ X 2 ] = p e Var [ X ] = p(1 p). Uma prova de Bernoulli isolada um caso pouco interessante. No entanto, muitas situaes de interesse prtico podem ser descritas como sequncias de repeties de uma prova desse tipo. Consideremos uma experincia aleatria que consiste numa sequncia de realizaes independentes de uma prova de Bernoulli com probabilidade de sucesso p. Que variveis aleatrias poder ter interesse considerar? Seja X = "nmero de sucessos em n realizaes da prova". Temos ento que n x nx f X (x) = , x = 0, 1, , n. x p (1 p)
Definio
Nas condies anteriores diz-se que a varivel aleatria X tem uma distribuio binomial ou X Bi(n, p), com n e 0 < p < 1. Notas: 1. Bi(1, p) Ber (p); 2. X = Xi onde X i Ber (p) indica o resultado da i realizao;
i=1 n
Bi(20,0.30)
0.2
Bi(20,0.50)
0.1
0.1
0.1
11 13 15 17 19
11 13 15 17 19
11 13 15 17 19
Bi(20,0.70)
0.2 0.2
Bi(20,0.90)
0.1
0.1
11 13 15 17 19
11 13 15 17 19
Exemplo
Um teste de escolha mltipla formado por 10 questes com 4 alneas das quais apenas uma est certa. 1. Qual a probabilidade desse aluno responder acertadamente a pelo menos metade das questes? 2. Se se responder a todas as questes ao acaso, qual o nmero mais provvel de respostas certas?
Se X Bi(n, p) representar o nmero de sucessos numa experincia aleatria do tipo referido, qual a distribuio do nmero de insucessos na mesma experincia (Y )? Qual a relao entre as variveis aleatrias X e Y ?
Distribuio hipergeomtrica.
Consideremos uma populao de dimenso N formada por objectos de dois tipos: M com uma caracterstica associada ao "sucesso" e N M sem essa caracterstica. Retirada uma amostra de dimenso n dessa populao, ao acaso mas sem reposio, seja X = "nmero de sucessos na amostra". Ento, M NM ( x )( n x ) f X (x) = , x = max (0, n ( N M )), , min (n, M ). N (n)
Definio
Nas condies anteriores diz-se que a varivel aleatria X tem uma distribuio hipergeomtrica ou X H( N , M , n), com N , 0 < M < N e 0 < n < N . Notas: 1. A experincia aleatria referida pode ser vista como uma sequncia de n realizaes dependentes de uma prova de Bernoulli mas com probabilidade de sucesso constante igual a p = M ; N 2. E[ X ] = n M N 3. Se N + com p = e Var [ X ] = n
M N
NM
N n
Aplicao: se N tem um valor elevado e N n ento ao longo das realizaes da prova a proporo de sucessos na populao tem uma variao pequena e podemos considerar que
X Bi(n, p) com p = M / N .
Distribuio geomtrica.
Consideremos uma experincia aleatria que consiste numa sequncia de realizaes independentes de uma prova de Bernoulli com probabilidade de sucesso p at ocorrncia do primeiro sucesso. Seja X = "nmero de realizaes da prova at ao primeiro sucesso". Temos ento que f X (x) = (1 p) x 1 p, x = 1, 2, .
Definio
Nas condies anteriores diz-se que a varivel aleatria X tem uma distribuio geomtrica (ou de Pascal) ou X Geo(p), com 0 < p < 1. Notas: 1. f X (x) sempre decrescente; 2. E[ X ] =
1 p
e Var [ X ] = 0,
1 p p2
. x<1 k x < k, k
3. F X (x) =
{ 1 (1 p) k ,
Teorema
X Geo(p) P ( X > i + j X > i) = P ( X > j), i, j = 1, 2,
Distribuio de Poisson.
Definio
Consideremos a contagem do nmero de ocorrncias de um evento durante um certo intervalo de tempo (comprimento, rea, etc.). Seja N (t ) o nmero de ocorrncias em ]0, t ] com N (0) = 0. Se 1. os nmeros de ocorrncias em intervalos disjuntos so independentes; 2. P ( N (t + t ) N (t ) = 1) t ; 3. P ( N (t + t ) N (t ) > 1) 0, ento a experincia aleatria diz-se um processo de Poisson com parmetro +.
Definio
Seja X a varivel aleatria que representa o nmero de ocorrncias de um fenmeno por unidade de tempo (comprimento, rea, etc.). Diz-se que X tem uma distribuio de Poisson ou X Poi( ), com + quando f X (x) = e x x! , x = 0, 1, .
em que a taxa mdia de ocorrncias por unidade de tempo. E[ X ] = Var [ X ] = . Funes de probabilidade de Poisson
0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 -0.1 1 3 5 7
Poi(0.1)
Poi(1)
0.2
Poi(5)
0.1
9 11 13 15 17 19 21
9 11 13 15 17 19 21
9 11 13 15 17 19 21
Poi(10)
Poi(15)
Poi(30)
9 11 13 15 17 19 21
-3
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29
-6
9 14 19 24 29 34 39 44 49 54 59
Teorema
Seja Nt o nmero de ocorrncias durante um intervalo de comprimento t > 0 num processo de Poisson de taxa mdia . Ento, Nt Poi( t ).
Teorema
Seja X Bi(n, p). Ento, quando n + , p 0 e = np constante, tem-se f X (x) e x x! .
Aplicao: quando X Bi(n, p), n suficientemente grande e p suficientemente pequeno ento X Poi(np).
a
Definio
Se 1 , ba f X (x) = 0, axb caso contrrio
ento diz-se que X tem uma distribuio uniforme contnua no intervalo [a, b] ou X U (a, b), com a < b . Notas:
b 1 a+b 1. E[ X ] = x dx = a b a 2 2 (b a) 2. Var [ X ] = 12
Distribuio exponencial.
Definio
Se x<0 ento diz-se que X tem uma distribuio exponencial ou X Exp( ), com > 0. Notas: 1. F X (x) = e t dt = [ e t ]0 = 1 e x , x 0 0 1 1 2. E[ X ] = e Var [ X ] = 2
x x
f X (x) =
e x , x 0 { 0,
Teorema
X Exp( ) P ( X > s + t X > t ) = P ( X > s), s, t 0
Teorema
Seja X uma varivel aleatria que representa o nmero de ocorrncias por unidade de tempo (comprimento, rea, etc.) de um qualquer fenmeno e Y uma outra varivel aleatria que representa o tempo entre ocorrncias sucessivas. Se X Poi( ) ento Y Exp( ). O teorema anterior tambm se aplica se a varivel aleatria representar o tempo at primeira ocorrncia do fenmeno.
Distribuio normal.
Definio
Se f X (x) = 1 2 2 exp ento diz-se que X tem uma distribuio normal ou gaussiana ou X N (, 2 ), com e 2 > 0. Notas: 1. E[ X ] = e Var [ X ] = 2 2. f X ( x) = f X ( + x), x > 0 3. Moda=Mediana= Funes densidade de probabilidade gaussianas
N(0,1) 0.8 N(1,2) N(-1,0.2) 0.6
1 2 2
(x ) 2 , x }
0.4
0.2
-3
-2
-1
Teorema
Se X N (, 2 ) e Y = aX + b, com a 0, ento Y N (a + b, a 2 2 ). Caso particular: 1 X Sejam a = e b = , isto , Y = . Ento Y N (0, 1) distribuio normal reduzida ou standard. As funes ( y) = FY ( y) e 1 ( y) encontram-se tabeladas.
Teorema
Sendo X e Y duas variveis aleatrias ento E[ X + Y ] = E[ X ] + E[Y ].
Teorema
Se X e Y so variveis aleatrias independentes ento E[ XY ] = E[ X ] E[Y ].
Definio
Seja ( X 1 , X 2 ) um par aleatrio. O valor esperado condicional de X i dado X j , com i j, definido por xi f no caso discreto Xi X j = x j (x i ), xi , E[ X i X j = x j] = x f (x ) dx i , no caso contnuo i Xi X j = x j i caso exista.
Teorema
Sendo ( X 1 , X 2 ) um par aleatrio tem-se que E[ E[ X i X j ]] = E[ X i ].
Definio
A covarincia de X e Y definida por Cov[ X , Y ] = E[( X E[ X ])(Y E[Y ])].
caso exista. Algumas propriedades da covarincia 1. Cov[ X , Y ] = Cov[Y , X ] 2. Cov[ X , X ] = Var [ X ] 3. Cov[ X , Y ] = E[ XY ] E[ X ] E[Y ] Interpretao da covarincia
E[Y]
E[Y]
E[X]
E[X]
E[Y]
E[Y]
E[X]
E[X]
Teorema
Se X e Y so variveis aleatrias independentes ento Cov[ X , Y ] = 0.
Definio
O coeficiente de correlao de X e Y definido por Cov[ X , Y ] Corr [ X , Y ] = . Var [ X ]Var [Y ] Algumas propriedades do coeficiente de correlao 1. 1 Corr [ X , Y ] 1
2. Corr [aX , Y + b] =
Teorema
Sejam X i Bi(ni , p), i = 1, , n, variveis aleatrias independentes. Ento Y = Xi Bi ni , p . (i = 1 ) i=1
n n
Teorema
Sejam X i Poi( i ), i = 1, , n, variveis aleatrias independentes. Ento Y = Xi Poi i . (i = 1 ) i=1
n n
Teorema
Sejam X i N (i , i2 ), i = 1, , n, variveis aleatrias independentes. Ento Y = Xi N
i=1 n
, 2 . (i = 1 i i = 1 i )
Definio
Uma sucesso de variveis aleatrias X 1 , , X n , com funes de distribuio F1 , , Fn , converge em distribuio para uma varivel aleatria X ( Xn X ), quando n + , se Fn F X para todo o ponto de continuidade de F X . Exemplos 1. H( N , M , n) Bi(n, p = M / N ) quando N + , M / N e n constantes; 2. Bi(n, p) Poi( = np) quando n + , p 0 e np constante.
N (0, 1).
Sn E[Sn ] 2. Para n suficientemente grande, P x (x). Var [Sn ] Aplicao Sejam X i Ber (p), i = 1, , n, variveis aleatrias independentes e Sn = in= 1 Xi . Tem-se que E[Sn ] = np, Var [Sn ] = np(1 p) e, pelo T. L. C., Sn np N (0, 1). np(1 p) Note-se que Sn Bi(n, p). Para n suficientemente grande ento Sn N (np, np(1 p)).
a
Bi(10,0.8)
0.2
Bi(20,0.8)
0.2
Bi(30,0.8)
0.1 0.1
0.1
11 13 15 17 19
-3
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29
0.15 0.10
Bi(50,0.8)
0.10
Bi(100,0.8)
0.05 0.05
-5
3 7 11 15 19 23 27 31 35 39 43 47
-11
19 29 39 49 59 69 79 89
Soma de exponenciais
0.4 n=1 0.4 n=2 0.4 n=5
0.2
0.2
0.2
-3
-2
-1 0.4
3 n=10
-3
-2
-1 0.4
3 n=20
-3
-2
-1 0.4
3 n=50
0.2
0.2
0.2
-3
-2
-1
-3
-2
-1
-3
-2
-1
N (0, 1).
Definio
Uma amostra um qualquer subconjunto de uma populao. Notao: x 1 , , x n amostra observada de dimenso n Como escolher uma amostra que represente bem uma populao? 1. 2. 3. 4. 5. Amostragem Amostragem Amostragem Amostragem aleatria simples ou amostragem casual aleatria por conglomerados aleatria estratificada determinstica
Definio
A amostragem aleatria simples um mtodo de amostragem em que todos os elementos de uma populao tm a mesma probabilidade de serem seleccionados. Descrio da amostra Estatstica descritiva Descrio da populao Inferncia estatstica Objectivo Estudo de uma varivel estatstica numa populao Estatstica paramtrica Estudo de uma varivel aleatria X com distribuio conhecida, f X (x; ), mas em que k tem um valor desconhecido. Nota: um vector de parmetros e o espao paramtrico (conjunto de valores possveis para ).
Definio
Uma amostra aleatria simples uma sucesso de variveis aleatrias X = ( X 1 , , X n ) independentes e identicamente distribudas de acordo com a
distribuio da varivel estatstica da populao. Nota: cada amostra observada uma concretizao particular da amostra aleatria! Qual a informao amostral? 1. os valores da amostra observada; 2. a distribuio da amostra aleatria : fX (x1 , , x n ; ) = f Xi (xi ; ) = f X (xi ; )
i=1 i=1 n n
O que fazer com a informao amostral? Em geral, essa informao resumida atravs do clculo de estatsticas.
Definio
Uma estatstica uma funo da amostra aleatria, ou seja, dada a amostra aleatria X = ( X 1 , , X n ) uma estatstica T dada por T = T (X ) = g( X1 , , X n ). Alguns exemplos comuns: = 1. X
2
in= 1 Xi n
2. S =
2 = 3. Sn
)2 in= 1 ( X i X n1 n )2 i = 1 ( Xi X
4. X(1) 5. X(n)
Definio
Um estimador pontual de um parmetro uma qualquer funo da amostra aleatria que no dependa de parmetros cujo valor seja desconhecido (estatstica).
Definio
Uma estimativa pontual de um parmetro um valor observado de um estimador pontual desse parmetro.
Exemplo
Seja X 1 , , X n uma amostra aleatria de uma populao com distribuio N (, 2 ). Alguns estimadores possveis para so: mdia amostral 1. X 2. mediana amostral 3. moda amostral X(1) + X(n) 4. centro do intervalo de variao amostral 2
Definio
Um estimador pontual T de um parmetro diz-se centrado se e s se E[T ] = , . Nota: d [T ] = E[T ] o desvio ou enviesamento do estimador.
Exemplo
Seja X 1 , , X n uma amostra aleatria de uma populao X . Ento, um estimador centrado de E[ X ]; 1. X
2 2. S 2 ( = Sn um estimador centrado de Var [ X ]; 1) 2 3. qual o problema de Sn ?
Definio
O erro quadrtico mdio de um estimador pontual T de um parmetro definido por EQM [T ] = E[(T ) 2 ]. Notas:
2 1. EQM [T ] = Var [T ] + d [T ]
E[T] d ( T )
Var[T]
Definio
Sejam T1 e T2 dois estimadores pontuais de um parmetro . Diz-se que T1 mais eficiente do que T2 se EQM [T1 ] EQM [T2 ], e : EQM [T1 ] < EQM [T2 ].
No caso discreto, quando o valor de conhecido, esta funo d-nos a probabilidade de se observar qualquer ponto amostral (x 1 , , x n ).
Definio
A funo (; x ) fX (x ; ) diz-se a funo de verosimilhana.
Definio
O valor
^ = argmax (; x ) diz-se a estimativa de mxima verosimilhana do parmetro . Notas: 1. O estimador associado, quando determinvel analiticamente, diz-se o respectivo estimador de mxima verosimilhana; 2. Frequentemente mais conveniente maximizar log (; x ).
Exemplo
Seja X 1 , , X n uma amostra aleatria de uma populao com distribuio Geo(p), com 0 < p < 1. Determine o estimador de mxima verosimilhana do parmetro p e de q = P ( X > 1).
Momentos da mdia amostral e de varincias amostrais. Distribuies amostrais da mdia e varincia numa populao normal. Distribuies do qui-quadrado e t-Student.
] = E[ X ]. Temos ainda que Var [ X ] = Var [ X ] / n. Para melhor se avaliar a J vimos que E[ X estimao de um parmetro importante conhecer a distribuio amostral de um estimador ou estatstica.
Teorema
Seja X 1 , , X n uma amostra aleatria de uma populao N (, 2 ). Ento 2 X X N , N (0, 1) ( n) n Para populaes no normais, se a amostra for suficientemente grande, podemos aplicar o Teorema do Limite Central, obtendo-se: E[ X ] a X Var [ X ] a N E[ X ], . N (0, 1) X ( n ) Var [ X ] n
Exemplo
Seja X 1 , , X n uma amostra aleatria de uma populao com distribuio Ber (p). Para n suficientemente grande tem-se p X p(1 p) a a N p, N (0, 1) X ) ( n p(1 p) n
Teorema
Se X N (0, 1) ento Y = X 2 tem uma funo densidade de probabilidade dada por fY ( y ) = com n = 1. (1 / 2) n /2 (n / 2) y n /2 1 e y /2 , y > 0,
Definio
Uma varivel aleatria com a funo densidade de probabilidade atrs diz-se que tem uma distribuio do qui-quadrado, X (2 , n . n) E[ X ] = n e Var [ X ] = 2 n Distribuies do qui-quadrado
n=2 0.4 n=3 n=5 0.3 n=10
0.2
0.1
10
15
Teorema
2 Se X 1 , , X n so variveis aleatrias independentes com X i (1) ento
Definio
Uma varivel aleatria com a funo densidade de probabilidade n+1 n 1 2 2 ( + ) x 2 1+ , x f X (x) = ( ) n n n ( ) 2 diz-se que tem uma distribuio t-Student, X t(n) , n . E[ X ] = 0, n 2 e Var [ X ] = Distribuies t-Student
0.4 N(0,1) t (2) 0.3 t (5) t (20) 0.2
n , n2
n 3, X N (0, 1)
0.1
-3
-2
-1
Teorema
Se X N (0, 1) e Y (2 so variveis aleatrias independentes ento n) X Y/n t(n) .
Como a soluo no nica necessrio introduzir um critrio adicional. Se tomarmos, por mera convenincia, a = b temos ento que b = 1 (
1+ . 2 )
Resolvendo as duas desigualdades anteriores em ordem a obtm-se b +b <<X PX = . n n 1 1+ b +b IAC () = X , X , com b = ( 2 ). n n Outras solues intervalos unilaterais: +b a = e b = 1 ( ) IAC () = , X n
+a a = 1 (1 ) e b = + IAC () = X , + n Aplicao Suponhamos que = 1 e que se observou uma amostra de dimenso n = 100 tal que x = 10. Para = 0.95 tem-se b = 1 (0.975) = 1.96 e IC0.95 () = ]9.804, 10.196[. Ser que podemos afirmar que P (9.804 < < 10.196) = 0.95 ?
uma probabilidade associada ao intervalo aleatrio de confiana, ou seja, a proporo de intervalos de confiana obtenveis que contm o valor desconhecido do parmetro. o nvel de confiana associado ao intervalo de confiana, ou seja, uma medida da confiana que podemos ter de que esse intervalo numrico contenha, de facto, o valor desconhecido do parmetro.
Definio
O conjunto (infinito) de todas as amostras possveis de serem obtidas numa populao designa-se por espao amostral e ser representado por .
Definio
Seja X = ( X 1 , , X n ) uma amostra aleatria de uma populao com distribuio f X (x; ). Um intervalo ] I (X ), S(X )[, com I (x ) S(x ) x , diz-se um intervalo aleatrio de confiana para . 1. se I (X ) (S(X )) no depende da amostra aleatria ento o intervalo diz-se unilateral esquerda (direita); 2. dada uma amostra observada x a concretizao do intervalo aleatrio de confiana, ] I (x ), S(x )[, um intervalo numrico designado por intervalo de confiana.
Definio
Seja ] I (X ), S(X )[ um intervalo aleatrio de confiana para um parmetro . Se P ( I (X ) < < S(X )) = , ento diz-se o nvel de confiana do intervalo aleatrio de confiana. O que h de geral no exemplo inicial? Mtodo da varivel fulcral ou mtodo pivotal
Definio
Uma funo da amostra aleatria e do parmetro de interesse, , que no depende de quaisquer outros parmetros com valores desconhecidos e cuja distribuio completamente conhecida diz-se uma varivel fulcral ou piv para o parmetro . E se o valor de 2 for tambm desconhecido? Neste caso a varivel aleatria, que j vimos anteriormente, X t(n 1) S n uma varivel fulcral para e a construo de intervalos de confiana segue os mesmos passos do exemplo anterior.
P a< (
Agora a distribuio da varivel fulcral no simtrica! Possvel soluo intervalo central ou de caudas iguais: 1. determinar a tal que F 2 (a) =
1 ; 2 1 2
(n 1)
(n 1)
(b) = 1
1+ . 2
P a< (
(n 1)S 2 2
<b
=P
(n 1)S 2 ( b
< 2 <
(n 1)S 2 a )
IAC ( 2 ) =
(n 1)S 2 ] b
(n 1)S 2 a [
Equivalentemente, 1 X 2 ) (1 2 ) (X
2 2 2 1 +n 2 n1
N (0, 1),
2 2 e 2 so conhecidas. que pode servir como varivel fulcral para 1 2 quando 1 2 2 e 2 so tambm desconhecidos pode-se mostrar que, se Quando os valores de 1 2 2 = 2 , ento 1
2 ) (1 2 ) 1 X (X
2 2 (n1 1)S1 + (n2 1)S2 1 1 ( n1 + n2 ) n1 + n2 2
t(n1 + n2 2) .
No caso mais geral no conhecida uma soluo exacta mas, se as amostras forem suficientemente grandes, pode-se usar uma varivel fulcral com uma distribuio aproximada 1 X 2 ) (1 2 ) a (X N (0, 1). 2 2 S2 S1 + n1 n2 claro que, neste ltimo caso, os intervalos tm nveis de confiana aproximados!
Uma vez que E[ X ] e Var [ X ] dependem de a varivel anterior pode ser usada como uma varivel fulcral aproximada para .
Exemplo
Seja X 1 , , X n uma amostra aleatria de uma populao com distribuio Ber (p). Para n suficientemente grande temos ento p X a N (0, 1). p(1 p) n Fixado 0 < < 1 ento com a = 1 (
1+ 2 )
tem-se
Exemplo (cont.)
p) 2 (X X p < a2 <a p (1 p ) p(1 p) n n a2 n) a2 n) 2<0 p+X
1+
+ 2X
Como (1 + an ) > 0 ento o intervalo aleatrio de confiana aproximado da forma ]k1 , k2 [ onde k1 e k2 so as solues da equao do segundo grau associada inequao anterior.
Exemplo (cont.)
Uma soluo mais simples: pode-se mostrar ainda que p X a N (0, 1). (1 X ) X n Com esta varivel fulcral aproximada tem-se (1 X ) (1 X ) X X , a +a IAC (p) X , X n n com a = 1 (
1+ 2 )
8. Testes de hipteses
Noes bsicas.
Nos dois captulos anteriores vimos como usar os dados observados para determinar um valor ou um conjunto de valores plausveis para um parmetro cujo valor numa populao desconhecido. Nas primeiras seces deste captulo o procedimento inverte-se: escolhido um valor ou um conjunto de valores possveis para um parmetro vamos avaliar se os dados observados suportam ou no essa escolha. Por fim, iremos analisar uma questo de uma natureza diferente: o ajustamento de uma distribuio a uma varivel aleatria.
seja pequena. 4. Aplicao do teste de hipteses Observada uma amostra x = (x1 , , x n ) calcula-se T (x ) e tomada uma deciso: se T (x ) C rejeita-se H0 ; caso contrrio no se rejeita H0 .
Definio
A potncia de um teste de hipteses definida por (), P (rejeitar H0 ) = { 1 (), 0 1 .
Definio
O nvel de significncia de um teste de hipteses definido por sup P (rejeitar H0 ) = sup ().
0
Estatstica de teste: Z0 =
= 0 X 0 N (0,
1)
Para definir a regio crtica fixa-se o nvel de significncia do teste, , ou seja, a probabilidade dessa regio sob H0 . C = x 0 1 x : n 1 > { 2 }
Deciso: se z0 C ento rejeita-se H0 para qualquer nvel de significncia superior ou igual a . x 0 1 Nota: z0 = n 1 2 1 0 1 1 x 1 + 0 2 n 2 n 1 1 0 x x + 1 1 2 2 n n z0 C 0 IC1 (), ou seja, no se rejeita H0 a um nvel de significncia se e s se 0 pertence ao IC1 ()! Alternativa Clculo do valor-p
Definio
O valor-p a probabilidade sob H0 de a estatstica de teste tomar valores to ou mais desfavorveis a H0 do que o seu valor observado, ou seja, o menor nvel de significncia que conduz rejeio de H0 . Neste caso o valor-p calculado como 2min { P ( Z0 > z0 ), P ( Z0 z0 )} = 2 P ( Z0 > z0 ) = 2 (1 ( z0 )). Pela definio anterior rejeita-se H0 para nveis de significncia superiores ao valor-p e no se rejeita no caso contrrio. o clculo do valor-p permite que se prescinda de fixar previamente o nvel de significncia de um teste de hipteses. 2. H0 : 0 contra H1 : > 0 Estatstica de teste: Z0 = n 0 = 0 X N (0, 1)
x: n {
x 0
> 1 (1 ) }
Nota: este teste de hipteses tambm se aplica s hipteses H0 : = 0 contra H1 : = 1 , com 1 > 0 . 3. H0 : 0 contra H1 : < 0 Estatstica de teste: Z0 = n 0 = 0 X N (0, 1) x 0 < 1 () }
x: n {
Nota: este teste de hipteses tambm se aplica s hipteses H0 : = 0 contra H1 : = 1 , com 1 < 0 . Quando o valor de 2 tambm desconhecido, todas as hipteses anteriores podem ser testadas usando a estatstica de teste X T= n t(n 1) . S A construco dos testes de hipteses inteiramente anloga aos casos anteriores.
Estatstica de teste: Q0 =
Qual dever ser a forma da regio crtica? Sob H0 de esperar que a estatstica tome valores em torno de E[Q0 ] = n 1. Logo, , quer para valores que se afastem dessa medida de localizao da distribuio (2 n 1) valores elevados quer para valores prximos de 0, fornecem evidncia contra a hiptese nula, ou seja,
C =
1 1 s 2 + : q0 < F ( / 2) q0 > F (1 / 2) . 2 2 { } (n 1) (n 1)
Exemplo
Um fabricante de lmpadas afirma que o tempo mdio de vida das suas lmpadas de 110 3 horas, no mnimo. Numa amostra de 120 lmpadas retiradas ao acaso da produo desse fabricante observou-se um tempo total de vida de 11210 3 horas. Admitindo que o tempo de vida de uma lmpada, em milhares de horas, segue uma distribuio exponencial, avalie a afirmao do fabricante. Seja X = ( X 1 , , X n ) uma amostra aleatria de uma populao com distribuio Exp( ), > 0. Hipteses H0 : 1 / 1 contra H1 : 1 / < 1 Estatstica de teste Como a dimenso da amostra suficientemente grande podemos utilizar T0 = Regio crtica 1 ) N (0, 1), n X (
a
Tendo em conta as hipteses e a estatstica de teste, a regio crtica dever ter a forma
+ 1 C = {x : t0 < ()}.
Assim o valor-p dado por P (T0 t0 ). Aplicao do teste de hipteses x = 112 tem-se t0 = Como i120 =1 i 120 (112 / 120 1) 0.73.
O valor-p igual a P (T0 0.73) = 1 (0.73) = 1 0.7673 = 0.2327. Concluses 1. deve-se rejeitar H0 para nveis de significncia superiores a 0.2327 e no rejeitar no caso contrrio; 2. no h evidncia suficiente para rejeitar a afirmao do fabricante de lmpadas aos nveis de significncia mais usuais (0.01-0.1).
Comecemos por criar uma partio do contradomnio de X , A1 , , Ak , na qual se agrupam os dados observados. Sejam pi0 = P ( X Ai H0 ) e Oi o nmero de observaes na amostra agrupadas na classe Ai , i = 1, , k. Sob H0 , Oi Bi(n, pi0 ) e defina-se Ei = E[Oi H0 ] = npi0 . Note-se que ik= 1 Oi = ik= 1 Ei = nik= 1 pi0 = n. Uma forma de avaliar a plausibilidade de H0 consiste em comparar as frequncias observveis, Oi , com as frequncias esperadas sob H0 , Ei . Para isso utiliza-se a estatstica do qui-quadrado de Pearson k (Oi Ei ) 2 a Q2 = (2 . k 1) Ei i=1
Uma vez que se trata de um teste aproximado necessrio que se verifiquem as seguintes condies: 1. todas as classes com Ei 1; 2. pelo menos 80% das classes com Ei 5. Quando isto no acontece procede-se a um agrupamento das classes.
Exemplo
Voltemos ao exemplo anterior. Para os 120 tempos de vida de lmpadas observados construiu-se o seguinte histograma:
71 70 60 50 40 30 20 12 10 6 2 4 5 2 6 27
H0 : A varivel segue uma distribuio Exp(1) H1 : A varivel no segue uma distribuio Exp(1) Seja pi0 = P ( X (i 1, i] H0 ), i = 1, , 6 e
0 = P ( X > 6 H0 ) = 1 i6= 1 pi0 . p7
e , i = 1, , 6. oi pi0 ei = 120pi0
Classes
oi
pi0
Como o nmero de classes 4 e no foram estimados quaisquer parmetros, o nmero de graus de liberdade da distribuio aproximada da estatstica de teste 3. Assim, para um nvel de significncia = 0.05, a regio
oi
pi0
ei = 120pi0 (oi ei ) 2 / ei 75.854 27.905 10.266 5.974 0.3107 0.0294 0.2930 2.7124
120 q 2 = 3.3454
crtica C0.05 = {q 2 + : q 2 > 7.815 }. Logo no h evidncia para rejeitar a hiptese nula para 0.05. Alternativa: valor-p = P (Q 2 > 3.3454) 0.30 < valor-p < 0.40. O teste anterior tambm pode ser utilizado para testar as hipteses
0 0 (x; ) contra H1 : X / fX (x, ) H0 : X f X
em que representa um conjunto de m parmetros com valores desconhecidos. Neste caso no possvel calcular as probabilidades p i0 ! Em vez disso, utilizam-se estimativas dessas probabilidades, ^ p i , calculadas a partir da estimativa de mxima verosimilhana de com base na amostra agrupada em classes. A estatstica de teste passa a ser Q2 =
i=1 k 0
^ (Oi Ei ) ^ Ei
(2 . k m 1)
290
240
25
35
45
55
65
75
85 x
Modelo de Regresso Linear Simples (MRLS) Yi = 0 + 1 xi + i , i = 1, , n 0 , 1 parmetros do MRLS i erro aleatrio associado a Yi = Y x = xi Pressupostos usuais do MRLS 1. E[i ] = 0, i E[Y x = xi ] = 0 + 1 xi ; 2 2. Var [i ] = 2 , i Var [Y x = xi ] = ; 3. i 's no correlacionados. Interpretao dos parmetros do MRLS 0 = ordenada na origem = E[Y x = 0] 1 = declive da recta = E[Y x = x0 + 1] E[Y x = x0 ] Aplicabilidade e validade do MRLS
^ Y 1 x
Equao de regresso estimada: ^ E[Y x] = ^ 0 + ^ 1 x Alternativa: mtodo da mxima verosimilhana Pressuposto adicional: i N (0, 2 ), i = 1, n Yi N ( 0 + 1 xi , 2 )
( 0 , 1 , 2 y ) =
1 2 2
1 ( yi ( 0 + 1 xi )) 2 2 2
i=1
2 ^ MV =
onde ki =
(xi x ) n j=1
n
x2 nx 2 j
Tem-se que ki =
i=1 n
= 0 e ki xi =
i=1
= 1.
E[^ 1 ] = ki E[Yi ] = ki ( 0 + 1 xi ) = 1 .
i=1 i=1
^ ^ 1 x 0 = Y =
in= 1 Yi n
n2 n
2.
Logo,
2 ^ =
0 + ^ 1 xi )) in= 1 (Yi (^ n2
um estimador centrado de .
^ 1 1
2 ^ x i2 nx 2
Estimao da resposta esperada: E[Y0 ] = E[Y x = x 0 ] = 0 + 1 x0 Estimador pontual: ^ E[Y0 ] = ^ 0 + ^ 1 x0 (centrado!) ^ ^ ( 0 + 1 x 0 ) ( 0 + 1 x 0 ) t(n 2) - varivel fulcral para E[Y0 ] 2 1 ) ( x x 2 0 ^ + 2 n ( x nx 2) i Nota: as inferncias podem no ser vlidas fora do intervalo de valores de x considerado extrapolao.
SQT = SQE + SQR variao total em Y =variao devida ao erro aleatrio + variao explicada pelo MRLS Coeficiente de determinao: R 2 = explicada pelo MRLS Por definio 0 R 2 1.
SQR SQT
R 2 1 indica um bom ajustamento do MRLS R 2 0 indica um mau ajustamento do MRLS R = + R 2 coeficiente de correlao emprico Resduos: yi = yi (^ 0 + ^ 1 xi ), i = 1, , n ri = yi ^ y i so teis para detectar violaes dos pressupostos do Grficos de ri versus x i ou ^ MRLS: 1. 2. 3. 4. dependncia nos erros; heterogeneidade da varincia; falta de normalidade; observaes discordantes.
Exerccio 9.1 Represente graficamente as observaes e desenhe a recta que, no seu entender, melhor se ajusta s observaes. Considere um modelo de regresso linear simples para explicar as observaes. Obtenha a estimativa dos mnimos quadrados dos coeficientes da recta de regresso e desenhe-a no grfico. Estimativas de mnimos quadrados e de mxima verosimilhana: ^ 1 =
y 12 xi yi nx
i=1
2 12 x 2 nx
i=1 i
= 2.4167
290
240
25
35
45
55
65
75
85 x
n 2 2 )(in= 1 yi2 ny 2) (i = 1 xi nx
(9278.08) 2 383823378.92
= 0.9593
Isto , 95.93% da variabilidade total da resistncia do plstico explicada pelo modelo de regresso com o tempo decorrido entre a moldagem e a medio da resistncia. Proceda ao teste da hiptese "O coeficiente angular nulo". Qual o interesse desta hiptese? Relacione-o com o valor do coeficiente de determinao obtido atrs.
t(10) ,
cujo valor observado dado por t0 = 15.35. Valor-p: p = 2 P (T0 > 15.35) = 2.8110 8 . Note-se que p < 0.001 = 20.0005 pois Ft1 (0.9995) = 4.587. (10) Concluso: Rejeita-se H 0 para nveis de significncia de pelo menos 2.8110 8 , ou seja, h evidncia contra H0 , isto , o tempo decorrido entre a moldagem e a medio da resistncia influencia significativamente a resistncia do plstico. Calcule o intervalo de confiana a 95% para o valor esperado da resistncia obtida 48 horas depois de concluda a moldagem. Acha legtimo usar o mesmo procedimento tratando-se de um perodo de 10 horas em vez de 48 horas? Justifique a sua resposta.
Varivel fulcral para E[Y x = x0 ] = 0 + 1 x0 : ^ ^ ( 0 + 1 x 0 ) ( 0 + 1 x 0 ) t(10) W= 2 1 (x x0 ) 2 ^ + 2 n 2 i xi nx ) ( Intervalo aleatrio de confiana para E[Y x = x0 ] a 95%: 1 (x x0 )2 2 1 ^ ^ ^ ( 0 + 1 x0 ) Ft(10) (0.975) + 2 2 ) ( n i xi nx P ( 2.228 < W < 2.228) = 0.95 pois Ft1 (0.975) = 2.228 (10) Estimativa pontual: E [Y x = 48] = 153.91 + 2.416748 = 269.91
Intervalo de confiana para E[Y x = 48] a 95%: (263.035; 276.785) No aconselhvel considerarmos x 0 fora do domnio dos dados observados, visto que no h informao fora desse domnio. O que acontece com x 0 = 10 (16, 80). yi = yi (^ 0 + ^ 1 xi ): Anlise de resduos ri = yi ^
ri 15 10 5 25 -5 -10 -15 35 45 55 65 75 85 x