Beruflich Dokumente
Kultur Dokumente
k
i
i
n f
1
,
n = nmero total de observaes.
(2) FREQNCIA RELATIVA (
i
fr
): a razes entre a freqncia simples a
freqncia total.
k
i
i
i
i
f
f
fr
1
Ex.:
275 , 0
40
11
40
1
3
3
i
i
f
f
fr
ESTATURA (cm) fi fri
150 a 154 4 0,100
154 a 158 9 0,225
158 a 162 11 0,275
162 a 166 8 0,200
166 a 170 5 0,125
170 a 174 3 0,075
Total 40 1
Fonte: MEC
Estatura de 40 alunos do colgio A
(3) FREQNCIA ACUMULADA ( i
F
): o total das freqncias de todos os valores
inferiores ao limite superior do intervalo de classe.
1
4
Instituto Federal de Educao, Cincia e Tecnologia RJ
Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
+ + +
k
i
i k i
f f f f F
1
2 1
.....
Ex:
+ + + +
3
1
3 2 1 3
24 11 9 4
i
i
f f f f F
, ou seja, existem 24 alunos com
estatura inferior a 162 cm ( 3
L
da 3 classe).
ESTATURA (cm) fi fri Fi
150 a 154 4 0,100 4
154 a 158 9 0,225 13
158 a 162 11 0,275 24
162 a 166 8 0,200 32
166 a 170 5 0,125 37
170 a 174 3 0,075 40
Total 40 1
Fonte: MEC
Estatura de 40 alunos do colgio A
(4) FREQNCIA ACUMULADA RELATIVA ( i
Fr
): a freqncia acumulada da
classe dividida pela freqncia total da distribuio.
k
i
i
i
i
f
F
Fr
1
Ex.:
600 , 0
40
24
40
1
3
3
i
i
f
F
Fr
ESTATURA (cm) fi fri Fi Fri
150 a 154 4 0,100 4 0,100
154 a 158 9 0,225 13 0,325
158 a 162 11 0,275 24 0,600
162 a 166 8 0,200 32 0,800
166 a 170 5 0,125 37 0,925
170 a 174 3 0,075 40 1
Total 40 1
Fonte: MEC
Estatura de 40 alunos do colgio A
1
5
Instituto Federal de Educao, Cincia e Tecnologia RJ
Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
OBSERVAO: Critrio para calcular o nmero de classes a ser utilizado
CRITRIO DA RAIZ
Se a seqncia estatstica contm n elementos e se indicarmos por i o nmero de
classes a ser utilizado, ento:
n i
onde n = nmero total de observaes.
Amplitude do intervalo de classe que chamaremos de h determinada por:
i
AT
h
, onde AT a Amplitude Total e n i
Exemplo:
n = 40
Ento, 40 i = 6,324, portanto o inteiro mais prximo 6.
Devemos trabalhar com o inteiro mais prximo da raiz de n, o inteiro
imediatamente anterior e o inteiro imediatamente superior.
Logo, as opes para i so: 5, 6 ou 7.
Ento,
A amplitude do intervalo de classe (h) determinada por:
4
6
150 - 174 (min) l - (Max) L
i i
AT
h
Observe que a opo por 6 classes foi feita em funo de um valor de h mais fcil
de se operar.
1
6
Instituto Federal de Educao, Cincia e Tecnologia RJ
Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
REPRESENTAO GRFICA DE UMA DISTRIBUIO DE FREQNCIA.
Histograma
- Consiste em um conjunto de retngulos, tantos quantos forem s classes de uma
distribuio.
- As classes so as bases dos retngulos (tantas partes quantas forem s classes)
- A escala para marcao dos pontos no eixo Y corresponde s freqncias.
Exemplo:
Polgono de freqncias
Freqncia Simples:
1
7
Instituto Federal de Educao, Cincia e Tecnologia RJ
Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
Freqncia Acumulada:
- As bases dos retngulos vo estar centradas nos pontos mdios das classes.
Exemplo:
1
8
Instituto Federal de Educao, Cincia e Tecnologia RJ
Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
CAPITULO 4
MEDIDAS DE POSIO: MDIA, MODA e MEDIANA;
O estudo sobre a Distribuio de Freqncia permitiu descrever, de um modo
geral, os valores que uma varivel pode assumir. Agora precisamos de um indicativo
generalizado.
O modo mais comum de se obter esse tipo de informao atravs das
MEDIDAS DE POSIO, estatstica que representa posio relativa da distribuio
em relao ao eixo horizontal.
As medidas de posio mais importantes so as MEDIDAS DE TENDNCIA
CENTRAL recebem esse nome pelo fato dos dados observados, em geral, se agruparem
em torno dos valores centrais.
So elas:
MDIA ARITMTICA
MODA
MEDIANA
Outras medidas de posio so:
SEPARATRIZES
QUARTIS
PERCENTIS
Essas medidas quando bem interpretadas, podem fornecer-nos informaes muito
valiosas com respeito s sries estatsticas, ou seja, com estas medidas tenta-se encontrar
um valor numrico que represente o comportamento tpico da serei em estudo.
(11 MDIA ARITMTICA SIMPLES ( x )
DADOS NO AGRUPADOS (dados brutos ou rol): Quando desejamos
conhecer a mdia dos dados no agrupados, determinamos a mdia
aritmtica simples.
1
9
Instituto Federal de Educao, Cincia e Tecnologia RJ
Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
n
x
x
n
i
i
1
, onde (
x
) a mdia aritmtica, (
i
x
) os valores da varivel e (n) o
nmero de valores.
Ex.: Produo leiteira diria da vaca A, durante uma semana, foi de 10, 14, 13, 15, 16,
18 e 12 litros. Qual a produo mdia da semana.
litros x 14
7
98
7
12 18 16 15 13 14 10
+ + + + + +
1 ,
Observe que i
f
a freqncia simples de cada varivel que neste caso funciona
como fator de ponderao (MDIA ARITMTICA PONDERADA).
Exemplo:
2
0
Instituto Federal de Educao, Cincia e Tecnologia RJ
Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
Exerccio: Calcule a Mdia.
Varivel estudada X(idade): 2, 5, 5, 5, 5, 6, 6, 6, 8, 8
IDADES f
i
f
i
x
i
2
5
6
8
Total
MDIA PARA DADOS AGRUPADOS COM INTERVALO DE
CLASSE.
i
n
i
i i
f
f x
x
1 ,
( i
x
) o ponto mdio de cada intervalo de classe.
( i
f
) a freqncia simples de cada intervalo de classe.
Exemplo:
Exerccio: (resposta: 161 cm)
ESTATURA (cm) fi
150 a 154 4
154 a 158 9
158 a 162 11
162 a 166 8
166 a 170 5
170 a 174 3
Total 40
Fonte: MEC
Estatura de 40 alunos do
colgio A
2
1
Instituto Federal de Educao, Cincia e Tecnologia RJ
Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
(11 MODA (MO): o valor que ocorre com maior freqncia em uma
srie de dados. Quando uma srie de dados no apresentar moda chamaremos
de AMODAL. Dois valores na srie, duas modas, chamaremos de
BIMODAL.
DADOS NO AGRUPADOS (dados brutos ou rol)
Exemplo:
DADOS AGRUPADOS SEM INTERVALO DE CLASSE.
Basta verificar o valor da varivel de maior freqncia.
N de meninos na famlia fi
0 2
1 6
2 10
3 12
4 4
Total 34
Uma vez agrupado os dados basta fixar o valor da varivel de MAIOR
freqncia. A moda nesse caso 3.
Exerccio: Qual a moda e o tipo para os dados agrupados em freqncia:
2
2
Instituto Federal de Educao, Cincia e Tecnologia RJ
Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
DADOS AGRUPADOS COM INTERVALO DE CLASSE.
A classe que apresentar a maior freqncia denominada CLASSE MODAL
que servir de base para os seguintes clculos:
a) Moda bruta: Ponto mdio da classe modal.
2
* *
L l
M
O
+
+
+
c) Moda de CZUBER
*
2 1
1 *
h
D D
D
l Mo
+
+
pos
ant
f f
f f
l Onde
*
2
*
1
*
*
ant
pos
*
D
D
modal classe da intervalo do amplitude a h
modal classe da simples freqncia a f
modal classe a anterior classe da simples freqncia a f
modal classe a posterior classe da simples freqncia a f
modal classe da inferior limite o :
2
3
Instituto Federal de Educao, Cincia e Tecnologia RJ
Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
Exerccio: Calcule a moda utilizando os trs mtodos
Resp.: 50
Observao:
1) A moda utilizada quando desejamos obter uma medida rpida e
aproximada de posio ou quando o valor da distribuio deve ser o valor
mais tpico da distribuio.
2) A moda uma medida de posio, pois indica a regio das mximas
freqncias.
(11 MEDIANA (Md)
o valor que divide o conjunto de dados ordenados em duas metades, com metade
dos valores acima da mediana e a metade dos valores abaixo dela. Quando o nmero de
observaes (n) mpar, a mediana o valor que ocupa a posio central. Quando n for
par, h duas posies centrais no conjunto, ento a mediana a mdia aritmtica dos dois
valores que ocupam as posies centrais.
Observao:
1) Se n for mpar (n=nmero de observaes), o valor mediano ser o de ordem
,
`
.
| +
2
1 n
, ou seja, o valor do elemento que ocupa est posio ser a mediana.
2) Se n for par, o rol admite dois termos centrais que ocupam as posies.O de ordem
,
`
.
|
+
,
`
.
|
1
2 2
n
e
n
, ento, a mediana ser a mdia dos valores que ocupam estas posies.
Exemplos:
2
4
Instituto Federal de Educao, Cincia e Tecnologia RJ
Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
DADOS AGRUPADOS SEM INTERVALO DE CLASSE.
Se os dados se agrupam em uma distribuio de freqncia ser preciso
determinar um valor tal que divida a distribuio em dois grupos que contenham o
mesmo nmero de elementos. Esse valor ser encontrado atravs da seguinte frmula:
2
i
i
f
F => nos fornece a posio do valor na srie de dados.
Passos para o clculo da mediana:
(1) Achar n
(2) Calcular Fi
(3) Calcular Posio da mediana P(Md)
(4) Procurar P(Md) em Fi
Exemplo:
1)
N de meninos fi Fi
0 2 2
1 6 8
2 10 18
3 12 30
4 4 34
Total 34
2
i
i
f
F = 34/2 = 17 ( a posio!!)
A mediana vai ser a mdia entre o 17 valor e o 18 valor da srie (pois temo um nmero
par de elementos (n=34).
Ento,
Md = (2+2)/2 = 2 meninos.
2
5
Instituto Federal de Educao, Cincia e Tecnologia RJ
Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
2)
X fi Fi
12 1 1
14 2 3
15 1 4
16 2 6
17 1 7
20 1 8
Total 8
2
i
i
f
F = 8/2 = 4 (4 posio na srie)
A mediana ser a mdia entre o 4 e o 5 elemento da srie => Md=(15+16)/2 = 31/2 =
15,5
3)
idade f
i
F
i
2 1 1
5 5 6
8 10 16
10 6 22
12 1 23
total 23
2
i
i
f
F = 23/2=11,5 (POSIO12)
Md = 8
Exerccios: Calcule a mediana.
2
6
Instituto Federal de Educao, Cincia e Tecnologia RJ
Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
DADOS AGRUPADOS COM INTERVALO DE CLASSE.
Passos para o clculo da Mediana:
(1) Achar n
(2) Calcular Fi
(3) Calcular P(Md)
(4) Determinar a Classe Mediana
Frmula para o clculo
*
*
*
2
h
f
F
n
l Md
ant
,
`
.
|
+
Onde:
mediana a contm que classe de intervalo do amplitude a h
mediana classe da simples freqncia a f
mediana classe anterior classe da acumulada freqncia a F
srie na mediana da posio a
2
mediana classe da inferior limite o
*
*
ant
*
n
l
Exemplo:
idade f
i
F
i
3 |--- 6 2 2
6 |--- 9 5 7
9 |--- 12 7 14
12 |--- 15 3 17
15 |--- 18 2 19
total 19
2
i
i
f
F =19/2=9,5 =10
O 10 elemento est na 3 classe.
*
*
*
2
h
f
F
n
l Md
ant
,
`
.
|
+
=
( )
3
7
7 5 , 9
9
+ =10,1
2
7
Instituto Federal de Educao, Cincia e Tecnologia RJ
Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
Exerccio: Calcule a mediana para o caso da distribuio de freqncia abaixo:
idade f
i
F
i
450 |--- 550 8
550 |--- 650 10
650 |--- 750 11
750 |--- 850 16
850 |--- 950 13
950 |--- 1.050 5
1.050 |-- 1.150 1
total 64
Observao:
No caso de existir uma freqncia acumulada exatamente igual a
2
i
f
, a Mediana ser
o limite superior da classe correspondente.
Por exemplo:
Classes f
i
F
i
0 |---10 1 1
10 |---20 3 4
20 |---30 9 13
30 |---40 7 20
40 |---50 4 24
50 |---60 2 26
total 26
30 10
9
) 4 13 (
20
:
30
13
2
26
2
*
x Md
Veja
L Md
Ento
f
i
2
8
Instituto Federal de Educao, Cincia e Tecnologia RJ
Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
Nota:
1) A mediana pode coincidir ou no com um elemento da srie. Vimos que, quando
tivermos um nmero de elementos mpar na srie de dados, h coincidncia.
Quanto o nmero de elementos de uma srie par, na h coincidncia.
2) A mediana depende da posio e no dos valores centrais na srie ordenada.
3) Usamos a mediana quando desejamos obter o ponto que divide a distribuio em
partes iguais; quando h valores extremos afetando de uma maneira acentuada a
mdia e quando a varivel em estudo salrio.
Exemplo:
5, 7, 10, 13, 15 => Mdia = 10 e Md = 10
5, 7, 10, 13, 65 => Mdia = 20 e Md = 10
Observe que a mediana permanece a mesma e a mdia sofreu influencia dos
valores extremos.
2
9
Instituto Federal de Educao, Cincia e Tecnologia RJ
Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
SEPARATRIZES
As separatrizes, como o prprio nome sugere so medidas que separam a srie em
partes iguais.
No so medidas de tendncia central, mas esto ligadas mediana relativamente
a sua segunda caracterstica, j que se baseiam em sua posio na srie.
QUARTIS: So valores de uma srie que a dividem em 4 partes
iguais. Assim temos:
o
1
Q = 1 quartil: Separa a seqncia ordenada deixando 25%
dos valores a sua esquerda e 75% dos valores a sua direita.
o
2
Q = 2 quartil: Separa a seqncia ordenada deixando 50%
dos valores a sua esquerda e 50% dos valores a sua direita.
o
3
Q = 3 quartil: Separa a seqncia ordenada deixando 75%
dos valores a sua esquerda e 25% dos valores a sua direita.
!---------!---------!---------!---------!
Q1 Q2 Q3
Pode-se observar que o 2 quartil e a mediana tem os mesmos valores, pois ambos
dividem uma srie ordenada em duas partes iguais.
!---------!---------!---------!---------!
Q1 Q2 Q3
!-------------------!-------------------!
Md
QUINTIS: Quando dividimos uma srie em 5 partes iguais, cada parte
ficar com 20% dos elementos da srie. Assim temos:
o
1
K = 1 quintil separa a seqncia ordenada deixando 20%
dos valores a sua esquerda e 80% dos valores a sua direita.
o
2
K = 2 quintil separa a seqncia ordenada deixando 40%
dos valores a sua esquerda e 60% dos valores a sua direita.
o
3
K = 3 quintil separa a seqncia ordenada deixando 60%
dos valores a sua esquerda e 40% dos valores a sua direita.
o
4
K = 4 quintil separa a seqncia ordenada deixando 80%
dos valores a sua esquerda e 20% dos valores a sua direita.
!---------!---------!---------!---------!---------!
1
K
2
K
3
K
4
K
3
0
Instituto Federal de Educao, Cincia e Tecnologia RJ
Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
DECIS: Quando dividimos uma srie em 10 partes iguais, cada parte
ficar com 10% dos elementos da srie. Assim temos:
o
1
D = 1 decil separa a seqncia ordenada deixando 10%
dos valores a sua esquerda e 90% dos valores a sua direita.
o
2
D = 2 decil separa a seqncia ordenada deixando 20%
dos valores a sua esquerda e 80% dos valores a sua direita.
o
3
D = 3 decil separa a seqncia ordenada deixando 30%
dos valores a sua esquerda e 70% dos valores a sua direita.
o .
o .
o .
o
8
D = 8 decil separa a seqncia ordenada deixando 80%
dos valores a sua esquerda e 20% dos valores a sua direita.
o
9
D = 9 decil separa a seqncia ordenada deixando 90%
dos valores a sua esquerda e 10% dos valores a sua direita.
!---!---!---!---!---!---!---!---!---!---!
D1 D2 D3 D4 D5 D6 D7 D8 D9
PERCENTIS ou CENTIL: So valores de uma srie que a dividem
em 100 partes iguais. Cada parte ficar com 1% dos elementos da
srie. Assim temos:
o
1
P = 1 percentil: separa a seqncia ordenada deixando 1%
dos valores a sua esquerda e 99% dos valores a sua direita.
o
2
P = 2 percentil: separa a seqncia ordenada deixando 2%
dos valores a sua esquerda e 98% dos valores a sua direita.
o
3
P = 3 percentil: separa a seqncia ordenada deixando 3%
dos valores a sua esquerda e 97% dos valores a sua direita.
o .
o .
o .
o
o
98
P = 98 percentil: separa a seqncia ordenada deixando
98% dos valores a sua esquerda e 2% dos valores a sua direita.
o
99
P = 99 percentil: separa a seqncia ordenada deixando
99% dos valores a sua esquerda e 1% dos valores a sua direita.
!---!---!---!---!---!---!---!---!---!---!
C10 C20 C30 C40 C50 C60 C70 C80 C90
Observao: Podemos separar em quantas partes quisermos.
3
1
Instituto Federal de Educao, Cincia e Tecnologia RJ
Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
Podemos notar que os quartis, quintis e decis podem ser expresses em termos dos
precentis,
Q
1
=P25 K
1
=P20 D
1
=P
10
Q
2
=P50 K
2
=P40 D
2
=P
20
Q
3
=P75 K
3
=P60 D
3
=P
30
K
4
=P80 D
4
=P
40
D
5
=P
50
D
6
=P
60
D
7
=P
70
D
8
=P
80
D
9
=P
90
Clculo das medidas separatrizes:
QUARTIL
o mesmo clculo de mediana sendo que
2
i
f
deve ser substitudo por
4
i
f
k
, onde k o nmero de ordem do quartil.
*
*
*
.
4
f
h F
f k
l Q
ant
i
k
]
]
]
]
Exemplo:
1. Calcule o Q
1
da seqncia X: 2, 5, 8, 5, 5, 10, 1, 12, 12, 11, 13, 15.
2. Calcule o Q
1
e Q
3
ESTATURA (cm) fi Fi
150 a 154 4 4
154 a 158 9 13
158 a 162 11 24
162 a 166 8 32
166 a 170 5 37
170 a 174 3 40
Total 40
Fonte: MEC
Estatura de 40 alunos do colgio A
Exerccio: Para os dados agrupados em freqncia, encontre o primeiro e segundo quartil.
3
2
Instituto Federal de Educao, Cincia e Tecnologia RJ
Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
QUINTIS
o mesmo clculo de mediana sendo que
2
i
f
deve ser substitudo por
5
i
f
k
, onde k o nmero de ordem do quintil.
*
*
*
.
5
f
h F
f k
l K
ant
i
k
]
]
]
]
Exemplo:
Considerando a tabela de distribuio de freqncia por intervalo de classe, calcule K
2
.
ESTATURA (cm) fi Fi
150 a 154 4 4
154 a 158 9 13
158 a 162 11 24
162 a 166 8 32
166 a 170 5 37
170 a 174 3 40
Total 40
Fonte: MEC
Estatura de 40 alunos do colgio A
3
3
Instituto Federal de Educao, Cincia e Tecnologia RJ
Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
DECIS
o mesmo clculo de mediana sendo que
2
i
f
deve ser substitudo por
10
i
f
k
, onde k o nmero de ordem do decil.
*
*
*
.
10
f
h F
f k
l D
ant
i
k
]
]
]
]
n
i
i
i
n
i
i
x
n
i
i
x
f
f x x
n
x x
Etapas do clculo da Varincia:
1. - Calcular a mdia aritmtica X
2. - Subtrair a mdia X de cada valor Xi do conjunto
( ) X Xi
, o que chamamos de
desvio;
3. - Elevar cada desvio ao quadrado ( )
2
X Xi
4. - Somar os quadrados dos desvios ( )
2
n
1 i
X Xi
5. - Dividir a soma por (n-1) quando se tratar de dados amostrais, ou simplesmente por
n se os dados representam todos os valores de uma populao.
Sendo a varincia calculada a partir dos quadrados dos desvios, ela um nmero
em unidade quadrada em relao varivel em questo, o que, sob o ponto de vista
prtico, um inconveniente.
Por isso mesmo, imaginou-se uma nova medida que tem a interpretao prtica,
denominada desvio padro, definida como a raiz quadrada da varincia.
) (
ou
) (
1
1
2
) (
1
2
) (
n
i
i
i
n
i
i
x
n
i
i
x
f
f x x
n
x x
3
6
Instituto Federal de Educao, Cincia e Tecnologia RJ
Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
Obs.: (1) O desvio padro sempre ser positivo!
(2) O desvio padro de uma srie indica o quanto os dados esto afastados
da mdia e, que se os dados so iguais, o valor da medida zero.
Exemplo 7:
Em uma turma de aluno, verificaram-se atravs da anlise das notas de 15 alunos (amostra), os
seguintes desempenhos:
Alunos Conceito na Prova
1 4,3 9,1204
2 4,5 7,9524
3 9 2,8224
4 6 1,7424
5 8 0,4624
6 6,7 0,3844
7 7,5 0,0324
8 10 7,1824
9 7,5 0,0324
10 6,3 1,0404
11 8 0,4624
12 5,5 3,3124
13 9,7 5,6644
14 9,3 3,9204
15 7,5
0,0324
Total 109,8 44,16
Mdia 7,32 3,155 Varincia
Desvio Padro 1,77
Observamos no exemplo, que a mdia das provas, foi estimada em 7,32 com desvio
padro em 1,77. Conclumos que a maioria das notas concentrou-se em 9,09 e 5,55.
Exerccio: Calcular a mdia aritmtica e o desvio padro dos seguintes dados relativos
dosagem de hemoglobina verificada em 12 animais bovinos (mg).
15 14 13 11 13 14 13,5 12 16 14,5 12 9
Resp.: Mdia = 13,083mg Varincia = 3,583mg
2
Desvio padro = 1,892mg
3
7
( )
2
X Xi
( )
2
n
1 i
X Xi
O coeficiente de variao
O coeficiente de variao de uma srie X definido por:
x
x
x CV
) (
) (
a razo entre o desvio padro e a mdia aritmtica da srie dos dados.
Note que o coeficiente de variao, como uma diviso de elementos de mesma
unidade, um nmero puro. Portanto pode ser expresso em percentual .
Exemplo:
Se uma srie X apresentar: 10 x e
2 ) ( x
E uma srie Y apresentar:
100 y
e
5 ) ( y
Do ponto de vista da disperso absoluta, a srie Y apresenta maior disperso que a
srie X.
No entanto, se levarmos em considerao as mdias das sries, o desvio padro de
Y que 5 em relao a 100 um valor menos significativo que o desvio padro de X que
2 em relao a 10. Isso nos leva a definir as medidas de disperso relativas.
Desse modo, se calcularmos os coeficientes de variao das sries X e Y
obteremos: cv(x) = 2/10 = 0,2 ou 20% cv(y) = 5/100 = 0,05 ou 5%
Comparando os valores destes dois coeficientes conclumos que a srie X admite
maior disperso relativa.
3
8
Instituto Federal de Educao, Cincia e Tecnologia RJ
Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
Como a medida de disperso relativa leva em considerao a medida de disperso
absoluta e a mdia da srie, uma medida mais completa que a medida de disperso
absoluta.
Portanto, a medida de disperso relativa prevalece sobre a medida de disperso
absoluta. Podemos afirmar que a srie que tem a maior disperso relativa, tem de modo
geral a maior disperso.
Ou seja,
A srie Y apresenta maior disperso absoluta.
A srie X apresenta maior disperso relativa.
Portanto, a srie X apresenta maior disperso.
Exerccio: Responda, justificando em cada caso, as questes abaixo:
(a) Qual das sries apresenta maior disperso absoluta?
(b) Qual das sries apresenta maior disperso relativa?
(c) Qual das sries apresenta maior disperso?
Caso 1)
20 x
2 ) ( x
20 y
5 ) ( y
Caso 2)
50 x
2 ) ( x
100 y
3 ) ( y
3
9
Instituto Federal de Educao, Cincia e Tecnologia RJ
Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
CAPITLO 6
EXPERIMENTO ALEATRIO, ESPAO AMOSTRAL, EVENTOS E
PROBABILIDADE.
DEFINIES:
EXPERIMENTO ALEATRIO: So aqueles que, mesmo repetidos vrias
vezes sob condies semelhantes, apresentam resultados imprevisveis.
Ex.: Em uma jogada de futebol, provvel que seu time: perca; que ele ganha;
que ele empate.
ESPAO AMOSTRAL (S): Cada experimento aleatrio corresponde, em geral, a
vrios resultados possveis. O conjunto desses resultados possveis recebe o nome de
espao amostral ou conjunto universo, representado por S.
Exemplo: Lanamento de uma moeda: S = {Ca, Co}
Lanamento de um dado: S={1, 2, 3, 4, 5, 6}
Cada um dos elementos de S que correspondem a um resultado recebe o
nome de PONTO AMOSTRAL, por exemplo, 2 a S => 2 um ponto amostral de S
(no caso do lanamento do dado).
EVENTOS (A): Chamamos de evento qualquer subconjunto do espao amostral S
de um experimento aleatrio.
Exemplo: Lanamento de um dado:
Espao amostral: S={1, 2, 3, 4, 5, 6}
Eventos:
a) Obter um nmero par na face superior:
A={2, 4, 6} => S A , logo, A um evento de S.
b) Obter um nmero menor ou igual a 6 na face superior:
B={1, 2, 3, 4, 5, 6}
4
0
Instituto Federal de Educao, Cincia e Tecnologia RJ
Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
Observao:
Seja E um evento qualquer:
Se E = S => E chamado de EVENTO CERTO
Se S E e E um conjunto unitrio => E chamado de EVENTO ELEMENTAR.
Se E=, E chamado de EVENTO IMPOSSVEL.
Exemplos:
No lanamento de um dado, onde S = {1,2,3,4,5,6}, temos:
A: Obter um nmero para na face superior.
A={2,4,6} = > A um evento de S.
B: Obter um nmero menor ou igual a 6.
B={1,2,3,4,5,6} = > logo, B um evento certo de S = > B=S.
C: Obter o nmero 4 na face superior.
C={4} = > C um evento elementar de S.
D: Obter um nmero maior que 6 na face superior.
D== > um evento impossvel de S
4
1
Instituto Federal de Educao, Cincia e Tecnologia RJ
Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
PROBABILIDADE
Seja S o seu espao amostral. Se todos os elementos de S tem a mesma chance de
acontecer, ento, chamamos de PROBABILIDADE DE UM EVENTO A, S A , o
nmero real P(A), tal que:
) (
) (
) (
S n
A n
A P
, Onde n(A) o nmero de elementos de A e n(S) o nmero de
elementos de S.
Exemplos:
a) Considere o lanamento de uma moeda e o evento A obter cara.
S= {Ca, Co} n(S) = 2 A = {Ca} n(A) = 1
P(A) =
2
1
, ou seja, 50% de chance de aparecer cara na face superior.
b) Considere o lanamento de um dado:
Evento A: obter um nmero par na face superior.
S = {1, 2, 3, 4, 5, 6} n(S) = 6
A = {2, 4, 6} n(A) = 3
P(A) =
2
1
6
3
x p
2) Para qualquer evento A implica que p(x) deve estar entre 0 e 1 para qualquer valor de
x:
1 ) ( 0 x P
Exemplos:
1) P(x)= x/5 (onde x toma os valores 0, 1, 2, 3) define a distribuio de
probabilidades?
Soluo: para que fique definida uma distribuio de probabilidades, devem ser
satisfeitas as duas condies, ou seja,
1 0 ) ( A P
e
( ) 1 S P
.
1
5
6
5
3
5
2
5
1
5
0
) 3 ( ) 2 ( ) 1 ( ) 0 ( ) ( + + + + + +
p p p p x p
Como a primeira condio no satisfeita => neste exemplo no uma distribuio de
probabilidade.
2) P(x) = x/3 (onde x pode ser 0, 1 ou 2) define uma distribuio de probabilidades?
Soluo:
4
8
A probabilidade de 0 acidentes com
a GOL (dentre sete acidentes)
0,210;
Os valores denotados 0+
representam probabilidades muito
pequenas;
Instituto Federal de Educao, Cincia e Tecnologia RJ
Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
1 (condio)=>
1
3
2
3
1
3
0
) 2 ( ) 1 ( ) 0 ( ) ( + + + +
p p p x p
2 (condio) => cada valor de p(x) est entre 0 e 1 inclusive.
Ento, como as duas condies so satisfeitas, a funo p(x) deste exemplo uma
distribuio de probabilidade.
MDIA E VARINCIA DE UMA DISTRIBUIO DE PROBABILIDADE
- Valor esperado de uma varivel aleatria (E): a mdia dos valores possveis de X,
cada um com a sua probabilidade de ocorrncia.
( ) ( )
n
i
i i
x p x X E
1
n
i
i i
x p X E x X VAR
1
2 2
4
9
Instituto Federal de Educao, Cincia e Tecnologia RJ
Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
Exerccios:
1) Determine se dada uma distribuio de probabilidade. Nos casos em que no
descrita uma distribuio de probabilidade, identifique a condio que no satisfeita. E
quando for descrita uma distribuio de probabilidade, determine sua mdia, varincia e
desvio padro.
a) Se sua faculdade contrata os 4 prximos funcionrios sem distino de sexo e o
conjunto de candidatos grande, com nmeros iguais de homens e mulheres, a
tabela a seguir d a distribuio de probabilidade do nmero x de mulheres
contratadas.
X p(x)
0 0,0625
1 0,2500
2 0,3750
3 0,2500
4 0,0625
b) Ao avaliar riscos de crdito, Jefferson investiga o nmero de cartes de crdito
que a pessoa tem. Com x sendo o nmero de cartes de crdito que os adultos
possuem a tabela a seguir d a distribuio de probabilidade para um conjunto de
solicitantes.
X p(x)
0 0,26
1 0,16
2 0,12
3 0,09
4 0,07
5 0,09
6 0,07
7 0,14
2) Seja X uma varivel aleatria discreta assumido valores no conjunto {1, 2, 3} e com
distribuio de probabilidade dada por:
x 1 2 3
P(X=x) 1/3 1/6 1/2
a. Calcule a mdia de X.
b. Calcule a (
( ) 2 x P
c. Calcule a (
( ) 2 > x P
5
0
Instituto Federal de Educao, Cincia e Tecnologia RJ
Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
3) O tempo T, em minutos, necessrio para um operrio processar certa pea uma
varivel aleatria com a seguinte distribuio de probabilidade:
T 2 3 4 5 6 7
P(T=t) 0,1 0,1 0,3 0,2 0,2 0,1
Calcule o tempo mdio de processamento.
(1) VARIVEL ALEATRIA DISCRETA: DISTRIBUIO BINOMIAL
Vimos que uma varivel aleatria associa um valor numrico a cada resultado de
um experimento aleatrio e uma distribuio de probabilidade associa uma probabilidade
a cada valor de uma varivel aleatria.
Veremos agora como determinar as probabilidades para uma categoria importante
de distribuio de probabilidades: OS EXPERIMENTOS BINOMIAIS.
Os experimentos binomiais tm a caracterstica de apresentarem exatamente dois
resultados complementares: SUCESSO E FRACASSO.
Exemplo:
Em processos industriais: as peas falham ou no falham.
Na medicina: um paciente sobrevive um ano ou morre.
Em propaganda, um consumidor reconhece um produto ou no.
Definio:
Um experimento binomial um experimento que satisfaz as seguintes condies:
1. O experimento deve comportar um nmero fixo de provas.
2. As provas devem ser independentes (o resultado de qualquer prova no afeta
as probabilidades das outras provas.)
3. Cada prova deve ter todos os resultados classificados em duas categorias.
4. As probabilidades devem permanecer constantes para cada prova.
Quando fazemos um experimento binomial, a distribuio da varivel aleatria x
chamada uma DISTRIBUIO BINOMIAL.
5
1
Instituto Federal de Educao, Cincia e Tecnologia RJ
Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
NOTAO:
S => sucesso
F => fracasso
p => probabilidade de sucesso => P(S)=p
q => probabilidade de fracasso => P(F)=q = 1-p
n = nmero fixo de provas
x => denota um nmero especfico de sucessos em n provas, podendo ser
qualquer inteiro entre 0 e n, inclusive.
P(x) => denota a probabilidade de obter exatamente x sucessos em n provas.
Exemplo: Dado que 10% das pessoas so canhotas, suponha que queiramos achar a
probabilidade de obter exatamente 3 estudantes canhotos em uma turma de 15 estudantes.
b)Trata-se de um experimento binomial
b)Em caso afirmativo, identifique os valores de n, x, p e q.
A probabilidade pode ser calculada utilizando-se a seguinte frmula:
( )
x n x n
x
p p x X P
) 1 .( ). (
( )
x n x x n x
x n
x n x n
x
q p
x x n
n
p p C p p x X P
p n Bin X
. .
! )! (
!
) 1 .( . ) 1 .( ). (
) , ( ~
,
Para x = 0, 1, 2, .....,n
Com
n = nmero de provas.
x = nmero de sucessos em n provas.
p = probabilidade de sucesso em qualquer prova.
q = probabilidade de fracasso em qualquer prova.
Obs.: lembrando que 0! = 1 (por definio)
Exerccios:
5
2
Instituto Federal de Educao, Cincia e Tecnologia RJ
Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
1) Aplicando a frmula da probabilidade binomial, determine a probabilidade de
obter 3 estudantes canhotos em uma turma de 15 estudantes, dado que 10% da
populao so canhotos. Isto determine P(3), se n=15, x=3, p=0,1 e 1=0,9.
2) Determine se os experimentos so binomiais.
a) 50 jogadas de um dado.
b) 200 jogadas de uma moeda equilibrada.
c) Selecionar aleatoriamente (sem reposio) um grupo de 12 pneus
diferentes de uma populao de 30 pneus, dos quais 5 so defeituosos.
d) Pesquisar 2000 espectadores de televiso para saber se recordam o nome
de determinado produto aps verem um comercial.
e) Pesquisa de 1000 consumidores americanos, perguntando se reconhece a
marca NIKE.
3) Suponha que em um experimento binomial, uma prova se repita n vezes.
Determine a probabilidade de x sucessos, dada a probabilidade p de sucesso em
uma prova:
a) n = 3, x= 2, p=0,9
b) n=8, x=7, p=0,99
c) n=10, x=4, p=0,30
d) n=6, x=1, p=0,05
4) Uma firma afirma que 20% de suas pastilhas de chocolate M&M so vermelhas.
Determine a probabilidade de que, em 15 pastilhas M&M escolhidas
aleatoriamente, exatamente 20%, ou seja, 3 pastilhas sejam vermelhas.
5) Acredita-se que 20% dos moradores das proximidades de uma grande indstria
siderrgica tm alergia aos poluentes lanados ao ar. Admitindo que este
percentual de alrgicos real (correto), calcule a probabilidade de que pelo menos
4 moradores tenham alergia entre 13 selecionados ao acaso.
6) Trs em cada quatro alunos de uma universidade fizeram cursinho antes de prestar
vestibular. Se 16 alunos so selecionados ao acaso, qual a probabilidade de que:
a) Pelo menos 12 tenham feito cursinho?
b) No mximo 13 tenham feito cursinho?
c) Exatamente 12 tenham feito cursinho?
5
3
Instituto Federal de Educao, Cincia e Tecnologia RJ
Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
7) Em um lote de 50 mudas, qual a probabilidade de que pelo menos
45 sejam aproveitveis?
8) Considerando um lote contendo 25 peas das quais 5 so defeituosas. Quatro
peas foram escolhidas ao acaso e seja X o nmero de peas defeituosas
encontradas nessa amostra.
Determine a distribuio de X se a amostra foi obtida com reposio.
5
4
Instituto Federal de Educao, Cincia e Tecnologia RJ
Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
(2) VARIVEL ALEATRIA CONTNUA - DISTRIBUIO NORMAL ou de
GAUSS
Definio: Se X uma varivel aleatria contnua, ento X assume todos os valores em
um intervalo de nmeros reais ().
- A distribuio de probabilidade de X descrita por uma curva de densidade, ou funo
de densidade.
- A probabilidade de qualquer evento a rea sob a curva de densidade entre os valores
de X que compe o evento.
- A rea total sob qualquer curva de densidade 1, de modo que a probabilidade de um
evento varia entre 0 e 1.
Definio Distribuio Normal:
A varivel aleatria X, tem distribuio Normal, com parmetros e 2 se essa
distribuio simtrica e apresenta a forma de sino (curva normal ou de Gauss).
Sua funo de probabilidade dada por:
( )
2
2
1
2
.
2
1
) , ( ~
,
`
.
|
x
e x f
N X
(Pi): constante matemtica ( 3,14159)
exp: funo exponencial exp(y) = ey
e: constante matemtica ( 2,71828).
Propriedades:
E(X) =
VAR(X) = 2
P(X=x) = f(X) = 0 (pois no existe a probabilidade no ponto e sim na rea)
5
5
Instituto Federal de Educao, Cincia e Tecnologia RJ
Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
f(X) simtrica ao redor da mdia, ou seja, a probabilidade de ocorrer valor
menor do que a mdia igual a probabilidade de ocorrer valor menor do que a
mdia.
A curva normal depende de duas constantes, e
2
:
- corresponde ao centro da simetria da curva
- 2 graficamente, fornece a distncia do centro da simetria aos pontos onde
a curva muda de sentido.
Representao grfica
Para quaisquer dois valores especficos podemos determinar a proporo de rea
sob a curva entre esses dois valores. Para a distribuio Normal, a proporo de valores
caindo dentro de um, dois, ou trs desvios padro da mdia :
5
6
Instituto Federal de Educao, Cincia e Tecnologia RJ
Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
Exemplo: Suponha que os comprimentos de um particular tipo de peixe podem
ser descritos por uma distribuio normal, com mdia 140mm e desvio padro 15mm.
Podemos calcular a proporo dos peixes que tm comprimentos entre 110 e 170mm, por
exemplo, como a proporo da rea sob a curva entre 110 e 170mm.
Ento em nosso exemplo, cerca de 95% dos peixes tem comprimentos entre
110mm e 170mm.
Obs.: Quando temos uma varivel aleatria com distribuio Normal, nosso principal
interesse obter a probabilidade de essa varivel aleatria assumir um valor em um
determinado intervalo.
Distribuio Normal Padro:
Na prtica desejamos calcular probabilidades para diferentes valores de e .
Para isso, a varivel cuja distribuio ) , ( ~
2
N X transformada numa
forma padronizada com distribuio
) 1 , 0 ( ~ N X
(distribuio normal padro),
pois tal distribuio tabelada. A quantidade dada por
X
Z
Exemplo:
1) Se j X a varivel aleatria que representa os dimetros dos parafusos produzidos por
certa mquina. Suponha que essa varivel tenha Distribuio Normal com mdia 2cm e
desvio padro 0,04cm.
a) A probabilidade de um parafuso ter um dimetro com valor entre 2 e 2,05 :
3944 , 0 ) 25 , 1 0 ( )
04 , 0
2 05 , 2
04 , 0
2 2
( ) 05 , 2 2 ( < <
<
<
< < Z P
X
P X P
4) P(-1,25<Z<0)
5) P(-1,25<Z<0)
5
7
Instituto Federal de Educao, Cincia e Tecnologia RJ
Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
6) P(0,8<Z<1,23)
7) P(Z>0,6)
5
8
Instituto Federal de Educao, Cincia e Tecnologia RJ
Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,000000 0,003989 0,007978 0,011966 0,015953 0,019939 0,023922 0,027903 0,031881 0,035856
0,1 0,039828 0,043795 0,047758 0,051717 0,055670 0,059618 0,063559 0,067495 0,071424 0,075345
0,2 0,079260 0,083166 0,087064 0,090954 0,094835 0,098706 0,102568 0,106420 0,110261 0,114092
0,3 0,117911 0,121720 0,125516 0,129300 0,133072 0,136831 0,140576 0,144309 0,148027 0,151732
0,4 0,155422 0,159097 0,162757 0,166402 0,170031 0,173645 0,177242 0,180822 0,184386 0,187933
0,5 0,191462 0,194974 0,198468 0,201944 0,205401 0,208840 0,212260 0,215661 0,219043 0,222405
0,6 0,225747 0,229069 0,232371 0,235653 0,238914 0,242154 0,245373 0,248571 0,251748 0,254903
0,7 0,258036 0,261148 0,264238 0,267305 0,270350 0,273373 0,276373 0,279350 0,282305 0,285236
0,8 0,288145 0,291030 0,293892 0,296731 0,299546 0,302337 0,305105 0,307850 0,310570 0,313267
0,9 0,315940 0,318589 0,321214 0,323814 0,326391 0,328944 0,331472 0,333977 0,336457 0,338913
1,0 0,341345 0,343752 0,346136 0,348495 0,350830 0,353141 0,355428 0,357690 0,359929 0,362143
1,1 0,364334 0,366500 0,368643 0,370762 0,372857 0,374928 0,376976 0,379000 0,381000 0,382977
1,2 0,384930 0,386861 0,388768 0,390651 0,392512 0,394350 0,396165 0,397958 0,399727 0,401475
1,3 0,403200 0,404902 0,406582 0,408241 0,409877 0,411492 0,413085 0,414657 0,416207 0,417736
1,4 0,419243 0,420730 0,422196 0,423641 0,425066 0,426471 0,427855 0,429219 0,430563 0,431888
1,5 0,433193 0,434478 0,435745 0,436992 0,438220 0,439429 0,440620 0,441792 0,442947 0,444083
1,6 0,445201 0,446301 0,447384 0,448449 0,449497 0,450529 0,451543 0,452540 0,453521 0,454486
1,7 0,455435 0,456367 0,457284 0,458185 0,459070 0,459941 0,460796 0,461636 0,462462 0,463273
1,8 0,464070 0,464852 0,465620 0,466375 0,467116 0,467843 0,468557 0,469258 0,469946 0,470621
1,9 0,471283 0,471933 0,472571 0,473197 0,473810 0,474412 0,475002 0,475581 0,476148 0,476705
2,0 0,477250 0,477784 0,478308 0,478822 0,479325 0,479818 0,480301 0,480774 0,481237 0,481691
2,1 0,482136 0,482571 0,482997 0,483414 0,483823 0,484222 0,484614 0,484997 0,485371 0,485738
2,2 0,486097 0,486447 0,486791 0,487126 0,487455 0,487776 0,488089 0,488396 0,488696 0,488989
2,3 0,489276 0,489556 0,489830 0,490097 0,490358 0,490613 0,490863 0,491106 0,491344 0,491576
2,4 0,491802 0,492024 0,492240 0,492451 0,492656 0,492857 0,493053 0,493244 0,493431 0,493613
2,5 0,493790 0,493963 0,494132 0,494297 0,494457 0,494614 0,494766 0,494915 0,495060 0,495201
2,6 0,495339 0,495473 0,495604 0,495731 0,495855 0,495975 0,496093 0,496207 0,496319 0,496427
2,7 0,496533 0,496636 0,496736 0,496833 0,496928 0,497020 0,497110 0,497197 0,497282 0,497365
2,8 0,497445 0,497523 0,497599 0,497673 0,497744 0,497814 0,497882 0,497948 0,498012 0,498074
2,9 0,498134 0,498193 0,498250 0,498305 0,498359 0,498411 0,498462 0,498511 0,498559 0,498605
3,0 0,498650 0,498694 0,498736 0,498777 0,498817 0,498856 0,498893 0,498930 0,498965 0,498999
3,1 0,499032 0,499065 0,499096 0,499126 0,499155 0,499184 0,499211 0,499238 0,499264 0,499289
3,2 0,499313 0,499336 0,499359 0,499381 0,499402 0,499423 0,499443 0,499462 0,499481 0,499499
3,3 0,499517 0,499534 0,499550 0,499566 0,499581 0,499596 0,499610 0,499624 0,499638 0,499651
3,4 0,499663 0,499675 0,499687 0,499698 0,499709 0,499720 0,499730 0,499740 0,499749 0,499758
3,5 0,499767 0,499776 0,499784 0,499792 0,499800 0,499807 0,499815 0,499822 0,499828 0,499835
3,6 0,499841 0,499847 0,499853 0,499858 0,499864 0,499869 0,499874 0,499879 0,499883 0,499888
3,7 0,499892 0,499896 0,499900 0,499904 0,499908 0,499912 0,499915 0,499918 0,499922 0,499925
3,8 0,499928 0,499931 0,499933 0,499936 0,499938 0,499941 0,499943 0,499946 0,499948 0,499950
3,9 0,499952 0,499954 0,499956 0,499958 0,499959 0,499961 0,499963 0,499964 0,499966 0,499967
4,0 0,499968 0,499970 0,499971 0,499972 0,499973 0,499974 0,499975 0,499976 0,499977 0,499978
5
9
Instituto Federal de Educao, Cincia e Tecnologia RJ
Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
CAPITULO 8
INTRODUO
A REGRESSO e a CORRELAO so tcnicas utilizadas para estimar uma
relao que possa existir na populao, enquanto as tcnicas anteriormente estudadas
(Medidas de Tendncia Central e de Disperso: Mdia, Desvio Padro, Varincia, etc.)
servem para estimar um nico parmetro populacional.
A anlise de correlao e regresso compreende a anlise de dados amostrais para
saber se e como duas ou mais variveis esto relacionadas uma com a outra numa
populao.
A correlao mede a fora, ou grau, de relacionamento entre duas variveis; a
regresso d a equao que descreve o relacionamento em termos matemticos.
Os dados para anlise de regresso e correlao provm de observaes de
variveis emparelhadas. Na regresso pressupe-se alguma relao de causa e efeito, de
explanao do comportamento entre as variveis.
Ex. a idade e a altura de cada indivduo; a alquota de imposto e a arrecadao; preo e
quantidade.
Se o relacionamento entre X e Y for consistente e necessitamos fazer uma
predio para o valor de Y, conhecido um valor de X, atravs de uma formula
matemtica adequada, podemos aplicar a chamada anlise de regresso simples.
6
0
Instituto Federal de Educao, Cincia e Tecnologia RJ
Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
(1) CORRELAO
Definio: Quando duas variveis esto ligadas por uma relao estatstica, dizemos que
existe correlao entre elas.
Por exemplo:
- A circunferncia C e o raio r esto perfeitamente correlacionados, porque
2 C
r.
- As variveis altura e peso de indivduos revelariam alguma correlao.
Diagrama de disperso: O diagrama de disperso um grfico onde pontos no espao
cartesiano XY so usados para representar simultaneamente os valores de duas variveis
quantitativas medidas em um conjunto de dados.
Por exemplo:
Um dos objetivos dos pesquisadores neste estudo encontrar uma maneira de
conhecer o peso do urso atravs de uma medida mais fcil de se obter do que a direta
(carregar uma balana para o meio da selva e colocar os ursos em cima dela) como, por
exemplo, uma medida de comprimento (altura, permetro do trax, etc.).
O problema estatstico aqui encontrar uma varivel que tenha uma relao forte com
o peso, de modo que, a partir de seu valor medido, possa ser calculado (estimado) o valor
peso indiretamente, atravs de uma equao matemtica.
O primeiro passo para encontrar esta varivel fazer o diagrama de disperso das
variveis candidatas (eixo horizontal) versus o peso (eixo vertical), usando os pares de
informaes de todos os ursos. Voc pode tentar as variveis: idade, altura, comprimento
da cabea, largura da cabea, permetro do pescoo e permetro do trax.
A Figura mostra a relao entre peso e altura e entre peso e permetro do trax.
6
1
Instituto Federal de Educao, Cincia e Tecnologia RJ
Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
Analisando o grfico:
1) Podemos ver que, tanto a altura quanto o permetro do trax so fortemente
associados ao peso do urso, no sentido de que quanto mais alto o urso ou quanto
maior a medida de seu trax, mais pesado ele ser.
2) Note que este crescimento linear para o permetro do trax e no-linear para a
altura.
3) Os pontos esto mais dispersos no grfico da altura, a varivel mais adequada
para estimar o peso o permetro do trax (a tcnica estatstica adequada aqui chama-
se Regresso Linear Simples).
Observao: A correlao entre duas variveis pode ser POSITIVA, NULA ou
NEGATIVA.
Exemplo:
6
2
Instituto Federal de Educao, Cincia e Tecnologia RJ
Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
-30
-25
-20
-15
-10
-5
0
5
10
0 5 10 15 20 25 30
Grfico 1 Grfico 2
-10
-5
0
5
10
15
0 5 10 15 20 25 30
Grfico 3
Coeficiente de correlao linear
um instrumento utilizado para a medida da correlao linear. Indica o grau de
intensidade entre duas variveis e ainda o sentido dessa correlao (positivo ou
negativo).
S deve ser utilizado com variveis contnuas.
Faremos o uso do coeficiente de correlao de Pearson.
Definio: Dado n pares de valores (x1, y1), (x2, y2), ..., (xn, yn), o coeficiente entre
as duas variveis X e Y dado pela mdia dos valores dos produtos padronizados das
variveis.
( ) ( )
( ) ( ) ( ) ( )
2
2
2
2
i i i i
i i i i
y y n x x n
y x y x n
r
6
3
-10
-5
0
5
10
15
20
25
30
0 5 10 15 20 25 30
Instituto Federal de Educao, Cincia e Tecnologia RJ
Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
A partir dos valores de R ou , podemos verificar o tipo da correlao existente
entre as variveis estudadas, conforme tabela seguinte:
Exerccios:
1) Considerando uma amostra aleatria, formada por dez dos 98 alunos de uma
classe da faculdade A e pelas notas obtidas por eles em Matemtica e Estatstica:
Matemtica (x) Estatstica (y)
1 5,0 6,0
8 8,0 9,0
24 7,0 8,0
38 10,0 10,0
44 6,0 5,0
58 7,0 7,0
59 9,0 8,0
72 3,0 4,0
80 8,0 6,0
92 2,0 2,0
Notas
Alunos
Calcule o coeficiente de correlao e interprete seu valor.
Matemtica (x) Estatstica (y) xy
1 5 6 30 25 36
8 8 9 72 64 81
24 7 8 56 49 64
38 10 10 100 100 100
44 6 5 30 36 25
58 7 7 49 49 49
59 9 8 72 81 64
72 3 4 12 9 16
80 8 6 48 64 36
92 2 2 4 4 4
Total 65 65 473 481 475
Notas
Alunos
2
i
x
2
i
y
6
4
Valor de R ou
Correlao
0,0 nula
0,0 ----| 0,3 fraca
0,3 ----| 0,6 media
0,6 ----| 0,9 forte
0,9 ----| 0,99 fortssima
1,0 perfeita
Instituto Federal de Educao, Cincia e Tecnologia RJ
Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
911 , 0
18 , 554
505
525 585
505
) 4225 4750 )( 4225 4810 (
4225 4730
) 65 475 10 )( 65 481 10 (
65 65 473 10
2 2
x
x x
x x
r
Grfico:
Grfico de disperso
0
2
4
6
8
10
12
0 2 4 6 8 10 12
Matemtica
E
s
t
a
t
s
t
i
c
a
Concluso: O resultado nos indica uma correlao linear positiva altamente significativa
entre as duas variveis.
Exerccios:
1) Observou-se que o volume mensal de lixo gerado em uma cidade, em funo do
nmero de dormitrios das residncias, o seguinte (em m
3
):
N
o
Dormitrios 1 2 3 4
Volume de lixo 0,15 0,29 0,45 0,57
a) Calcular o coeficiente de correlao de Pearson.
b) Interprete o grfico de disperso dessa relao.
Grfico de disperso
0,00
0,10
0,20
0,30
0,40
0,50
0,60
0 1 2 3 4 5
Nmero de dormitrios
V
o
l
u
m
e
d
e
l
i
x
o
6
5
Instituto Federal de Educao, Cincia e Tecnologia RJ
Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
(2) REGRESSO
Objetivo: A regresso linear simples constitui uma tentativa de estabelecer uma equao
matemtica linear (linha reta) que descreva o relacionamento entre duas variveis.
Para obter uma reta de regresso, n pares de observaes das variveis so
utilizados. Considerando X como a varivel independente e Y como a varivel
dependente, a reta de regresso dada por:
Y = + X + u
o coeficiente linear, ou seja, o ponto onde a reta corta o eixo Y;
o coeficiente angular, ou seja, determina a inclinao da reta.
Graficamente:
u representa o incremento em Y quando X aumenta em uma unidade;
ESTIMADORES DE E PARA O MODELO DE REGRESSO
LINEAR
Os valores de a e b sero determinados, atravs do Mtodo dos Mnimos
Quadrados (MMQ). O objetivo encontrar a e b tal que a soma dos erros quadrticos
mdios seja o menor possvel.
O erro determinado por:
i i i
y y e
tal que
) (
i i i
bx a y e +
+ X + u
+ X
X X+1
Y
X
6
6
Instituto Federal de Educao, Cincia e Tecnologia RJ
Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
Os valores de a e b so encontrados atravs da seguinte frmula:
2
1
2
1
x n x
y x n y x
b
n
i
i
n
i
i i
x b y a
importante observar que:
- b mede a variao que ocorre em Y por unidade de variao de X.
- Quando no houver relao entre X e Y teremos
Y
Y , pois b=0
- Quando as relaes entre X e Y forem proporcionais, a reta passa na origem e
a = 0, logo
Y
bX
Exemplo:
Sejam duas variveis X e Y, entre as quais exista uma correlao acentuada, embora no
perfeita:
xi yi
5 6
8 9
7 8
10 10
6 5
7 7
9 8
3 4
8 6
2 2
Grfico de disperso
0
2
4
6
8
10
12
0 2 4 6 8 10 12
Podemos concluir que o grfico se trata de uma correo retilnea, de modo a
permitir o ajustamento de uma reta, imagem da funo Y = + X + u.
Ento, precisamos calcular os valores dos parmetros da equao
bX a Y +
que
uma estimativa da verdadeira equao da reta de regresso, onde
Y
o estimado.
6
7
Instituto Federal de Educao, Cincia e Tecnologia RJ
Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
xi yi xy x2
5 6 30 25
8 9 72 64
7 8 56 49
10 10 100 100
6 5 30 36
7 7 49 49
9 8 72 81
3 4 12 9
8 6 48 64
2 2 4 4
Total 65 65 473 481
n=10
mdias 6,5 6,5
8632 , 0
5 , 58
5 , 50
) 65 ( 473 10
5 , 6 5 , 6 10 473
2
2
1
2
1
x n x
y x n y x
b
n
i
i
n
i
i i
8892 , 0 5 , 6 8632 , 0 5 , 6
x b y a
Logo,
X Y 8632 , 0 8892 , 0 +
Y
=0,89 X=5 =>
Y
= 0,89+5.0,86 = 5,19
Estimativa da reta de regresso
0
2
4
6
8
10
12
0 2 4 6 8 10 12
5
5,19
0,89
X Y 8632 , 0 8892 , 0 +
6
8
Instituto Federal de Educao, Cincia e Tecnologia RJ
Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
Exerccio:
Exemplo 1: Um laboratrio est interessado em medir o efeito da temperatura sobre a
potncia de um antibitico. Dez amostras de 50 gramas cada foram guardadas a
diferentes temperaturas, e aps 15 dias, mediu-se a potncia. Os resultados esto no
quadro abaixo.
Temperatura 30 36 50 54 60 73 78 82 91 95
Potncia 38 43 32 26 33 19 27 23 14 21
a) Qual a varivel dependente?
b) Qual a varivel independente?
c) Encontre os estimadores da reta de regresso.
d) Interprete seus valores.
6
9
Instituto Federal de Educao, Cincia e Tecnologia RJ
Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
Uma importante funo de determinar a reta de regresso para duas variveis a
possibilidade de realizar previses, ou seja, uma vez que obtemos a reta de regresso,
podemos escolher um valor de interesse para a varivel independente (X) e determinar o
valor esperado para a varivel dependente (Y).
Exemplo 1: Determinar a potncia do antibitico quando a exposio for de 65
o
C.
5677 , 27 65 * 3511 , 0 3892 , 50
Y .
COEFICIENTE DE DETERMINAO
Encontrar uma reta de regresso para duas variveis no significa encontrar o
melhor modelo matemtico para representar a relao entre elas. Isso porque podemos
calcular a equao para quaisquer duas variveis.
Uma das formas de determinar se o modelo encontrado satisfatrio para explicar
os dados calculando o COEFICIENTE DE DETERMINAO do modelo. Esse
coeficiente compara a variabilidade do modelo com a variabilidade total dos dados.
A variabilidade do modelo pode ser calculada como:
2
1
) (
n
i
i
y y
.
A variabilidade total pode ser calculada como:
n
i
i
y y
1
2
) (
.
Assim, o coeficiente de determinao R
2
, calculado da seguinte forma:
n
i
i
n
i
i
y y
y y
R
1
2
1
2
2
) (
) (
7
0
Instituto Federal de Educao, Cincia e Tecnologia RJ
Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
Exemplo 1: Calcular e interpretar o coeficiente de determinao R
2
para os dados do
primeiro exerccio.
Temperatura
(X)
Potncia
(Y)
Valores
preditos (
y
)
2
) ( y y
i
2
) ( y y
i
30 38 39.86 108.16 150.21
36 43 37.75 237.16 103.01
50 32 32.83 19.36 27.40
54 26 31.43 2.56 14.67
60 33 29.32 29.16 2.97
73 19 24.76 73.96 8.07
78 27 23.00 0.36 21.13
82 23 21.60 21.16 36.01
91 14 18.44 184.96 83.92
95 21 17.03 43.56 111.63
y
27,6
n
i
i
y y
1
2
) (
720,4
n
i
i
y y
1
2
) (
559,02
R
2
0,7759
Interpretao: o modelo X Y 3511 , 0 3892 , 50