Sie sind auf Seite 1von 72

Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009


APOSTILA
DE
ESTATSTICA
BSICA
1
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
CAPITULO 1
O que estatstica?
a parte da matemtica aplicada que fornece mtodos para coleta, organizao,
descrio, anlise e interpretao dos dados e para utilizao dos mesmos na tomada de
decises.
A estatstica se divide em duas partes:
(1) ESTATSTICA DESCRITIVA: Responsvel pela coleta, organizao e descrio
dos dados observados.
(2) ESTATSTICA INDUTIVA OU INFERENCIAL: Responsvel pela anlise e
interpretao dos dados.
Fases do mtodo estatstico:
- Coleta dos dados: Feito atravs de registros nascimento, casamento, bitos,
importao e exportao de mercadoria, banco de dados de empresas, questionrios,....
- Crtica dos dados: Para verificar possveis erros por parte dos informantes, por
distrao ou m interpretao das perguntas que lhe forem feitas.
- Exposio ou apresentao dos dados: Tabulao e grficos.
- Anlise dos resultados: Concluso sobre o todo (POPULAO) a partir de
informaes fornecidas por parte representativa do todo (AMOSTRA).
POPULAO: o conjunto de indivduos ou objetos que apresentam pelo menos uma
caracterstica comum.
AMOSTRA: um subconjunto finito de uma populao.
Exemplo: Digamos que a Secretaria Estadual de Educao queira pesquisar o grau de
satisfao dos alunos no que se refere qualidade da merenda escolar.
Populao: Alunos da rede estadual.
Amostra: Parte do total de alunos que representa o todo (populao).
Varivel em estudo: variveis que possam informar a satisfao dos alunos com a
merenda escolar.
2
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
As variveis podem ser quantificadas ou qualificadas. Teremos, portanto, variveis
quantitativas e qualitativas.
Qualitativas: quando seus valores so expressos por atributos.
Exemplos:
Populao: moradores de uma cidade.
Varivel: cor dos olhos (pretos, castanhos, azuis, etc...).
Populao: Peas produzidas por uma mquina.
Varivel: qualidade da pea (perfeita ou defeituosa).
Populao: Candidatos a um exame de vestibular.
Varivel: sexo (masculino ou feminino).
Quantitativa: Quando seus valores so expressos em nmeros. Podem ser subdivididas
em discretas (assumem valores enumerveis, nmeros inteiros no-negativos, contagens)
e contnuas (assumem valores num certo intervalo, medies).
Exemplos:
Populao: casais residentes em uma cidade.
Variveis: Nmero de filhos (quantitativa discreta)
Idade (quantitativa continua)
Populao: As jogadas possveis com um dado.
Varivel: Ponto obtido em cada jogada (quantitativa discreta)
Populao: peas produzidas em uma linha de montagem.
Varivel: Nmero de defeitos por unidade (quantitativa discreta)
Dimetro por unidade (quantitativa contnua)
Populao: Funcionrios de uma empresa.
Varivel: Salrio (discreta)
Populao: Alunos da CEFETEQ
Varivel: Peso dos alunos (contnua)
3
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
LISTA DE EXERCCIOS 1
1) O que estatstica?
2) O que populao?
3) o que amostra?
4) A Estatstica se divide em duas partes. Cite e explique cada uma delas.
5) Quais so as fases do mtodo estatstico?
6) Qual a diferena entre varivel qualitativa e quantitativa?
7) Classifique as variveis em qualitativas, quantitativas contnuas ou quantitativas
discreta.
a) Populao: Alunos de uma escola.
Varivel: Cor da pele ___________________________
b) Populao: Casais residentes em um bairro.
Varivel: N de filhos ___________________________
c) Populao: Jogadas de um dado.
Varivel: O ponto obtido em cada jogada____________________
d) Populao: Peas produzidas por certa mquina.
Varivel: Nmero de peas produzidas por hora________________
e) Populao: Aparelho produzido em uma linha de montagem.
Varivel: N de defeitos por unidade________________________
f) Populao: Pessoas residentes em uma cidade.
Varivel: Idade ___________________________
g) Populao: Bolsa de valores de So Paulo.
Varivel: N de aes negociadas_________________________
h) Populao: Funcionrios de uma empresa.
Varivel: Salrio ___________________________
i) Populao: Pregos produzidos por uma mquina.
Varivel: Comprimento do prego_________________________
j) Populao: Casais residentes em uma cidade.
Varivel: Sexo dos filhos ___________________________
4
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
8) Dizer quais dos seguintes itens representam dados discretos e quais representam dados
contnuos.
a) Altura de precipitao da chuva em centmetros, de uma cidade durante vrios
meses do ano.____________________________
b) Velocidade de um automvel em km/h._________________________
c) Nmero de notas de vinte dlares em circulao nos Estados Unidos, em qualquer
poca._________________________________
d) Valor total das aes vendidas diariamente na Bolsa de
Valores.______________________
e) Nmero de estudantes matriculados em uma universidade, em certo nmero de
anos._____________________________
9) Estabelecer quais dos dados seguintes so discretos e quais so contnuos.
a) Temperatura registrada a cada meia hora em um posto de
meteorologia.______________________

b) Vida mdia das vlvulas de televiso produzidas por uma determinada
companhia.___________________________
c) Comprimento de 1000 parafusos produzidos numa fbrica. __________________
5
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
CAPITULO 2
O objetivo da estatstica sintetizar os valores que uma ou mais variveis podem
assumir e isso ela consegue apresentando esses valores em TABELAS E GRFICOS.
TABELAS ESTATSTICAS
TABELA UM QUADRO QUE RESUME UM CONJUNTO DE
OBSERVAES
CATEGORIAS TOTAL DE MATRICULAS
1 GRAU 2.000
2 GRAU 2.500
3 GRAU 3.000
TOTAL 7.500
FONTE: IBGE.
MATRCULAS NAS ESCOLAS DA CIDADE A -1995
TTULO
CABEALHO
CORPO DA
TABELA
RODAP
COLUNA
NUMRICA
COLUNA
INDICADORA
SRIES ESTATSTICAS
Definio: Srie Estatstica toda tabela que apresenta a distribuio de um conjunto de
dados em funo da poca, do local ou da espcie.
Da, podemos inferir que numa srie estatstica observamos a existncia de trs elementos
ou fatores: o tempo, o espao e a espcie.
Conforme varie um dos elementos da srie, podemos classific-la em histrica,
geogrfica e especfica.
SRIE HISTRICA, CRONOLGICA, TEMPORAIS: Descrevem valores
da varivel, em determinado local, discriminados segundo intervalos de tempo.
(OS DADOS VARIAM COM O TEMPO).
PRODUO MEDIA DE SOJA NO BRASIL
2005-06
ANOS
PRODUO (1.000 t)
2005
2006
51 138
52 223
FONTE: IBGE.
6
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
SRIES GEOGRFICAS, ESPACIAIS, TERRITORIAIS OU DE
LOCALIZAO: Descrevem valores da varivel, em determinado instante,
discriminados segundo regies. (OS DADOS VARIAM NO LOCAL).
DURAO MDIA DOS
ESTUDOS SUPERIORES
1994
PASES
NMERO DE
ANOS
Itlia
Alemanha
Frana
Holanda
7,5
7,0
7,0
5,9
FONTE: APA.
SRIES ESPECFICAS OU CATEGRICAS: Descrevem valores da varivel
em determinado tempo e local, discriminados segundo especificaes e
categorias (OS DADOS VARIAM DE ACORDO COM A ESPCIE OU
QUALIDADE DO FENMENO).
SRIES CONJUGADAS, TABELAS DE DUPLA ENTRADA: Quando
precisamos apresentar em uma nica tabela a variao de valores de mais de uma
varivel (OS DADOS SO RELATIVOS A 2 OU 3 ASPECTOS
SIMULTANEAMENTE).
7
EXPORTAO BRASILEIRA
2005
PRODUTOS
QUANTIDADE
(em bilhes de toneladas)
Gros
Farelo
leo
20,5
14,2
2,4
FONTE: Companhia Nacional de Abastecimento (Conab).
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
REGIES 1991 1992 1993
NORTE 342.938 375.658 403.494
NORDESTE 1.287.813 1.379.101 1.486.649
SUDESTE 6.234.501 6.729.767 7.231.634
SUL 1.497.315 1.608.989 1.746.232
CENTRO-OESTE 713.357 778.925 884.822
Fonte: Revista Veja.
TERMINAIS TELEFNICOS EM SERVIOS - 1991 - 1993
EXERCCIO:
Verificou-se, em 1985 e 1995, a seguinte movimentao de exportao de
mercadorias:
13,0% em 1985 e 13,4% em 1995 oriundas da Amrica Latina, dos Estados
Unidos e Canad, 28,2% em 1985 e 22,2% em 1995; e da Europa, 33,9% em 1985
e 20,7% e, 1995.
Confeccione a srie correspondente e classifique-a, sabendo que os dados acima
foram fornecidos pelo MIC e SECEX.
GRFICOS ESTATSTICOS
O grfico estatstico uma forma de apresentar os dados estatsticos, com
o objetivo de mostrar uma impresso mais rpida do fenmeno em estudo, com
simplicidade, clareza e veracidade.
Ttulos completos e o mais claro possvel;
Sempre que possvel a escala vertical deve ser escolhida de modo a aparecer na
linha o valor zero;
A escala horizontal deve ser lida da esquerda para direita e a escala vertical deve
ser lida de baixo para cima.
8
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
Tipos mais comuns de grficos:
Grfico em colunas ou em barras
ANOS QUANTIDADE (1.000 t)
1989 18.196
1990 11.168
1991 10.468
1992 9.241
Fonte: Agropalma.
(GRFICO DE COLUNAS) (GRFICO EM BARRAS)
PRODUO BRASILEIRA DE CARVO MINERAL
BRUTO - 1987 - 1992
PRODUO BRASILEIRA DE CARVO
MINERAL BRUTO - 1989 - 1992
0
5.000
10.000
15.000
20.000
1989 1990 1991 1992
Anos
M
i
l

t
o
n
e
l
a
d
a
s
Fonte: Ministrio da Agricultura.
PRODUO BRASILEIRA DE
CARVO MINERAL BRUTO - 1989 -
1992
0 5.000 10.000 15.000 20.000
1989
1990
1991
1992
A
n
o
s
Mil toneladas
Fonte: Ministrio da Agricultura.
Grfico de linhas ou em curva
ANOS QUANTIDADE (1.000 t)
1987 39
1988 53
1989 69
1990 55
1991 42
1992 38
Fonte: Agropalma.
PRODUO BRASILEIRA DE LEO DE DEND -
1987 - 1992
Produo Brasileira de leo de
Dend - 1987 a 1992
0
20
40
60
80
1987 1988 1989 1990 1991 1992
Anos
M
i
l

t
o
n
e
l
a
d
a
s
Fonte: Agropalma.
9
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
Grfico em setores ou de pizza:
Considere a utilizao de um grfico de pizza quando:
Voc tiver apenas uma srie de dados que deseja plotar.
Nenhum dos valores que deseja plotar for negativo.
Quase nenhum dos valores que deseja plotar for igual a zero.
Voc no tiver mais de sete categorias.
As categorias representarem partes de toda a pizza.
1
0
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
CAPITULO 3
Aps a coleta de dados relativos a um determinado fenmeno em estudo, que compem
uma amostra, obtemos um conjunto de dados que ser tabulado.
Por exemplo:
TABELA 1
ESTATURA DE 40 ALUNOS DA CEFETEQ
Observe que a tabela foi formada por dados que no esto organizados. Dessa forma ela
recebe o nome de TABELA PRIMITIVA.
Dessa forma difcil ter uma idia exata do comportamento da varivel em estudo
(estatura). Precisamos organizar os dados tabelados atravs de uma ordenao crescente
ou decrescente.
TABELA 2
ESTATURA DE 40 ALUNOS DA CEFETEQ
Obteremos uma segunda tabela ordenada que recebe o nome de ROL.
Dessa forma, podemos saber, com relativa facilidade, qual a menor estatura (150) e qual
a maior (173); qual a amplitude de variao (173-150=23cm); qual o ponto mdio
(160+161)/2 = 160,5.
Ainda assim, a varivel observada (ESTATURA) ser mais facilmente estudada quando
dispusermos os valores ordenados em uma coluna e ao lado de cada valor o nmero de
vezes que aparece repetido (FREQNCIA).
Obtemos dessa forma uma tabela que recebe o nome de DISTRIBUIO DE
FREQNCIA.
1
1
166 160 161 150 162 160 165 167 164 160
162 161 168 163 156 173 160 155 164 168
155 152 163 160 155 155 169 151 170 164
154 161 156 172 153 157 156 158 158 161
150 154 155 157 160 161 162 164 166 169
151 155 156 158 160 161 162 164 167 170
152 155 156 158 160 161 162 164 168 172
153 155 156 160 160 161 162 164 168 173
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
ESTATURA (cm) Freq
150 1
151 1
152 1
153 1
154 1
155 4
156 3
157 1
158 2
160 5
161 4
162 2
163 2
164 3
165 1
166 1
167 1
168 2
169 1
170 1
172 1
173 1
Total 40
Fonte: MEC
Estatura de 40 alunos do
colgio A
Outra soluo aceitvel e mais conveniente para diminui o tamanho da tabela quando o
nmero de valores da varivel grande, seria agrup-los em vrios intervalos
(INTERVALOS DE CLASSE).
Nesse caso a tabela passa a ser denominada: DISTRIBUIO DE FREQNCIA
POR INTERVALO DE CLASSE.
L-se: 4 alunos tm estatura entre 150 e 154 anos (exclusive) intervalo fechado
esquerda.
1
2
ESTATURA (cm) Freq
150 a 154 4
154 a 158 9
158 a 162 11
162 a 166 8
166 a 170 5
170 a 174 3
Total 40
Fonte: MEC
Estatura de 40 alunos do
colgio A
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
ELEMENTOS DE UMA DISTRIBUIO DE FREQNCIA.

(1) CLASSE (i): So intervalos de variao da varivel.
Ex.: Intervalo 150 a 154 define a 1 classe (i=1),
i = 1, 2, 3,......, k
i = classe
k = nmero total de classes.
(2) LIMITES DE CLASSE: So os extremos de cada classe.
i
l
= Limite inferior i
L
= Limite superior
Ex.: Na primeira classe: i
l
= 150 e i
L
= 154.

(3) AMPLITUDE DE UM INTERVALO DE CLASSE ( i
h
): a medida do intervalo
que define a classe. Diferena entre o limite superior e inferior da classe.
Ex.: Na primeira classe: i
l
= 150 e i
L
= 154.
i
h
= i
L
i
l
= 154 150 = 4 cm.
(4) AMPLITUDE TOTAL DA DISTRIBUIO (AT): a diferena entre o Limite
superior da ultima classe e o Limite inferior da primeira classe.
AT = L (Max) l (min)
Ex.: 174 150 = 24 cm
Observe que como as classes possuem o mesmo intervalo vale a relao:
k
h
AT
i

24/4 = 6 (6 = Nmero total de classes)


(5) PONTO MDIO DE UMA CLASSE ( i
x
): o ponto que divide o intervalo de
classe em duas partes iguais.
Ex.: Classe 1: (150 + 154)/2 = 152 cm
1
3
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
TIPOS DE FREQNCIA:
(1) FREQNCIA SIMPLES OU ABSOLUTA ( i
f
): o nmero de observaes
correspondentes a classe ou a um valor.
ESTATURA (cm) fi
150 a 154 4
154 a 158 9
158 a 162 11
162 a 166 8
166 a 170 5
170 a 174 3
Total 40
Fonte: MEC
Estatura de 40 alunos do
colgio A
Ex.:
1
f
= 4 => freqncia da classe 1,
2
f
= 9 => freqncia da classe 2,...............
A soma de todas as freqncias ser:

k
i
i
n f
1
,
n = nmero total de observaes.
(2) FREQNCIA RELATIVA (
i
fr
): a razes entre a freqncia simples a
freqncia total.

k
i
i
i
i
f
f
fr
1
Ex.:
275 , 0
40
11
40
1
3
3

i
i
f
f
fr
ESTATURA (cm) fi fri
150 a 154 4 0,100
154 a 158 9 0,225
158 a 162 11 0,275
162 a 166 8 0,200
166 a 170 5 0,125
170 a 174 3 0,075
Total 40 1
Fonte: MEC
Estatura de 40 alunos do colgio A
(3) FREQNCIA ACUMULADA ( i
F
): o total das freqncias de todos os valores
inferiores ao limite superior do intervalo de classe.
1
4
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009

+ + +
k
i
i k i
f f f f F
1
2 1
.....
Ex:

+ + + +
3
1
3 2 1 3
24 11 9 4
i
i
f f f f F
, ou seja, existem 24 alunos com
estatura inferior a 162 cm ( 3
L
da 3 classe).
ESTATURA (cm) fi fri Fi
150 a 154 4 0,100 4
154 a 158 9 0,225 13
158 a 162 11 0,275 24
162 a 166 8 0,200 32
166 a 170 5 0,125 37
170 a 174 3 0,075 40
Total 40 1
Fonte: MEC
Estatura de 40 alunos do colgio A
(4) FREQNCIA ACUMULADA RELATIVA ( i
Fr
): a freqncia acumulada da
classe dividida pela freqncia total da distribuio.

k
i
i
i
i
f
F
Fr
1
Ex.:
600 , 0
40
24
40
1
3
3

i
i
f
F
Fr
ESTATURA (cm) fi fri Fi Fri
150 a 154 4 0,100 4 0,100
154 a 158 9 0,225 13 0,325
158 a 162 11 0,275 24 0,600
162 a 166 8 0,200 32 0,800
166 a 170 5 0,125 37 0,925
170 a 174 3 0,075 40 1
Total 40 1
Fonte: MEC
Estatura de 40 alunos do colgio A
1
5
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
OBSERVAO: Critrio para calcular o nmero de classes a ser utilizado
CRITRIO DA RAIZ
Se a seqncia estatstica contm n elementos e se indicarmos por i o nmero de
classes a ser utilizado, ento:
n i
onde n = nmero total de observaes.
Amplitude do intervalo de classe que chamaremos de h determinada por:
i
AT
h
, onde AT a Amplitude Total e n i
Exemplo:
n = 40
Ento, 40 i = 6,324, portanto o inteiro mais prximo 6.
Devemos trabalhar com o inteiro mais prximo da raiz de n, o inteiro
imediatamente anterior e o inteiro imediatamente superior.
Logo, as opes para i so: 5, 6 ou 7.
Ento,
A amplitude do intervalo de classe (h) determinada por:
4
6
150 - 174 (min) l - (Max) L

i i
AT
h
Observe que a opo por 6 classes foi feita em funo de um valor de h mais fcil
de se operar.
1
6
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
REPRESENTAO GRFICA DE UMA DISTRIBUIO DE FREQNCIA.
Histograma
- Consiste em um conjunto de retngulos, tantos quantos forem s classes de uma
distribuio.
- As classes so as bases dos retngulos (tantas partes quantas forem s classes)
- A escala para marcao dos pontos no eixo Y corresponde s freqncias.
Exemplo:
Polgono de freqncias
Freqncia Simples:
1
7
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
Freqncia Acumulada:
- As bases dos retngulos vo estar centradas nos pontos mdios das classes.
Exemplo:
1
8
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
CAPITULO 4
MEDIDAS DE POSIO: MDIA, MODA e MEDIANA;
O estudo sobre a Distribuio de Freqncia permitiu descrever, de um modo
geral, os valores que uma varivel pode assumir. Agora precisamos de um indicativo
generalizado.
O modo mais comum de se obter esse tipo de informao atravs das
MEDIDAS DE POSIO, estatstica que representa posio relativa da distribuio
em relao ao eixo horizontal.
As medidas de posio mais importantes so as MEDIDAS DE TENDNCIA
CENTRAL recebem esse nome pelo fato dos dados observados, em geral, se agruparem
em torno dos valores centrais.
So elas:
MDIA ARITMTICA
MODA
MEDIANA
Outras medidas de posio so:
SEPARATRIZES
QUARTIS
PERCENTIS
Essas medidas quando bem interpretadas, podem fornecer-nos informaes muito
valiosas com respeito s sries estatsticas, ou seja, com estas medidas tenta-se encontrar
um valor numrico que represente o comportamento tpico da serei em estudo.
(11 MDIA ARITMTICA SIMPLES ( x )
DADOS NO AGRUPADOS (dados brutos ou rol): Quando desejamos
conhecer a mdia dos dados no agrupados, determinamos a mdia
aritmtica simples.
1
9
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
n
x
x
n
i
i

1
, onde (
x
) a mdia aritmtica, (
i
x
) os valores da varivel e (n) o
nmero de valores.
Ex.: Produo leiteira diria da vaca A, durante uma semana, foi de 10, 14, 13, 15, 16,
18 e 12 litros. Qual a produo mdia da semana.
litros x 14
7
98
7
12 18 16 15 13 14 10

+ + + + + +

MDIA PARA DADOS AGRUPADOS SEM INTERVALO DE


CLASSE.
i
n
i
i i
f
f x
x

1 ,
Observe que i
f
a freqncia simples de cada varivel que neste caso funciona
como fator de ponderao (MDIA ARITMTICA PONDERADA).
Exemplo:
2
0
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
Exerccio: Calcule a Mdia.
Varivel estudada X(idade): 2, 5, 5, 5, 5, 6, 6, 6, 8, 8
IDADES f
i
f
i
x
i
2
5
6
8
Total
MDIA PARA DADOS AGRUPADOS COM INTERVALO DE
CLASSE.
i
n
i
i i
f
f x
x

1 ,
( i
x
) o ponto mdio de cada intervalo de classe.
( i
f
) a freqncia simples de cada intervalo de classe.
Exemplo:
Exerccio: (resposta: 161 cm)
ESTATURA (cm) fi
150 a 154 4
154 a 158 9
158 a 162 11
162 a 166 8
166 a 170 5
170 a 174 3
Total 40
Fonte: MEC
Estatura de 40 alunos do
colgio A
2
1
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
(11 MODA (MO): o valor que ocorre com maior freqncia em uma
srie de dados. Quando uma srie de dados no apresentar moda chamaremos
de AMODAL. Dois valores na srie, duas modas, chamaremos de
BIMODAL.
DADOS NO AGRUPADOS (dados brutos ou rol)
Exemplo:
DADOS AGRUPADOS SEM INTERVALO DE CLASSE.
Basta verificar o valor da varivel de maior freqncia.

N de meninos na famlia fi
0 2
1 6
2 10
3 12
4 4
Total 34
Uma vez agrupado os dados basta fixar o valor da varivel de MAIOR
freqncia. A moda nesse caso 3.
Exerccio: Qual a moda e o tipo para os dados agrupados em freqncia:
2
2
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
DADOS AGRUPADOS COM INTERVALO DE CLASSE.
A classe que apresentar a maior freqncia denominada CLASSE MODAL
que servir de base para os seguintes clculos:
a) Moda bruta: Ponto mdio da classe modal.
2
* *
L l
M
O
+

Onde: l* o limite inferior da classe modal;


L* o limite superior da classe modal.
b) Moda de KING
* *
h
f f
f
l Mo
pos ant
pos

+
+

c) Moda de CZUBER
*
2 1
1 *
h
D D
D
l Mo
+
+

pos
ant
f f
f f
l Onde


*
2
*
1
*
*
ant
pos
*
D
D
modal classe da intervalo do amplitude a h
modal classe da simples freqncia a f
modal classe a anterior classe da simples freqncia a f
modal classe a posterior classe da simples freqncia a f
modal classe da inferior limite o :
2
3
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
Exerccio: Calcule a moda utilizando os trs mtodos
Resp.: 50
Observao:
1) A moda utilizada quando desejamos obter uma medida rpida e
aproximada de posio ou quando o valor da distribuio deve ser o valor
mais tpico da distribuio.
2) A moda uma medida de posio, pois indica a regio das mximas
freqncias.
(11 MEDIANA (Md)
o valor que divide o conjunto de dados ordenados em duas metades, com metade
dos valores acima da mediana e a metade dos valores abaixo dela. Quando o nmero de
observaes (n) mpar, a mediana o valor que ocupa a posio central. Quando n for
par, h duas posies centrais no conjunto, ento a mediana a mdia aritmtica dos dois
valores que ocupam as posies centrais.
Observao:
1) Se n for mpar (n=nmero de observaes), o valor mediano ser o de ordem

,
`

.
| +
2
1 n
, ou seja, o valor do elemento que ocupa est posio ser a mediana.
2) Se n for par, o rol admite dois termos centrais que ocupam as posies.O de ordem

,
`

.
|
+
,
`

.
|
1
2 2
n
e
n
, ento, a mediana ser a mdia dos valores que ocupam estas posies.
Exemplos:
2
4
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
DADOS AGRUPADOS SEM INTERVALO DE CLASSE.
Se os dados se agrupam em uma distribuio de freqncia ser preciso
determinar um valor tal que divida a distribuio em dois grupos que contenham o
mesmo nmero de elementos. Esse valor ser encontrado atravs da seguinte frmula:
2

i
i
f
F => nos fornece a posio do valor na srie de dados.
Passos para o clculo da mediana:
(1) Achar n
(2) Calcular Fi
(3) Calcular Posio da mediana P(Md)
(4) Procurar P(Md) em Fi
Exemplo:
1)
N de meninos fi Fi
0 2 2
1 6 8
2 10 18
3 12 30
4 4 34
Total 34
2

i
i
f
F = 34/2 = 17 ( a posio!!)
A mediana vai ser a mdia entre o 17 valor e o 18 valor da srie (pois temo um nmero
par de elementos (n=34).
Ento,
Md = (2+2)/2 = 2 meninos.
2
5
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
2)
X fi Fi
12 1 1
14 2 3
15 1 4
16 2 6
17 1 7
20 1 8
Total 8
2

i
i
f
F = 8/2 = 4 (4 posio na srie)
A mediana ser a mdia entre o 4 e o 5 elemento da srie => Md=(15+16)/2 = 31/2 =
15,5
3)
idade f
i
F
i
2 1 1
5 5 6
8 10 16
10 6 22
12 1 23
total 23
2

i
i
f
F = 23/2=11,5 (POSIO12)
Md = 8
Exerccios: Calcule a mediana.
2
6
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
DADOS AGRUPADOS COM INTERVALO DE CLASSE.
Passos para o clculo da Mediana:
(1) Achar n
(2) Calcular Fi
(3) Calcular P(Md)
(4) Determinar a Classe Mediana
Frmula para o clculo
*
*
*
2
h
f
F
n
l Md
ant

,
`

.
|

+
Onde:
mediana a contm que classe de intervalo do amplitude a h
mediana classe da simples freqncia a f
mediana classe anterior classe da acumulada freqncia a F
srie na mediana da posio a
2
mediana classe da inferior limite o
*
*
ant
*
n
l
Exemplo:
idade f
i
F
i
3 |--- 6 2 2
6 |--- 9 5 7
9 |--- 12 7 14
12 |--- 15 3 17
15 |--- 18 2 19
total 19
2

i
i
f
F =19/2=9,5 =10
O 10 elemento est na 3 classe.
*
*
*
2
h
f
F
n
l Md
ant

,
`

.
|

+
=
( )
3
7
7 5 , 9
9

+ =10,1
2
7
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
Exerccio: Calcule a mediana para o caso da distribuio de freqncia abaixo:
idade f
i
F
i
450 |--- 550 8
550 |--- 650 10
650 |--- 750 11
750 |--- 850 16
850 |--- 950 13
950 |--- 1.050 5
1.050 |-- 1.150 1
total 64
Observao:
No caso de existir uma freqncia acumulada exatamente igual a
2
i
f
, a Mediana ser
o limite superior da classe correspondente.
Por exemplo:
Classes f
i
F
i
0 |---10 1 1
10 |---20 3 4
20 |---30 9 13
30 |---40 7 20
40 |---50 4 24
50 |---60 2 26
total 26
30 10
9
) 4 13 (
20
:
30
13
2
26
2
*

x Md
Veja
L Md
Ento
f
i
2
8
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
Nota:
1) A mediana pode coincidir ou no com um elemento da srie. Vimos que, quando
tivermos um nmero de elementos mpar na srie de dados, h coincidncia.
Quanto o nmero de elementos de uma srie par, na h coincidncia.
2) A mediana depende da posio e no dos valores centrais na srie ordenada.
3) Usamos a mediana quando desejamos obter o ponto que divide a distribuio em
partes iguais; quando h valores extremos afetando de uma maneira acentuada a
mdia e quando a varivel em estudo salrio.
Exemplo:
5, 7, 10, 13, 15 => Mdia = 10 e Md = 10
5, 7, 10, 13, 65 => Mdia = 20 e Md = 10
Observe que a mediana permanece a mesma e a mdia sofreu influencia dos
valores extremos.
2
9
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
SEPARATRIZES
As separatrizes, como o prprio nome sugere so medidas que separam a srie em
partes iguais.
No so medidas de tendncia central, mas esto ligadas mediana relativamente
a sua segunda caracterstica, j que se baseiam em sua posio na srie.
QUARTIS: So valores de uma srie que a dividem em 4 partes
iguais. Assim temos:
o
1
Q = 1 quartil: Separa a seqncia ordenada deixando 25%
dos valores a sua esquerda e 75% dos valores a sua direita.
o
2
Q = 2 quartil: Separa a seqncia ordenada deixando 50%
dos valores a sua esquerda e 50% dos valores a sua direita.
o
3
Q = 3 quartil: Separa a seqncia ordenada deixando 75%
dos valores a sua esquerda e 25% dos valores a sua direita.
!---------!---------!---------!---------!
Q1 Q2 Q3
Pode-se observar que o 2 quartil e a mediana tem os mesmos valores, pois ambos
dividem uma srie ordenada em duas partes iguais.
!---------!---------!---------!---------!
Q1 Q2 Q3
!-------------------!-------------------!
Md
QUINTIS: Quando dividimos uma srie em 5 partes iguais, cada parte
ficar com 20% dos elementos da srie. Assim temos:
o
1
K = 1 quintil separa a seqncia ordenada deixando 20%
dos valores a sua esquerda e 80% dos valores a sua direita.
o
2
K = 2 quintil separa a seqncia ordenada deixando 40%
dos valores a sua esquerda e 60% dos valores a sua direita.
o
3
K = 3 quintil separa a seqncia ordenada deixando 60%
dos valores a sua esquerda e 40% dos valores a sua direita.
o
4
K = 4 quintil separa a seqncia ordenada deixando 80%
dos valores a sua esquerda e 20% dos valores a sua direita.
!---------!---------!---------!---------!---------!

1
K
2
K
3
K
4
K
3
0
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
DECIS: Quando dividimos uma srie em 10 partes iguais, cada parte
ficar com 10% dos elementos da srie. Assim temos:
o
1
D = 1 decil separa a seqncia ordenada deixando 10%
dos valores a sua esquerda e 90% dos valores a sua direita.
o
2
D = 2 decil separa a seqncia ordenada deixando 20%
dos valores a sua esquerda e 80% dos valores a sua direita.
o
3
D = 3 decil separa a seqncia ordenada deixando 30%
dos valores a sua esquerda e 70% dos valores a sua direita.
o .
o .
o .
o
8
D = 8 decil separa a seqncia ordenada deixando 80%
dos valores a sua esquerda e 20% dos valores a sua direita.
o
9
D = 9 decil separa a seqncia ordenada deixando 90%
dos valores a sua esquerda e 10% dos valores a sua direita.
!---!---!---!---!---!---!---!---!---!---!
D1 D2 D3 D4 D5 D6 D7 D8 D9
PERCENTIS ou CENTIL: So valores de uma srie que a dividem
em 100 partes iguais. Cada parte ficar com 1% dos elementos da
srie. Assim temos:
o
1
P = 1 percentil: separa a seqncia ordenada deixando 1%
dos valores a sua esquerda e 99% dos valores a sua direita.
o
2
P = 2 percentil: separa a seqncia ordenada deixando 2%
dos valores a sua esquerda e 98% dos valores a sua direita.
o
3
P = 3 percentil: separa a seqncia ordenada deixando 3%
dos valores a sua esquerda e 97% dos valores a sua direita.
o .
o .
o .
o
o
98
P = 98 percentil: separa a seqncia ordenada deixando
98% dos valores a sua esquerda e 2% dos valores a sua direita.
o
99
P = 99 percentil: separa a seqncia ordenada deixando
99% dos valores a sua esquerda e 1% dos valores a sua direita.
!---!---!---!---!---!---!---!---!---!---!
C10 C20 C30 C40 C50 C60 C70 C80 C90
Observao: Podemos separar em quantas partes quisermos.
3
1
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
Podemos notar que os quartis, quintis e decis podem ser expresses em termos dos
precentis,
Q
1
=P25 K
1
=P20 D
1
=P
10
Q
2
=P50 K
2
=P40 D
2
=P
20
Q
3
=P75 K
3
=P60 D
3
=P
30
K
4
=P80 D
4
=P
40
D
5
=P
50
D
6
=P
60
D
7
=P
70
D
8
=P
80
D
9
=P
90
Clculo das medidas separatrizes:
QUARTIL
o mesmo clculo de mediana sendo que
2
i
f
deve ser substitudo por
4
i
f
k
, onde k o nmero de ordem do quartil.
*
*
*
.
4
f
h F
f k
l Q
ant
i
k
]
]
]
]

Exemplo:
1. Calcule o Q
1
da seqncia X: 2, 5, 8, 5, 5, 10, 1, 12, 12, 11, 13, 15.
2. Calcule o Q
1
e Q
3


ESTATURA (cm) fi Fi
150 a 154 4 4
154 a 158 9 13
158 a 162 11 24
162 a 166 8 32
166 a 170 5 37
170 a 174 3 40
Total 40
Fonte: MEC
Estatura de 40 alunos do colgio A
Exerccio: Para os dados agrupados em freqncia, encontre o primeiro e segundo quartil.
3
2
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
QUINTIS
o mesmo clculo de mediana sendo que
2
i
f
deve ser substitudo por
5
i
f
k
, onde k o nmero de ordem do quintil.
*
*
*
.
5
f
h F
f k
l K
ant
i
k
]
]
]
]

Exemplo:
Considerando a tabela de distribuio de freqncia por intervalo de classe, calcule K
2
.
ESTATURA (cm) fi Fi
150 a 154 4 4
154 a 158 9 13
158 a 162 11 24
162 a 166 8 32
166 a 170 5 37
170 a 174 3 40
Total 40
Fonte: MEC
Estatura de 40 alunos do colgio A
3
3
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
DECIS
o mesmo clculo de mediana sendo que
2
i
f
deve ser substitudo por
10
i
f
k
, onde k o nmero de ordem do decil.
*
*
*
.
10
f
h F
f k
l D
ant
i
k
]
]
]
]

Exemplo: Considerando a tabela de distribuio de freqncia por intervalo de classe,


calcule D
3
.
ESTATURA (cm) fi Fi
150 a 154 4 4
154 a 158 9 13
158 a 162 11 24
162 a 166 8 32
166 a 170 5 37
170 a 174 3 40
Total 40
Fonte: MEC
Estatura de 40 alunos do colgio A
PERCENTIS
o mesmo clculo de mediana sendo que
2
i
f
deve ser substitudo por
100
i
f
k
, onde k o nmero de ordem do percentil.
*
*
*
.
100
f
h F
f k
l P
ant
i
k
]
]
]
]

Exemplo: Considerando a tabela de distribuio de freqncia por intervalo de


classe, calcule P
8
.
ESTATURA (cm) fi Fi
150 a 154 4 4
154 a 158 9 13
158 a 162 11 24
162 a 166 8 32
166 a 170 5 37
170 a 174 3 40
Total 40
Fonte: MEC
Estatura de 40 alunos do colgio A
3
4
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
CAPITULO 5
MEDIDAS DE DISPERSO OU VARIABILIDADE.
As medidas de disperso ou variabilidade servem para avaliar o quanto os dados
so semelhantes, descreve ento o quanto os dados distam do valor central. Desse jeito,
as medidas de disperso servem tambm para avaliar qual o grau de representao da
mdia.
fcil demonstrar que apenas a mdia insuficiente para descrever um grupo de
dados. Dois grupos podem ter a mesma mdia, mas serem muito diferentes na amplitude
de variao de seus dados. Por exemplo:
-Grupo A (dados observados): 5; 5; 5.
-Grupo B (dados observado): 4; 5; 6.
-Grupo C (dados observados): 0; 5; 10.
A mdia dos trs grupos a mesma (5), mas no grupo A no h variao entre
os dados, enquanto no grupo B a variao menor que no grupo C. Dessa forma,
uma maneira mais completa de apresentar os dados (alm de aplicar uma medida de
tendncia central como a mdia) aplicar uma medida de disperso.
Dessas medidas, estudaremos as seguintes:
Medidas de variao absoluta que so: a amplitude total, a varincia e o
desvio padro.
Medidas de variao relativas que so: coeficiente de variao e a
varincia relativa.
(1) MEDIDAS DE VARIAO ABSOLUTA
Amplitude Total
a diferena entre o maior e o menor valor observado. Tem o inconveniente de s
levar em conta os dois valores extremos da srie, no levando em considerao os valores
intermedirios. Ela apenas uma indicao aproximada da disperso ou variabilidade.
AT = L (Max) l (min)
3
5
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
Varincia e Desvio Padro
A varincia e o desvio padro so medidas que levam em considerao a
totalidade dos valores da varivel em estudo, o que faz delas ndices de variabilidade
bastante estveis e, por isso mesmo, os mais geralmente empregados.
A varincia a mdia aritmtica do quadrado dos desvios (em relao mdia).

) (
ou
) (
1
1
2
2
) (
1
2
2
) (

n
i
i
i
n
i
i
x
n
i
i
x
f
f x x
n
x x

Etapas do clculo da Varincia:
1. - Calcular a mdia aritmtica X
2. - Subtrair a mdia X de cada valor Xi do conjunto
( ) X Xi
, o que chamamos de
desvio;
3. - Elevar cada desvio ao quadrado ( )
2
X Xi
4. - Somar os quadrados dos desvios ( )
2
n
1 i
X Xi

5. - Dividir a soma por (n-1) quando se tratar de dados amostrais, ou simplesmente por
n se os dados representam todos os valores de uma populao.
Sendo a varincia calculada a partir dos quadrados dos desvios, ela um nmero
em unidade quadrada em relao varivel em questo, o que, sob o ponto de vista
prtico, um inconveniente.
Por isso mesmo, imaginou-se uma nova medida que tem a interpretao prtica,
denominada desvio padro, definida como a raiz quadrada da varincia.

) (
ou
) (
1
1
2
) (
1
2
) (

n
i
i
i
n
i
i
x
n
i
i
x
f
f x x
n
x x

3
6
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
Obs.: (1) O desvio padro sempre ser positivo!
(2) O desvio padro de uma srie indica o quanto os dados esto afastados
da mdia e, que se os dados so iguais, o valor da medida zero.
Exemplo 7:
Em uma turma de aluno, verificaram-se atravs da anlise das notas de 15 alunos (amostra), os
seguintes desempenhos:
Alunos Conceito na Prova
1 4,3 9,1204
2 4,5 7,9524
3 9 2,8224
4 6 1,7424
5 8 0,4624
6 6,7 0,3844
7 7,5 0,0324
8 10 7,1824
9 7,5 0,0324
10 6,3 1,0404
11 8 0,4624
12 5,5 3,3124
13 9,7 5,6644
14 9,3 3,9204
15 7,5
0,0324
Total 109,8 44,16
Mdia 7,32 3,155 Varincia
Desvio Padro 1,77
Observamos no exemplo, que a mdia das provas, foi estimada em 7,32 com desvio
padro em 1,77. Conclumos que a maioria das notas concentrou-se em 9,09 e 5,55.
Exerccio: Calcular a mdia aritmtica e o desvio padro dos seguintes dados relativos
dosagem de hemoglobina verificada em 12 animais bovinos (mg).
15 14 13 11 13 14 13,5 12 16 14,5 12 9
Resp.: Mdia = 13,083mg Varincia = 3,583mg
2
Desvio padro = 1,892mg
3
7
( )
2
X Xi
( )
2
n
1 i
X Xi

Instituto Federal de Educao, Cincia e Tecnologia RJ



Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
( 2) MEDIDAS DE VARIAO RELATIVA
A varincia relativa
A varincia relativa de uma srie X definida por:

2
2
) (
) (
x
x
x V

O coeficiente de variao
O coeficiente de variao de uma srie X definido por:
x
x
x CV
) (
) (


a razo entre o desvio padro e a mdia aritmtica da srie dos dados.
Note que o coeficiente de variao, como uma diviso de elementos de mesma
unidade, um nmero puro. Portanto pode ser expresso em percentual .
Exemplo:
Se uma srie X apresentar: 10 x e
2 ) ( x
E uma srie Y apresentar:
100 y
e
5 ) ( y
Do ponto de vista da disperso absoluta, a srie Y apresenta maior disperso que a
srie X.
No entanto, se levarmos em considerao as mdias das sries, o desvio padro de
Y que 5 em relao a 100 um valor menos significativo que o desvio padro de X que
2 em relao a 10. Isso nos leva a definir as medidas de disperso relativas.
Desse modo, se calcularmos os coeficientes de variao das sries X e Y
obteremos: cv(x) = 2/10 = 0,2 ou 20% cv(y) = 5/100 = 0,05 ou 5%
Comparando os valores destes dois coeficientes conclumos que a srie X admite
maior disperso relativa.
3
8
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
Como a medida de disperso relativa leva em considerao a medida de disperso
absoluta e a mdia da srie, uma medida mais completa que a medida de disperso
absoluta.
Portanto, a medida de disperso relativa prevalece sobre a medida de disperso
absoluta. Podemos afirmar que a srie que tem a maior disperso relativa, tem de modo
geral a maior disperso.
Ou seja,
A srie Y apresenta maior disperso absoluta.
A srie X apresenta maior disperso relativa.
Portanto, a srie X apresenta maior disperso.
Exerccio: Responda, justificando em cada caso, as questes abaixo:
(a) Qual das sries apresenta maior disperso absoluta?
(b) Qual das sries apresenta maior disperso relativa?
(c) Qual das sries apresenta maior disperso?
Caso 1)
20 x
2 ) ( x
20 y
5 ) ( y
Caso 2)
50 x
2 ) ( x
100 y
3 ) ( y
3
9
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
CAPITLO 6
EXPERIMENTO ALEATRIO, ESPAO AMOSTRAL, EVENTOS E
PROBABILIDADE.
DEFINIES:
EXPERIMENTO ALEATRIO: So aqueles que, mesmo repetidos vrias
vezes sob condies semelhantes, apresentam resultados imprevisveis.
Ex.: Em uma jogada de futebol, provvel que seu time: perca; que ele ganha;
que ele empate.
ESPAO AMOSTRAL (S): Cada experimento aleatrio corresponde, em geral, a
vrios resultados possveis. O conjunto desses resultados possveis recebe o nome de
espao amostral ou conjunto universo, representado por S.
Exemplo: Lanamento de uma moeda: S = {Ca, Co}
Lanamento de um dado: S={1, 2, 3, 4, 5, 6}
Cada um dos elementos de S que correspondem a um resultado recebe o
nome de PONTO AMOSTRAL, por exemplo, 2 a S => 2 um ponto amostral de S
(no caso do lanamento do dado).
EVENTOS (A): Chamamos de evento qualquer subconjunto do espao amostral S
de um experimento aleatrio.
Exemplo: Lanamento de um dado:
Espao amostral: S={1, 2, 3, 4, 5, 6}
Eventos:
a) Obter um nmero par na face superior:
A={2, 4, 6} => S A , logo, A um evento de S.
b) Obter um nmero menor ou igual a 6 na face superior:
B={1, 2, 3, 4, 5, 6}
4
0
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
Observao:
Seja E um evento qualquer:
Se E = S => E chamado de EVENTO CERTO
Se S E e E um conjunto unitrio => E chamado de EVENTO ELEMENTAR.
Se E=, E chamado de EVENTO IMPOSSVEL.
Exemplos:
No lanamento de um dado, onde S = {1,2,3,4,5,6}, temos:
A: Obter um nmero para na face superior.
A={2,4,6} = > A um evento de S.
B: Obter um nmero menor ou igual a 6.
B={1,2,3,4,5,6} = > logo, B um evento certo de S = > B=S.
C: Obter o nmero 4 na face superior.
C={4} = > C um evento elementar de S.
D: Obter um nmero maior que 6 na face superior.
D== > um evento impossvel de S
4
1
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
PROBABILIDADE
Seja S o seu espao amostral. Se todos os elementos de S tem a mesma chance de
acontecer, ento, chamamos de PROBABILIDADE DE UM EVENTO A, S A , o
nmero real P(A), tal que:
) (
) (
) (
S n
A n
A P
, Onde n(A) o nmero de elementos de A e n(S) o nmero de
elementos de S.
Exemplos:
a) Considere o lanamento de uma moeda e o evento A obter cara.
S= {Ca, Co} n(S) = 2 A = {Ca} n(A) = 1
P(A) =
2
1
, ou seja, 50% de chance de aparecer cara na face superior.
b) Considere o lanamento de um dado:
Evento A: obter um nmero par na face superior.
S = {1, 2, 3, 4, 5, 6} n(S) = 6
A = {2, 4, 6} n(A) = 3
P(A) =
2
1
6
3

Evento B: obter um nmero menor ou igual a 6 na face superior.


S = {1, 2, 3, 4, 5, 6} n(S) = 6
4
2
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
B = {1, 2, 3, 4, 5, 6} n(B) = 6
P(B) = 1 (podemos chamar esse evento de EVENTO CERTO, pois coincide
com o espao amostral S).
EVENTOS COMPLEMENTARES
- Se p a probabilidade de um evento ocorrer (sucesso) e q a probabilidade de que
ele no ocorra (insucesso), ento para um mesmo evento existe a relao
p + q = 1 = > q = 1 p
Ex.: A probabilidade de sair 4 no lanamento de um dado p=1/6, ento, a probabilidade
de no tirar 4 no lanamento de um dado
q = 5/6.
EVENTOS MUTUAMENTE EXCLUSIVOS
- Dois ou mais eventos so mutuamente exclusivos quando a realizao de um
exclui a realizao dos outros, ou seja, se os mesmos elementos no podem ocorrer
simultaneamente.
- Se os eventos so mutuamente exclusivos, a probabilidade de que um ou outro
se realize igual a soma das probabilidades.
P(AB) = P(A) + P(B)
- Se os eventos no forem mutuamente exclusivos, temos:
P(AB) = P(A) + P(B) - P(AB)
EVENTOS INDEPENDENTES
- Dois eventos so independentes quando a ocorrncia ou a no ocorrncia de um
evento no tem efeito algum na probabilidade de ocorrncia do outro evento. Quando
lanamos dois dados, o resultado obtido em um deles independe do resultado obtido no
outro.
- A probabilidade de dois eventos ocorrerem simultaneamente igual ao produto
das probabilidades.
4
3
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
P(A e B) = P(AB) = P(A)P(B)
Exemplo:
Uma moeda lanada duas vezes, a probabilidade de que ambos os resultados
sejam cara :
Evento A = sair cara nos 2 lanamentos
P(A) = P(A1 A2) = (1/2)x(1/2)
- Quando dois eventos so dependentes, o conceito de probabilidade condicional
empregado para indicar a probabilidade de ocorrncia de um evento relacionado. A
expresso P(B/A) indica a probabilidade de ocorrer o evento B, dado que tenha ocorrido
o evento A. Note que B/A no uma frao.
P(B/A) =
) (
) (
A P
BeA P
=
) (
) (
A P
A B P

P(A e B) = P(AB)=P(A)P(B/A)
Exemplo:
Suponha um conjunto de 10 peas contendo 8 em boas condies e duas
defeituosas. O experimento consiste em se retirar duas peas aleatoriamente e sem
reposio. A probabilidade de que as duas peas selecionadas sejam boas :
Evento B = as duas peas sejam boas
P(B) = P(B1B2)= P(B1)P(B2/B1)= (8/10)(7/9)=56/90=28/45
4
4
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
Exerccios:
1) Qual a probabilidade de sair s de ouros quanto retiramos uma carta de um
baralho de 52 cartas?
2) Qual a probabilidade de sair um rei quanto retiramos uma carta de um baralho de
52 cartas?
3) Um lote de 12 peas, 4 so defeituosas. Sendo retirada uma pea, calcule?
a- A probabilidade de essa pea ser defeituosa:
b- A probabilidade de essa pea no ser defeituosa:
4) No lanamento de dois dados, calcule a probabilidade de se obter soma igual a 5.
5) De dois baralhos de 52 cartas retiram-se, simultaneamente, uma carta do primeiro
baralho e uma carta do segundo baralho. Qual a probabilidade de a carta do
primeiro baralho ser um rei e a do segundo baralho ser o 5 de paus?
6) Uma urna A contm: 3 bolas brancas, 4 pretas, 2 verdes; Uma urna B contm: 5
bolas brancas, 2 pretas, 1 verde; Uma urna C contm: 2 bolas brancas, 3 pretas e 4
verdes. Uma bola retirada de cada urna. Qual a probabilidade de as 3 bolas
retiradas da primeira, segunda e terceira urnas serem, respectivamente, branca,
preta e verde?
7) De um baralho de 52 cartas retiram-se, ao acaso, duas cartas sem reposio. Qual
a probabilidade de a primeira carta ser o s de paus e a segunda ser o rei de paus?
8) Qual a probabilidade de sair uma figura quando retiramos uma carta de um
baralho de 52 cartas?
9) Qual a probabilidade de sair uma carta de copas ou de ouros quando retiramos
uma carta de um baralho de 52 cartas?
10) No lanamento de um dado, qual a probabilidade de se obter um nmero no
inferior a 5?
4
5
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
Observaes:
1) O menor valor que uma probabilidade pode ter 0 (indica que o evento impossvel) e
o maior valor 1(indica que o evento certamente ir ocorrer). Ento em geral:
0 <= P(A) <= 1
2) P(S) = 1
3) Quando desejamos determinar a probabilidade de ocorrer um evento ou um outro (ou
ambos) em uma s observao podemos representar, segundo a linguagem da teoria dos
conjuntos, como unio de A e B => P (AB).
P(AB) = P(A) + P(B) - P(AB)
5) Se os eventos forem mutuamente exclusivos a P(AB)=0 (os eventos no podem
ocorrer ao mesmo tempo), ento,
P (AUB) = P(A) + P(B)
6) Probabilidade condicional indica a probabilidade de ocorrer o evento B, dado que
tenha ocorrido o evento A. Note que B/A no uma frao.

P(B/A) =
) (
) (
A P
A B P
7) Regra da multiplicao:
Se os eventos so independentes:
P(A e B) = P(AB) = P(A)P(B)
Se os eventos so dependentes:
P(A e B) = P(AB) = P(A)P(B/A) ou P(B e A) = P(BA )= P(B)P(A/B)
4
6
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
CAPTULO 07
Reviso: VARIVEIS ALEATRIAS DISCRETAS E CONTNUAS
Uma varivel aleatria tem um nmero para cada resultado de um experimento:
Exemplo:
X= nmero de mulheres entre 10 empregados recm-admitidos.
X = nmero de alunos que no compareceram aula de estatstica hoje.
X= altura de um adulto do sexo masculino selecionado aleatoriamente.
O termo VARIVEL ALEATRIA empregado para descrever o valor que corresponde
ao resultado de determinado experimento.
Definies:
Uma VARIVEL ALEATRIA DISCRETA: ou admite um nmero finito de valores ou
tem uma quantidade enumervel de valores.
Uma VARIVEL ALEATRIA CONTNUA: pode tomar um nmero infinito de
valores em uma escala contnua.
Por exemplo:
a) Nmero de expectadores que vem um filme um nmero inteiro (varivel
aleatria discreta).
b) A voltagem de uma pilha de um detector de fumaa pode ser qualquer valor entre
0 volts e 9 volts (varivel aleatria contnua).
___________________________________//___________________________________
Alm de identificar valores de uma varivel aleatria, podemos atribuir uma
probabilidade a cada um desses valores.
Quando conhecemos todos os valores de uma varivel aleatria juntamente com suas
respectivas probabilidade, temos uma distribuio de probabilidade.
Definio: Uma DISTRIBUIO DE PROBABILIDADE d a probabilidade de cada
valor de uma varivel aleatria.
4
7
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
Exemplo: Distribuio de probabilidade no nmero de acidentes areos com a GOL,
dentre sete acidentes.
X p(x)
0 0,210
1 0,367
2 0,275
3 0,115
4 0,029
5 0,004
6 0+
7 0+
A representao grfica de uma DISTRIBUIO DE PROBABILIDADES feito
atravs do HISTOGRAMA DE PROBABILIDADES, semelhantes ao HISTOGRAMA
DE FREQNCIA, sendo que a escala vertical apresenta probabilidades, em lugar das
correspondentes freqncias.
Condies para uma DISTRIBUIO DE PROBABILIDADE:
1) A soma de todas as probabilidades individuais 1:
( ) 1

x p
2) Para qualquer evento A implica que p(x) deve estar entre 0 e 1 para qualquer valor de
x:
1 ) ( 0 x P
Exemplos:
1) P(x)= x/5 (onde x toma os valores 0, 1, 2, 3) define a distribuio de
probabilidades?
Soluo: para que fique definida uma distribuio de probabilidades, devem ser
satisfeitas as duas condies, ou seja,
1 0 ) ( A P
e
( ) 1 S P
.
1
5
6
5
3
5
2
5
1
5
0
) 3 ( ) 2 ( ) 1 ( ) 0 ( ) ( + + + + + +

p p p p x p
Como a primeira condio no satisfeita => neste exemplo no uma distribuio de
probabilidade.
2) P(x) = x/3 (onde x pode ser 0, 1 ou 2) define uma distribuio de probabilidades?
Soluo:
4
8
A probabilidade de 0 acidentes com
a GOL (dentre sete acidentes)
0,210;
Os valores denotados 0+
representam probabilidades muito
pequenas;
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
1 (condio)=>
1
3
2
3
1
3
0
) 2 ( ) 1 ( ) 0 ( ) ( + + + +

p p p x p

2 (condio) => cada valor de p(x) est entre 0 e 1 inclusive.
Ento, como as duas condies so satisfeitas, a funo p(x) deste exemplo uma
distribuio de probabilidade.
MDIA E VARINCIA DE UMA DISTRIBUIO DE PROBABILIDADE
- Valor esperado de uma varivel aleatria (E): a mdia dos valores possveis de X,
cada um com a sua probabilidade de ocorrncia.
( ) ( )


n
i
i i
x p x X E
1

- Varincia de uma varivel aleatria: uma medida de disperso da varivel aleatria


em torno da mdia
( ) ( ) [ ] ( )


n
i
i i
x p X E x X VAR
1
2 2

4
9
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
Exerccios:
1) Determine se dada uma distribuio de probabilidade. Nos casos em que no
descrita uma distribuio de probabilidade, identifique a condio que no satisfeita. E
quando for descrita uma distribuio de probabilidade, determine sua mdia, varincia e
desvio padro.
a) Se sua faculdade contrata os 4 prximos funcionrios sem distino de sexo e o
conjunto de candidatos grande, com nmeros iguais de homens e mulheres, a
tabela a seguir d a distribuio de probabilidade do nmero x de mulheres
contratadas.
X p(x)
0 0,0625
1 0,2500
2 0,3750
3 0,2500
4 0,0625
b) Ao avaliar riscos de crdito, Jefferson investiga o nmero de cartes de crdito
que a pessoa tem. Com x sendo o nmero de cartes de crdito que os adultos
possuem a tabela a seguir d a distribuio de probabilidade para um conjunto de
solicitantes.
X p(x)
0 0,26
1 0,16
2 0,12
3 0,09
4 0,07
5 0,09
6 0,07
7 0,14

2) Seja X uma varivel aleatria discreta assumido valores no conjunto {1, 2, 3} e com
distribuio de probabilidade dada por:
x 1 2 3
P(X=x) 1/3 1/6 1/2
a. Calcule a mdia de X.
b. Calcule a (
( ) 2 x P
c. Calcule a (
( ) 2 > x P
5
0
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
3) O tempo T, em minutos, necessrio para um operrio processar certa pea uma
varivel aleatria com a seguinte distribuio de probabilidade:
T 2 3 4 5 6 7
P(T=t) 0,1 0,1 0,3 0,2 0,2 0,1
Calcule o tempo mdio de processamento.
(1) VARIVEL ALEATRIA DISCRETA: DISTRIBUIO BINOMIAL
Vimos que uma varivel aleatria associa um valor numrico a cada resultado de
um experimento aleatrio e uma distribuio de probabilidade associa uma probabilidade
a cada valor de uma varivel aleatria.
Veremos agora como determinar as probabilidades para uma categoria importante
de distribuio de probabilidades: OS EXPERIMENTOS BINOMIAIS.
Os experimentos binomiais tm a caracterstica de apresentarem exatamente dois
resultados complementares: SUCESSO E FRACASSO.
Exemplo:
Em processos industriais: as peas falham ou no falham.
Na medicina: um paciente sobrevive um ano ou morre.
Em propaganda, um consumidor reconhece um produto ou no.
Definio:
Um experimento binomial um experimento que satisfaz as seguintes condies:
1. O experimento deve comportar um nmero fixo de provas.
2. As provas devem ser independentes (o resultado de qualquer prova no afeta
as probabilidades das outras provas.)
3. Cada prova deve ter todos os resultados classificados em duas categorias.
4. As probabilidades devem permanecer constantes para cada prova.
Quando fazemos um experimento binomial, a distribuio da varivel aleatria x
chamada uma DISTRIBUIO BINOMIAL.
5
1
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
NOTAO:
S => sucesso
F => fracasso
p => probabilidade de sucesso => P(S)=p
q => probabilidade de fracasso => P(F)=q = 1-p
n = nmero fixo de provas
x => denota um nmero especfico de sucessos em n provas, podendo ser
qualquer inteiro entre 0 e n, inclusive.
P(x) => denota a probabilidade de obter exatamente x sucessos em n provas.
Exemplo: Dado que 10% das pessoas so canhotas, suponha que queiramos achar a
probabilidade de obter exatamente 3 estudantes canhotos em uma turma de 15 estudantes.
b)Trata-se de um experimento binomial
b)Em caso afirmativo, identifique os valores de n, x, p e q.
A probabilidade pode ser calculada utilizando-se a seguinte frmula:
( )
x n x n
x
p p x X P

) 1 .( ). (
( )
x n x x n x
x n
x n x n
x
q p
x x n
n
p p C p p x X P
p n Bin X

. .
! )! (
!
) 1 .( . ) 1 .( ). (
) , ( ~
,
Para x = 0, 1, 2, .....,n
Com
n = nmero de provas.
x = nmero de sucessos em n provas.
p = probabilidade de sucesso em qualquer prova.
q = probabilidade de fracasso em qualquer prova.
Obs.: lembrando que 0! = 1 (por definio)
Exerccios:
5
2
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
1) Aplicando a frmula da probabilidade binomial, determine a probabilidade de
obter 3 estudantes canhotos em uma turma de 15 estudantes, dado que 10% da
populao so canhotos. Isto determine P(3), se n=15, x=3, p=0,1 e 1=0,9.
2) Determine se os experimentos so binomiais.
a) 50 jogadas de um dado.
b) 200 jogadas de uma moeda equilibrada.
c) Selecionar aleatoriamente (sem reposio) um grupo de 12 pneus
diferentes de uma populao de 30 pneus, dos quais 5 so defeituosos.
d) Pesquisar 2000 espectadores de televiso para saber se recordam o nome
de determinado produto aps verem um comercial.
e) Pesquisa de 1000 consumidores americanos, perguntando se reconhece a
marca NIKE.
3) Suponha que em um experimento binomial, uma prova se repita n vezes.
Determine a probabilidade de x sucessos, dada a probabilidade p de sucesso em
uma prova:
a) n = 3, x= 2, p=0,9
b) n=8, x=7, p=0,99
c) n=10, x=4, p=0,30
d) n=6, x=1, p=0,05
4) Uma firma afirma que 20% de suas pastilhas de chocolate M&M so vermelhas.
Determine a probabilidade de que, em 15 pastilhas M&M escolhidas
aleatoriamente, exatamente 20%, ou seja, 3 pastilhas sejam vermelhas.
5) Acredita-se que 20% dos moradores das proximidades de uma grande indstria
siderrgica tm alergia aos poluentes lanados ao ar. Admitindo que este
percentual de alrgicos real (correto), calcule a probabilidade de que pelo menos
4 moradores tenham alergia entre 13 selecionados ao acaso.
6) Trs em cada quatro alunos de uma universidade fizeram cursinho antes de prestar
vestibular. Se 16 alunos so selecionados ao acaso, qual a probabilidade de que:
a) Pelo menos 12 tenham feito cursinho?
b) No mximo 13 tenham feito cursinho?
c) Exatamente 12 tenham feito cursinho?
5
3
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
7) Em um lote de 50 mudas, qual a probabilidade de que pelo menos
45 sejam aproveitveis?
8) Considerando um lote contendo 25 peas das quais 5 so defeituosas. Quatro
peas foram escolhidas ao acaso e seja X o nmero de peas defeituosas
encontradas nessa amostra.
Determine a distribuio de X se a amostra foi obtida com reposio.
5
4
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
(2) VARIVEL ALEATRIA CONTNUA - DISTRIBUIO NORMAL ou de
GAUSS
Definio: Se X uma varivel aleatria contnua, ento X assume todos os valores em
um intervalo de nmeros reais ().
- A distribuio de probabilidade de X descrita por uma curva de densidade, ou funo
de densidade.
- A probabilidade de qualquer evento a rea sob a curva de densidade entre os valores
de X que compe o evento.
- A rea total sob qualquer curva de densidade 1, de modo que a probabilidade de um
evento varia entre 0 e 1.
Definio Distribuio Normal:
A varivel aleatria X, tem distribuio Normal, com parmetros e 2 se essa
distribuio simtrica e apresenta a forma de sino (curva normal ou de Gauss).
Sua funo de probabilidade dada por:
( )
2
2
1
2
.
2
1
) , ( ~

,
`

.
|



x
e x f
N X
(Pi): constante matemtica ( 3,14159)
exp: funo exponencial exp(y) = ey
e: constante matemtica ( 2,71828).
Propriedades:
E(X) =
VAR(X) = 2
P(X=x) = f(X) = 0 (pois no existe a probabilidade no ponto e sim na rea)
5
5
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
f(X) simtrica ao redor da mdia, ou seja, a probabilidade de ocorrer valor
menor do que a mdia igual a probabilidade de ocorrer valor menor do que a
mdia.
A curva normal depende de duas constantes, e
2
:
- corresponde ao centro da simetria da curva
- 2 graficamente, fornece a distncia do centro da simetria aos pontos onde
a curva muda de sentido.
Representao grfica
Para quaisquer dois valores especficos podemos determinar a proporo de rea
sob a curva entre esses dois valores. Para a distribuio Normal, a proporo de valores
caindo dentro de um, dois, ou trs desvios padro da mdia :
5
6
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
Exemplo: Suponha que os comprimentos de um particular tipo de peixe podem
ser descritos por uma distribuio normal, com mdia 140mm e desvio padro 15mm.
Podemos calcular a proporo dos peixes que tm comprimentos entre 110 e 170mm, por
exemplo, como a proporo da rea sob a curva entre 110 e 170mm.
Ento em nosso exemplo, cerca de 95% dos peixes tem comprimentos entre
110mm e 170mm.
Obs.: Quando temos uma varivel aleatria com distribuio Normal, nosso principal
interesse obter a probabilidade de essa varivel aleatria assumir um valor em um
determinado intervalo.
Distribuio Normal Padro:
Na prtica desejamos calcular probabilidades para diferentes valores de e .
Para isso, a varivel cuja distribuio ) , ( ~
2
N X transformada numa
forma padronizada com distribuio
) 1 , 0 ( ~ N X
(distribuio normal padro),
pois tal distribuio tabelada. A quantidade dada por

X
Z
Exemplo:
1) Se j X a varivel aleatria que representa os dimetros dos parafusos produzidos por
certa mquina. Suponha que essa varivel tenha Distribuio Normal com mdia 2cm e
desvio padro 0,04cm.
a) A probabilidade de um parafuso ter um dimetro com valor entre 2 e 2,05 :
3944 , 0 ) 25 , 1 0 ( )
04 , 0
2 05 , 2
04 , 0
2 2
( ) 05 , 2 2 ( < <

<

<

< < Z P
X
P X P

4) P(-1,25<Z<0)
5) P(-1,25<Z<0)
5
7
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
6) P(0,8<Z<1,23)
7) P(Z>0,6)
5
8
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,000000 0,003989 0,007978 0,011966 0,015953 0,019939 0,023922 0,027903 0,031881 0,035856
0,1 0,039828 0,043795 0,047758 0,051717 0,055670 0,059618 0,063559 0,067495 0,071424 0,075345
0,2 0,079260 0,083166 0,087064 0,090954 0,094835 0,098706 0,102568 0,106420 0,110261 0,114092
0,3 0,117911 0,121720 0,125516 0,129300 0,133072 0,136831 0,140576 0,144309 0,148027 0,151732
0,4 0,155422 0,159097 0,162757 0,166402 0,170031 0,173645 0,177242 0,180822 0,184386 0,187933
0,5 0,191462 0,194974 0,198468 0,201944 0,205401 0,208840 0,212260 0,215661 0,219043 0,222405
0,6 0,225747 0,229069 0,232371 0,235653 0,238914 0,242154 0,245373 0,248571 0,251748 0,254903
0,7 0,258036 0,261148 0,264238 0,267305 0,270350 0,273373 0,276373 0,279350 0,282305 0,285236
0,8 0,288145 0,291030 0,293892 0,296731 0,299546 0,302337 0,305105 0,307850 0,310570 0,313267
0,9 0,315940 0,318589 0,321214 0,323814 0,326391 0,328944 0,331472 0,333977 0,336457 0,338913
1,0 0,341345 0,343752 0,346136 0,348495 0,350830 0,353141 0,355428 0,357690 0,359929 0,362143
1,1 0,364334 0,366500 0,368643 0,370762 0,372857 0,374928 0,376976 0,379000 0,381000 0,382977
1,2 0,384930 0,386861 0,388768 0,390651 0,392512 0,394350 0,396165 0,397958 0,399727 0,401475
1,3 0,403200 0,404902 0,406582 0,408241 0,409877 0,411492 0,413085 0,414657 0,416207 0,417736
1,4 0,419243 0,420730 0,422196 0,423641 0,425066 0,426471 0,427855 0,429219 0,430563 0,431888
1,5 0,433193 0,434478 0,435745 0,436992 0,438220 0,439429 0,440620 0,441792 0,442947 0,444083
1,6 0,445201 0,446301 0,447384 0,448449 0,449497 0,450529 0,451543 0,452540 0,453521 0,454486
1,7 0,455435 0,456367 0,457284 0,458185 0,459070 0,459941 0,460796 0,461636 0,462462 0,463273
1,8 0,464070 0,464852 0,465620 0,466375 0,467116 0,467843 0,468557 0,469258 0,469946 0,470621
1,9 0,471283 0,471933 0,472571 0,473197 0,473810 0,474412 0,475002 0,475581 0,476148 0,476705
2,0 0,477250 0,477784 0,478308 0,478822 0,479325 0,479818 0,480301 0,480774 0,481237 0,481691
2,1 0,482136 0,482571 0,482997 0,483414 0,483823 0,484222 0,484614 0,484997 0,485371 0,485738
2,2 0,486097 0,486447 0,486791 0,487126 0,487455 0,487776 0,488089 0,488396 0,488696 0,488989
2,3 0,489276 0,489556 0,489830 0,490097 0,490358 0,490613 0,490863 0,491106 0,491344 0,491576
2,4 0,491802 0,492024 0,492240 0,492451 0,492656 0,492857 0,493053 0,493244 0,493431 0,493613
2,5 0,493790 0,493963 0,494132 0,494297 0,494457 0,494614 0,494766 0,494915 0,495060 0,495201
2,6 0,495339 0,495473 0,495604 0,495731 0,495855 0,495975 0,496093 0,496207 0,496319 0,496427
2,7 0,496533 0,496636 0,496736 0,496833 0,496928 0,497020 0,497110 0,497197 0,497282 0,497365
2,8 0,497445 0,497523 0,497599 0,497673 0,497744 0,497814 0,497882 0,497948 0,498012 0,498074
2,9 0,498134 0,498193 0,498250 0,498305 0,498359 0,498411 0,498462 0,498511 0,498559 0,498605
3,0 0,498650 0,498694 0,498736 0,498777 0,498817 0,498856 0,498893 0,498930 0,498965 0,498999
3,1 0,499032 0,499065 0,499096 0,499126 0,499155 0,499184 0,499211 0,499238 0,499264 0,499289
3,2 0,499313 0,499336 0,499359 0,499381 0,499402 0,499423 0,499443 0,499462 0,499481 0,499499
3,3 0,499517 0,499534 0,499550 0,499566 0,499581 0,499596 0,499610 0,499624 0,499638 0,499651
3,4 0,499663 0,499675 0,499687 0,499698 0,499709 0,499720 0,499730 0,499740 0,499749 0,499758
3,5 0,499767 0,499776 0,499784 0,499792 0,499800 0,499807 0,499815 0,499822 0,499828 0,499835
3,6 0,499841 0,499847 0,499853 0,499858 0,499864 0,499869 0,499874 0,499879 0,499883 0,499888
3,7 0,499892 0,499896 0,499900 0,499904 0,499908 0,499912 0,499915 0,499918 0,499922 0,499925
3,8 0,499928 0,499931 0,499933 0,499936 0,499938 0,499941 0,499943 0,499946 0,499948 0,499950
3,9 0,499952 0,499954 0,499956 0,499958 0,499959 0,499961 0,499963 0,499964 0,499966 0,499967
4,0 0,499968 0,499970 0,499971 0,499972 0,499973 0,499974 0,499975 0,499976 0,499977 0,499978
5
9
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
CAPITULO 8
INTRODUO
A REGRESSO e a CORRELAO so tcnicas utilizadas para estimar uma
relao que possa existir na populao, enquanto as tcnicas anteriormente estudadas
(Medidas de Tendncia Central e de Disperso: Mdia, Desvio Padro, Varincia, etc.)
servem para estimar um nico parmetro populacional.
A anlise de correlao e regresso compreende a anlise de dados amostrais para
saber se e como duas ou mais variveis esto relacionadas uma com a outra numa
populao.
A correlao mede a fora, ou grau, de relacionamento entre duas variveis; a
regresso d a equao que descreve o relacionamento em termos matemticos.
Os dados para anlise de regresso e correlao provm de observaes de
variveis emparelhadas. Na regresso pressupe-se alguma relao de causa e efeito, de
explanao do comportamento entre as variveis.
Ex. a idade e a altura de cada indivduo; a alquota de imposto e a arrecadao; preo e
quantidade.
Se o relacionamento entre X e Y for consistente e necessitamos fazer uma
predio para o valor de Y, conhecido um valor de X, atravs de uma formula
matemtica adequada, podemos aplicar a chamada anlise de regresso simples.
6
0
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
(1) CORRELAO
Definio: Quando duas variveis esto ligadas por uma relao estatstica, dizemos que
existe correlao entre elas.
Por exemplo:
- A circunferncia C e o raio r esto perfeitamente correlacionados, porque
2 C
r.
- As variveis altura e peso de indivduos revelariam alguma correlao.
Diagrama de disperso: O diagrama de disperso um grfico onde pontos no espao
cartesiano XY so usados para representar simultaneamente os valores de duas variveis
quantitativas medidas em um conjunto de dados.
Por exemplo:
Um dos objetivos dos pesquisadores neste estudo encontrar uma maneira de
conhecer o peso do urso atravs de uma medida mais fcil de se obter do que a direta
(carregar uma balana para o meio da selva e colocar os ursos em cima dela) como, por
exemplo, uma medida de comprimento (altura, permetro do trax, etc.).
O problema estatstico aqui encontrar uma varivel que tenha uma relao forte com
o peso, de modo que, a partir de seu valor medido, possa ser calculado (estimado) o valor
peso indiretamente, atravs de uma equao matemtica.
O primeiro passo para encontrar esta varivel fazer o diagrama de disperso das
variveis candidatas (eixo horizontal) versus o peso (eixo vertical), usando os pares de
informaes de todos os ursos. Voc pode tentar as variveis: idade, altura, comprimento
da cabea, largura da cabea, permetro do pescoo e permetro do trax.
A Figura mostra a relao entre peso e altura e entre peso e permetro do trax.
6
1
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
Analisando o grfico:
1) Podemos ver que, tanto a altura quanto o permetro do trax so fortemente
associados ao peso do urso, no sentido de que quanto mais alto o urso ou quanto
maior a medida de seu trax, mais pesado ele ser.
2) Note que este crescimento linear para o permetro do trax e no-linear para a
altura.
3) Os pontos esto mais dispersos no grfico da altura, a varivel mais adequada
para estimar o peso o permetro do trax (a tcnica estatstica adequada aqui chama-
se Regresso Linear Simples).
Observao: A correlao entre duas variveis pode ser POSITIVA, NULA ou
NEGATIVA.
Exemplo:
6
2
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
-30
-25
-20
-15
-10
-5
0
5
10
0 5 10 15 20 25 30
Grfico 1 Grfico 2
-10
-5
0
5
10
15
0 5 10 15 20 25 30
Grfico 3
Coeficiente de correlao linear
um instrumento utilizado para a medida da correlao linear. Indica o grau de
intensidade entre duas variveis e ainda o sentido dessa correlao (positivo ou
negativo).
S deve ser utilizado com variveis contnuas.
Faremos o uso do coeficiente de correlao de Pearson.
Definio: Dado n pares de valores (x1, y1), (x2, y2), ..., (xn, yn), o coeficiente entre
as duas variveis X e Y dado pela mdia dos valores dos produtos padronizados das
variveis.
( ) ( )
( ) ( ) ( ) ( )



2
2
2
2
i i i i
i i i i
y y n x x n
y x y x n
r
6
3
-10
-5
0
5
10
15
20
25
30
0 5 10 15 20 25 30
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
A partir dos valores de R ou , podemos verificar o tipo da correlao existente
entre as variveis estudadas, conforme tabela seguinte:
Exerccios:
1) Considerando uma amostra aleatria, formada por dez dos 98 alunos de uma
classe da faculdade A e pelas notas obtidas por eles em Matemtica e Estatstica:
Matemtica (x) Estatstica (y)
1 5,0 6,0
8 8,0 9,0
24 7,0 8,0
38 10,0 10,0
44 6,0 5,0
58 7,0 7,0
59 9,0 8,0
72 3,0 4,0
80 8,0 6,0
92 2,0 2,0
Notas
Alunos
Calcule o coeficiente de correlao e interprete seu valor.
Matemtica (x) Estatstica (y) xy
1 5 6 30 25 36
8 8 9 72 64 81
24 7 8 56 49 64
38 10 10 100 100 100
44 6 5 30 36 25
58 7 7 49 49 49
59 9 8 72 81 64
72 3 4 12 9 16
80 8 6 48 64 36
92 2 2 4 4 4
Total 65 65 473 481 475
Notas
Alunos
2
i
x
2
i
y
6
4
Valor de R ou
Correlao
0,0 nula
0,0 ----| 0,3 fraca
0,3 ----| 0,6 media
0,6 ----| 0,9 forte
0,9 ----| 0,99 fortssima
1,0 perfeita
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
911 , 0
18 , 554
505
525 585
505
) 4225 4750 )( 4225 4810 (
4225 4730
) 65 475 10 )( 65 481 10 (
65 65 473 10
2 2

x
x x
x x
r
Grfico:
Grfico de disperso
0
2
4
6
8
10
12
0 2 4 6 8 10 12
Matemtica
E
s
t
a
t

s
t
i
c
a
Concluso: O resultado nos indica uma correlao linear positiva altamente significativa
entre as duas variveis.
Exerccios:
1) Observou-se que o volume mensal de lixo gerado em uma cidade, em funo do
nmero de dormitrios das residncias, o seguinte (em m
3
):
N
o
Dormitrios 1 2 3 4
Volume de lixo 0,15 0,29 0,45 0,57
a) Calcular o coeficiente de correlao de Pearson.
b) Interprete o grfico de disperso dessa relao.
Grfico de disperso
0,00
0,10
0,20
0,30
0,40
0,50
0,60
0 1 2 3 4 5
Nmero de dormitrios
V
o
l
u
m
e

d
e

l
i
x
o
6
5
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009

(2) REGRESSO
Objetivo: A regresso linear simples constitui uma tentativa de estabelecer uma equao
matemtica linear (linha reta) que descreva o relacionamento entre duas variveis.
Para obter uma reta de regresso, n pares de observaes das variveis so
utilizados. Considerando X como a varivel independente e Y como a varivel
dependente, a reta de regresso dada por:
Y = + X + u
o coeficiente linear, ou seja, o ponto onde a reta corta o eixo Y;
o coeficiente angular, ou seja, determina a inclinao da reta.
Graficamente:
u representa o incremento em Y quando X aumenta em uma unidade;
ESTIMADORES DE E PARA O MODELO DE REGRESSO
LINEAR
Os valores de a e b sero determinados, atravs do Mtodo dos Mnimos
Quadrados (MMQ). O objetivo encontrar a e b tal que a soma dos erros quadrticos
mdios seja o menor possvel.
O erro determinado por:
i i i
y y e
tal que
) (
i i i
bx a y e +
+ X + u
+ X

X X+1
Y
X
6
6
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
Os valores de a e b so encontrados atravs da seguinte frmula:
2
1
2
1

x n x
y x n y x
b
n
i
i
n
i
i i

x b y a


importante observar que:
- b mede a variao que ocorre em Y por unidade de variao de X.
- Quando no houver relao entre X e Y teremos

Y
Y , pois b=0
- Quando as relaes entre X e Y forem proporcionais, a reta passa na origem e
a = 0, logo

Y
bX
Exemplo:
Sejam duas variveis X e Y, entre as quais exista uma correlao acentuada, embora no
perfeita:
xi yi
5 6
8 9
7 8
10 10
6 5
7 7
9 8
3 4
8 6
2 2
Grfico de disperso
0
2
4
6
8
10
12
0 2 4 6 8 10 12
Podemos concluir que o grfico se trata de uma correo retilnea, de modo a
permitir o ajustamento de uma reta, imagem da funo Y = + X + u.
Ento, precisamos calcular os valores dos parmetros da equao
bX a Y +

que
uma estimativa da verdadeira equao da reta de regresso, onde

Y
o estimado.
6
7
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
xi yi xy x2
5 6 30 25
8 9 72 64
7 8 56 49
10 10 100 100
6 5 30 36
7 7 49 49
9 8 72 81
3 4 12 9
8 6 48 64
2 2 4 4
Total 65 65 473 481
n=10
mdias 6,5 6,5
8632 , 0
5 , 58
5 , 50
) 65 ( 473 10
5 , 6 5 , 6 10 473

2
2
1
2
1


x n x
y x n y x
b
n
i
i
n
i
i i
8892 , 0 5 , 6 8632 , 0 5 , 6

x b y a
Logo,
X Y 8632 , 0 8892 , 0 +

Para traar a reta: X=0 =>

Y
=0,89 X=5 =>

Y
= 0,89+5.0,86 = 5,19
Estimativa da reta de regresso
0
2
4
6
8
10
12
0 2 4 6 8 10 12
5
5,19
0,89
X Y 8632 , 0 8892 , 0 +

6
8
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
Exerccio:
Exemplo 1: Um laboratrio est interessado em medir o efeito da temperatura sobre a
potncia de um antibitico. Dez amostras de 50 gramas cada foram guardadas a
diferentes temperaturas, e aps 15 dias, mediu-se a potncia. Os resultados esto no
quadro abaixo.
Temperatura 30 36 50 54 60 73 78 82 91 95
Potncia 38 43 32 26 33 19 27 23 14 21
a) Qual a varivel dependente?
b) Qual a varivel independente?
c) Encontre os estimadores da reta de regresso.
d) Interprete seus valores.
6
9
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
Uma importante funo de determinar a reta de regresso para duas variveis a
possibilidade de realizar previses, ou seja, uma vez que obtemos a reta de regresso,
podemos escolher um valor de interesse para a varivel independente (X) e determinar o
valor esperado para a varivel dependente (Y).
Exemplo 1: Determinar a potncia do antibitico quando a exposio for de 65
o
C.
5677 , 27 65 * 3511 , 0 3892 , 50

Y .
COEFICIENTE DE DETERMINAO
Encontrar uma reta de regresso para duas variveis no significa encontrar o
melhor modelo matemtico para representar a relao entre elas. Isso porque podemos
calcular a equao para quaisquer duas variveis.
Uma das formas de determinar se o modelo encontrado satisfatrio para explicar
os dados calculando o COEFICIENTE DE DETERMINAO do modelo. Esse
coeficiente compara a variabilidade do modelo com a variabilidade total dos dados.
A variabilidade do modelo pode ser calculada como:
2
1
) (

n
i
i
y y
.
A variabilidade total pode ser calculada como:

n
i
i
y y
1
2
) (
.
Assim, o coeficiente de determinao R
2
, calculado da seguinte forma:

n
i
i
n
i
i
y y
y y
R
1
2
1
2
2
) (
) (
7
0
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
Exemplo 1: Calcular e interpretar o coeficiente de determinao R
2
para os dados do
primeiro exerccio.
Temperatura
(X)
Potncia
(Y)
Valores
preditos (
y
)
2
) ( y y
i

2
) ( y y
i

30 38 39.86 108.16 150.21
36 43 37.75 237.16 103.01
50 32 32.83 19.36 27.40
54 26 31.43 2.56 14.67
60 33 29.32 29.16 2.97
73 19 24.76 73.96 8.07
78 27 23.00 0.36 21.13
82 23 21.60 21.16 36.01
91 14 18.44 184.96 83.92
95 21 17.03 43.56 111.63
y
27,6

n
i
i
y y
1
2
) (
720,4

n
i
i
y y
1
2
) (
559,02
R
2
0,7759
Interpretao: o modelo X Y 3511 , 0 3892 , 50

explica 77,59% da variabilidade total


de Y. Em outras palavras, a variabilidade da potncia do antibitico 77,59% explicada
pela sua temperatura de armazenamento.
7
1
Instituto Federal de Educao, Cincia e Tecnologia RJ

Prof.: Janaina S. de Q. Pereira 1 Semestre/2009
EXERCCIO
Uma amostra de 5 ratos da raa Wistar foi obtida e suas idades (em dias) e pesos (em
gramas) so apresentados na tabela abaixo:
Idade (dias) Peso mdio (gramas)
30 63,94
34 74,91
38 81,65
42 95,05
46 105,89
a. Esboce um diagrama de disperso para essas variveis.
b. Calcule o coeficiente de correlao de Pearson.
c. Com base nos itens (a) e (b), voc acha que h relao entre as duas variveis? Que
tipo de relao essa?
d. Deseja-se obter uma reta que explique o peso mdio dos ratos em funo das suas
idades. Qual deve ser a varivel independente e qual deve ser a varivel dependente?
e. Obtenha e interprete a reta de regresso.
f. Calcule o coeficiente de determinao para a reta obtida. Voc acha que o modelo se
ajusta bem aos dados observados? Por qu?
g. Qual o peso mdio, em gramas, para ratos com 32, 40, 43 e 49 dias?
7
2

Das könnte Ihnen auch gefallen