Sie sind auf Seite 1von 32

1 Estatstica Descritiva

1.1 Denies e Conceitos em Estatstica


a) Estatstica: a cincia que se preocupa em tirar concluses de um todo com base em uma parte
do todo. Por meio dela possvel coletar, apresentar, analisar e interpretar um conjunto de
dados.
b) Censo: um estudo estatstico que resulta da observao de todos os indivduos da populao
relativamente a diferentes atributos pr-denidos. Teoricamente, no censo, tem-se a informao
precisa de uma varivel em estudo, enquanto na estatstica tem-se uma previso da ocorrncia
da varivel.
c) Diviso da Estatstica: A estatstica bsica pode ser dividida em duas reas:
Estatstica descritiva: descreve resumidamente um conjunto de dados, utilizando ta-
belas, grcos, medidas de posio e de disperso.
Exemplos: Velocidade de processamento de um computador; tempo de espera para ser
atendido em uma loja; opinio das pessoas quanto a violncia no pas; temperatura
mensal de uma cidade.
Estatstica Indutiva ou Inferncia Estatstica: representa o estudos dos dados de
amostras com o objetivo de entender ou tirar concluses sobre o comportamento da
populao a partir das amostras.
Exemplo: Suponha que se deseja calcular a voltagem necessria para que um dispositivo
eltrico chegue a falhar. Para isso, submete-se uma amostra de tais dispositivos a
voltagens cada vez mais elevadas, at falhar cada dispositivo da amostra. Com base
nos resultados, pode-se estimar a probabilidade de falha nos dispositivos, a cada
voltagem.
d) Dados de observao: so valores (realizaes) assumidos por uma varivel e observada pelo
pesquisador
e) Populao: conjunto de indivduos ou objetos que possuem pelo menos uma caracterstica
comum observvel.
Exemplos: Todos os eleitores do Brasil;
Todos os cidados que possui TV;
f ) Amostra: um subconjunto nito da populao que mantm as mesmas caractersticas desta
populao.
Exemplos: 3000 eleitores;
Cidados entrevistados pelo servio de televiso;
g) Varivel: uma caracterstica que pode assumir diferentes valores de indivduo para indivduo.
Variveis qualitativas: so aquelas para as quais uma medio numrica no pos-
svel e, apresentam como possveis realizaes uma qualidade ou atributo do indivduo
pesquisado.
Variveis quantitativas: so aquelas para as quais possvel realizar uma contagem
ou mensurao.
Variveis nominais: utilizadas quando no existe nenhuma ordenao nas possveis
realizaes.
1
Exemplos: Sexo (Feminino ou masculino), estado civil (Solteiro, casado, divorciado,
vivo), naturalidade (Uberlndia, Monte Alegre, Araguari), etc.
Variveis ordinais: utilizadas quando os seus possveis resultados podem ser ordenados
por algum critrio especico.
Exemplos: Grau de instruo de um indivduo (Ensino Mdio, graduao, ps-graduao),
classe social (Baixa, mdia, alta), classicao de um produto (regular, bom, timo)
etc.
Variveis discretas: assumem valores especcos, e geralmente esto relacionadas a
dados de contagem e associadas com o conjunto dos nmeros inteiros.
Exemplos: Nmero de lhos de um casal, nmero de acidentes ocorridos em uma
determinada rodovia, nmero de moradores de uma residncia, etc.
Variveis contnuas: assumem innitos valores dentro de um intervalo, e esto asso-
ciadas em geral, com os nmeros reais e relacionadas a medies.
Exemplos: Estatura de um indivduo, temperatura de uma cidade, produo de uma
cultura, etc.
h) Dados Brutos: so os dados de observao sem nenhuma observao lgica.
i) Dados elaborados ou rol: so os dados de observao em ordem crescente ou decrescente.
j) Amplitude Total(A): a diferena entre o maior valor observado e o menor valor observado.
A = X
(n)
X
(1)
= maior valor observado - menor valor observado.
Apresentao dos dados
A organizao, sumarizao e descrio de dados podem ser feitas por meio dos mtodos tabulares
e grcos.
1.2 Distribuio de Frequncias:
Uma distribuio de frequncia um sumrio tabular dos dados que mostra o nmero (frequncia)
de itens em cada uma das classes ou categorias no sobrepostas.
Tipos de frequncias
a) Frequncia Absoluta (f
i
): o nmero de vezes que o indivduo aparece na amostra
b) Frequncia Relativa (f
r
): fr =
f
i
n
, em que n o nmero de observaes, ou seja,
n =
k

i=1
f
i
, sendo k o nmero de classes ou categorias.
c) Frequncia Percentual (f
p
): f
p
= f
r
100:
d) Frequncia Acumulada (F
i
): indica o nmero de dados que possuem valores menores
ou maiores, ou ento iguais ao limite superior de cada classe.
Algoritmo para construo da distribuio de frequncias para variveis quantita-
tivas
a) Calcular a Amplitude Total (A): A = X
(n)
X
(1)
;
b) Calcular o nmero de classes (k): k =

n se n 100; k = 5logn se n > 100. Em ambos
os casos deve-se escolher o nmero inteiro mais prximo;
2
c) Calcular a amplitude da Classe (C): C =
A
k1
;
d) Calcular o limite inferior da primeira classe (LI
1
a): LI
1
a = X
(1)
;
e) Organizar as classes e contar as frequncias;
Observaes:
1. Os intervalos das classes podem se classicar em: abertos(]a,b[ ou a b) de modo que
os limites da classe no pertencem a ela; fechados ([a,b] ou a b) em que os limites da
classe pertencem a ela ou mistos ([a,b[ ou a b)no qual um dos limites pertence classe,
e o outro, no;
2. Por questes de ordem prtica e esttica, sugere-se utilizar de 5 a 20 classes;
3. As frequncias simples so representadas por letras minsculas e as frequncias acumula-
das por letras maisculas;
4. No caso de variveis discretas, quando a amplitude total das observaes pequena, cada
valor adotado como sendo uma classe, e nestes casos, o algoritmo apresentado no
utilizado;
5. Para determinados clculos estatsticos, todos os pontos de uma classe podem ser repre-
sentados pelo ponto mdio da classe. O ponto mdio da classe i ( x
i
) calculado pela
mdia dos limites da classe. Esse critrio conhecido como hiptese tabular bsica.
Exemplos:
1. Uma pesquisa foi realizada para vericar a preferncia dos consumidores em uma cidade quanto
aos cinco tipos de refrigerantes: coca-cola(C), fanta(F), pepsi-cola(P), sprite(S) e Guaran(G),
obtendo os seguintes dados:
F C C F P P C G C F
C S C F C F C S P C
C P C S G P F P C C
P G P C P G S C C P
a) Classicar a varivel;
b) Obter a distribuio de frequncias;
2. Para facilitar um projeto de ampliao da rede esgoto de um certo bairro, as autoridades
tomaram uma amostra de tamanho 36 dos 270 quarteires que compem a regio em estudo,
e foram encontrados os seguintes nmeros de casas por quarteiro:
15 27 22 36 13 29
23 45 15 18 16 25
26 10 34 23 27 44
20 30 21 32 16 34
14 20 17 24 25 26
17 25 36 22 42 29
a) Classicar a varivel;
b) Colocar os dados em rol;
c) Construir a distribuio de frequncias;
d) Obter as frequencias acumuladas Abaixo de e Acima de;
3
3. Um estudo apresentou informaes sobre a tecnologia dos aparelhos domsticos e sua utilizao
por pessoas de 12 anos ou mais. Os dados a seguir referem-se ao nmero de horas de uso de
computadores pessoais durante uma semana para uma amostra de 50 pessoas:
1,5 1,6 1,6 2,0 2,8 3,0 3,1 3,1 3,1 3,3
3,4 3,5 3,7 3,7 3,9 3,9 4,0 4,1 4,1 4,1
4,1 4,2 4,3 4,4 4,7 4,8 5,4 5,6 5,7 5,7
5,7 5,9 5,9 6,1 6,1 6,1 6,2 7,1 7,2 7,6
8,8 9,5 10,3 10,3 10,4 10,4 10,8 11,1 12,1 12,9
a) Classicar a varivel em estudo;
b) Construir a distribuio de frequncias;
1.3 Representaes grcas:
Variveis contnuas:
a) Histogramas: um grco de colunas justapostas, no qual a varivel contnua, dividida
em classes, representada no eixo horizontal. No eixo vertical, marcam-se as freqncias
relativas ou percentuais de cada classe, construindo as colunas.
b) Polgono de frequncias: so segmentos de retas que tem suas extremidades correspon-
dentes ao ponto mdio da classe e a coordenada y da extremidade ser proporcional a
frequncia da classe.
c) Grco da frequncia acumulada (ogiva): so grcos construdos a partir da dis-
tribuio de frequncias acumuladas. No caso das variveis continuas, utiliza-se linhas
contnuas.
d) Histogramas com amplitudes de classes desiguais: se a distribuio de frequncias
possuir amplitudes de classes desiguais, deve-se fazer um ajuste de frequncias antes de
construir o histograma. Esse procedimento garante a proporcionalidade das reas entre
as diferentes classes. As correes das frequncias so realizadas por meio das densidades
de frequncias (d.f), ou seja, substituindo a frequncia da classe i pela df
i
, dada por:
df
i
= f
i
/C
i
.
Exemplos:
1. A distribuio de frequncias abaixo refere-se ao preo em reais das refeies por quilo de
25 restaurantes prximo a UFU:
Preo das refeies (R$) f
i
f
r
f
p
10 13 1 0,04 4
13 16 4 0,16 16
16 19 12 0,48 48
19 22 6 0,24 24
22 25 2 0,08 8
Total 25 1,00 100
Pede-se:
a) Interpretar a distribuio de frequncias;
b) Construir o histograma e o polgono de frequncias;
c) Calcular as frequncias acumuladas e construir o grco correspondente (ogivas).
4
2. Considere a seguir a distribuio de 130 empresas classicadas segundo o nmero de
empregados:
Nmero de Empregados f
i
0 20 10
20 40 30
40 80 60
80 160 30
Construir o histograma para esses dados;
Variveis discretas:
a) Grco de linhas: para as variveis discretas a representao grca conveniente para
as frequncias simples o grco de linhas, pois s ocorre frequncias nos pontos xos,
ou seja, no existe a continuidade.
b) Grco de frequncias acumuladas: so grcos construdos a partir das frequncias
acumuladas e no caso discreto, assume um aspecto de escadas.
Exemplos:
1. O setor pessoal de uma empresa brasileira registrou os seguintes nmeros de faltas de
funcionrios em uma semana do ms de julho/2010:
Nmero de faltas f
i
2 2
3 3
4 8
5 5
6 2
Total 20
Com base nestes dados:
a) Construir o grco de linhas;
b) Obter as frequncias acumuladas e representar gracamente as frequncias acu-
muladas;
Outras representaes grcas:
a) Grco de setores: compara as partes estudadas com o todo, sendo apresentado em
porcentagens sobre a forma de setores em circulo e indicado para representar variveis
qualitativas.
b) Ramos e folhas: so os grcos construdos com os valores observados. Trata-se da dis-
posio em rol dos dados, com base no isolamento de um algarismo mais signicativo,
denominado galho (por exemplo, dezena), e de algarismos menos signicativos, denomi-
nados folhas (por exemplo, unidades).
c) Grco de barras: similar ao histograma, possuindo o objetivo de apresentar as frequn-
cias sob a forma de barras horizontais ou verticais, separadas entre si. Os dados podem
ser nominais ou quantitativos (agrupados em classes ou no).
d) Grcos de pontos (disperso): usado em estudos de correlao, permitindo vi-
sualizar o grau de associao entre duas variveis quantitativas medidas em um mesmo
indivduo. Cada par de observaes representado por um ponto (x,y) do sistema de
coordenadas cartesianas.
5
e) Grco Box-plot: um dos mais usados grcos da estatstica e fornece ideias sobre as
medidas de posio, disperso, assimetria, caudas e dados discrepantes.
Exemplos:
1. Uma pesquisa foi realizada com o objetivo de vericar o estado de procedncia dos alunos
matriculados na rea de exatas na UFU, obtendo os seguintes resultados:
Estado f
p
ngulo(graus)
MG 62
SP 17
GO 14
Outros 7
Total 100
Representar essas informaes em um grco de setores.
2. Os dados abaixo referem-se ao nmero de quartos ocupados diariamente num hotel de
praia durante o ms de janeiro:
55 49 37 57 46 40 64 35 73 62
61 43 72 48 54 69 45 78 46 59
40 58 56 49 42 62 53 46 81 52
Represente os dados atravs de um grco de ramos e folhas.
3. Utilizando as informaes do exemplo 1, construa um grco de barras.
4. Um estudo realizado em 5 cidades mineiras vericou que o nmero de lhos de 50 famlias
pode ser representado pela tabela a seguir:
Nmero de lhos f
i
f
r
f
p
1 14 0,28 28
2 18 0,36 36
3 12 0,24 24
4 6 0,12 12
Total 50 1 100
Esboar o grco de barras para esses dados.
5. Os dados a seguir foram obtidos num estudo sobre a relao entre a resistncia (ohms) e
o tempo (min) que certos resistores sobrecarregados levam para falhar.
Resistncia 33 36 30 44 34 25 40 28 40 46
Tempo 39 36 34 51 36 21 45 25 45 36
Verique, por meio do diagrama de disperso, a relao existente entre a resistncia e o
tempo de falha.
1.4 Interpolaes em tabelas de distribuio de frequncias:
Exemplo: A tabela a seguir representa a distribuio de salrios em uma empresa:
Salrios fa
7,50 10,50 14
10,50 13,50 17
13,50 16,50 11
16,50 19,50 8
Total 50
a) Qual a % de funcionrios que ganham mais de 13,50 salrios?
b) Qual a % de funcionrios que ganham entre 8 e 12 salrios?
6
1.5 Natureza da distribuio de frequncias:
a) Simtrica: 50% das observaes esto abaixo do valor central e 50% acima.
b) Assimtrica direita: maioria dos valores esto concentrados esquerda da distribuio.
c) Assimtrica a esquerda: maioria dos valores esto concentrados a direita da distribuio.
d) Multimodal: vrios picos de frequncia.
1.6 Tcnicas de somatrio
Dada as variveis X
i
e Y
j
(i = 1,2, , n), (j = 1,2, , m) e a constante k, temos:
a)
n

i=1
X
i
= x
1
+x
2
+ +x
n
b)
n

i=1
m

j=1
X
i
Y
j
= x
1
y
1
+x
1
y
2
+ +x
n
y
m
c)
n

i=1
X
i
m

j=1
Y
j
= (x
1
+x
2
+ +x
n
)(y
1
+y
2
+ +y
m
)
d)
n

i=1
X
2
i
= x
2
1
+x
2
2
+ +x
2
n
e) (
n

i=1
X
i
)
2
= (x
1
+x
2
+ +x
n
)
2
f )
n

i=1
k = k +k + +k = nk
g)
n

i=1
kX
i
= kx
1
+kx
2
+ +kx
n
= k
n

i=1
X
i
1.7 Medidas de posio
As medidas de posio ou de tendncia central constituem uma forma mais sinttica de apresentar
os resultados contidos nos dados observados, pois representam um valor central, em torno do qual os
dados se concentram. Portanto, constitui como objetivo ao obter as medidas de posio, encontrar
um nico valor, em um conjunto de valores observados, que seja representante desse conjunto. As
medidas de posio mais empregadas so a mdia, a mediana e a moda.
a) Mdia aritmtica ( x): uma medida de fcil compreenso, mais comum e simples de ser
calculada.
i) Dados no agrupados: x =
n

i=1
x
i
n
ii) Dados agrupados: x =
k

i=1
x
i
f
i
n
, em que x
i
o ponto mdio da classe i;
7
Observao:
1. Nas distribuies de frequncias, assume-se a hiptese de que todas as observaes
contidas em uma classe so consideradas iguais ao ponto mdio da classe.
Exemplos:
1. O nmero de peas defeituosas observado em amostras retiradas diariamente da linha
de produo de uma indstria, durante uma semana foi de: 10, 14, 13, 15, 16, 18 e 12
peas. Calcular o nmero mdio de peas defeituosas por dia desta semana avaliada.
2. Considere os nmeros de gols por partida em um determinado campeonato de futebol,
agrupados e apresentados na sequncia. Calcule o nmero mdio de gols por partida.
N
o
de gols por partida f
i
0 7
1 12
2 16
3 12
4 9
5 2
6 2
Total 60
3. Para a distribuio de frequncias que representa a fora de ruptura em libras por
polegada quadrada (psi) da garrafas descartveis de um litro de refrigerante, calcular
a mdia.
Classes f
i
86,6 147 1
147 208 6
208 269 13
269 330 8
330 390 2
Total 30
Propriedades da mdia aritmtica:
1. A soma dos desvios (SD) de um conjunto de dados em relao a sua mdia nula.
2. A soma dos quadrados dos desvios de um conjunto de dados em relao a uma
constante k mnima se e somente se k= x.
3. Somando ou subtraindo uma constante k a cada valor observado, a mdia do novo
conjunto de dados car somada ou subtrada da constante k, em relao a mdia
inicial.
4. Multiplicando ou dividindo-se cada valor observado por uma constante k a nova
mdia car multiplicada ou dividida por k.
b) Outros tipos de mdia:
1. Mdia Ponderada ( x
p
): essa mdia associa as observaes x
1
, x
2
, , x
n
determinadas
ponderaes ou pesos que dependem da importncia atribuda a cada uma das observa-
es.
x
p
=
n

i=1
w
i
x
i
n

i=1
w
i
=
w
1
x
1
+w
2
x
2
+ +w
n
x
n
w
1
+w
2
+ +w
n
,
8
sendo w
i
o peso da observao i.
2. Mdia Geomtrica (G): utilizada para representar variveis assimtricas a direita, pois
nestes casos, a mdia aritmtica, por ser muito inacionada pelos valores extremos, no
representa bem a varivel.
G =
n

x
1
.x
2
. .x
n
ou ainda logG =
1
n
(logx
1
+logx
2
+ logx
n
)
3. Mdia Harmnica (H): utilizada para variveis que apresentam periodicidade, ou seja,
uma variao harmnica como por exemplo, ondas de rdio, variao de preos, entres
outros.
H =
n
n

i=1
1/x
i
Exemplos:
1. Suponha que uma indstria realizou ao longo dos ltimos trs meses cinco compras
de determinada matria prima:
Compra Custo por quilo (R$) Quantidade Quilos
1 3 1200
2 3,40 500
3 2,80 2750
4 2,90 1000
5 3,25 800
Deseja-se obter informaes sobre o custo mdio por quilo da matria prima.
Qual esse custo mdio?
2. Sabe-se que os multiplicadores de crescimento anual de consumo de um determinado
servio telefnico foram iguais a 1,2; 1,8; 2,7; 0,9; 1,5; 2,3 e 0,7. Calcular a mdia
aritmtica, geomtrica e harmnica.
c) Mediana(Md): a realizao que ocupa a posio central de um conjunto de dados ordenados.
Ou seja, abaixo da mediana devero estar 50% dos elementos analisados e acima da mediana
devero estar 50% dos dados analisados.
i) Dados no agrupados: O valor da mediana depende da quantidade n de elementos
presentes no conjunto de dados. Se o nmero de dados for mpar a mediana ser igual
ao valor central. No caso de nmeros de dados par a mediana ser dada pela mdia
aritmtica entre os dois valores centrais.
Matematicamente, a mediana denida como:
Md =
_
x
(n+1)/2
se n mpar
x
(
n
2
)
+x
(
n+2
2
)
2
se n par
ii) Dados agrupados:
Md = LI +
0,5nF
i
f
Md
.C
em que:
LI o limite inferior da classe mediana;
F
i
a frequncia acumulada das classes anteriores a classe mediana;
9
f
Md
a frequncia da classe mediana;
C a amplitude da classe mediana;
n o nmero de observaes e classe mediana a classe onde se encontra o indivduo
mediano.
Exemplos:
1. Os preos em reais para uma amostra de aparelho de ar condicionado so: 500, 840,
470, 480, 420, 440 e 440. Calcular a mediana.
2. O peso de mancais produzidos por um processo de fundio est sendo estudado.
Uma amostra de seis mancais foi medida, resultando nos seguintes pesos: 1,18; 1,21;
1,19; 1,17; 1,20 e 1,21. Obter a mediana.
3. Utilizando novamente os dados referente aos nmeros de gols por partida em um
campeonato de futebol, calcular a mediana desses valores:
N
o
de gols por partida f
i
0 7
1 12
2 16
3 12
4 9
5 2
6 2
Total 60
4. Suponha que a renda familiar em salrios mnimos de uma amostra com 72 traba-
lhadores pudesse ser representada segundo a tabela:
Classe f
i
1 2 13
2 4 22
4 6 18
6 8 7
8 10 8
10 12 4
Total 72
Calcular a mediana.
d) Moda(Mo): o valor que ocorre com maior frequncia entre os valores observados. Em um
conjunto de dados, pode existir mais de uma moda ou no ter nenhum valor modal.
i) Dados no agrupados: o valor que aparece repetido mais vezes.
ii) Dados agrupados: Se os dados encontram-se em uma distribuio de frequncia, procede-
se das seguintes formas:
utilizao de frmula:
Mo = LI +

1

1
+
2
.C,
em que: LI o limite inferior da classe modal;

1
a diferena entre a frequncia da classe modal e a frequncia da classe imediatamente
inferior;

2
a diferena entre a frequncia da classe modal e a frequncia da classe posterior;
C amplitude da classe modal e classe modal a classe de maior frequncia.
10
utilizao do ponto mdio da classe modal:
Mo =
LI +LS
2
,
em que: LI o limite inferior da classe modal e LS o limite superior da classe modal
utilizao do mtodo geomtrico:
Observaes:
1. Quando o mtodo geomtrico utilizado, a moda tender para o limite inferior ou
superior da classe modal a medida que o valor da frequncia da classe anterior for
maior que a d posterior ou a frequencia da classe posterior for maior que a da anterior,
respectivamente. Se as classes anterior e posterior a classe modal tiverem a mesma
frequncia, ento a moda ser o ponto mdio da classe.
2. As propriedades (3) e (4) da mdia aritmtica tambm so vlidas para a mediana e
a moda.
Exemplos:
1. Durante o ms de setembro de um certo ano, o nmero de acidentes por dia em um
certo trecho da rodovia, apresentou os seguintes valores:
0 0 0 0 0 1 1 1 1 1
1 1 1 1 1 1 2 2 2 2
2 2 2 2 3 3 3 4 4 6
Qual a moda de acidentes por dia?
2. Determine a moda para os seguintes conjuntos de dados:
a) 150, 155, 157, 160, 160, 163, 165, 165, 170
b) 10, 12, 14, 15, 16, 19, 21
3. Considere os dados amostrais do nmero de circuitos defeituosos em um sistema
composto por 4 circuitos. Uma amostra de 19 sistemas foi coletada, obtendo os
seguintes dados:
Nmero de circuitos defeituosos f
i
1 10
2 7
3 1
4 1
Total 19
Determinar a moda, ou seja, o nmero modal de circuitos defeituosos por sistema.
4. O quadro a seguir representa a distribuio de frequncias do peso (kg) de pessoas
de uma certa faixa etria:
Peso f
i
40 45 3
45 50 8
50 55 16
55 60 12
60 65 7
65 70 3
70 75 1
Total 50
Calcular a moda e interpretar.
11
1.8 Relao entre, x, Md e Mo
a) Se x = Md = Mo: Distribuio simtrica
b) Se x > Md > Mo : Distribuio assimtrica direita.
c) Se x < Md < Mo: Distribuio assimtrica esquerda.
1.9 Separatrizes (Quartis)
Se um conjunto de dados organizado em rol, o valor central ou a mdia entre os dois valores
centrais foi denido como a mediana. Por extenso desse conceito de mediana, pode-se pensar nos
valores que dividem o conjunto em quatro partes iguais, e teremos os quartis (Q
1
, Q
2
, Q
3
). O quartil
Q
2
coincide com a mediana. Podemos ainda ter os decis que dividem os dados ordenados em 10 (D
1
,
D
2
, ..., D
9
) conjuntos iguais, ou os percentis que os dividem em 100 partes iguais (P
1
, P
2
, ..., P
99
).
Desse modo, segue que: Q
2
= D
5
= P
50
= Md; P
75
= Q
3
; P
25
= Q
1
.
Clculo do p-simo percentil:
1. Organize os dados em rol e calcule o ndice (i): i =
_
p
100
_
n, em que p o percentil
procurado e n o nmero de observaes.
2. Se i no for um nmero inteiro, arredonde-o para cima. Esse nmero denomina a posio
do p-simo percentil.
3. Se i for um nmero inteiro, o p-simo percentil ser a mdia dos valores nas posies i e
i + 1.
Exemplos:
1. As notas nais de nove alunos em uma determinada disciplina so iguais a: 89,88, 94, 65,
42, 73, 66, 66 e 35. Calcular e interpretar os quartis.
2. Os slarios dos empregados de uma indstria so: 2710, 2755, 2850, 2880, 2880, 2890,
2920, 2940, 2950, 3050, 3130 e 3325. Determine os quartis e o 85
o
percentil.
1.10 Medidas de disperso
Sabemos que sucessivas realizaes de um fenmeno no produzem o mesmo resultado. Por
exemplo, o desempenho de consumo do carro no o mesmo para cada tanque de combustvel.
Existe uma variabilidade nos resultados que nesse caso pode depender de vrios fatores como tipo
de estrada, marca do combustvel, condies climticas, desgaste do veiculo com o tempo, entre
outras. Dessa forma, resumindo o conjunto de dados em uma nica medida de posio, no se tem
ideia dessa variabilidade. Assim, necessrio obter uma medida que nos indique o quanto os dados
se encontram dispersos em torno da regio central, ou da mdia, sendo a medida de disperso usada
para esse m.
Exemplo:
Trs grupos de alunos submeteram-se a um teste, obtendo as seguintes notas:
Grupo A: {1, 8, 10, 10, 11, 12, 18} x
A
= 10; Md
A
= 10; Mo
A
= 10
Grupo B: {1, 2, 10, 10, 10, 13, 24} x
B
= 10; Md
B
= 10; Mo
B
= 10
Grupo C: {10, 10, 10, 10, 10, 10, 10} x
C
= 10; Md
C
= 10; Mo
C
= 10
12
A mdia, a mediana e a moda so iguais, mas os trs grupos apresentam comportamento dife-
renciado. O grupo C mais homogneo e o grupo B o que apresenta a maior variao das notas.
Nesse caso a variabilidade que distinta nos trs grupos no pode ser identicada apenas com as
medidas de posio, seria necessrio uma medida de disperso. As principais medidas de disperso
so: a amplitude total, a varincia e o desvio padro, o coeciente de variao e o erro padro da
mdia.
a) Amplitude total (A): corresponde a diferena entre a maior (mximo) e a menor observao
(mnimo) de um conjunto de dados.
i) Dados no agrupados: A = X
(n)
X
(1)
;
ii) Dados agrupados: A = x
k
x
1
, em palavras, a diferena entre o ponto mdio da ltima
classe e o ponto mdio da primeira classe.
Exemplos:
1. Encontre a amplitude total do conjunto de dados: 2, 3, 3, 5, 5, 5, 8, 10 e 12.
2. Utilizando o exemplo da distribuio de frequncias do peso (kg) de pessoas de uma
certa faixa etria, calcular a amplitude total:
Peso f
i
40 45 3
45 50 8
50 55 16
55 60 12
60 65 7
65 70 3
70 75 1
Total 50
Problemas associados a esta medida:
1. No considera todas as observaes no clculo;
2. No se tem ideia do comportamento dos dados entre os extremos;
3. Apresenta muita variao de uma amostra para outra, mesmo que ambas sejam
extradas da mesma populao.
Caractersticas desejadas em uma medida de disperso:
1. Considera todas as observaes no clculo;
2. facilmente calculvel e compreensvel;
3. Deve estar exposta o menos possvel as utuaes das amostras.
b) Varincia(s
2
) e desvio padro(s):
i) Dados no agrupados: s
2
=
Soma de quadrados dos desvios (SQD)
n1
=
n

i=1
(x
i
x)
2
n1
;
Desenvolvendo a soma de quadrados dos desvios e aplicando algumas propriedades algbricas,
obtm-se que: s
2
=
n

i=1
x
2
i

_
n

i=1
x
i
_
2
n
n1
.
13
ii) Dados agrupados: s
2
=
k

i=1
x
2
i
f
i

_
k

i=1
x
i
f
i
_
2
n
n1
Observaes:
1. O desvio padro (s) denido como sendo a raiz quadrada positiva da varincia, ou
seja, s =

s
2
;
2. Quanto as unidades dessas medidas de disperso, tem-se que o desvio padro possui
a mesma unidade dos dados, enquanto a varincia tem a unidade dos dados elevada
ao quadrado. Para a varincia a unidade no tem signicado fsico por estar ao
quadrado, o que diculta a interpretao
Exemplos:
1. Os dados a seguir referem-se a produo, em toneladas, de um certo produto de uma
indstria:
50 280 560 170 180 500 250 200 1050 240
180 1000 1100 120 420 510 480 90 870 360
Calcular a produo mdia da indstria, varincia e desvio padro.
2. Uma inspeo feita em uma amostra de 30 embalagens, cada uma contendo uma dzia
de ovos, ao serem transportados de uma granja at o local destinado, apresentou os
seguintes nmero de ovos danicados:
Nmero de ovos quebrados f
i
0 13
1 9
2 3
3 3
4 1
5 1
Total 30
Determinar a varincia.
3. Um estudo foi realizado para investigar a quantidade (em milhes) de passageiros
transportados em diferentes pocas do ano por uma grande empresa de transporte
urbano:
Classes f
i
1,5 4,5 5
4,5 7,5 10
7,5 10,5 12
10,5 13,5 6
13,5 16,5 7
Total 40
Pede-se: Determinar a mdia e o desvio padro.
Propriedades da varincia e do desvio padro:
1. Somando-se ou subtraindo-se uma constante k a cada observao, a varincia e o
desvio padro no se alteram.
2. Multiplicando-se ou dividindo-se cada observao por uma constante k, a nova vari-
ncia car multiplicada ou dividida por k
2
, e o novo desvio por k.
14
3. A varincia de uma constante igual a zero.
4. A varincia e o desvio padro so sempre positivos, e so usados todos os valores
observados em seu clculo.
c) Coeciente de variao: Conjuntos de dados com diferentes unidades de medida, ou mesmo
para uma nica unidade, se os conjuntos de dados possuem mdias diferentes, suas variabilida-
des no podem ser comparadas pela varincia ou desvio padro. Uma medida de variabilidade
que no depende desses fatores o coeciente de variao, que no possui unidade de medida
e pode ser calculado pela frmula:
CV =
s
x
100.
Exemplos:
1. Uma pesquisa sobre temperatura (
o
C) e presso (atm) em uma caldeira industrial
mostrou os seguintes resultados:
T(
o
C) 400 450 350 500 600 550
P(atm) 40 52 37 67 70 72
a) Calcular a mdia e o desvio padro para cada varivel;
b) Que atributo apresenta maior variabilidade?
2. Numa empresa, o salrio mdio dos homens de R$4000, com desvio padro de
R$1500, e o das mulheres e em mdia R$3000, com desvio padro de R$1200. Qual
salrio apresenta maior variabilidade?
d) Erro padro da mdia (s
x
): uma medida de disperso que mede a preciso com que a mdia
amostral foi calculada. Quanto menor for seu valor, mais provvel ser a chance de obter a
mdia da amostra nas proximidades da mdia da populao. O erro padro da mdia dado
por:
s
x
=
s

n
Observe que se n s
x
0
Exemplo:
1. Em um estudo sobre a acidez de algumas solues, o ph de um certo produto foi
medido, obtendo os seguintes resultados:
5,1 5,3 5,2 5,5 4,9
6,2 6,0 5,8 5,3 5,0
5,1 5,4 5,1 6,1 5,6
5,4 5,8 5,7 5,5 5,1
a) Calcular o erro padro da mdia usando as duas primeiras linhas dos dados;
b) Agora, utilize todos os dados;
15
2 Probabilidade
Neste captulo sero abordados os conceitos de probabilidade que do suporte para o estudo de
estatstica e experimentao. Quando fala-se de probabilidade, pretende-se identicar a chance de
ocorrncia de um determinado resultado de interesse, em situaes nas quais no possvel calcular
com exatido o valor real do evento. Desta forma, trabalha-se com chances ou probabilidades.
2.1 Conceitos
a) Experimento aleatrio: consiste em um experimento que pode ser efetuado repetidas vezes,
sob as mesmas condies de realizao, mas cujos resultados no so essencialmente os mesmos
em todas as repeties.
Exemplos:
1. Lanamento de uma moeda ou dado;
2. Tempo de vida til de um componente eletrnico;
3. Nmero de chamadas telefnicas que chegam a uma central em um intervalo de
tempo;
b) Espao amostral () : conjunto formado por todos os resultados possveis de um experimento.
c) Evento: um subconjunto do espao amostral.
Exemplos:
1. Uma fbrica produz determinado artigo. Da linha de produo so retirados trs
artigos, e cada um classicado como bom (B) ou defeituoso (D). Qual o espao
amostral associado a esse experimento? Se A denido como sendo dois artigos
bons, quais so os elementos pertencentes a esse evento?
2. Qual o espao amostral associado a um experimento que consiste em determinar
o tempo de decomposio industrial em um aterro sanitrio? Se A o evento o
tempo de decomposio est entre dois e doze anos, como pode ser representado
esse evento?
2.2 Operaes de conjuntos
As operaes com conjuntos podem ser aplicadas aos eventos. Ento dene-se:
a) Evento interseo (AB): o conjunto formado pelos resultados que pertencem aos eventos
A e B simultaneamente.
b) Evento unio (A B): o evento formado pelos resultados de A ou B, ou seja, os resultados
que pertencem a pelo menos um dos eventos.
c) Evento complementar (

A ou A
c
): o evento formado pelos resultados que no pertencem
ao evento considerado.
d) Evento mutuamente exclusivo: Dois eventos so mutuamente exclusivos se e somente se
A B = .
Se a unio de n eventos mutuamente exclusivos o prprio , temos que tais eventos formam
uma partio de .
16
2.3 Denio e axiomas de probabilidade
Probabilidade: a denio clssica de probabilidade nos diz que a probabilidade de ocorrer o
evento A denida como:
P(A) =
nmeros de casos favorveis
nmeros de casos possveis
=
A

=
n
N
Exemplos:
1. Qual a probabilidade de se retirar dois ou mais artigos bons, no experimento que tem por
nalidade classicar os artigos da linha de produo de uma fbrica?
2. Qual a probabilidade de obter duas caras em duas jogada de uma moeda?
Axiomas de Probabilidade:
Axioma 1: A probabilidade de um certo evento ocorrer corresponde a um nmero no ne-
gativo, ou seja, P(A) 0.
Axioma 2: A probabilidade de ocorrer todo o espao amostral igual a um, isto , P() = 1.
Axioma 3: Se A
1
, A
2
, , A
n
so eventos mutuamente exclusivos, P(A
1
A
2
A
n
) =
P(A
1
) +P(A
2
) + +P(A
n
)
A partir desses axiomas, pode-se enunciar as seguintes propriedades, que so teis no clculo de
probabilidades:
Propriedade 1: 0 P(A) 1, evento A .
Propriedade 2: P() = 0
Propriedade 3: Se A
1
A
2
, ento P(A
1
) P(A
2
)
Propriedade 4: P(A
c
) = 1 P(A)
Propriedade 5: P(A
1
A
2
) = P(A
1
) +P(A
2
) P(A
1
A
2
)
Exemplos:
1. Suponha que o seguinte quadro represente uma possvel diviso de alunos matriculados
na UFU em um determinado semestre:
Sexo
Cursos Masculino (M) Feminino (F) Total
Engenharia (E) 70 40 110
Matemtica (MT) 15 15 30
Qumica (Q) 10 20 30
Computao (C) 20 10 30
Total 115 85 200
Calcular:
a) A probabilidade de uma pessoa selecionada aleatoriamente estar matriculada em
engenharia;
17
b) P(M)?
c) P(MT M)?
d) P(E C)?
e) P(Q
c
)?
2. Considere um experimento e os eventos A e B associados a este experimento. Seja
P(A)= 1/2; P(B)= 1/3 e P(A B)= 1/4. Calcule:
a) P(A
c
);
b) P(A B);
c) P(A
c
B
c
);
d) P(A
c
B
c
);
e) Qual a probabilidade que B ocorra e A no ocorra.
2.4 Anlise Combinatria
Nem sempre possvel enumerar o espao amostral. Nestes casos, deve-se usar a anlise combi-
natria como processo de contagem. Nas combinaes estamos interessados somente em selecionar
objetos sem nos preocuparmos com a ordem. Assim, o nmero total de combinaes de n objetos
selecionados dentre os N objetos distintos, denotado por
_
N
n
_
:
_
N
n
_
=
N!
n!(Nn)!
.
Exemplos:
1. Em um congresso cientco existem 15 engenheiros e 12 arquitetos. Qual a probabili-
dade de se formar uma comisso com cinco membros, na qual gurem 3 engenheiros e 2
arquitetos?
2. Suponha que num lote com 20 peas existam 5 defeituosas, e escolhemos 4 peas do lote
ao acaso. Qual a probabilidade de se escolher duas peas defeituosas na amostra?
2.5 Probabilidade Condicional e Independncia
2.5.1 Probabilidade Condicional
Algumas vezes, as probabilidades necessitam ser reavaliadas medida que informaes adicionais
se tornam disponveis. Uma maneira de incorporar informao adicional em um modelo de probabi-
lidade considerar que o resultado gerado um elemento de um dado evento. Esse evento, denotado
por B, dene as condies em que se sabe que o resultado satisfatrio. Ento, as probabilidades
podem ser revistas de modo a incluir esse conhecimento. A probabilidade de um evento A, sabendo
qual ser o resultado do evento B, dada por P(A/B) e chamada de probabilidade condicional de
A dado B.
Desse modo, a probabilidade condicional P(A/B) denida como:
P(A/B) =
P(A B)
P(B)
com P(B) = 0
Analogamente,
P(B/A) =
P(B A)
P(A)
com P(A) = 0
Dessas expresses possvel denir a regra do produto de probabilidade:
P(A B) = P(B)P(A/B) = P(A)P(B/A)
18
Exemplos:
1. Utilizando os dados dos alunos matriculados em uma universidade, determine: Sabendo
que uma pessoa selecionada ao acaso est matriculada em matemtica, qual a probabili-
dade que ela seja do sexo masculino?
2. Num certo colgio, 4% dos homens e 1% das mulheres tm mais de 1,75 de altura. 60%
dos estudantes so mulheres. Um estudante escolhido ao acaso e tem mais de 1,75m.
Qual a probabilidade de que seja homem?
2.5.2 Eventos independentes
Da regra do produto de probabilidades, surge a denio de eventos independentes.
Dois eventos A e B so independentes se e somente se P(A/B) = P(A) ou P(B/A) = P(B).
Assim, se A e B forem independentes, temos:
P(A/B) =
P(A B)
P(B)
= P(A B) = P(A/B)P(B) = P(A B) = P(A)P(B)
Generalizando, vrios eventos so independentes entre si, se forem independentes dois a dois, ou
ainda: P(A B W) = P(A)P(B) P(W)
Exemplos:
1. Suponha que trs componentes de um sistema eltrico funcionam em srie. O sistema
funcionar se os componentes, 1, 2 e 3 funcionam simultaneamente. Suponha ainda que
cada componente funcione independentemente e que p
i
a probabilidade do componente
i funcionar, qual a probabilidade do sistema funcionar?
2. Suponha agora que um outro sistema constitudo por 4 componentes. Neste sistema
os componentes 1 e 2 funcionam em srie, e estes mesmos componentes funcionam em
paralelo com os componentes 3 e 4, que por sua vez funcionam em srie. A probabilidade
de cada um dos componentes funcionar de 0,90. Determinar a conabilidade deste
sistema funcionar.
3. A probabilidade de que um homem esteja vivo daqui a 30 anos 2/5; a de sua mulher
de 2/3. Determinar a probabilidade de que daqui 30 anos:
a) ambos estejam vivos;
b) somente o homem esteja vivo;
c) pelo menos um esteja vivo;
2.6 Teorema de Bayes
um importante teorema que expressa uma probabilidade condicional em funo de outras pro-
babilidades condicionais.
Teorema de Bayes: Sejam B
1
, B
2
, B
n
uma partio de , ou seja, B
i
B
j
= , i = j e
B
1
B
2
B
n
= . Considerando A um evento qualquer e conhecendo-se P(B
i
) e P(A/B
i
),
temos que:
P(B
i
/A) =
P(B
i
)P(A/B
i
)
n

i=1
[P(B
i
)P(A/B
i
)]
19
Exemplos:
1. Durante o ms de dezembro, a probabilidade de chover de 10%. Um time ganha um jogo
em um dia chuvoso, com 40% de probabilidade, e em um dia sem chuva, com 60% de pro-
babilidade. Tendo esse time ganho um jogo em um dia de dezembro, qual a probabilidade
de ter chovido nesse dia?
2. Considere cinco urnas cada uma com seis bolas. Duas dessas urnas (tipo C
1
), tem trs
bolas brancas, duas outras urnas (tipo C
2
), tem duas bolas brancas e a ltima (tipo C
3
)
tem seis bolas brancas. Escolhe-se uma urna ao acaso e retira-se uma bola desta. Qual a
probabilidade de que a urna escolhida seja do tipo C
3
, sabendo-se que a bola retirada
branca?
3. Para selecionar seus funcionrios, uma empresa oferece aos candidatos um curso de trei-
namento. Ao nal eles so submetidos a uma prova e 25% so classicados como bons
(B), 50% como mdios (M) e os restantes 25% como fracos (F). Para facilitar a seleo,
a empresa pretende substituir o treinamento por um teste contendo questes de conhe-
cimentos gerais e especcos. Para isso, gostaria de conhecer qual a probabilidade de
um indivduo aprovado no teste ser considerado fraco, caso zesse o curso. De acordo
com os resultados receberam os conceitos aprovado (A) ou reprovado (R). Sabendo que
P(A/B) = 0,80; P(A/M) = 0,50; e P(A/F) = 0,20, encontrar P(F/A).
20
3 Variveis aleatrias unidimensionais
Neste captulo ser apresentado o conceito de varivel aleatria unidimensional, tanto para o
caso discreto quanto para o caso contnuo, e tambm ser denida as principais funes que regem
as variveis aleatrias.
3.1 Denio de Variveis Aleatrias Unidimensionais
Considere um experimento aleatrio e o espao amostral associado a esse experimento. Uma
funo que associa valores reais aos eventos do espao amostral denida como uma varivel aleatria
(v.a.). Geralmente, as letras maisculas so utilizadas para representar a varivel aleatria, e as letras
minsculas os valores que esta varivel aleatria pode assumir. Por exemplo, se a varivel aleatria
representada por X, as realizaes dessa varivel aleatria representada pelos valores x
1
, x
2
, , x
n
.
As variveis aleatrias podem se classicar em discretas e contnuas. A varivel aleatria discreta
aquela que assume valores nitos, ou innito enumervel, de valores, j a varivel aleatria contnua
aquela que assume um nmero innito no enumervel de valores, ou seja, so valores oriundos de
grandezas mensuradas em uma escala real.
3.1.1 Varivel Aleatria Discreta
Uma varivel discreta X pode ser denida como aleatria discreta se a cada um de seus valores
se associa uma probabilidade P(X).
Exemplos:
1. Se um experimento consiste no lanamento de um dado, a funo: X: o dobro do valor
obtido menos um, dene uma varivel aleatria discreta, que pode assumir seis valores
possveis: 1, 3, 5, 7, 9 e 11 com probabilidade igual a 1/6.
2. Se um experimento consiste em observar o nmero de carros vendidos durante um dia em
uma garagem, conforme tabela abaixo:
Vendas de carros Dias P(X)
0 54 54/300 = 0,18
1 117 117/300 = 0,39
2 72 72/300 = 0,24
3 42 42/300 = 0,14
4 3 3/300 = 0,01
5 12 12/300 = 0,04
Total 300 1,00
e Y for denido como sendo o nmero de carros vendidos em um dia, Y poder assumir os
valores 0, 1, 2, 3, 4 e 5 com probabilidade 0,18; 0,39; 0,24; 0,14; 0,01 e 0,04, respectivamente.
Distribuio de Probabilidade
Para cada valor x
1
, x
2
, , x
n
que a varivel aleatria X assume sero atribudos nmeros reais,
representando as probabilidades de a varivel aleatria X ser igual a esses valores. Essas proba-
bilidades sero denotadas por P(X = x
1
) = p
1
, P(X = x
2
) = p
2
, , P(X = x
n
) = p
n
, e devem
satisfazer s seguintes condies:
a) 0 p
i
1 i = 1,2, , n.
21
b)
n

i=1
p
i
= 1.
As probabilidades p
i
, i = 1,2, , n formam o que se denomina funo de probabilidade da
varivel aleatria X.
Para quaisquer valores de a e b, tem-se que P(a < X < b) =
b

x
i
>a
P(X = x
i
).
Para os exemplos dados anteriormente, as distribuies de probabilidade nestes casos so:
X 1 3 5 7 9 11
P(X = x) 1/6 1/6 1/6 1/6 1/6 1/6 1,00
Y 0 1 2 3 4 5
P(Y = y) 0,18 0,39 0,24 0,14 0,01 0,04 1,00
3.1.2 Varivel Aleatria Contnua
A varivel aleatria dita contnua se corresponder a dados de medida, pertencentes aos R. O
conceito de v.a. contnua ser mais bem entendido por meio dos seguintes exemplos:
1. Se um experimento consiste em vericar as alturas de 30 universitrios, a funo: X: Altura de
um universitrio, dene uma varivel aleatria contnua, que pode assumir quaisquer valores
entre 130 e 220 cm.
2. Se um experimento consiste em mensurar os pesos dos 30 universitrios, a funo: Y : Peso de
um universitrio, dene uma varivel aleatria contnua, que pode assumir quaisquer valores
entre 60 e 130 kg.
3. Se um experimento consiste em vericar a durabilidade de um lote de 50 pneus, a funo:
Z: tempo de vida til de um pneu, dene uma v.a. contnua, que pode assumir quaisquer
valores entre 50.000 e 70.000 km.
Com base nos exemplos apresentados, a varivel aleatria contnua est vinculada a dados oriun-
dos de uma mensurao que resultam a um intervalo de nmeros reais.
Funo Densidade de Probabilidade
Se a varivel aleatria X contnua, dene-se uma funo, denotada por f(x), e denominada
funo densidade de probabilidade (f.d.p.) da varivel aleatria X, que representa, sicamente,
a curva das probabilidades de todos os innitos valores de X. Deste modo, reas sero usadas para
representar as probabilidades, e probabilidades so valores numricos positivos, portanto, a funo
densidade deve estar inteiramente acima do eixo x.
Uma funo de densidade de probabilidade construda de modo que a rea abaixo da curva
at o eixo x seja igual a 1, quando calculada para a amplitude de X para o qual f(x) foi denida.
Se essa amplitude de X for um intervalo nito, sempre possvel estender o intervalo para incluir o
conjunto inteiro dos reais, denindo-se f(x) como sendo igual a zero em todos os pontos nas pores
estendidas do intervalo. Isso vlido pois uma varivel contnua X tem uma probabilidade zero
de assumir exatamente qualquer um de seus valores. Essa funo f(x) deve satisfazer s seguintes
propriedades:
a) f(x) 0, para todo x R
22
b)
_
+

f(x)dx = 1
c) P(a x b) = P(a x < b) = P(a < x b) = P(a < x < b) =
_
b
a
f(x)dx, a e b.
Exemplo:
1. Suponha que o erro na temperatura de reao (em
0
C), para um experimento de labo-
ratrio controlado, seja a varivel aleatria contnua X, que tem a seguinte funo de
densidade de probabilidade:
f(x) =
_
x
2
3
, se 1 < x < 2
0, caso contrrio
a) Verique se as propriedades (a) e (b) de f(x) so satisfeitas;
b) Determine a P(0 < X 1)
3.2 Funo Repartio ou Funo de Distribuio Acumulada
A funo de distribuio acumulada nos fornece a probabilidade de que a varivel em questo
esteja abaixo de um determinado valor. Em geral, ela representada por F(X) ou (X). Assim,
F(X) = P(X x).
Varivel Aleatria Discreta:
Para uma varivel aleatria discreta a funo de distribuio acumulada ser denida como:
F(x) = P(X x) =

x
i
<x
P(X = x
i
) para < x < +.
Varivel Aleatria Contnua:
Para uma varivel aleatria contnua a funo de distribuio acumulada ser denida como:
F(x) = P(X x) =
_
x

f(t)dt para < x < +.


Propriedades da Funo Repartio ou Funo de Distribuio Acumulada
i) 0 F(X) 1
ii) F() = lim
x
F(x) = 0
iii) F(+) = lim
x+
F(x) = 1
iv) F(x) sempre crescente
v) P(a x b) = F(b) F(a), se b > a
Exemplos:
1. Um carregamento de oito microcomputadores similares para um ponto-de-venda contm
trs que apresentam defeitos. Se uma escola faz uma compra aleatria de dois desses
microcomputadores, pede-se:
a) Determinar a distribuio de probabilidade para o nmero de microcomputadores
defeituosos;
b) P(0 X 1);
c) Obter a funo de distribuio acumulada.
23
2. O dimetro X de um cabo eltrico uma v.a. contnua denida pela seguinte funo:
f(x) =
_
_
_
0 para x < 0
k(2x x
2
) para 0 x 1
0 para x > 1
a) Encontre o valor de k para que f(x) seja uma funo densidade de probabilidade;
b) Calcular a probabilidade de x ser menor que 0,5;
c) Obter a distribuio acumulada F(X).
3.3 Parmetros caractersticos de uma Distribuio de Probabilidade
3.3.1 Esperana Matemtica
Muitas vezes tem-se o interesse em estimar parmetros caractersticos de uma distribuio de
probabilidade de uma varivel aleatria qualquer. Um desses parmetros a Esperana Matemtica,
que representa uma mdia aritmtica ponderada ou um valor esperado de uma varivel aleatria.
Na prtica, a esperana pode ser entendida como um centro de distribuio de probabilidade, isto
, a mdia de uma distribuio de probabilidade.
A Esperana Matemtica denida da seguinte forma:
Se X uma varivel aleatria discreta:

x
= E(X) =
n

i=1
x
i
P(X = x
i
)
Se X uma varivel aleatria contnua:

x
= E(X) =
_
+

xf(x)dx
Propriedades da Esperana Matemtica
i) E(k) = k, sendo k uma constante
ii) E(kX) = kE(X)
iii) E(X Y ) = E(X) E(Y )
iv) E(X K) = E(X) K
v) E(XY ) =E(X)E(Y ) se X e Y so variveis aleatrias independentes.
3.3.2 Varincia e desvio padro
Anteriormente foi apresentado que a esperana matemtica fornece a mdia de uma distribuio
de probabilidade. Porm, nestas situaes no se tem a informao a respeito do grau de disperso
das probabilidades em torno da mdia. Portanto, a medida que ser utilizada para estimar o grau
de disperso (ou de concentrao) de probabilidade em torno da mdia ser a varincia.
A varincia denida da seguinte forma:
V (X) =
2
x
= E(X
2
) [E(X)]
2
= E(X
2
)
2
24
Se X uma varivel aleatria discreta, ento a esperana matemtica E(X
2
)
dada por :

x
= E(X
2
) =
n

i=1
x
2
i
P(X = x
i
)
Se X uma varivel aleatria contnua, ento a esperana matemtica E(X
2
) :

x
= E(X
2
) =
_
+

x
2
f(x)dx
O desvio padro obtido por meio da seguinte expresso:
x
=
_

2
x
.
Propriedades da Varincia
i) V (k) = 0, sendo k uma constante;
ii) V (kX) = k
2
V (X)
iii) V (X K) = V (X)
iv) V (X Y ) = V (X) V (Y ), se X e Y so variveis aleatrias independentes
Exemplos:
1. Um estudo do nmero de carros alugados em uma operadora durante certo perodo do
ano foi realizado e obteve se a seguinte funo de probabilidade:
X 0 1 2 3 4
P(X = x) 0,05 0,25 0,36 0,21 0,13
Obter a mdia e o desvio padro para esses dados.
2. Dada a v.a. contnua com a seguinte funo densidade de probabilidade:
f(x) =
_

_
0 para x < 0
k para 0 x < 1
k(2 x) para 1 x < 2
0 para x > 2
a) Determinar o valor de k para que f(x) seja uma funo densidade de probabilidade;
b) Esboce o grco de f(x);
c) Encontre a distribuio acumulada F(X);
d) Construa o grco de F(X)
e) Calcular a esperana, a varincia e o desvio padro de f(x).
25
4 Variveis Aleatrias Bidimensionais
Em muitas situaes, pode-se estar interessado em observar duas caractersticas simultanea-
mente. Neste casos, deve-se tratar cada caracterstica como uma varivel aleatria, e, portanto, as
duas variveis aleatrias conjuntamente como uma varivel bidimensional.
4.1 Denio de Variveis Aleatrias Bidimensionais
Considere um experimento aleatrio e o espao amostral associado a esse experimento. Sejam X
e Y duas variveis aleatrias. Ento, (X, Y ) dene uma varivel aleatria bidimensional. Os valores
da varivel aleatria bidimensional (X, Y ) so representados pelos pares ordenados (x,y). Se tanto a
varivel aleatria X quanto a varivel aleatria Y assumirem um nmero nito ou innito numervel
de valores, ento dizemos que a varivel aleatria bidimensional discreta. Caso a varivel aleatria
X e a varivel aleatria Y assumirem, cada uma, um nmero innito no enumervel de valores,
ento a varivel bidimensional considerada uma varivel aleatria contnua.
Pode acontecer o caso de uma varivel aleatria ser discreta e a outra varivel aleatria ser
contnua. No entanto, somente os casos em que ambas as variveis so discretas ou ambas so
contnuas ser abordado neste curso.
4.2 Varivel Aleatria Discreta
Seja (X, Y ) uma varivel aleatria bidimensional discreta. A cada valor possvel (x, y) associa-
se um nmero real, denotado por p(x,y), representando a probabilidade de a varivel aleatria X
assumir o valor x, ao mesmo tempo em que a varivel aleatria Y assume o valor y, isto , p(x, y) =
P(X = x, Y = y). O conjunto de todas as probabilidades p(x, y), para todos os valores vlidos para
as variveis aleatrias X e Y , denido como a funo conjunta de probabilidades da varivel
aleatria bidimensional discreta (X, Y ). Esses nmeros p(x, y), como representam probabilidades,
devem satisfazer s seguintes condies:
a) 0 p(x, y) 1 para todo (x, y)
b)

y
p(x, y) = 1
Exemplos:
1. Uma fbrica produz determinado tipo de pea. A pea pode ser produzida por duas
linhas de produo distintas. A capacidade de produo da linha I de 4 peas por hora,
e a capacidade de produo da linha II de 3 peas por hora. Representando o nmero
de peas realmente produzidas pelas duas linhas em uma determinada hora atravs de
uma varivel aleatria bidimensional (X,Y ), ento o nmero de peas produzidas pela
linha I representar a varivel X e o nmero de peas produzidas pela linha II a varivel
Y . Sendo assim, tem-se a seguinte funo conjunta de probabilidades:
Y \ X 0 1 2 3 4 Total
0 0,01 0,01 0,05 0,08 0,11 0,26
1 0,01 0,02 0,06 0,09 0,06 0,24
2 0,01 0,03 0,06 0,07 0,08 0,25
3 0,01 0,02 0,05 0,09 0,08 0,25
Total 0,04 0,08 0,22 0,33 0,33 1
Determinar a probabilidade de a linha I produzir um nmero maior de peas do que
a linha II em uma determinada hora.
26
2. A funo de probabilidade conjunta da varivel aleatria bidimensional discreta (X, Y )
p(x, y) = c(2x +y), em que 0 x 2 e 0 y 3.
a) Determinar o valor da constante c e obter a funo conjunta da varivel bidimen-
sional (X, Y );
b) Calcular a P(X 1; Y 2);
4.2.1 Distribuies de Probabilidades Marginais
Se mais de uma varivel aleatria for denida em um experimento aleatrio, ser importante
distinguir entre a distribuio de probabilidades conjuntas de X e Y e a distribuio de probabili-
dades de cada varivel individualmente. A distribuio individual de probabilidade de uma varivel
aleatria referida como a distribuio de probabilidades marginais.
Em geral, a distribuio de probabilidades marginais de X pode ser determinada a partir da
distribuio de probabilidades conjuntas de X e de outras variveis aleatrias.
Se X e Y so variveis aleatrias discretas, com funo de probabilidade conjunta P(X,Y ), ento
as funes de probabilidades marginais de X e Y so:
p(x) = P(X = x) =

Todo y
p(x, y) e p(y) = P(Y = y) =

Todo x
p(x, y)
importante lembrar que, como p(x) e p(y) so funes de probabilidade, ento as condies
0 p(x) 1 e

x
p(x) = 1 devem ser satisfeitas, e, analogamente, 0 p(y) 1 e

y
p(y) = 1.
Voltando ao exemplo anterior das linhas de produo, tem-se que as probabilidades marginais
de X e Y so dados, respectivamente, por:
x 0 1 2 3 4
p(x) 0,04 0,08 0,22 0,33 0,33 1
y 0 1 2 3
p(y) 0,26 0,24 0,25 0,25 1
Observao:
1. A E(X), E(Y ), V (X) e V (Y ) podem ser obtidas calculando as distribuies marginais
de X e Y , e em seguida, determinando as esperanas e varincias pelo mtodo usual.
4.2.2 Distribuies de Probabilidades Condicionais
A probabilidade condicional de variveis aleatrias bidimensionais calculada de forma seme-
lhante probabilidade condicionada de eventos, vista no captulo de probabilidades. Desse modo, a
funo de probabilidade condicionada de X dado que Y = y, denotada por p(x|y), denida por:
P(X = x|Y = y) =
P(X = x; Y = y)
P(Y = y)
Exemplos:
1. Utilizando novamente o exemplo das duas linhas de produo, calcule:
a) P(X=0|Y=0)
b) P(X=2|Y=1)
c) P(X=4|Y=3)
27
2. Sejam X e Y duas variveis aleatrias, representando, respectivamente, o nmero de gols
marcados pela equipe A e o nmero de gols marcados pela equipe B em um campeonato de
futebol. Portanto, possvel expressar a funo de probabilidade conjunta dessa varivel
aleatria bidimensional discreta por meio da seguinte tabela:
Y \ X 0 1 2 3 p(y)
0 0,04 0,08 0,04 0,04 0,2
1 0,08 0,16 0,08 0,08 0,4
2 0,08 0,16 0,08 0,08 0,4
p(x) 0,2 0,4 0,2 0,2 1
a) Qual a probabilidade do nmero de gols marcados pela equipe A, sabendo que a
equipe B marcou um gol?
4.2.3 Variveis Aleatrias independentes
Diz-se que X e Y so variveis aleatrias independentes quando o resultado de X, por exemplo,
de modo algum no inuencia o resultado de Y , e vice-versa, ou seja, p(x|y) = p(x) para todo x e
y, ou equivalentemente, se p(y|x) = p(y) para todo x e y.
Assim, se (X, Y ) uma varivel aleatria bidimensional discreta, diz-se que X e Y so variveis
independentes se, e somente se,
p(x, y) = p(x)p(y)
para quaisquer x e y. Essa relao consequncia do conceito de probabilidade condicionada, pois
por exemplo, como P(X = x|Y = y) =
P(X=x;Y =y)
P(Y =y)
e, no caso de independncia, p(x|y) = p(x),
segue que p(x, y) = p(x)p(y).
Exemplo:
1. Verique se as variveis bidimensionais (X, Y) do exemplo das linhas de produo e
tambm das equipes do campeonato de futebol so independentes.
4.2.4 Funes de Variveis Aleatrias
Seja (X, Y ) uma varivel aleatria bidimensional discreta. Seja W = H(X, Y ) uma funo da
varivel aleatria bidimensional discreta (X, Y ). Ento, W ser uma varivel aleatria unidimensi-
onal discreta, e neste caso, tem-se o interesse em obter a sua funo de probabilidade p(w), que
obtida a partir da funo H(X, Y ) e dos valores assumidos pelas variveis X e Y .
Exemplos:
1. Utilizando os dados do exemplo das linhas de produo considere a varivel W = X +Y
que representa o nmero total de peas produzidas pelas duas linhas, em uma determinada
hora.
a) Determinar a funo de probabilidade da varivel aleatria W
b) Calcular a E(X), E(Y ), E(W)
2. Sejam X e Y variveis aleatrias que representam o nmero de carros importados e o
nmero de carros nacionais, respectivamente, que uma concessionria vende ao longo de
uma semana, conforme a tabela a seguir:
y
x 0 1 2 3
0 0,015 0,06 0,045 0,03
1 0,05 0,20 0,15 0,10
2 0,035 0,14 0,105 0,07
28
a) Calcule as distribuies marginais das variveis X e Y ;
b) Obtenha a distribuio da varivel Z = X.Y
c) Calcule E(X), E(Y ), E(Z)
4.2.5 Covarincia de duas variveis aleatrias
A covarincia entre duas variveis aleatrias uma medida de relao linear entre as variveis.
Se X e Y so duas variveis aleatrias, a covarincia de X e Y denida por:
cov(X,Y ) = E[(X E(X))(Y E(Y ))].
Para a varivel aleatria discreta esta frmula pode ser reescrita como:
cov(X,Y ) =

y
[X
i
E(X
i
)][Y
i
E(Y
i
)]P(x
i
, y
i
)
ou ainda,
cov(X,Y ) = E(XY ) [E(X)E(Y )]
.
Exemplos:
1. Verique se as variveis do exemplo das linhas de produo e tambm do exemplo das
vendas dos carros importados e nacionais so correlacionadas;
Denio:
Quando a cov(X,Y ) = 0, tem-se que X e Y so variveis aleatrias no correlacionadas
linearmente.
Proposio:
Se X e Y so duas variveis aleatrias independentes, cov(X,Y ) = 0. No entanto, a recproca
no verdadeira.
Teorema:
Para duas variveis aleatrias X e Y tem-se que:
a) V(X+Y)=V(X)+V(Y)+2cov(X,Y);
b) Se X e Y so independentes, ento: V(X+Y)=V(X)+V(Y)
4.2.6 Coeciente de correlao
H uma outra medida da relao entre duas variveis aleatrias que frequentemente mais fcil
de interpretar que a covarincia.
A correlao entre as variveis aleatrias X e Y , denotada por (X,Y ) :
(X,Y ) =
cov(X,Y )
_
V (X)V (Y )
=

X,Y

Y
Observaes:
1. Para quaisquer duas variveis aleatrias X e Y , 1 (X,Y ) +1.
2. Quando (X,Y ) = 1 existe uma relao linear perfeita entre X e Y (direta).
29
3. Quando (X,Y ) = 1 existe uma relao linear inversa perfeita entre X e Y .
4. Na equao de regresso linear (Y = ax +b), temos: Se a > 0 ento (X,Y ) positivo e
se a < 0 ento (X,Y ) negativo.
Exemplo:
1. Para os exemplos das linhas de produo e das vendas dos carros importados e nacionais
calcule o coeciente de correlao;
4.3 Varivel aleatria contnua
Seja (X,Y ) uma varivel aleatria bidimensional contnua. Isso signica que tanto a varivel
aleatria X quanto a varivel aleatria Y assumem, cada uma, um nmero innito no enumervel
de valores. Portanto, a varivel aleatria bidimensional contnua (X,Y ) pode assumir um nmero
innito no enumervel de valores.
A funo densidade de probabilidade conjunta da varivel aleatria bidimensional contnua
(X,Y ), denotada por f(x,y) e representando a superfcie de probabilidades dos valores (x,y) que a
varivel aleatria (X,Y ) assume , uma funo que deve satisfazer s seguintes condies:
a) f(x,y) 0 para todo par (x,y);
b)
_
+

_
+

f(x,y)dxdy = 1
O clculo da probabilidade de a X b e c Y d dado por:
P(a X b, c Y d) =
_
b
a
_
d
c
f(x,y)dydx
Exemplos:
1. Suponha que a varivel aleatria bidimensional contnua (X,Y ) tenha a funo densidade
de probabilidade conjunta dada por: f(x,y) = x
2
+
xy
3
, 0 x 1 e 0 y 2.
a) Verique se f(x, y) uma funo densidade de probabilidade conjunta.
b) Calcular P(X 1/2; Y 1/2)
4.3.1 Funo densidade de probabilidade marginal
De modo anlogo as variveis discretas, pode-se estar interessado na funo densidade de proba-
bilidade da varivel aleatria X ou na funo de densidade de probabilidade da varivel aleatria Y ,
determinadas, respectivamente, funo densidade de probabilidade marginal de X denotada g(x), e
funo densidade de probabilidade marginal de Y , denotada por h(y). Essas funes so denidas
da seguinte maneira:
g(x) =
_
+

f(x,y)dy e h(y) =
_
+

f(x,y)dx.
importante lembrar que, como g(x) e h(y) so funes densidade de probabilidade, g(x) 0
para todo x e
_
+

g(x)dx = 1, assim como h(y) 0 para todo y e


_
+

h(y)dy = 1.
Por meio destas funes g(x) e h(y), pode-se calcular a probabilidade de ocorrer x ou a proba-
bilidade de ocorrer y.
30
Exemplos:
1. Voltando ao exemplo anterior:
a) Determine a funo de densidade de probabilidade marginal da varivel X e da
varivel Y .
b) Qual a probabilidade de x estar entre 0,2 e 0,4?
c) Qual a probabilidade de y estar entre 0,5 e 0,75?
4.3.2 Distribuies de Probabilidade Condicionais
Sejam X e Y variveis aleatrias contnuas com funo densidade conjunta f(x,y) e distribuies
marginais g(x) e h(y).
A funo densidade de probabilidade condicional de X, dado que Y = y denida por:
f(X|Y = y) =
f(x,y)
h(y)
, h(y) > 0,
e funo densidade de probabilidade condicional de Y , dado que X = x dada por:
f(Y |X = x) =
f(x,y)
g(x)
, g(x) > 0,
Exemplos:
1. Utilizando o exemplo da varivel aleatria bidimensional contnua (X,Y ), com funo
densidade de probabilidade conjunta dada por: f(x,y) = x
2
+
xy
3
, 0 x 1 e 0 y 2,
pede-se:
a) Determinar f(x|y) e f(y|x);
b) Calcular P(Y < 1/2|X < 1/2)
2. Seja (X,Y ) uma varivel aleatria bidimensional contnua com funo densidade de pro-
babilidade conjunta dada por: f(x,y) = cx(1 y), 0 < x < 1 e 0 < y < 1. Calcular:
a) O valor da constante c.
b) A funo densidade de probabilidade condicionada f(x|y).
c) A funo densidade de probabilidade condicionada f(y|x).
4.3.3 Variveis Aleatrias Independentes
Diz-se que X e Y so variveis aleatrias contnuas independentes quando o resultado de X,
por exemplo, de modo algum no inuencia o resultado de Y , e vice-versa, ou seja, X e Y sero
independentes se g(x|y) = g(x), ou equivalentemente, se h(y|x) = h(y), para todo x e y.
Ento seja (X,Y ) uma varivel aleatria bidimensional contnua. Diz-se que X e Y so variveis
aleatrias contnuas independentes se, e somente se,
f(x,y) = g(x)h(y)
para todo x e y, em que f(x,y) a funo densidade de probabilidade conjunta da varivel aleatria
bidimensional (X,Y ), e g(x) e h(y) so as funes densidade de probabilidade marginais de X e
Y , respectivamente. Essa relao consequncia do conceito de probabilidade condicionada: como
g(x|y) =
f(x,y)
h(y)
, para todo x e y, logo f(x,y) = g(x)h(y) e, no caso de independncia, g(x|y) = g(x),
para todo x e y, logo f(x,y) = g(x)h(y); analogamente, como h(y|x) =
f(x,y)
g(x)
e, no casos de
independncia, h(y|x) = h(y), para todo x e y, logo f(x,y) = g(x)h(y).
31
Exemplos:
1. Utilizando novamente o exemplo da varivel aleatria bidimensional contnua (X,Y ), com
funo densidade de probabilidade conjunta dada por: f(x,y) = x
2
+
xy
3
, 0 x 1 e
0 y 2, vericar se as variveis X e Y so independentes.
2. O consumo de gasolina de uma marca de carro em determinada viagem representado por
uma varivel aleatria X com funo densidade de probabilidade dada por: f(x) =
x
2
,
0 < x < 2, e consumo de leo representado por uma varivel aleatria Y com funo
densidade de probabilidade dada por g(y) =
y
3
4
, 0 < y < 2. Supondo que o consumo de
gasolina e o consumo de leo sejam independentes, qual a probabilidade de o consumo de
leo ser menor que o consumo de gasolina?
32

Das könnte Ihnen auch gefallen