Sie sind auf Seite 1von 49

APOSTILA

DE
ESTATSTICA

Aluno: ______________________________________

A arte de descobrir novos horizontes


Cristiane Sander *

Se todos ns temos perguntas/problemas e buscamos alternativas para os mesmos


e, se a pesquisa nos leva a desenvolver o conhecimento, criar alternativas para
problemas e a descobrir novos horizontes, ento todos podemos ser
pesquisadores.
Geralmente, quando ouvimos falar em
pesquisa, nos reportamos a laboratrios cheios de
aparelhos sofisticados, tubos de ensaio, produtos
qumicos etc, ou ento a nmeros, dados,
porcentagem, ou ainda, a pessoas importantes,
cientistas, doutores, professores e outros.
No entanto, a pesquisa no tem endereo certo,
quer dizer, no s em laboratrios que ela se
encontra. A pesquisa est prxima de ns, ela faz
parte do nosso dia-a-dia. Para pesquisar
necessrio, em primeiro lugar, ter um problema ou
uma pergunta a resolver. Ou seja, quando nos
dispomos conscientemente a resolver um
problema, estamos dando incio a uma pesquisa.
Passos para a pesquisa
Para realizar uma pesquisa no h uma receita
pronta para seguir. H, no entanto, alguns
elementos importantes a observar, dos quais
destacamos:
Problema: Na vida, no dia-a-dia, nos
deparamos com vrios problemas, somos
desafiados sempre a tomar decises e definir
rumos. Por exemplo, se estamos desempregados,
vamos fazer o levantamento de quais so as
qualificaes, capacidades, habilidades que
possumos e onde podemos ir buscar trabalho
dentro dessas condies. Mas buscamos tambm
saber por que estamos desempregados, se este
um problema que apenas ns estamos
enfrentando ou se mais pessoas esto nesta
situao. A partir disto, levantamos vrias
hipteses, respostas, alternativas para resolver
nosso problema.
Temos que ter presente que problema na
pesquisa no se refere a uma coisa negativa e
sim a algo que nos ajuda a construir e encontrar
sadas.
A forma de levantar um problema, de
fazer a pergunta, define de certa maneira a
perspectiva que daremos pesquisa. Por isso
importante saber fazer as perguntas, ver quem faz
as perguntas e para quem e por que estas
perguntas/problemas
so
considerados
importantes. Ou seja, quais so os objetivos que
pretendemos atingir com a pesquisa.
Hipteses: So as vrias possibilidades
de soluo que levantamos para responder o
problema, ou seja, so respostas antecipadas que
imaginamos a partir do conhecimento que j
possumos acerca do objeto a ser investigado. No
entanto precisamos comprovar ou refutar nossas
hipteses para ter um resultado da pesquisa, pois

no podemos ficar no achismo, em opinies,


precisamos ter bases concretas, provas para
realizar nossas pesquisas. Para tanto, precisamos
buscar dados, o que implica em ver onde
podemos busc-los, o que precisamos para
comprovar nossas hipteses e qual ser o mtodo
que vamos usar. Podemos buscar dados,
respostas para nossas pesquisas em vrios
lugares: em livros, revistas, jornais(dados
bibliogrficos); em arquivos; em fotografias,
objetos, ou junto s pessoas, atravs de
entrevistas, questionrios etc. Ou seja, s vezes
as
respostas podem estar onde menos
esperamos.
Podemos, por exemplo, chegar ao
trmino da pesquisa e concluir que as hipteses
que levantamos no incio da pesquisa no eram
verdadeiras. Isso no quer dizer que a pesquisa
no tenha sido vlida, ao contrrio, ela pode nos
mostrar justamente por onde no devemos andar,
ou ainda, nos mostrar caminhos que antes no
havamos pensado em seguir.
Por que importante pesquisar?
Quando realizamos qualquer pesquisa,
precisamos sempre ter presente por que vamos
faz-la, em que ela vai contribuir para melhorar a
vida das pessoas na sociedade.
A pesquisa, antes de tudo, gera
conhecimento, pois leva-nos a refletir, pensar, ler,
escrever e descobrir novos horizontes.
importante que tornemos pblicos os resultados
aos quais chegamos, pois se guardamos o
conhecimento adquirido para ns, ele no ter
importncia nenhuma para a sociedade.
A pesquisa nos possibilita tambm a
olhar de forma crtica a realidade, na medida em
que ela nos instiga busca do novo, para a
formulao de novas perguntas e para a produo
prpria e criativa do conhecimento.
Poderamos iniciar a pesquisa nas
escolas e tambm fora dela, para torn-la mais
presente em nossa vida. No entanto, a proposta
da pesquisa quebra com a lgica pedaggica de
muitas escolas, que se preocupam somente em
dar respostas aos alunos. Pois, a pesquisa
preocupa-se em fazer perguntas e levar os
prprios alunos a buscar solues, instigando sua
criatividade que leva a questionar aquilo que
muitos no querem que seja questionado.
* Cristiane Sander, licenciada em histria-UNIJU,
mestranda em Servio Social-PUCRS. Abril/2000

Introduo

PROBABILIDADE
A histria da teoria das probabilidades teve incio com os jogos de cartas, dados e de roleta.
Esse o motivo da grande existncia de exemplos de jogos de azar no estudo da probabilidade. A
teoria da probabilidade permite que se calcule a chance de ocorrncia de um nmero em um
experimento aleatrio. A estatstica surgiu muito antes da probabilidade e tratava principalmente da
coleta, organizao e apresentao de dados por meio de tabelas e cartas. Com o advento da
probabilidade, foi constatado que a estatstica poderia ser utilizada para extrair concluses vlidas
e tomar decises razoveis com base na anlise de dados, como em teoria da amostragem e
previses.
Experimento Aleatrio
aquele experimento que quando repetido em iguais condies, podem fornecer resultados
diferentes, ou seja, so resultados explicados ao acaso. Quando se fala de tempo e possibilidades
de ganho na loteria, a abordagem envolve clculo de experimento aleatrio
Exemplos : - Retirar uma carta de um baralho com 52 cartas e observar seu naipe, sua cor ou seu
nmero / letra.
- Jogar uma moeda 50 vezes e observar o nmero de caras ou coroas obtidas
- Retirar com ou sem reposio, bolas de uma caixa que contenha determinadas quantidades de
bolas pretas e brancas
- Arremessar um dado e observar o nmero da face de cima.

Espao Amostral
o conjunto de todos os resultados possveis de um experimento aleatrio. A letra que
representa o espao amostral, S.
Exemplo: Lanando uma moeda e um dado, simultaneamente, sendo S o espao amostral,
constitudo pelos 12 elementos: S = {K1, K2, K3, K4, K5, K6, R1, R2, R3, R4, R5, R6}
1.

Escreva explicitamente os seguintes eventos: A = {caras e um nmero par aparece},


B = {um nmero primo aparece}, C = {coroas e um nmero mpar aparecem}.

2.

Idem, o evento em que:


a)
A ou B ocorrem;
b)
B e C ocorrem;
c)
Somente B ocorre.

3.

Quais dos eventos A, B e C so mutuamente exclusivos

Resoluo:

4
1.

Para obter A, escolhemos os elementos de S constitudos de um K e um nmero par:


A={K2, K4, K6};
Para obter B, escolhemos os pontos de S constitudos de nmeros primos:
B={K2,K3,K5,R2,R3,R5}
Para obter C, escolhemos os pontos de S constitudos de um R e um nmero mpar:
C={R1,R3,R5}.

2.

(a) A ou B = AUB = {K2,K4,K6,K3,K5,R2,R3,R5}


(b) B e C = B C = {R3,R5}
(c) Escolhemos os elementos de B que no esto em A ou C;
c
c
B A C = {K3,K5,R2}

3.

A e C so mutuamente exclusivos, porque A C =

Conceito de probabilidade
Se num fenmeno aleatrio as possibilidades so igualmente provveis, ento a probabilidade
de ocorrer um evento A :

Por, exemplo, no lanamento de um dado, um nmero par pode ocorrer de 3 maneiras


diferentes dentre 6 igualmente provveis, portanto, P = 3/6= 1/2 = 50%
Dizemos que um
espao amostral S (finito) equiprovvel quando seus eventos elementares tm
probabilidades iguais de ocorrncia. Num espao amostral equiprovvel S (finito), a
probabilidade de ocorrncia de um evento A sempre:

Propriedades Importantes:
1. Se A e A so eventos complementares, ento:

P( A ) + P( A' ) = 1
2. A probabilidade de um evento sempre um nmero entre (probabilidade de evento
impossvel) e 1 (probabilidade do evento certo).

5
Probabilidade Condicional
Antes da realizao de um experimento, necessrio que j tenha alguma informao sobre o
evento que se deseja observar. Nesse caso, o espao amostral se modifica e o evento tem a
sua probabilidade de ocorrncia alterada.
Exemplo: Uma caixa tem 30 bolas, sendo 10 vermelhas e 20 azuis. Se ocorrer um sorteio de 2
bolas, uma de cada vez e sem reposio, qual ser a probabilidade de a primeira ser vermelha
e a segunda ser azul?
Resoluo:
Seja o espao amostral S=30 bolas, bolinhas e considerarmos os seguintes eventos:
A: vermelha na primeira retirada e P(A) = 10/30
B: azul na segunda retirada e P(B) = 20/29
Assim:
P(A e B) = P(A).(B/A) = 10/30.20/29 = 20/87
Eventos independentes
Dizemos que E1 e E2 e ...En-1, En so eventos independentes quando a probabilidade de ocorrer
um deles no depende do fato de os outros terem ou no terem ocorrido.
Exemplo: Uma caixa tem 30 bolas, sendo 10 vermelhas e 20 azuis. Se sortearmos 2 bolas, 1 de
cada vez e respondo a sorteada na urna, qual ser a probabilidade de a primeira ser vermelha e a
segunda ser azul?
Resoluo:
Como os eventos so independentes, a probabilidade de sair vermelha na primeira retirada e azul
na segunda retirada igual ao produto das probabilidades de cada condio, ou seja, P(A e B) =
P(A).P(B). Ora, a probabilidade de sair vermelha na primeira retirada 10/30 e a de sair azul na
segunda retirada 20/30. Da, usando a regra do produto, temos: 10/30.20/30=2/9. Observe que na
segunda retirada foram consideradas todas as bolas, pois houve reposio. Assim, P(B/A) =P(B),
porque o fato de sair bola vermelha na primeira retirada no influenciou a segunda retirada, j que
ela foi reposta na urna.
Probabilidade de ocorrer a unio de eventos
Exemplo: Se dois dados, azul e branco, forem lanados, qual a probabilidade de sair 5 no azul
e 3 no branco?
Considerando os eventos:
A: Tirar 5 no dado azul e P(A) = 1/6
B: Tirar 3 no dado branco e P(B) = 1/6
Sendo S o espao amostral de todos os possveis resultados, temos:
n(S) = 6.6 = 36 possibilidades. Da, temos:P(A ou B) = 1/6 + 1/6 1/36 = 11/36
Exemplo: Se retirarmos aleatoriamente uma carta de baralho com 52 cartas, qual a
probabilidade de ser um 8 ou um Rei?
Sendo S o espao amostral de todos os resultados possveis, temos: n(S) = 52 cartas.
Considere os eventos:
A: sair 8 e P(A) = 4/52

6
B: sair um rei e P(B) = 4/52
Assim, P(A ou B) = 4/52 + 4/52 0 = 8/52 = 2/13. Note que P(A e B) = 0, pois uma carta no
pode ser 8 e rei ao mesmo tempo. Quando isso ocorre dizemos que os eventos A e B so
mutuamente exclusivos.
Porque a estatstica importante?
Os mtodos estatsticos so usados hoje em quase todos os campos de investigao
cientfica, j que eles nos capacitam a responder a um vasto nmero de questes, tais como:
1) Como os cientistas avaliam a validade de novas teorias?
2) Como os pesquisadores mdicos testam a eficincia de novas drogas?
3) Como os demgrafos prevem o tamanho da populao do mundo em qualquer tempo futuro?
4) Como pode um economista verificar se a mudana atual no ndice de Preos ao Consumidor
a continuao de uma tendncia secular, ou simplesmente um desvio aleatrio?
5) Como possvel para algum predizer o resultado de uma eleio entrevistando apenas
algumas centenas de eleitores?
Estes so poucos exemplos nos quais a aplicao da estatstica necessria. Por isso, a
estatstica tornou-se uma ferramenta cotidiana para todos os tipos de profissionais que entram em
contato com dados quantitativos ou tiram concluses a partir destes.
Definio de Estatstica
Estatstica uma parte da Matemtica Aplicada que fornece mtodos para a coleta,
organizao, descrio, anlise e interpretao de dados. Ela dividida em:
Estatstica Descritiva: parte da Estatstica que apenas coleta, descreve, organiza e
apresenta os dados. Nela no so tiradas concluses.
Estatstica Indutiva ou Inferncia: analisa os dados e obtm-se as concluses.

Estatstica Descritiva
Fases do Mtodo Estatstico
Tabelas
Coleta de
dados

Crtica dos
dados

Apresentao
dos dados

Anlises
Grficos

Coleta de Dados
Aps a definio do problema a ser estudado e o estabelecimento do planejamento da
pesquisa (forma pela qual os dados sero coletados; cronograma das atividades, custos
envolvidos; exame das informaes disponveis; delineamento da amostra etc.), o passo seguinte
a coleta de dados, que consiste na busca ou compilao dos dados das variveis, componentes
do fenmeno a ser estudado.
A coleta de dados pode ser direta ou indireta.

7
- coleta direta: quando os dados so obtidos na fonte originria. Os valores assim
compilados so chamados de dados primrios, como, por exemplo, nascimentos,
casamentos e bitos, registrados no Cartrio de Registro Civil; opinies obtidas em
pesquisas de opinio pblica; ou ainda, quando os dados so coletados pelo prprio
pesquisador.
A coleta direta pode ser classificada relativamente ao fator tempo em:

contnua quando feita continuamente, como por exemplo, nascimentos e bitos,

freqncia dos alunos s aulas;

peridica quando feita em intervalos constantes de tempo, como os censos (de

10 em 10 anos);

ocasional quando feita sem poca preestabelecida.

- coleta indireta: quando os dados obtidos provm da coleta direta. Os valores assim
compilados so denominados de dados secundrios, como, por exemplo, o clculo do
tempo de vida mdia, obtido pela pesquisa, nas tabelas demogrficas publicadas pela
Fundao Instituto Brasileiro de Geografia e Estatstica, se constitui em uma coleta
indireta.
Crtica dos Dados
Obtidos os dados, eles devem ser cuidadosamente criticados, procura de possveis
falhas e imperfeies, eliminando os erros capazes de provocar futuros enganos de apresentao
e anlise.
Apresentao dos Dados
Aps a crtica, os dados devem ser apresentados sob forma adequada (tabelas ou
grficos), para o melhor entendimento do fenmeno que est sendo estudado.
Caractersticas Importantes dos Dados
1- A natureza ou forma de distribuio dos dados como forma de sino, uniforme ou assimtrica.
2- Um valor representativo como uma mdia
3- Uma medida de disperso ou variao.
Podemos conhecer alguma coisa da natureza ou forma da distribuio organizando os dados e
construindo grficos.

Estatstica Descritiva: Tabelas, Sries Estatsticas e Grficos Estatsticos


Tabelas
Tabela um quadro que resume um conjunto de observaes.
Ela composta de:
- ttulo: conjunto de informaes, as mais completas possveis, respondendo s perguntas: O que?
(referente ao fato), Quando? (relativo ao lugar), Onde? (correspondente poca);
- corpo: conjunto de linhas e colunas que contm informaes sobre a varivel em estudo;
- cabealho: parte superior da tabela que especifica o contedo das colunas;

8
- rodap: reservado pare as observaes pertinentes, bem como a identificao da fonte dos
dados .
Sries Estatsticas
toda tabela que apresenta a distribuio de um conjunto de dados estatsticos em funo
da poca, do local ou da espcie.
Conforme o critrio de agrupamento as sries classificam-se em:
a) Srie Cronolgica, Temporal, Evolutiva ou Histrica: a srie estatstica em que os
dados so observados segundo a poca de ocorrncia. Exemplo:
Vendas da Companhia Alfa - 1990-1994
Ano

Vendas (em R$ 1.000,00)

1990

2.181

1991

3.948

1992

5.642

1993

7.550

1994

10.009

Fonte: Departamento de Marketing da Companhia Alfa.


b) Srie Geogrfica ou de Localizao: a srie estatstica em que os dados so
observados segundo a localidade de ocorrncia. Exemplo:
INAMPS - Empresas fiscalizadas em 1998
Regies
Norte

Empresas fiscalizadas
7.495

Nordeste

107.783

Sudeste

281.207

Sul

53.661

Centro-Oeste

15.776
Fonte: Mensrio Estatstico do IBGE

c) Srie Especfica: a srie estatstica em que os dados so agrupados segundo a


modalidade de ocorrncia. Exemplo:
Matriculas no Ensino de Terceiro Grau
Brasil1995 (ciclo bsico)
reas de ensino

Matrculas

Cincias Biolgicas

62.109

Cincias Exatas e Tecnologia

95.949

Cincias Agrrias

32.419

Cincias Humanas

178.842

Letras

39.883

Artes

37.464

9
Duas ou mais reas

46.323

Fonte: Servio de Estatstica do Ministrio da Educao e Cultura.


d) Distribuio de Freqncias. a srie estatstica em que os dados so agrupados com suas
respectivas freqncias. Ser vista com mais detalhes a seguir. Exemplo:
Nmero de Acidentes por Dia na Rodovia X em Janeiro de 2003
Nmero de acidentes por dia

Nmero de dias

10

2
Fonte: DNER.

Grficos Estatsticos
A representao grfica das sries estatsticas tem por finalidade dar uma idia, a mais
imediata possvel, dos resultados obtidos, permitindo chegar-se a concluses sobre a evoluo do
fenmeno ou sobre como se relacionam os valores da srie. No h apenas uma maneira de
representar graficamente uma srie estatstica. A escolha do grfico mais apropriado ficar a
critrio do analista.
Contudo, os elementos simplicidade, clareza e veracidade devem ser considerados
quando da elaborao de um grfico.
Os principais tipos de grficos.
a)

Grfico em Colunas
Populao Brasileira
Grfico em Colunas

1940 1970

100
90

Populao
Populao do Brasil (milhes)

Ano

80

1940

41 236 315

70

1950

51 944 397

60

1960

70 119 071

50

1970

93 139 037

40

Fonte: Anurio Estatstico


- 1974 -

30
20
10
0

1940

1950

1960
Ano

1970

Populao

10

b) Grfico em Barras: semelhante ao grfico em colunas, porm os retngulos so dispostos


horizontalmente. Eis a configurao do mesmo grfico anterior:
Grfico em Barras

1970

Ano

1960

1950

1940

10

20

30

40

50

60

70

80

90

100

Populao

Populao do Brasil (milhes)

Esses dois tipos de grficos so geralmente utilizados para comparar diferentes variveis ou
diferentes valores da mesma varivel.
b)

Grficos em Setores: a representao grfica de uma srie estatstica, em um crculo,


por meio de setores. utilizado principalmente quando se pretende comparar cada valor
da srie com o total. Para constru-lo, divide-se o crculo em setores, cujas reas sero
proporcionais aos valores da srie. Essa diviso poder ser obtida pela soluo da regra
de trs.
Grfico em Setores

Total _____ 360 o


Parte _____ x o

(1996), 90,0

(1998), 150,0

(1997), 120,0

RECEITA DO MUNICPIO X DE 1996 a 1998 (milhes)

11

Grfico em Curvas ou Linear: utilizado para representar o crescimento ou o

c)

decrescimento da varivel. Exemplo:

Vendas da Companhia

Grfico Linear
500

Beta
1991 a 1997

400

Ano

Vendas
R$ 1.000,00)
230

1992

260

1993

380

1994

300

1995

350

1996

400

1997

4500

VENDAS

1991

300

200

100

1991

1992

1993

1994

1995

Anos

Fonte: Departamento de Marketing


Companhia Beta

Dicas para a Apresentao dos Dados

Dados

Dados
Quantitativos

Dados
Qualitativos

Mtodos
Tabulares

Distribuies de
freqncias

Mtodos
Grficos

Grficos de barras
e pizza

Mtodos
Tabulares

Distribuies de
freqncias

Mtodos
Grficos

Histograma

1996

1997

12

Tabela de Dados
Relaciona TODOS os dados levantados na pesquisa, independentemente de ordem.
Tabela de Dados Ordenados (Rol)
Relaciona TODOS os dados levantados na pesquisa, ordenados de alguma forma.
Tabela de Freqncia
Relaciona classes e freqncia do nmero de valores que se enquadram em cada categoria.
Amplitude de Amostra ( Amplitude Total) (Range)
Diferena entre o maior e o menor valores encontrados na Tabela de dados.
Amplitude de Classe
Diferena entre os limites superior e inferior de cada classe.
Freqncia Absoluta
o nmero de vezes que o elemento aparece na amostra, ou o nmero de elementos
pertencentes a uma classe.
Freqncia Relativa

freqncia relativa =

freqncia absoluta
freqncia de classe
ou
freqncia total
freqncia total

As freqncias relativas tambm podem ser apresentadas como porcentagens. Quando calculada
corretamente e, a menos dos erros de arredondamento, a soma das freqncias relativas deve ser
igual a 1 (ou 100%).
Freqncia Acumulada
A freqncia acumulada de uma classe a soma das freqncias daquela classe e de todas as
classes que a antecedem.
Freqncia Absoluta Acumulada
a soma da freqncia absoluta do elemento ou da classe com a freqncia absoluta dos
elementos anteriores ou das classes anteriores.
Freqncia Relativa
A freqncia relativa o valor da freqncia absoluta dividido pelo nmero total de
observaes:

fr =

fi
.
n

Freqncia Acumulada Relativa ou Freqncia Relativa Acumulada


A freqncia acumulada relativa o valor da freqncia acumulada dividido pelo nmero total
de observaes:

far =

f ac
.
n

Anlise dos Resultados

13
Realizadas as fases anteriores, faz-se uma anlise dos resultados obtidos, atravs dos mtodos da
Estatstica Indutiva ou Inferncia, e tiram-se as concluses e previses.

Tipos de Variveis
Varivel o conjunto de resultados possveis de um fenmeno. Por exemplo:
- Para o fenmeno sexo so dois os resultados possveis: sexo masculino e sexo feminino;
- Para o fenmeno nmero de filhos h um nmero de resultados possveis expressos atravs
dos nmeros naturais: 0, 1, 2, 3, ... n;
- Para o fenmeno estatura temos uma situao diferente, pois os resultados podem tomar um
nmero infinito de valores numricos dentro de um determinado intervalo.
As variveis, desta forma, podem ser:
Variveis quantitativas - referem-se a quantidades e podem ser medidas em uma escala
numrica. Exemplos: idade de pessoas, preo de produtos, peso de recm nascidos. Elas
subdividem-se em dois grupos:
- Variveis quantitativas discretas: so aquelas que assumem apenas determinados
valores tais como 0,1,2,3,4,5,6 dando saltos de descontinuidade entre seus valores.
Normalmente referem-se a contagens. Por exemplo: nmero de ovos produzidos por uma
granja, nmero de pessoas por famlia, quantidade de doentes por hospital.
- Variveis quantitativas contnuas: so aquelas cujos valores assumem uma faixa
contnua e no apresentam saltos de descontinuidade. Exemplos dessas variveis so o
peso de pessoas, a renda familiar, o consumo mensal de energia eltrica, o preo de um
produto agrcola, a produo de leite de uma fazenda.
Variveis Qualitativas - refere-se a dados no numricos. Exemplos dessas variveis so o sexo
das pessoas, a cor, o grau de instruo. Elas subdividem-se tambm em dois grupos:
- Variveis qualitativas ordinais: so aquelas que definem um ordenamento ou uma
hierarquia. Exemplos so o grau de instruo, a classificao de um estudante no curso de
estatstica, as posies das 100 empresas mais lucrativas, etc.
- Variveis qualitativas nominais: por sua vez no definem qualquer ordenamento ou
hierarquia. So exemplos destas a cor, o sexo, o local de nascimento, etc.
Populao
o conjunto de elementos a serem observados. Exemplo: alunos de uma escola.
Amostra
uma pequena parte selecionada de uma populao que se pretende estudar. Fazemos uma
amostragem quando:

14
- o nmero de elementos da populao muito grande;
- queremos economizar tempo e dinheiro.

Distribuio de Freqncias e Histograma para Dados sem Intervalo de Classe


Utilizamos esse tipo de distribuio quando o nmero de elementos distintos da amostra for
pequeno.
Exemplo: Considere o seguinte conjunto de dados: 21, 21, 21, 22, 22, 23, 23, 24, 25, 25, 25,
25, 26, 26, 26, 28, 30. Construa uma distribuio com todas as freqncias.
X

fi

fac

fr

far

21

3/17

3/17

22

23

24

25

26

28

30

17

||||||||||||||||||||||

|||||||||||||||||||||||

fr %

far %

|||||||||||||||||||||

Histograma
Histograma uma representao grfica de uma tabela de distribuio de freqncias.
Desenhamos um par de eixos cartesianos e no eixo horizontal (abcissas) colocamos os valores da
varivel em estudo e no eixo vertical (ordenadas) colocamos os valores das freqncias. O
histograma tanto pode ser representado para as freqncias absolutas como para as freqncias
relativas. No caso do exemplo anterior, o histograma seria:

15

Freqncia Absoluta

Histograma
5
4
3
2
1
0
21

22

23

24

25

26

28

30

Mais

valores

Ogiva
Ogiva uma representao grfica de uma tabela de distribuio de freqncias acumuladas.
No caso exemplo anterior, a ogiva seria:

Ogiva
Frequencias Acumuladas

18
16
14
12
10
8
6
4
2
0
21

22

23

24

25

Valores de x

26

28

30

16

Distribuio de Freqncia e Histograma para Dados com Intervalo de Classe


Quando o nmero de elementos distintos da amostra for grande, os dados devem ser
tabulados em intervalos de classes. Para a determinao dessas classes no existe uma regra prestabelecida, sendo necessrio um pouco de tentativa e erro para a soluo mais adequada.
Suponhamos que as safras agrcolas de um determinado produto, em uma determinada regio
sejam dadas pela tabela a seguir:
Ano

Safra (1000 t)

Ano

Safra (1000 t)

1
280
10
365
2
305
11
280
3
320
12
375
4
330
13
380
5
310
14
400
6
340
15
371
7
310
16
390
8
340
17
430
9
369
18
370
Lembrando os passos que devem ser seguidos para a tabulao de freqncias de dados.
- Sempre comear por ordenar os dados. Obter o Rol(Tabela de dados ordenados) antes de
comear a construir as Tabela de Freqncias
- Definir o nmero de classes. O nmero de classes no deve ser muito baixo nem muito alto.
Um nmero de classes pequeno gera amplitudes de classes grandes o que pode causar distores
na visualizao do histograma. Um nmero de classes grande gera amplitude de classes muito
reduzidas. Foram definidas regras prticas para a determinao do nmero de classes, sendo que
este deve variar entre 5 e 20 (5 para um nmero muito reduzido de observaes e 20 para um
nmero muito elevado). Se n representa o nmero de observaes (na amostra ou na populao,
conforme for o caso) o nmero aproximado de classes pode ser calculado por Nmero de
Classes(k), k =
k=

n , arredondando os resultados. No caso do exemplo anterior temos n = 18 e

18 = 4,24 e podemos adotar um nmero de 5 classes, que ser razovel. Lembrar que o

valor adotado para k deve ser SEMPRE INTEIRO


- Calcular a amplitude das classes(h). A amplitude ser obtida conhecendo-se o nmero de
classes(k) e amplitude total(AT) dos dados. A amplitude total dos dados o resultado da subtrao
valor mximo - valor mnimo da srie de dados. A amplitude de classe ser: h =

AT
k

O valor do resultado tambm poder ser arredondado para um nmero inteiro mais adequado.
No nosso exemplo temos:

h=

430 - 280
= 30
5

17
Preparar a tabela de seleo com os limites de cada classe. Na tabela abaixo apresentamos
para os dados do nosso exemplo os limites inferior(Linf) e superior (Lsup) de cada uma das 5 classes
de freqncia.
Classe

Limite inferior

Limite Superior

280

310

310

340

340

370

370

400

400

430

Observa-se na tabela acima que o limite superior de cada classe coincide com o limite inferior
da classe seguinte. Prevendo-se que pode ocorrer que o valor de uma observao seja
exatamente igual ao valor do limite de classe deve-se estabelecer um critrio de incluso. Para
evitar esse tipo de dificuldade normalmente se estabelece que o limite superior de cada classe
aberto (e consequentemente, o limite inferior de cada classe fechado), ou seja, cada intervalo
de classe no inclui o valor de seu limite superior, com exceo da ltima classe.
Tabular os dados por classe de freqncia. A partir da listagem de dados seleciona-se para
cada um deles qual a sua classe de freqncia e acumula-se o total de freqncia de cada
classe. De acordo com nosso exemplo, teremos:
Classe
280 |--- 310

fi
3

310 |--- 340

340 |--- 370

370 |--- 400

400 |---| 430

Total

18

fac

fr

far

fr %

far %

18
Histograma
6

Freqncia

5
4
3
2
1
0

280 - 310

310 - 340

340 - 370
classes

370 - 400

400 - 430

Polgono de Freqncia

Freqncia

5
4
3
2
1
0
280 - 310

310 - 340

340 - 370

370 - 400

400 - 430

classes

Estatstica Descritiva: Medidas de Tendncia Central (ou de Posio)


As medidas de tendncia central so usadas para indicar um valor que tende a representar
melhor um conjunto de dados. Geralmente localizam-se em torno do meio ou do centro de uma
distribuio, onde a maior parte dos dados tende a se concentrar. As principais medidas de
tendncia central so: mdia, mediana e moda.

Mdia Aritmtica ( X ), ou simplesmente Mdia


A mdia definida como a soma das observaes dividida pelo nmero de observaes.

x
Se tivermos, por exemplo, n valores, temos:

X=

Exemplo: Calcule a mdia da varivel x: 3, 5, 8, 12, 7, 12, 15, 18, 20, 20.

19

X =

3 + 5 + 8 + .............................. ..... .......... .......


=
= ...............
10
10

Mdia para Dados Agrupados sem Intervalos de Classe ( X )

A mdia para dados agrupados sem intervalo de classe obtida por: X

x f
f

i i
i

onde fi a freqncia absoluta


Exemplo: Determinar a mdia da distribuio:
xi

fi

xifi

fi = 10

X=

Ento:

x f
f
i

xifi =

...................
= ..................
10

Mdia para Dados Agrupados com Intervalos de Classe ( X )


Para o clculo da mdia para dados agrupados com intervalos de classe, necessrio
calcular o ponto mdio de cada classe. A mdia obtida por:

X=

P f
f

m i
i

onde: Pm o ponto mdio de cada classe.


O ponto mdio de cada classe definido por:

Pm =

L inf + L sup
2

Exemplo: Calcular a mdia da distribuio:


classes

fi

2 |------ 5

5 |------ 8

10

8 |------ 11

11 |------ 14

14 |------17

2
fi = 20

Pm

Pmfi

Pmfi = ........

20

X=

Ento:

P f
f
m

.......... ......
= .......... ......
...........

Mdia Geomtrica (G)


A mdia geomtrica de uma amostra definida como a raiz ensima do produto dos n
valores amostrais.

G = n ( x1 )( x2 )...( xn )
Por exemplo, a mdia geomtrica de 5, 9 e 13 :

G = .... (.......)(.......)(........) = ...........


Mdia Harmnica (H)
A mdia harmnica o inverso da mdia aritmtica dos inversos dos valores observados.
Simbolicamente, para uma amostra, temos:

1
H=

1
1
1
x1 + x2 +...+ xn
=
n

1
(1 / x) =
n

n
(1 / x)

Exemplo: A mdia harmnica dos trs valores 2, 5 e 10 :

H=

.........
.........
..........
=
=
= .........
....... ....... ....... ........ + ........ + ........ .........
+
+
...... ...... .......

Mdia Quadrtica (Q) E a raiz quadrada da mdia dos quadrados dos valores observados
n

x
Q=

2
i

i =1

Exemplo: a mdia quadrtica dos trs valores 2 , 5 e

Q=

10 :

...... 2 + ...... 2 + .....2


....... + ....... + .......
........
=
=
= ....... = ........
......
.......
......

Mdia Ponderada
Tomemos um conjunto de n dados...

x1 , x 2 , x3 ,......... .., x n

21
Se, para cada dado

xi associarmos respectivamente um peso pi , a mdia ponderada ser dada

x .p
i

por :

P=

i =1
n

i =1

Exemplo : A mdia ponderada dos valores 5, 7, 9, 11sabendo-se que tm, respectivamente,


pesos 2, 3, 3 e 4 :

P=

5 x 2 + 7 x3 + 9 x3 + 11x 4 .......... ......


=
= .................
2+3+3+ 4
.......... .....

Mediana (Md)
A mediana um valor real que separa o rol em duas partes deixando sua esquerda o mesmo
nmero de elementos que a sua direita. Portanto, a mediana um valor que ocupa a posio
central em uma srie. Ela denotada por: Md.
Inicialmente devemos ordenar os elementos, em seguida determinamos o nmero n de elementos.
Se n mpar: a mediana o termo central, aquele que divide o rol em duas partes iguais.
Exemplo: Determinar a mediana do conjunto: x: 2, 20, 12, 23, 20, 8, 12.
Ordenando os termos: 2, 8, 12, 12, 20, 20 ,23.
A mediana ser o nmero 12, pois ele divide o conjunto em duas partes iguais. Portanto, Md = 12.
Se n par: a mediana ser a mdia aritmtica dos dois termos centrais.
Exemplo: Determinar a mediana da srie: x: 7, 21, 13, 15, 10, 8, 9, 13.
Ordenando os termos: 7, 8, 9, 10, 13, 13, 15, 21.
A mediana ser: Md =

10 + 13
= 11,5
2

Moda (Mo)
o valor de maior freqncia em um conjunto de dados. Ela denotada por Mo.
Exemplos: Determinar a moda dos conjuntos de dados:
a) x: 2, 8, 3, 5, 4, 5, 3, 5, 5, 1.
O elemento de maior freqncia 5. Portanto, Mo = 5. uma seqncia unimodal, pois s
temos uma moda.
b) X: 6, 10, 5, 6, 10, 2.
Este conjunto de dados apresenta o elemento 6 e 10 como elementos de maior freqncia.
Portanto, Mo = 6 e Mo = 10. Por isso chamada de bimodal.
Quando no houver elementos que se destaque pela maior freqncia, dizemos que a
srie amodal.
Exemplo: x: 3, 3, 3, 4, 4, 4.

22
No h moda, pois os elementos tm a mesma freqncia.

Utilizao das Medidas de Tendncia Central


Na maioria das situaes, no necessitamos calcular as trs medidas de tendncia central.
Normalmente precisamos de apenas uma das medidas para caracterizar o centro da srie.
A medida ideal em cada caso aquela que melhor representa a maioria dos dados da srie.
Quando houver forte concentrao de dados na rea central da srie, devemos optar pela Mdia.
Quando houver forte concentrao de dados no incio e no final da srie, devemos optar pela
Mediana.
A Moda deve ser a opo como medida de tendncia central apenas em sries que apresentam
um elemento tpico, isto , um valor cuja freqncia muito superior freqncia dos outros
elementos da srie.

Estatstica Descritiva: Medidas de Disperso


As medidas de disperso so medidas que mostram o grau de disperso ou de concentrao em
torno da mdia. As principais medidas de disperso so: varincia, desvio padro e coeficiente de
variao.
Varincia e Desvio Padro para Dados Agrupados sem Intervalos de Classe
A varincia uma mdia aritmtica calculada a partir dos quadrados dos desvios obtidos
entre os elementos da srie e a sua mdia.
O desvio padro a raiz quadrada positiva da varincia.

S = S 2 , para a amostra;

= 2 , para a populao.
O desvio-padro de um conjunto de valores amostrais uma medida de variao dos
valores em relao mdia.
Frmulas : desvio-padro populacional

desvio-padro amostral

s=

i =1

( x i x )2

i =1

( x i x )2
n 1

Notao
s = desvio-padro de um conjunto de dados amostrais
= desvio-padro de um conjunto de dados populacionais
s = varincia de um conjunto de dados amostrais

= varincia de um conjunto de dados populacionais

23
OBS : Em artigos de revistas e relatrios profissionais costuma-se indicar o desvio-padro por
SD(Standard Deviation) e a varincia por Var.

Maneira de se calcular o desvio-padro


Eemplo : Calcule a varincia e o desvio padro da srie abaixo, representativa de uma populao.
xi

fi

20

xi fi

(xi -

Primeiro, calculamos a mdia:

)2

x f
f
i

fi(xi -

)2

.........
= ..........
.........

Como estamos trabalhando com uma populao a varincia dada por:

f (x
=
i

)2

..............
= ..............
..........

= .......... ..... = .......... ......

O desvio padro ser:

Varincia e Desvio Padro para Dados Agrupados com Intervalos de Classe


A varincia para dados agrupados com intervalos de classe dada por:

S2 =

f (P
i

X )2

n 1

f (P
=
i

)2

, para a amostra;

, para a populao.

O desvio padro dado por:

S = S 2 , para a amostra;

= 2 , para a populao.

Exemplo: Calcule a varincia e o desvio padro da srie abaixo, representativa de uma populao:

24
classes

fi

Pm

2 |------ 5

3,5

5 |------ 8

10

8 |------ 11

11 |------ 14

14 | ------ | 17

20

Pmfi

( Pm ) 2

f i ( Pm ) 2

Primeiramente calculamos o ponto mdio de cada classe e em seguida a mdia:

P f
f
m

...........
= ..........
.....

Como estamos trabalhando com uma populao a varincia dada por:

2 =

f (P
i

)2

.......... ....
= ............
.....

O desvio padro ser:

= ............ = .............

Coeficiente de Variao (CV)


uma medida relativa de disperso, til para a comparao em termos relativos do grau
de concentrao em torno da mdia.

CV =
Se: CV 15%

desvio padro
100
mdia

Baixa disperso Homognea, estvel, regular.

15% < CV< 30%

Mdia disperso.

CV > 30%

Alta disperso Heterognea.

Exemplo: Determine o coeficiente de variao para o exemplo anterior:

25

CV =

............
100 = ...........%
......

Quartis, Decis e Percentis(ou Centis)


Assim como a mediana divide os dados em duas partes iguais, os trs quartis,
denotados por

Q1 , Q2 e Q 3 , dividem as observaes ordenadas(dispostas em ordem

crescente) em quatro partes iguais.


Grosso modo,
mediana e

Q1

Q3

separa os 25% inferiores dos 75% superiores dos valores ordenados ;

iguais a

separa os 75% inferiores dos 25% superiores dos dados. Mais precisamente, ao

menos 25% dos dados sero no mximo iguais a

Q1 .

Q2

Q1

e, ao menos 75% dos dados sero no mnimo

Da mesma forma, 75% dos dados sero no mximo iguais a

sero, no mnimo, iguais a

Q3

Q3 , enquanto ao menos 25%

Analogamente h nove decis, denotados por

D1 , D2 , D3 ,......., D9 , que dividem os dados em 10

grupos com cerca de 10% deles em cada grupo.


H, finalmente, 99 percentis(ou centis), que dividem os dados em 100 grupos com cerca de 1%
em cada grupo.
Os quartis, decis e percentis(centis) so exemplos de fractis, que dividem os dados em partes
aproximadamente iguais.
Exemplo : Um estudante que se submeteu ao vestibular para ingresso em uma faculdade
informado que est no 92 percentil. Isso no significa, entretanto, que ele tenha obtido 92% no
exame; indica apenas que, qualquer que tenha sido a nota obtida, ela foi superior a 92%(e inferior
a 8%) das notas de toda a turma.
O 92 percentil , portanto, uma excelente classificao em
relao aos outros que fizeram o exame.
O processo de determinao do percentil Pk , correspondente a um determinado valor x
bastante simples, como pode ser visto na expresso seguinte :

ndice do percentil do valor x = k =

k=

Lx100
n

nmero de valores inferiores a x


100
nmero total de valores

k
ou L =
.n
100

Onde L = nmero de valores inferiores a x ( O endereo do percentil na tabela)


k = ndice do percentil Pk
n = nmero total de valores ( nmero de elementos da tabela)

Fluxograma para determinao do k-simo percentil

26
Incio

Ordenar os dados, do
menor para o maior.

Calcular
L = (k/100).n ,
n = nmero de valores
k = percentil desejado

Sim

L um
nmero
inteiro?

O valor do k-simo percentil est a meio


caminho entre o L-simo valor e o
prximo valor mais alto no conjunto
original de dados. Obtm-se Pk ,
somando-se o L-simo valor ao prximo
valor mais alto e dividindo-se o
resultado por 2.

No
Modificar L, arredondando
seu valor para o maior inteiro
mais prximo

Exemplo : Determine o 40 percentil (

O valor de

Pk o L-simo valor a

contar do mais baixo

P40

) dos valores da tabela de dados ordenados abaixo :

TABELA DE DADOS ORDENADOS (Rol)


01
02
03
04
05
06
07
08
09
10
11

200
208
225
242
254
259
262
263
267
268
270

201
209
228
248
256
259
262
264
268
268
270

204
215
230
250
256
260
263
265
268
268
270

204
217
234
251
256
261
263
265
268
269
270

206
218
236
251
257
262
263
265
268
269
270

206
220
241
252
257
262
263
266
268
269
270

208
223
242
252
258
262
263
267
268
269
270

27
12
13
14
15
16
17
18
19
20
21
22
23
24
25

270
272
274
275
277
278
279
281
282
283
285
287
290
292

271
273
274
276
277
278
279
281
282
283
285
288
290
293

271
273
274
276
277
278
279
281
282
284
286
289
290
293

272
273
274
276
277
278
280
281
282
284
286
289
291
294

272
273
275
276
277
278
280
282
283
284
286
289
291
295

272
273
275
276
277
278
280
282
283
284
286
289
292
295

272
273
275
277
277
278
281
282
283
285
287
289
292
297

k
40
L=
n =
175 = 70
100
100

Soluo : Acompanhando o fluxograma, calculamos :


P
Sendo 70 um nmero inteiro , segundo o fluxograma, 40 est a meio caminho entre o 70 e o
71 valores. E como esses valores so, respectivamente, 269 e 270, conclumos que o 40
percentil (269 + 270) / 2 = 269,5.
Exemplo 2 : Determine o 71 Percentil.
Soluo :

k
71
L=
n =
175 = 124,25 (valor no inteiro).
100
100

Neste caso, simplesmente se arredonda para o nmero inteiro superior mais prximo, ou seja,
L = 125. E, assim, o nmero que est no espao 125 o 280 e, portanto, P71 = 280
Treino : Determine todos os Quartis
Determine todos os Decis pares
Descubra qual o Percentil dos dados : 208, 252, 278, 287 e 294

Escores z
Quase todos ns estamos familiarizados com a sigla QI(coeficiente de inteligncia) e reconhecemos que
um QI de 102 bastante comum enquanto um QI de 170 raro. Esse QI de 102 bastante comum
porque est prximo da mdia de 100, mas o QI de 170 raro porque est bem acima de 100. Esta
circunstncia pode sugerir uma diferena entre os valores tpicos e os valores raros, com base em sua

(x x )

diferena em relao mdia


. Mas o tamanho dessa diferena depende da escala que
estamos utilizando. Com os valores de QI, uma diferena de 2 pontos insignificante mas, para mdias
de notas de uma faculdade, uma diferena de 2 pontos, entre 2,00 e 4,00, altamente significativa.
Seria muito melhor se dispusssemos de um padro que no levasse em conta a escala utilizada. Com
o valor, ou escore padronizado, dividimos a diferena
chegarmos a esse resultado.

(x x ) ou (x - ) pelo desvio-padro para

DEFINIO : O escore padronizado, ou escore z , o nmero de desvios-padro pelo qual um valor x


dista da mdia (para mais ou para menos) .
Obtm-se como se segue :
Amostra

Populao

28

z=

xx
s

z=

NOTA : Arredondar z para duas casas decimais


Exemplo : As alturas da populao de homens adultos tm mdia

= 1,75

m, desvio-padro

= 0,07 m

e distribuio em forma de sino. Um jogador de basquete com 1,98 m pode ser


considerado excepcionalmente alto, comparado com a populao geral de homens adultos ? Determine
o escore z para a altura de 1,98 m.
Soluo : Como estamos lidando com parmetros populacionais, o escore z se calcula como segue :

z=

1,98 1,75
= 3,29
0,07

Podemos interpretar este resultado dizendo que a altura do jogador de basquete est 3,29 desviospadro acima da mdia.
A importncia dos escores z na estatstica reside no fato de que eles permitem distinguir entre valores
usuais e valores raros, ou incomuns. Consideramos usuais os valores cujos escores padronizados
estejam entre 2,00 e 2,00 e incomuns os valores com escore z inferior a 2,00 ou superior a 2,00 .
Assim, a altura do jogador de basquete do exerccio anterior corresponde a um escore z de 3,29, que
consideramos incomum por ser superior a 2,00. Em comparao com a populao geral, o jogador
pode ser considerado, excepcionalmente alto.

Valores
Incomuns

Valores
Incomuns

Valores usuais

-3

-2

-1

Fig 01 - Interpretao do escore z

Testes de Hipteses e Significncia


Decises Estatsticas
Quando somos levados a tomar decises com base em informaes sobre amostras elas so
chamadas de decises estatsticas.
Hipteses Estatsticas e Hipteses Nulas.
Na tentativa de se chegar a decises, conveniente fazer suposies ou conjeturas sobre as
populaes envolvidas. Estas suposies, que podem ser verdadeiras ou no, so chamadas de
hipteses estatsticas e, em geral, so afirmaes sobre as distribuies de probabilidade das
populaes.
Por exemplo : a) Se queremos decidir se uma moeda viciada, formulamos a hiptese de que a
moeda honesta, ou seja, p=0,5 onde p a probabilidade de dar cara no lanamento da moeda.
b) Se queremos decidir se um procedimento melhor do que outro, formulamos a
hiptese de que no h diferena entre os procedimentos( i.e., quaisquer diferenas observadas
so meramente devido a flutuaes na amostragem de uma mesma populao).
Tais hipteses, muitas vezes chamadas de hipteses nulas ou simplesmente hipteses, so

29
denotadas

H0 .

Quaisquer outras hipteses que difiram de uma dada hiptese nula so chamadas de hipteses
alternativas e so denotadas por H 1 .
Por exemplo : Se a hiptese nula p = 0,5, hipteses alternativas podem ser
p = 0,7 , p 0,5 , p > 0,5 .
Testes de Hipteses e Significncia
Se, sob a suposio de uma hiptese particular ser verdadeira, concluirmos que os resultados
observados em uma amostra aleatria diferem muito daqueles esperados, diramos que as
diferenas observadas so significantes e estaramos inclinados a rejeitar a hiptese.
Por exemplo : Se 20 lanamentos de uma moeda do 16 caras, estaramos inclinados a rejeitar a
hiptese de que a moeda honesta, apesar de admitirmos que podemos estar equivocados.
Os procedimentos que nos capacitam a decidir se aceitamos ou rejeitamos uma hiptese ou a
determinar se a amostra observada difere significativamente dos resultados esperados so
chamados de testes de hipteses, testes de significncia ou regras de deciso.
Erros do Tipo I e Do Tipo II
Se rejeitamos uma hiptese quando ela de fato verdadeira, dizemos que foi cometido um erro do
Tipo I .
Se aceitamos uma hiptese quando ela deveria ser rejeitada, dizemos que foi cometido um erro
do Tipo II .
Em ambos os casos ocorreu uma deciso errada ou um erro no julgamento.
Para que um Teste de hipteses (ou uma regra de deciso) seja bom, precisa ser construdo de
modo a minimizar erros de deciso. Este no um problema simples pois, em geral, para um
dado tamanho de amostra, a tentativa de diminuir um tipo de erro acompanhada por um aumento
no outro tipo de erro.
Na prtica, um tipo de erro pode ser mais srio do que o outro e ento deveria ser assumido um
compromisso em favor de uma limitao no erro mais srio. A nica maneira de reduzir ambos os
tipos de erros, aumentar o tamanho da amostra, o que nem sempre possvel.
Nvel de Significncia
Ao testar uma dada hiptese, a probabilidade mxima com a qual queremos arriscar cometer erro
do Tipo I chamada de nvel de significncia do teste. Esta probabilidade em geral especificada
antes de qualquer amostra ser extrada para que os resultados obtidos no venham a influenciar
nossa deciso.
Na prtica so usuais nveis de significncia de 0,05 ou 0,01 , apesar de outros valores tambm
serem usados. Se, por exemplo, um nvel de significncia de 0,05 (ou 5%) for escolhido na
construo de um teste de hipteses, ento h em torno de 5 chances em 100, da hiptese ser
rejeitada quando ela deveria ter sido aceita, isto , sempre que a hiptese nula for verdadeira,
estaremos em torno de 95% confiantes de que tomamos a deciso correta. Em tais ocasies
dizemos que a hiptese foi rejeitada ao nvel de significncia de 0,05, o que significa que podemos
estar errados com probabilidade de 5%.

30
Testes envolvendo a Distribuio Normal
Para ilustrar as idias recm apresentadas, suponhamos que sob uma dada hiptese, a
distribuio amostral de uma estatstica S uma distribuio normal com mdia s e desviopadro

. Alm disso, suponhamos que decidimos rejeitar a hiptese de S se for muito pequena

ou muito grande. A distribuio da varivel padronizada

Z=

(S s )
s

a distribuio normal

padro (mdia 0, varincia 1) mostrada na figura abaixo e valores extremos de Z nos levariam
rejeio da hiptese.
Regio
crtica
0,025

Regio
crtica
0,025

0,95

z = - 1,96

z = 1,96

Como est indicado na figura, podemos estar 95% confiantes de que, se a hiptese for verdadeira,
o escore z de uma estatstica amostral verdadeira S estar entre 1,96 e 1,96 (pois a rea sob a
curva normal entre estes valores 0,95).
Entretanto, se ao escolher uma nica amostra aleatoriamente encontramos o escore z desta
estatstica fora do intervalo de 1,96 a 1,96, concluiramos que tal evento aconteceria somente
com probabilidade de 0,05(rea sombreada total na figura) se a hiptese fosse verdadeira.
Diramos ento que este escore z difere significativamente do que seria esperado sob a hiptese e
estaramos inclinados a rejeitar a hiptese.
A rea 0,05 da regio sombreada total o nvel de significncia do teste. Este nvel representa a
probabilidade de estarmos errados em rejeitar a hiptese, isto , a probabilidade de cometer o erro
do Tipo I. Portanto dizemos que uma hiptese rejeitada ao nvel de significncia de 0,05 ou que
o escore z de uma dada estatstica amostral significante ao nvel de significncia de 0,05.
O conjunto de escores z fora do intervalo de 1,96 a 1,96 constitui o que chamado de regio
crtica ou regio de rejeio da hiptese ou regio de significncia. O conjunto dos escores z
dentro do intervalo de 1,96 a 1,96 pode ser chamado de regio de aceitao da hiptese ou
regio de no-significncia.
Com base nestas observaes podemos formular as seguintes regras de deciso :
a)
Rejeito a hiptese ao nvel de significncia de 0,05 se o escore z da estatstica S
estiver fora do intervalo de 1,96 a 1,96 (isto , z > 1,96 ou z < -1,96 ). Isto
equivale dizer que a estatstica amostral observada significante ao nvel de 0,05.
b)

Aceito a hiptese( ou, se desejado, no tomo qualquer deciso) em caso contrrio.

IMPORTANTE : Deve-se destacar que outros nveis de significncia poderiam ter sido usados.
Por exemplo : se um nvel de 0,01 fosse usado, substituiramos 1,96 por 2,58 em todos os lugares
acima. Vide as Tabelas abaixo.

Clculo do Desvio-Padro
A mdia pode ser encontrada fazendo-se

= np

31
O desvio-padro pode ser encontrado aplicando-se a frmula

= n. p.q

onde :

n = quantidade de dados utilizados na pesquisa


p = probabilidade de sucesso do evento analisado
q = probabilidade de fracasso do evento analisado
Observe-se que, SEMPRE, p + q = 1
Exemplos : Moedas.... p = 0,5 =
q = 0,5 =
Dados ..... p = 1/6
q = 5/6

Tabelas de valores crticos de Escore Z


Nvel de
Confiana

99,73 %

99 %

98 %

96 %

95,45 %

95 %

90 %

80 %

68,27 %

50 %

3,00

2,58

2,33

2,05

2,00

1,96

1,645

1,28

1,00

0,6745

Valores
crticos

zc

Nvel de
significncia

0,10

0,05

0,01

0,005

0,002

-1,28
ou
1,28
-1,645
e
1,645

-1,645
ou
1,645
-1,96
e
1,96

-2,33
ou
2,33
-2,58
e
2,58

-2,58
ou
2,58
-2,81
e
2,81

-2,88
ou
2,88
-3,08
e
3,08

Valores crticos
de z para testes
unilaterais
Valores crticos
de z para testes
bilaterais

Teste do Qui Quadrado


Este teste objetiva verificar se a freqncia absoluta observada de uma varivel
significativamente diferente da distribuio de freqncia absoluta esperada. Aplica-se o teste do
qui quadrado para uma amostra quando se quer estudar a dependncia entre duas variveis
atravs de uma tabela de dupla entrada, tambm conhecida como tabela de contingncia.

Para que se possa executar o teste do qui quadrado h de se observar algumas condies
como :
a) Exclusivamente para variveis nominais e ordinais
b) Somente para observaes independentes
c) No se aplica se 20% das observaes forem inferiores a 5.(Amostras muito
pequenas)
d) No pode haver freqncias inferiores a 1

32
e) Nos dois ltimos casos, caso haja incidncia, aconselha-se agrupar os dados
segundo algum critrio especfico.

Passo-a-Passo para a Execuo do Teste Qui Quadrado


Passo 01 : Determinar a hiptese nula

H 0 que dever ser a negativa da existncia de diferenas

entre a distribuio de freqncia observada e a esperada.


Passo 02 : Estabelecer o nvel de significncia

( )

Passo 03 : Determinar a regio de rejeio da hiptese nula

H 0 atravs da determinao dos

( )

graus de liberdade sendo = k 1 onde k o nmero de classes(categorias). A


determinao feita atravs da tabela de contingncia onde se localiza o valor do qui quadrado
tabelado

(x ).
2
t

Passo 04 : Determinar o valor do qui quadrado calculado

xc2 =

(x ) atravs da frmula :

(oi ei )2
ei

(x ) e do qui quadrado calculado (x )


o valor do segundo maior do que o primeiro, isto , (x ) > (x ) , rejeita-se a hiptese

Passo 05 : Comparar os valores do qui quadrado tabelado


. Sendo

2
c

2
t

2
c

2
c

nula H 0 em favor da hiptese alternativa

2
t

H1 .

Exemplo :
Um vendedor trabalhou comercializando um produto em cinco bairros residenciais de uma mesma
cidade, num mesmo perodo do ano. O gerente decidiu verificar se o desempenho do vendedor
oscilava em virtude do bairro trabalhado, ou seja, se as diferenas eram significativas entre os
bairros trabalhados. A partir deste estudo o gerente pretendia elaborar uma estratgia comercial
especfica para cada bairro ou manter uma mesma estratgia para todos.
Bairro
Valores
Observados

Total

11

25

20

15

80

Valores
Esperados

16

16

16

16

16

80

Soluo :
Passo 01 : A hiptese nula

H 0 ser : No h diferenas significativas entre os 5 bairros

estudados e, assim, uma hiptese alternativa H 1 poder ser As diferenas observadas entre os
bairros mais discrepantes ( 3 e 4) so significativamente diferentes para melhor em relao aos
demais bairros

33

Passo 02 : Nvel de significncia escolhido

= 0,05 = 5%

Passo 03 : Sendo k = 5 ( nmero de bairros estudados, classes, categorias), teremos

= k 1 = 5 1 = 4

e a tabela de contingncia nos oferece

(x ) =9,488 9,49
2
t

(x ) = [(..... .....) + (..... .....) + (..... .....) + (..... .....)


2

2
c

Passo 04 :

+ ..(... .....)

]=

.......... .
2
(
.....) + (.....) + ..... + ..... + (.....)
..... + ..... + ..... + ..... + ..... .........
=
=
=
= ...........
..........
........
........
2

Passo 05 : Observa-se que, de fato,


favor de

(x ) > (x ) pois
2
c

2
t

10,75 > 9,49 e, assim, rejeita-se

H 0 em

H 1 . Desta forma a concluso final a de que h diferena significativa, ao nvel de 5%

de significncia para os bairros 3 e 4 e o gerente dever mesmo elaborar uma estratgia comercial
para cada bairro.

Teste do Qui Quadrado para Independncia (Duas Amostras)


A utilizao do presente teste em pesquisa visa verificar se as distribuies de duas ou mais
amostras no relacionadas diferem significativamente em relao determinada varivel.
CONDIES PARA A EXECUO DO TESTE
a)Exclusivamente para variveis nominais e ordinais;
b)Preferencialmente para amostras grandes, n <30;
c)Observaes independentes;
d)No se aplica se 20% das observaes forem inferiores a 5
e)No pode haver freqncias inferiores a 1;
f)Nos dois ltimos casos, se houver incidncias desta ordem, aconselha-se agrupar os
dados segundo um critrio em especfico.
Passo-a-Passo para a Execuo do Teste
Passo 01: Determinar H0. As variveis so independentes, ou as variveis no esto associadas
Passo 02 : Estabelecer o nvel de significncia ( );
Passo 03 : Determinar a regio de rejeio de H0. Determinar o valor dos graus de liberdade (),

34
sendo = (L 1) (C 1), onde L = nmeros de linhas da tabela e C = ao nmero de
colunas.. Encontrar portanto, o valor do qui-quadrado tabelado;
Passo 04 : Para encontrar o valor esperado (E), utilizar a frmula a seguir:

E=

(Soma da linha i )(Soma da coluna i )


Total das observaes

Passo 05 : Sendo o qui quadrado calculado, maior do que o tabelado, rejeita-se H0 em favor de H1.
H dependncia ou as variveis no esto associadas.

Exemplo: Um pesquisador deseja identificar se h dependncia no consumo de seus chocolates e


as cidades de sua regio.

Sabor do chocolate
Chocolate com caju
Chocolate com amendoim
Chocolate com flocos
Chocolate com passas

Cidades do Vale do Taquari


Lajeado
Santa Cruz Estrela
60
30
20
45
35
20
55
25
47
70
35
25
230
125
112

Taquari
40
10
13
20
83

150
110
140
150
550

Passo 01 : H0: A preferncia pelos sabores independe da cidade


H1: A preferncia pelos sabores depende da cidade.
Passo 02 : = 0,05 = 5%
Passo 03 : = (4 1) (4 1) = 9, onde qui quadrado tabelado igual a 16,919.(Vide Tabela A-4)
Passo 04 :
Calculo dos valores esperados
(E)
Sabor do chocolate
Chocolate com caju
Chocolate com amendoim
Chocolate com flocos
Chocolate com passas

Cidades do Vale do Taquari


Lajeado
62,7
46,0
58,5
62,7

Santa Cruz Estrela

Taquari

Passo 05 :
-qui quadrado para a linha Chocolate com caju

X2 =

(...... ......)2 + (...... ......)2 + (...... ......)2 + (...... ......)2


.........

.........

.........

.........

= .......... .

- qui quadrado para a linha Chocolate com amendoim

X2 =

(...... .....)2 + (...... .....)2 + (...... ......)2 + (...... ......)2


........

........

.........

.........

= ..........

35
- qui quadrado para a linha Chocolate com flocos

2
2
2
(
...... ......)
(
...... ......)
(
..... ......)
(...... ....)..2
=
+
+
+

.........

.........

.........

.........

= ........

-qui quadrado para a linha Chocolate com passas

2
2
2
2
(
(
(
(
...... ......)
...... ......)
...... ......)
...... ......)
=
+
+
+

.........

.........

.........

.........

= .......... .

-qui quadrado total calculado = ............. + ............. + ............. + ............. = ................


Conclui-se que o qui quadrado calculado (..............) maior do que o tabelado (.............) e, assim,
rejeita-se H0 em favor de H1.

CONCLUSO : Portanto ............... diferena significativa, ao nvel de 0,05 ou (5%), entre as cidades.

Correlao
Existe uma correlao entre duas variveis quando uma delas est, de alguma forma, relacionada
com a outra.
O coeficiente de correlao linear r mede o grau de relacionamento linear entre os valores
emparelhados x e y em uma amostra. O coeficiente de correlao linear chamado s vezes de
coeficiente momento-produto de Pearson.
TABELA PARA CLCULO DE r

x
-

y
-

Frmula para clculo de r

r=

x.y
x. y

X
x2

Y
y2

n xy ( x )( y )

[ n( x 2 ) ( x )2 ][

( y ) ( y ) ]
2

36

Deveremos arredondar o coeficiente de correlao linear r para trs casas decimais, a fim de que
seu valor possa ser comparado com os valores crticos da Tabela de Valores Crticos do
Coeficiente de Correlao r de Pearson, encontrada na maioria dos livros de Estatstica.

Interpretao do Coeficiente de Correlao Linear


Se o valor de r est prximo de 0, conclumos que no h correlao linear significativa entre x e
y, mas se r est prximo de 1 ou +1, conclumos pela existncia de correlao linear
significativa entre x e y . Como a interpretao da expresso prximo de 0, ou 1, ou +1
vaga, adota-se o critrio de deciso seguinte, bastante especfico :
Se o mdulo do valor calculado de r excede o valor na Tabela A-6,
conclumos que h correlao linear significativa. Em caso contrrio,
no h evidncia suficiente para apoiar a existncia de uma
correlao linear significativa.

Regresso Linear
A expresso

y = b0 + b1 x

chamada de :

Equao da Regresso ou,


Reta de Regresso ou,
Regra de melhor ajuste ou,
Reta de mnimos quadrados

Onde

x = varivel independente ou varivel preditora


y = varivel dependente ou varivel resposta
b0 = intercepto y

b1 = coeficiente angular
OBS : 1)- Os valores

b0 e b1 so estatsticas amostrais usadas para estimar os parmetros

populacionais

0 e 1 .

2)- A Equao da Regresso s poder ser usada para relaes lineares


3)- A Equao da regresso s poder ser usada para variveis aleatrias de distribuio
normal(em forma de sino)

Objetivo
O objetivo utilizar dados amostrais emparelhados para estimar a equao de regresso.
Dispondo apenas de dados amostrais, no poderemos achar os valores exatos dos parmetros
populacionais 0 e 1 mas, com os dados amostrais, podemos estim-los com b0 e b1 , que se
obtm com as frmulas :

Regras de Arredondamento :
1) - De modo geral, para arredondar,
utilize um decimal a mais do que os que
aparecem nos dados originais.
2) - Arredondar apenas a resposta final e
no os valores intermedirios.
Exemplos :
1)- A mdia de (2), (3) e (5)
3,33333333............. , que pode ser

37

(y)(x ) (x)(xy)
=
n(x ) (x)
2

b0

b1 =

n( xy ) ( x )( y )

n x 2 ( x )

TABELA

DE

DISTRIBUIO QUI QUADRADO (x)


rea direita do valor crtico

Graus
de
liberdade
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28

0,995

0,99

0,975

0,95

0,90

0,10

0,05

0,025

0,01

0,005

---0,010
0,072
0,207
0,412
0,676
0,989
1,344
1,735
2,156
2,603
3,074
3,565
4,075
4,601
5,142
5,697
6,265
6,844
7,434
8,034
8,643
9,260
9,886
10,520
11,160
11,808
12,461

---0,020
0,115
0,297
0,554
0,872
1,239
1,646
2,088
2,558
3,053
3,571
4,107
4,660
5,229
5,812
6,408
7,015
7,633
8,260
8,897
9,542
10,196
10,856
11,524
12,198
12,879
13,565

0,001
0,051
0,216
0,484
0,831
1,237
1,690
2,180
2,700
3,247
3,816
4,404
5,009
5,629
6,262
6,908
7,564
8,231
8,907
9,591
10,283
10,982
11,689
12,401
13,120
13,844
14,573
15,308

0,004
0,103
0,352
0,711
1,145
1,635
2,167
2,733
3,325
3,940
4,575
5,226
5,892
6,571
7,261
7,962
8,672
9,390
10,117
10,851
11,591
12,338
13,091
13,848
14,611
15,379
16,151
16,928

0,016
0,211
0,584
1,064
1,610
2,204
2,833
3,490
4,168
4,865
5,578
6,304
7,042
7,790
8,547
9,312
10,085
10,865
11,651
12,443
13,240
14,042
14,848
15,659
16,473
17,292
18,114
18,939

2,706
4,605
6,251
7,779
9,236
10,645
12,017
13,362
14,684
15,987
17,275
18,549
19,812
21,064
22,307
23,542
24,769
25,989
27,204
28,412
29,615
30,813
32,007
33,196
34,382
35,563
36,741
37,916

3,841
5,991
7,815
9,488
11,071
12,592
14,067
15,507
16,919
18,307
19,675
21,026
22,362
23,685
24,996
26,296
27,587
28,869
30,144
31,410
32,671
33,924
35,172
36,415
37,652
38,885
40,113
41,337

5,024
7,378
9,348
11,143
12,833
14,449
16,013
17,535
19,023
20,483
21,920
23,337
24,736
26,119
27,488
28,845
30,191
31,526
32,852
34,170
35,479
36,781
38,076
39,364
40,646
41,923
43,194
44,461

6,635
9,210
11,345
13,277
15,086
16,812
18,475
20,090
21,666
23,209
24,725
26,217
27,688
29,141
30,578
32,000
33,409
34,805
36,191
37,566
38,932
40,289
41,638
42,980
44,314
45,642
46,963
48,278

7,879
10,597
12,838
14,860
16,750
18,548
20,578
21,955
23,589
25,188
26,757
28,299
29,819
31,319
32,801
34,267
35,718
37,156
38,582
39,997
41,401
42,796
44,181
45,559
46,928
48,290
49,645
50,993

38
29
30
40
50
60
70
80
90
100

13,121
13,787
20,707
27,991
35,534
43,275
51,172
59,196
67,328

14,257
14,954
22,164
29,707
37,485
45,442
53,540
61,754
70,065

16,047
16,791
24,433
32,357
40,482
48,758
57,153
65,647
74,222

17,708
18,493
26,509
34,764
43,188
51,739
60,391
69,126
77,929

19,768
20,599
29,051
37,689
46,459
55,329
64,278
73,291
82,358

39,087
40,256
51,805
63,167
74,397
85,527
96,578
107,565
118,498

42,557
43,773
55,758
67,505
79,082
90,531

45,722
46,979
59,342
71,420
83,298
95,023

101,879
113,145
124,342

106,629
118,136
129,561

De Donald B. Owen, Hanbook of Statistical Tables, @ 1962 Addison-Wesley Publishing Co. , Reading, MA

TABELA
Valores Crticos do Coeficiente de
Correlao r de Pearson
n
= 0,05
= 0,01
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
25
30
35
40
45
50
60
70
80

0,950
0,878
0,811
0,754
0,707
0,666
0,632
0,602
0,576
0,553
0,532
0,514
0,497
0,482
0,468
0,456
0,444
0,396
0,361
0,335
0,312
0,294
0,279
0,254
0,236
0,220

0,999
0,959
0,917
0,875
0,834
0,798
0,765
0,735
0,708
0,684
0,661
0,641
0,623
0,606
0,590
0,575
0,561
0,505
0,463
0,430
0,402
0,378
0,361
0,330
0,305
0,286

49,588
50,892
63,691
76,154
88,379

52,336
53,672
66,766
79,490
91,952

100,425
112,329
124,116
135,807

104,215
116,321
128,299
140,169

39
90
100

0,207
0,196

0,269
0,256

NOTA : Para testar Ho : p = 0 contra H1 : p 0 , rejeite Ho se o


valor absoluto de r for maior do que o valor crtico da tabela

(a) Correlao positiva entre x e y

***
***
***
****
***
****
***
***
****
***
****
x
**

* **
***
* ** * **
**
*** *
** * *
** *
**** * *
* * * **
****** *
* * * **
x

*
*
*
*
*
*
*
*
*
*

*
(b)

Forte

Correlao

positiva entre x e

*
** *
* * *
*
* * * * **
** ** * *
** *** * *
* ** *** * *
** *
** * *
**

(c)

Correlao

positiva

perfeita entre x e y

*
***
**
***
**
**

*
*
*
*
*
*
***
**
***
*

*
*
*
*
***

Correlao
(d) Correlao negativa entre x e y Forte
(e)
negativa entre x e

*
(f)

Correlao negativa
perfeita entre x e y

40

*
*
*

***
***
* *

*
*

**

* *
*
*

*
*

* **

***
***
* **
**
*

*
*
*

*
*

(g) No h correlao entre x e y

(i) Grfico da Equao de


Regresso entre x e y

(h) Correlao no linear


entre x e y

Exerccios sobre Sries e Grficos


1. Montar uma srie cronolgica para representar os valores das exportaes de acar,
fornecidas pelo Instituto do Acar e do lcool nos anos de 1965 a 1971 em milhares de
dlares: 60193 80114 812826 106879 112064 126740 149548.

2. Idealizar uma srie geogrfica para representar o seguinte fato: populao da regio Norte
do Brasil em 1970, sabendo-se que em Rondnia, Acre, Amazonas, Roraima, Par e
Amap temos, respectivamente, 116620 218006 960934 41638 2197072 e 116480
habitantes, segundo dados da Fundao IBGE.

3. Fazer uma tabela estatstica para representar o movimento religioso de certo municpio no
perodo 1975-1977, que apresentou os seguintes dados: em 1975 houve 56738 habitantes
batizados (dos quais 26914 do sexo feminino), 15884 casamentos e 13678 extremasunes. Em 1976, houve 33915 batizados do sexo masculino e 29568 do sexo feminino;
os casamentos foram em nmero de 17032 e as extremas-unes, 14328. Em 1977, em
um total de 71232 batizados, 34127 eram do sexo masculino; as extremas-unes foram
16107 e os casamentos 16774.

4. A tabela a seguir mostra as reas, em milhes de km, dos oceanos. Representar


graficamente os dados, usando: a) um grfico de colunas ; b) um grfico de setores.
Oceano

Antrtico

rtico

Atlntico

ndico

Pacfico

41
rea
(milhes km)

36,8

23,2

199,4

137,9

342,7

Exerccio de Estatstica
Completar as Tabelas de Distribuio de Freqncias abaixo.

Xi

Fa

21
22
23
24
25
26
28
30
31
32
33
34
35
36

3
2
2
1
4
3
1
1
3
1
3
3
2
1

Fa a

Fr

Fr a

|||||||||||||||||||||||||||

Classe

Fa

45 |--- 55
55 |--- 65
65 |--- 75

15
20
35

Fa a

||||||||||||||||||||||||||||

Fr

Fr a

42
75 |--- 85
85 |--- 95

20
10

|||||||||||||||||||||||

|||||||||||||||||||||||

EXERCCIO DE ESTATSTICA - Mdias


Um levantamento feito nas idades dos atletas participantes de um determinado torneio de futebol
produziu a tabela abaixo.
21
32
23
21
26
40
22
31
19
21
19
16
21
20

22
23
24
21
26
19
21
30
18
22
20
21
20
22

21
24
26
21
27
20
20
19
30
21
17
27
34
23

20
26
27
21
28
21
26
23
30
23
25
27
23
21

23
23
28
22
29
23
27
24
18
25
26
28
30
27

23
21
23
22
32
26
29
25
19
18
40
24
25
26

23
32
25
24
31
23
22
26
27
28
29
30
30
29

19
35
24
23
29
22
21
21
21
20
19
20
23
24

30
21
42
28
18
28
22
21
21
23
24
25
28
26

25
21
28
29
17
19
18
19
21
20
20
21
27
24

23
20
28
29
30
23
22
23
22
23
23
24
25
25

25
21
29
30
31
32
33
34
21
23
22
22
22
25

23
24
22
23
24
22
21
23
28
23
21
20
17
34

34
25
17
21
24
23
18
24
25
27
24
28
29
28

Pede-se :
Calcular a mdia de idade dos jogadores utilizando-se uma Tabela de Freqncias com intervalo
de Classes em uma das seguintes situaes :
1) Descartando a menor idade encontrada
2) Descartando a maior idade encontrada
3) Descartando a maior e a menor idade encontradas
4) Considerando todas as idades encontradas

43
Utilizar K =

K / Situao
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

EXERCCIOS SOBRE VARINCIA E DESVIO PADRO


1 A tabela abaixo representa os dados coletados de uma amostra.
20
23
29
25

26
25
20
20

1111111111-

26
28
27
25

22
21
28
28

26
28
22
25

29
29
26
29

27
20
28
25

26
27
23
27

21
29
20
30

29
25
23
29

23
29
27
27

27
20
24
28

30
23
25
26

28
25
26
28

a Qual a Amplitude desta amostra?


b Qual o valor da Mediana?
c Qual a sua Moda?
d Calcule a Mdia da terceira coluna.
e Calcule a Mdia Geomtrica da quarta coluna
f Calcule a Mdia Harmnica da sexta coluna
g Calcule a Mdia Quadrtica da ltima coluna
h Qual a Varincia da amostra?
i Qual o Desvio Padro da amostra?
j Qual o Coeficiente de Variao da amostra?

2 A tabela abaixo representa o Rol de uma Populao.


200
208
225
242
254
259
262
263
267
268
269
270

201
209
228
248
256
259
262
264
268
268
270
271

204
215
230
250
256
260
263
265
268
268
270
271

204
217
234
251
256
261
263
265
268
269
270
272

206
218
236
251
257
262
263
265
268
269
270
272

206
220
241
252
257
262
263
266
268
269
270
272

208
223
242
252
258
262
263
267
268
269
270
272

208
224
242
253
259
262
263
267
268
269
270
272

208
225
242
254
259
262
263
267
268
269
270
272

208
225
242
254
259
262
263
267
268
269
270
272

28
20
25
30

44
272
273
273
273
273
273
273
274
274
274
274
275
275
275
275
276
276
276
276
276
277
277
277
277
277
277
277
277
278
278
278
278
278
278
278
279
279
279
280
280
280
281
282
283
283
284
284
284
285
286
286
287
287
288
288
288
2 a Transforme este Rol numa Tabela com dados agrupados com
Intervalos de classe
2 b Calcule a Varincia desta Populao
2 c Calcule o Desvio-Padro desta Populao
2 d Calcule o Coeficiente de Variao (CV ) desta pesquisa.

273
275
277
277
279
281
285
289

274
275
277
278
279
281
286
289

274
275
277
278
279
282
286
290

208
224
242
253
259
262
263
267
268
269
270
272
273
275
277
277
279
280
282
283
285
287
289
292
297

208
225
242
254
259
262
263
267
268
269
270
272
274
275
277
278
279
281
282
283
285
287
290
292
297

208
225
242
254
259
262
263
267
268
269
270
272
274
275
277
278
279
281
282
283
285
287
290
292
300

Exerccios sobre FRACTIS

200
208
225
242
254
259
262
263
267
268
269
270
272
274
275
277
278
279
281
282
283
285
287
290
292

201
209
228
248
256
259
262
264
268
268
270
271
273
274
276
277
278
279
281
282
283
285
288
290
293

204
215
230
250
256
260
263
265
268
268
270
271
273
274
276
277
278
279
281
282
284
286
289
290
293

204
217
234
251
256
261
263
265
268
269
270
272
273
274
276
277
278
280
281
282
284
286
289
291
294

206
218
236
251
257
262
263
265
268
269
270
272
273
275
276
277
278
280
282
283
284
286
289
291
295

206
220
241
252
257
262
263
266
268
269
270
272
273
275
276
277
278
280
282
283
284
286
289
292
295

208
223
242
252
258
262
263
267
268
269
270
272
273
275
277
277
278
280
282
283
285
287
289
292
297

Com base na Tabela de Dados Ordenados(Rol) Acima, pede-se:

208
225
242
254
259
262
263
267
268
269
270
272
274
275
277
278
279
281
282
283
285
287
290
292
300

45
a) Os Percentis
b) Os Quartis

P37 , P48 , P77

Q1 , Q 2 , Q 3

c) Os Decis D3 , D 5 , D 7
d) Determine o Percentil correspondente a 252 , 279 , 287
e) Qual a diferena entre D2 e P20 ?
f)
g)
h)
i)

Qual o Percentil correspondente a Q1 , Q 2 e Q 3 ?


Qual a Amplitude da Amostra ?
Como faria para escolher o nmero de classes ?
Adotado um nmero de classes, qual seria a amplitude de classe ?

Exerccios de Estatstica Mdias


01 Determine as mdias aritmtica, geomtrica, harmnica e quadrtica das seguintes sries :
a) 3, 4, 1, 3, 6, 5, 6
b) 7, 8, 8, 10, 12
c) 3,2; 4; 0,75; 5; 2,13; 4,75
d) 70, 75, 76, 80, 82, 83, 90

02 A mdia mnima para aprovao em determinada disciplina 5,0. Se um estudante obtm as


notas 7,5; 8,0; 3,5; 6,0; 2,5; 2,0; 5,5; 4,0 nos trabalhos mensais da disciplina em questo,
pergunta-se se ele foi ou no aprovado.

03 Calcule para cada uma das distribuies abaixo, sua respectiva mdia.
a)

xi | 3 4 7 8 12

b)

fi | 2 5 8 4 3
c)

xi |

f ac

2
3
4
5
6

3
9
19
25
28

|
|
|
|
|

xi | 10 11 12 13
f i | 5 8 10 6

d)

xi |
7
8
9
10
11

|
|
|
|
|

fi
1/16
5/18
1/3
2/9
5/48

e)

xi |
85
87
88
89
90

|
|
|
|
|

fi
5
1
10
3
5

46

04 Dadas as estaturas, em cm, de 140 alunos, conseguiu-se a distribuio abaixo.


Calcular a mdia.
Estat.| 145|---150 | 150|---155 | 155|---160 | 160|---165 | 165|---170 | 170|---175 | 175|---180 | 180|---185
N |
2
|
10 |
27 |
38 |
27 |
21 |
8
|
7

05 Turmas que possuem determinada disciplina em comum apresentam, nessa disciplina:


Turma A (40 alunos) - mdia 6,5
Turma B (35 alunos) - mdia 6,0
Turma C (35 alunos) - mdia 4,0
Turma D (20 alunos) - mdia 7,5
Determine a mdia geral.

Exerccios sobre ESCORE Z


01 Os carros dos estudantes de uma faculdade tm idade mdia de 7,93 anos, com desviopadro de 3,68 anos. Determine o escore z para os seguintes carros :
a) Um GM Corsa 1994
b) Um FIAT Plio 2003
c) Um FORD Focus 0 Km
02 Uma pesquisa realizada no Japo detectou que o nmero de horas que os estudantes
universitrios passam estudando fora da escola, cada semana, tm mdia de 8,03 h e desviopadro 4,97 h. Determine o escore z para um aluno que estuda 20 horas por semana.
03 Uma mulher alegou ter dado luz uma criana, 305 dias aps a visita de seu marido, que
estava servindo na Marinha em misso no exterior. Os tempos de durao da gravidez, acusam
uma mdia de 269 dias, com desvio-padro de 15,5 dias. Determine o escore z correspondente
aos 305 dias e comente:
a) Esse prazo pode ser considerado fora do comum ?
b)Que se pode concluir ?
04 Certa mquina automtica aceita moedas de 50 centavos que no fujam ao padro comum.
Ache o escore z para uma moeda de 50 centavos que pesa 7,37 g. Sabe-se que os pesos das
moedas de 50 centavos tm mdia de 7,60 g com desvio-padro de 0,009 g e pergunta-se :
a) Qual o escore z desta moeda
b) Esta moeda ser aceita pela mquina ?
05 Para os homens com idade entre 18 e 24 anos, os nveis de colesterol ( em mg / ml ) tm
mdia de 178,1 e desvio-padro de 40,7.

47
a) Determine o escore z para um homem de 22 anos de idade, que tem um ndice de
colesterol de 274,9 mg / ml.
b) Esse nvel pode ser considerado muito elevado ?
06 ) Trs candidatos a um emprego fazem testes equivalentes de desempenho em pensamento
crtico e voc o encarregado de decidir qual deles contratar.
A. da Silva acertou 38 questes em um teste onde a mdia era de 29 e o desvio-padro, 6.
B. dos Santos acertou 399 questes no teste de mdia 313 e desvio-padro, 56
C. Oliveira teve nota 4,11 em teste de mdia 2,76 e desvio-padro 0,91.
a) Qual deles seria o seu escolhido ?
b) Por que ?
07) Em exame de estatstica a mdia foi de 78 e o desvio-padro foi 10.
a) Determine os escores z de dois alunos cujas notas foram 93 e 62, respectivamente.
b) Determine as notas de dois alunos cujos escores z foram -0,6 e 1,2, respectivamente
08) Encontre a mdia e o desvio-padro em um exame onde as notas 70 e 88 correspondem a
escores z de -0,6 e 1,4, respectivamente.

Exerccios de fixao sobre TESTES DE HIPTESE E SIGNIFICNCIA


01 ) Para testar uma hiptese de que uma moeda honesta, a seguinte regra de deciso tomada:
(1) Aceito a hiptese se o nmero de caras em uma nica amostra de 100 lanamentos est entre
40 e 60 inclusive
(2) Rejeito a hiptese caso contrrio.
a)- Encontre a probabilidade de rejeitar a hiptese quando ela, de fato, correta
b)- Interprete graficamente a regra de deciso e o resultado da pergunta anterior
c)- Que concluses voc tiraria se a amostra de 100 fornecesse 53 caras ?
d)- E se fornecesse 60 caras ?
e)- Voc poderia estar errado em suas concluses da pergunta c) ?
02) Crie uma regra de deciso para testar a hiptese de que uma moeda honesta se uma
amostra de 64 lanamentos da moeda obtida e se um nvel de (a) 0,05, (b) 0,01 usado.

03) Em um experimento sobre percepo extra sensorial (PES), uma pessoa em uma sala
questionada sobre a cor(vermelha ou azul) de uma carta escolhida de um baralho de 50 cartas
embaralhadas por um indivduo em outra sala. A pessoa desconhece quantas cartas vermelhas ou
azuis tm no baralho. Se a pessoa identifica 32 cartas corretamente, determine se os resultados
so significantes ao nvel de
(a) 0,05 de significncia
(b) 0,01 de significncia.
04) Em 200 lanamentos de uma moeda, 115 caras e 85 coroas foram observadas. Teste a hiptese de que a moeda
honesta usando um nvel de significncia de: (a) 0,05
(b) 0,01
05) A tabela abaixo mostra as freqncias observadas e esperadas no lanamento de um dado 120 vezes.
(a) Teste a hiptese de que o dado honesto, usando um nvel de significncia de 0,05.
Face
Freqncia
Observada
Freqncia
Esperada

25

17

15

23

24

16

20

20

20

20

20

20

48

06) Considere dois grupos, A e B, cada um consistindo de 100 pessoas portadoras de uma doena. Um soro dado
ao Grupo A, mas no ao Grupo B(o qual chamado grupo de controle); caso contrrio, os dois grupos so tratados
identicamente. constatado que nos Grupos A e B, 75 e 65 pessoas, respectivamente, se recuperaram da doena.
Teste a hiptese de que o soro ajudou a curar a doena usando um nvel de significncia de: (a) 0,01
(b) 0,05
(c) 0,10.
07) Em 60 lanamentos de uma moeda, 37 caras e 23 coroas foram observadas. Teste a hiptese da moeda ser honesta usando um
nvel de significncia de : (a) 0,05
(b) 0,01.

08) Em um longo perodo de tempo as notas atribudas por um grupo de instrutores em determinado curso tm sido
em mdia, 12% As, 18% Bs, 40% Cs, 18% Ds e 12% Es.
Um novo instrutor atribuiu 22 As, 34 Bs, 66 Cs, 16 Ds
e 12 Es durante dois semestres. Determine, ao nvel de significncia de 0,05, se o novo instrutor est seguindo o
padro de notas dos outros instrutores.
09) O nmero de livros emprestados por uma biblioteca pblica durante uma certa semana dado pela tabela abaixo. Teste a
hiptese de que o nmero de livros emprestados no depende do dia da semana, usando um nvel de significncia de
(a) 0,05
(b) 0,01.
Segunda
Tera
Quarta
Quinta
Sexta
N de livros
emprestados
135
108
120
114
146

10) Duzentos parafusos de porca foram selecionados aleatoriamente da produo de cada uma de 4 mquinas. O
nmero de parafusos defeituosos encontrados foram, 2, 9, 10, 3. Determine se existe uma diferena significante entre
as mquinas usando um nvel de significncia de 0,05.

Exerccios sobre Correlao e Regresso Linear


01 Duas variveis aleatrias X e Y, apresentam certo grau de correlao conforme a
tabela abaixo.
X
1
3
4
6
8
9
11
14
Y
1
2
4
4
5
7
8
9
a) Determine se h, ou no, forte correlao entre as variveis
b) Apresente a Equao de Regresso

02 A tabela abaixo apresenta as respectivas alturas de uma amostra de 12 pais e


seus filhos mais velhos.
Altura do pai (polegadas)
65 63 67 64 68 62 70 66 68 67 69 71
Altura do filho (polegadas)
68 66 68 65 69 66 68 65 71 67 68 70
a) Qual o grau de correlao entre as alturas de pai e primognito ?
b) Qual a Regra de melhor ajuste entre as variveis ?

03 A tabela abaixo fornece valores experimentais da presso P de uma dada massa


de gs correspondendo a vrios valores do volume V. De acordo com os princpios da
Termodinmica, deve haver um relacionamento entre as variveis.
Volume V ( in)
Presso P ( lb/in)

54,3
61,2

61,8
49,5

72,4
37,6

88,7
28,4

118,6
19,2

a) Encontre a equao que estabelece este relacionamento


b) Pela equao encontrada, qual seria o valor de P para V=100 in ?

194,0
10,1

49

04 Verifique se h correlao entre as variveis abaixo e, se houver, determine a


equao de sua regresso linear.
x
y

1,2
4,5

1,8
5,9

3,1
7,0

4,9
7,8

5,7
7,2

7,1
6,8

8,6
4,5

9,8
2,7

05 A tabela apresentada a seguir apresenta pesos, alturas e idades de 12 meninos


de uma escola norte americana.
Peso Z (libras)
64
Altura X (polegadas)
57
Idade Y (anos)
8
Verifique se h Correlao e,
a) Peso e Altura
b) Peso e Idade
c) Altura e Idade

71 53
59 49
10
6
havendo,

67 55
62 51
11
8
apresente

58 77 57 56 51
50 55 48 52 42
7
10
9
10
6
a Equao de Regresso

76 68
61 57
12
9
para :

Das könnte Ihnen auch gefallen