Apostila Estatística

FUNDAO OSWALDO CRUZ
CENTRO DE PESQUISAS AGGEU MAGALHES

INTRODUO BIOESTATSTICA

CARLOS FEITOSA LUNA

RECIFE
2012

A mente que se abre a uma nova idia jamais
voltar ao seu tamanho original.

Albert Einstein

SUMRIO

Introduo Estatstica............................................................................................................1

Estatstica Descritiva .............................................................................................................21

Probabilidade.........................................................................................................................50

Distribuio de Probabilidade ...............................................................................................65

Estatstica Descritiva .............................................................................................................76

Estimao ..............................................................................................................................94

Testes Paramtricos.............................................................................................................106

Testes No-Paramtricos.....................................................................................................136

Regresso Linear Simples ...................................................................................................170

Tabelas e Figuras.................................................................................................................182

1
Captulo 1

INTRODUO ESTATSTICA

1. CONCEITOS FUNDAMENTAIS DE ESTATSTICA

1.1 CONCEITOS E OBJETIVOS

Podemos considerar a Estatstica como um conjunto de mtodos e
processos quantitativos que serve para estudar e medir os fenmenos
coletivos.

O objetivo de reunir dados o de fornecer informaes sobre as caractersticas de
grupos de pessoas ou coisas. Essas informaes tm por objetivo conhecer o problema e,
desta forma, servir de base para a escolha dos mtodo mais adequados para resolv-lo.
Quando um cardiologista, por exemplo, solicita do seu paciente informaes referentes
ao seu histrico familiar sobre doenas cardiovasculares, DCV, est levantando um dado que
j mostrou, a partir de dados referentes a outros pacientes, apresentar uma possvel relao
com o seu prognstico cardiolgico. Essa e outras informaes, como tipo de alimentao,
exposies a tenses e sedentarismo, iro auxiliar a compor um quadro dos fatores que podem
contribuir para melhorar ou prejudicar a sade do paciente. Essas informaes so de natureza
estatstica, aplicas, neste caso, medicina.
Evidentemente, trata-se de fornecer a informao da forma mais inteligvel e completa
possvel. Desta forma, so utilizadas rotinas e meios que permitam um bom atendimento das
informaes, organizando os dados. A organizao de vrios grupos de dados d origem aos
bancos de dados.
Define-se como primeiro (porm no mais importante) objetivo da estatstica tornar a
informao clara e precisa ao receptor, valendo-se do ferramental disponvel. Atualmente, os
recursos automticos e grficos da microcomputao so ferramentas indispensveis para o
tratamento da informao e, por extenso, para a estatstica.

1.2 HISTRICO

O desenvolvimento da estatstica, como cincia, relativamente recente. Entretanto,
algumas, tarefas do trabalho estatstico foram j realizadas pelo homem h milhares de anos.
o caso, por exemplo, dos levantamentos populacionais, ou Censos, cuja existncia remonta
s cidades estado gregas, e que tinham como principal objetivo a verificao da capacidade
militar delas prprias. Deste modo, os primeiros registros estatsticos eram de pessoas (pela
finalidade, inclusive, contavam-se somente as do sexo masculino e em idade adulta), animais
(principalmente cavalos) e armas. Tempo depois os governantes descobriram que o registro
do numero de habitantes do seu estado tinha importncia do ponto de vista fiscal, pois, se
cada habitante era taxado com um determinado tributo, para estimar a receita total do estado
era necessrio dispor de informaes sobre a populao total. Por esta razo, a etimologia do
termo estatstica est associada raiz stat (ou estat), e o seu significado estrito seria coisas
do estado ou notcias do estado sentido no qual o termo foi pela primeira vez utilizado
documentalmente, em 1749, por Achenwall, referindo-se coleo de informaes acerca do
Estado.
2
Em termos de registros mais concretos, Schott cita a primeira estatstica da populao
em Nremberg, em 1449. No sculo XVI, surgem descries estatsticas na Itlia e Espanha.
Entre 1624 e 1640 so publicadas as Descries estatsticas de Jan de Laet, intituladas
Republicae Elzevirianae. Mais prximo das estatsticas de sade, e a primeira obra neste
sentido que se tem registro a obra Natural und political observations upon the bills of
mortality, de John Graunt, no ano de 1662. Anos mais tarde, em 1693 registrada a
publicao da primeira tabela de mortalidade, por Halley. A partir do final da primeira metade
do sculo XVIII, so efetuados censos em vrias cidades alems e, em 1749, inicia-se, na
Sucia, o trabalho de levantamento estatstico demogrfico com carter regular. Em 1741, o
dinamarqus Anchersen faz a primeira exposio estatstica utilizando tabelas, que iro
permitir a reorganizao do trabalho de descrio de dados. Em 1782, em Giessen, Crone
emprega pela primeira vez as representaes grficas. Em 1790, por mandato da Constituio,
os Estados Unidos realizam seu primeiro censo populacional, que ser repetido de dez em dez
anos. Nos anos seguintes as naes mais desenvolvidas utilizam a estatstica com
regularidade. Em 1834 fundada a Statistical Society, em Londres. Na Alemanha, nos anos
subseqentes, so efetuados diversos tipos de censos (industriais, profissionais, comerciais,
etc.). Em 1885 fundado o Instituto Internacional de estatstica. necessrio notar que em
todos esses estudos, predomina a estatstica de observao, ou estatstica descritiva, que cuida
basicamente da organizao das informaes.
A estatstica ganha um novo status quando aliada ao ramo da matemtica, conhecido
como Teoria das Probabilidades, e passa ento a tratar dos erros decorrentes da chamada
cincia indutiva
1
. A partir desse momento, torna-se uma ferramenta importante nos ramos da
cincia em que este mecanismo de conhecimento empregado, e pode ser observada nos
currculos de cursos diversos, tais como, Medicina, Engenharia, Economia, Administrao,
Fsica, Psicologia e outros.

1.3 BIOESTATSTICA

Bioestatstica a estatstica aplicada s cincias que estudam aspectos vitais
(referentes vida), como a Medicina, Biologia, Odontologia ou Psicologia.
Na medicina, especificamente, pode ser entendida em dois ambientes. O primeiro,
referente ao levantamento de informaes, como registro de doenas, surtos, endemias,
epidemias, e de registros de qualidade de vida, como condies de alimentao, sanitrias,
habitacionais, de preveno a doenas, educao, etc. Denomina-se este ambiente de
Ambiente Macro, e tem a ver fundamentalmente com a identificao, a planificao e a
execuo de aes de Sade Pblica. Neste caso, constitui-se num ferramental fundamental
para cadeiras do curso de medicina como Epidemiologia, Medicina Preventiva, Organizao
de Sistemas de Sade, etc.
O segundo ambiente refere-se elaborao de experincias e pesquisa cientfica, tais
como testes de vacinas, avaliao de teraputicas e tratamentos, testes de medicamentos etc.
Denomina-se este ambiente de Ambiente Micro, e tem a ver, naturalmente, com a pesquisa
laboratorial e cientfica. Relaciona-se principalmente por esse motivo com as disciplinas de
Imunologia, Fisiologia e Farmacologia, dentro do ciclo de formao bsica do mdico, e
com todas as demais reas clnicas, em maior ou menor medida, como Pediatria,
Cardiologia, Neurologia, Pneumologia, Psiquiatria, Gastroenterologia, etc., toda vez que

1
O mtodo indutivo, que a base de uma cincia indutiva, busca a construo de leis gerais a partir do
conhecimento de uma parcela do universo. Por exemplo: observando algumas caractersticas de um grupo de
fumantes, assumir que essas caractersticas so tpicas de todos os fumantes.
3
indispensvel compreenso da grande maioria das publicaes de artigos cientficos nessas
especialidades.
A Bioestatstica, pela sua importncia para a pesquisa mdica, disciplina obrigatria
da maioria das especialidades de ps-graduao em medicina. No sentido de disciplina, a
Estatstica ensina mtodos racionais para a obteno de informaes a respeito de um
fenmeno coletivo, alm de obter concluses vlidas para o fenmeno e tambm permitir
tomada de decises, atravs de alguma(s) caracterstica(s) de valores numricos observados.
Desta forma, a Estatstica pode ser dividida em duas grandes reas:

- ESTATSTICA DESCRITIVA - a parte da Estatstica que tem por objetivo
descrever os dados observados. So atribuies da Estatstica Descritiva:

a) A organizao dos dados consiste na ordenao e crtica quanto correo dos
valores observados, falhas humanas, omisses, abandono de dados duvidosos,
etc.

b) Reduo dos dados consiste no entendimento e compreenso de grande
quantidade de dados atravs de simples leitura de seus valores individuais uma
tarefa extremamente rdua e difcil mesmo para o mais experimentado
pesquisador, portanto deveremos tabular os dados.

c) A representao dos dados pode facilitar a compreenso quando apresentados
atravs de uma representao grfica, a qual permite uma visualizao
instantnea de todos os dados. Os grficos quando bem representativos, tornam-
se importantes instrumentos de trabalho.

d) A obteno de algumas informaes que sumarizam os dados, facilitando a
descrio dos fenmenos observados.

- ESTATSTICA INFERENCIAL (ou Indutiva) - a parte da Estatstica que tem
por objetivo obter e generalizar concluses para a populao a partir de uma
amostra.

Complementando o processamento estatstico, no caso de uma estimao, a Estatstica
Indutiva estuda os parmetros a partir do uso de estimadores usando o clculo das
probabilidades, elemento este que viabiliza a inferncia estatstica.
Em resumo, um estudo estatstico completo que recorra s tcnicas de Estatstica
Inferencial ir envolver tambm, direta ou indiretamente, tpicos de Estatstica Descritiva,
Clculo das Probabilidades e Amostragem. Logo, para se desenvolver um curso completo e
razovel de Estatstica, todos esses assuntos devem ser abordados.

4
1.4 O PAPEL DA ESTATSTICA NA PESQUISA CIENTFICA

1.4.1 RELAO ENTRE O PROJETO DE PESQUISA E A ESTATSTICA

A estatstica tem tido uma longa e estreita relao com a filosofia da cincia e sua
epistemologia, embora a estatstica, freqentemente tem sido modesta na sua extenso e
pragmtica na sua atitude. Em stricto sensu a estatstica parte da filosofia da cincia, porm
de fato, essas duas reas so estudadas separadamente (Kuskal e Tuner, 1978).
Segundo Pereira (1997) a estatstica a tecnologia da cincia e, portanto, a estatstica
deve estar presente desde o incio da pesquisa. A Figura 1.1 mostra a relao entre o projeto
de pesquisa e o papel da estatstica, a Figura 1.2, a produo do conhecimento cientfico e a
Figura 1.3, as relaes entre o mundo terico e o mundo emprico.

O projeto de pesquisa O papel da estatstica

Conceitualizao do objeto de pesquisa
1) Definio do objeto de pesquisa
2) Situao dos conhecimentos
3) Modelo terico e hipteses ou questes
da pesquisa

A estatstica ajuda a
operacionalizar as hipteses
ou questes de pesquisa

Escolha de uma
estratgia de pesquisa
4.a) Modelo de pesquisa escolhido
4.b) Validade do modelo

Por estratgia de pesquisa
entende-se a integrao e
articulao do conjunto das
decises a serem tomadas, para
apreender de maneira coerente a
realidade emprica, a fim de
testar de maneira rigorosa as
hipteses ou questes de pesquisa

Planificao operacional da pesquisa
5) populao estudada
6) definio das variveis e coleta de dados
7) Anlise de dados
8) Cronograma e oramento
9) Pertinncia da pesquisa
10) Respeito s regras ticas

A estatstica ajuda na definio da
populao a ser estudada, na
definio das variveis, na coleta
de dados e na anlise.

Figura 1.1: Esquema de um projeto de pesquisa

5
A roda do conhecimento cientfico O papel da estatstica

Teorias Parmetros
populacionais

Generalizaes
Hipteses
Inferncia
Estatstica
Hipteses
Amostras
Estimadores

Observaes Dados
Estimativas

Figura 1.2: A produo do conhecimento cientfico

Mundo conceitual terico Mundo emprico observado

X1

Proposio
terica

Operacionalizao

Hiptese

X2

Figura 1.3: Relaes entre o mundo terico e o mundo emprico

Modelo terico. Uma teoria uma explicao sistemtica dos fenmenos observados
e das leis relativas a eles. Uma teoria se expressa pelos enunciados das relaes que existem
entre os conceitos. O modelo terico escolhido deve ento propor uma soluo original para a
situao problemtica que constitui o objeto do estudo projetado, caso j exista possvel que
seja preciso adapt-lo e modific-lo. Quando no existe um modelo terico o pesquisador
deve propor um que integre a situao dos conhecimentos e as suas prprias observaes.

A qualidade de um modelo terico reside na sua capacidade de dar conta dos
fenmenos observados no mundo emprico

1.4.2 FORMULAO DAS HIPTESES OU QUESTES DE PESQUISA

Hipteses. Uma hiptese um enunciado formal das relaes esperadas entre pelo
menos uma varivel independente e uma varivel dependente. Nas pesquisas exploratrias, as
hipteses podem se tornar questes de pesquisa. Estas questes pela sua especificidade,
devem dar testemunho do trabalho conceitual efetuado pelo pesquisador e, pela sua clareza,
permitir uma resposta interpretvel.

X1
X2
6
As hipteses devem ser formuladas na forma de uma relao a ser verificada entre,
pelo menos, duas variveis e no em termo de uma hiptese nula, impossvel de verificar,
como no caso seguinte:

Os programas de diagnstico de cncer do pulmo por radiografia no diminuem
a mortalidade por cncer de seio

As hipteses de uma pesquisa devem enunciar-se por propostas claras e especficas
quanto possvel, como, por exemplo:

Os programas de diagnstico de cncer do seio por mamografia diminuem em um
tero o risco de mortalidade por este cncer

A inteno de utilizar preservativo associada positivamente presena de
normas sociais aprovando a adoo desse comportamento.

Em um mesmo estudo pode haver mais de uma hiptese e estas podem se relacionar
de diferentes formas, conforme Figura 1.4.

1.4.3 PLANEJAMENTO OPERACIONAL DA PESQUISA

O planejamento operacional da pesquisa consiste em prever as aes que devero ser
efetuadas para aplicar a estratgia da pesquisa escolhida. Estas aes dizem respeito seleo
da populao a ser estudada, definio das variveis e coleta de dados, assim como
anlise dos dados recolhidos.
Populao. Toda questo de pesquisa define um universo de objetos aos quais os
resultados do estudo devero ser aplicados. A populao alvo, tambm chamada populao
estudada, composta de elementos distintos possuindo um certo nmero de caractersticas
comuns (pelo menos). Estes elementos, chamados de unidades populacionais, so as
unidades de anlise sobre as quais sero recolhidas informaes.

Uma populao ou universo, no sentido geral, um conjunto de elementos
com pelo menos uma caracterstica comum. Essa caracterstica comum deve
delimitar inequivocamente quais os elementos que pertencem populao e
quais os que no pertencem (Costa Neto, 1977)

7

Figura 1.4: Tipos de hipteses

As unidades populacionais podem estar constitudas por pessoas, famlias, turmas de
alunos, empresas, escolas, ou ainda fazer parte de um objeto mais complexo, como por
exemplo, rgos ou partes do corpo, ou, ainda, podem ser objetos, como, por exemplo, peas
defeituosas, plantas, animais, entre outros.
Duas sries de critrios servem para definir os elementos que constituem a populao
alvo: os critrios de incluso e, de excluso. A conjuno desses critrios deveria ser tal
modo que todo elemento pudesse ser classificado, sem equvoco, como fazendo ou no parte
da populao alvo. Teoricamente, a populao alvo deveria ser definida com uma preciso tal
que fosse possvel estabelecer a lista de todos os elementos que a constituem, o que em alguns
casos, impossvel.
Amostra. Uma amostra um subconjunto de indivduos da populao alvo. Para que
as generalizaes sejam vlidas, as caractersticas da amostra devem ser as mesmas da
populao.
Existem dois tipos de amostras, as probabilsticas, baseadas nas leis de probabilidades,
e as amostras no probabilsticas, que tentam reproduzir o mais fielmente possvel a
populao alvo. Entretanto, somente as amostras probabilsticas podem, por definio,
originar uma generalizao estatstica, apoiada no clculo de probabilidades e permitir a
utilizao da potente ferramenta que a inferncia estatstica.
Existem vrias tcnicas de amostragem, cada uma tem vantagens e desvantagens, e a
escolha dever ser feita pelo pesquisador de acordo aos objetivos propostos pela pesquisa.
8
1.4.4 TCNICAS DE AMOSTRAGEM

Amostragem probabilstica:

a) Amostragem aleatria simples
b) Amostragem sistemtica
c) Amostragem por conglomerados
d) Amostragem estratificada

Amostragem no probabilstica:

a) Amostragem acidental
b) Amostragem de voluntrios
c) Amostragem por escolhas racionais:
i) Julgamento do especialista
ii) Julgamento por escolha deliberada

d) Amostragem por quotas

1.4.5 DEFINIO OPERACIONAL DAS VARIVEIS

Toda questo de pesquisa define um nmero de construes tericas que o pesquisador
quer associar. O grau de operacionalizao destas construes no faz parte de um consenso.
Porm, a seo que trata das definies das variveis deve permitir ao leitor avaliar a
adequao entre os instrumentos utilizados, as variveis escolhidas e as construes tericas
descritas no quadro conceitual.

Varivel uma caracterstica da populao

Classificao funcional das variveis

Tipos de pesquisa Tipos de variveis
Pesquisa experimental

Variveis independentes
Variveis dependentes
As outras variveis (variveis de controle, fator de
confuso, entre outras)
Pesquisa sinttica No pertinente a classificao, pois as variveis se
relacionam em rede
Pesquisa de desenvolvimento No necessrio distinguir as variveis, pois o objetivo
estabelecer e validar uma interveno ou um instrumento
de medida de uma construo

Variveis dependentes. So aquelas cujos efeitos so esperados de acordo com as
causas. Elas se situam, habitualmente, no fim do processo causal e so sempre definidas na
hiptese ou na questo de pesquisa.
Variveis independentes. So aquelas cujos efeitos queremos medir. Podem ser
assinaladas s causas do fenmeno que se quer estudar.
9
Quando um estudo tem mais de uma hiptese, podem ser definidas diversas variveis
dependentes. Elas podem ser independentes umas das outras ou constituir uma ordem
hierrquica, na qual certas variveis dependentes podem ter um efeito sobre outras variveis
dependentes. Por exemplo:

Hiptese 1: O consumo de lcool diminui o estado de alerta do crebro
Hiptese 2: O risco de acidentes de trnsito aumenta quando o estado de alerta do
crebro diminui

consumo de
lcool
estado de alerta
do crebro
risco de
acidentes de
trnsito

varivel
independente
varivel
dependente
intermediria
varivel
dependente
principal

Notao estatstica:

X Y Z

A varivel dependente intermediria ou mediatriz representa o mecanismo que precisa
a relao entre a varivel dependente principal e a varivel independente.
As informaes ou dados caractersticos dos fenmenos ou populaes so
denominados variveis estatsticas ou simplesmente variveis. Conforme suas caractersticas
particulares podem ser classificadas como:

- QUANTITATIVAS - So aquelas que podem ser expressas em termos
numricos. Em geral so as resultantes de medies, enumeraes ou contagens.
So subdivididas em contnuas e discretas.

- Contnuas - so aquelas que podem assumir qualquer valor num certo
intervalo de medida, podendo ser associados ao conjunto dos nmeros reais,
ou seja, seus valores possveis formam um conjunto no enumervel. Entre
outras, enquadram-se nesta categoria as medidas de tempo, comprimento,
espessura, rea, volume, peso e velocidade.

- Discretas (ou descontnuas) - quando s podem assumir determinados
valores num certo intervalo, podendo ser associadas ao conjunto dos
nmeros inteiros, ou seja, seus possveis valores formam um conjunto finito
ou enumervel. Em geral, representam nmeros inteiros resultantes do
processo de contagem, como o nmero de alunos por sala, de crditos por
disciplinas, de pacientes atendidos diariamente num hospital, etc.

- QUALITATIVAS - Nem sempre os elementos de uma populao so
exclusivamente contveis. Muitas vezes, eles podem ser qualificados tambm
10
segundo algumas de suas caractersticas tpicas. Nesses casos, as variveis
podem ser agrupadas em nominais ou ordinais (por postos).

- Nominais - quando puderem ser reunidas em categorias ou espcies com
idnticos atributos. Aqui se incluem os agrupamentos por sexo, rea de
estudo, desempenho, cor, raa, nacionalidade e religio.

- Ordinais - quando os elementos forem reunidos segundo a ordem em que
aparecem dispostos numa lista ou rol. So tpicos desta forma de
agrupamento, as listas classificatrias de concursos e as tabelas de
campeonatos.

De modo geral, as medies do origem as variveis contnuas e as contagens ou
enumeraes, as variveis discretas. Designamos estas variveis por letras latinas, em geral,
as ltimas: X, Y, Z.
Em geral, uma mesma populao pode ser caracterizada por mais de um tipo de
varivel. Assim os inscritos num vestibular, por exemplo, podem ser contados, medidos ou
pesados, podem ser agrupados segundo o sexo ou rea de estudo e podem ainda ser
classificados segundo as notas obtidas nas provas prestadas.
Observa-se que uma varivel quantitativa pode-se transformar em uma varivel
qualitativa e isso depende da descrio da varivel

1.4.6 DESCRIO DAS VARIVEIS

A varivel constitui um primeiro nvel de operacionalizao de uma construo terica
e, para cada uma, se deve dar, em seguida, uma descrio operacional. Para algumas variveis
a descrio simples, porm, em outros casos, essa definio mais complexa.

Idade Consumo de lcool Classe social
Nominal Sim, No
Ordinal Criana, jovem, velho Pouco, mdio, muito Baixa, mdia, alta
Discretas Nmero de anos
completos
Nmero de copos de
lcool ingeridos
Nmero de salrios
mnimos completos
Contnuas Idade em anos, meses,
dias,...
Quantidade de lcool
presente no sangue
Renda familiar em reais

No exemplo do consumo de lcool e o risco de acidente, pode-se definir a varivel
consumo de lcool das seguintes formas:

a) nmero de copos consumidos nas quatro horas que precedem o momento de dirigir,
segundo a declarao do motorista;
b) concentrao de lcool no sangue segundo o bafmetro;
c) observao do motorista enquanto passa pelo teste de dirigir em marcha a r em
linha reta;
d) anlise em laboratrio de uma amostra sangunea
Outro exemplo medir atitude em relao matemtica, pode-se perguntar:

11
Voc gosta de matemtica?

a) ( )No ( )Sim
b) ( )Detesta ( )Gosta pouco ( )Mais ou menos ( )Gosta muito ( )Gosta muitssimo
c) De uma escala de 0 a 10 atribua uma nota para o quanto voc gosta de
matemtica: ______
d) Na escala a seguir, marque com um X o quanto voc gosta de matemtica:

0 1 2 3 4 5 6 7 8 9 10

Diante das dificuldades de operacionalizar as variveis, recomenda-se descrever
detalhadamente as condies operacionais de medida, assim como os instrumentos utilizados.

1.4.7 MTODOS DE COLETA DE DADOS

Existem trs grandes fontes de dados: a utilizao de documentos, a observao pelo
pesquisador e a informao fornecida pelos indivduos.
Oficiais
Escritos
Utilizao de Pessoais
documentos
Mudos
Experimental

Sistemtica Semi-experimental

Ligada entrevista Natural
Observao
Livre

Participante
De explorao

Livre Com informao chave

Informaes Clnica
fornecidas pelos
indivduos Semi-estruturada
Dirigida
Questionrio

Figura 1.5: Mtodos de coleta de dados
12
A coleta dos dados poder ser feita de diversas formas. A ideal aquela que maximiza
os recursos disponveis, dados os objetivos e a preciso previamente estipulados. No seu
planejamento, deve-se considerar o tipo de dado a ser coletado, o local onde este se
manifestar, a frequncia de sua ocorrncia, e outras particularidades julgadas importantes.
Quando os dados se referirem ou estiverem em poder de pessoas, sua coleta poder
ser realizada mediante respostas a questionrios previamente elaborados. Esses questionrios
podem ser enviados aos entrevistados para devoluo posterior ou podem ser aplicados pelos
prprios pesquisadores ou por entrevistadores externos ou contratados, devidamente
treinados.
Os dados ou informaes representativas dos fenmenos ou problema em estudo
podem ser obtidos de duas formas:
- Por via direta - quando feita sobre elementos informativos de registro
obrigatrio (p. ex.: nascimentos, casamentos, bitos, matrculas de alunos etc.)
ou, ainda, quando os dados so coletados pelo prprio pesquisador atravs de
entrevistas ou questionrios. A coleta direta de dados, com relao ao fator
tempo, pode ser classificada em:

a) contnua, tambm denominada registro, feita continuamente, tal como a de
nascimentos, bitos, etc.;
b) peridica, quando feita em intervalos constantes de tempo, como os
censos(de 10 em 10 anos), os balanos de uma empresa comercial, etc.;
c) ocasional, quando feita extemporaneamente, a fim de atender a uma
conjuntura ou a uma emergncia, como no caso de epidemias que assolam ou
dizimam seres humanos

- Por via indireta - quando inferida de elementos conhecidos (coleta direta)
e/ou conhecimento de outros fenmenos relacionados com o fenmeno
estudado. Como exemplo, podemos citar a pesquisa sobre a mortalidade
infantil, que feita atravs de dados colhidos via coleta direta.

1.4.8 CRTICA DOS DADOS

Os dados colhidos por qualquer via ou forma e no previamente organizados so
chamados de dados brutos. Esses dados brutos, antes de serem submetidos ao
processamento estatstico propriamente dito, devem ser "criticados", visando eliminar
valores imprprios e erros grosseiros que possam interferir nos resultados finais do estudo.
A crtica externa quando visa s causas dos erros por parte do informante, por
distrao ou m interpretao das perguntas que lhe foram feitas; interna quando se
observa o material constitudo pelos dados coletados. o caso, por exemplo, da verificao
de somas de valores anotados.

1.4.9 APURAO OU PROCESSAMENTO

Uma vez assegurado que os dados brutos so consistentes, devemos submet-los ao
processamento adequado aos fins pretendidos. A apurao ou processamento dos dados pode
ser manual ou eletrnica. Os processos e mtodos estatsticos a que um conjunto de dados
pode ser submetido sero nosso objeto de estudo nas sees seguintes.
13
1.4.10 EXPOSIO OU APRESENTAO DOS DADOS

Por mais diversa que seja a finalidade que se tenha em vista, os dados devem ser
apresentados sob forma adequada (tabelas ou grficos), tornando mais fcil o exame daquilo
que est sendo objeto de tratamento estatstico e ulterior obteno de medidas tpicas.
No caso particular da estatstica descritiva, o objetivo do estudo se limita, na maioria
dos casos, simples apresentao dos dados, assim entendida a exposio organizada e
resumida das informaes coletadas atravs de tabelas ou quadros, bem como dos grficos
resultantes.

1.4.11 QUALIDADE DOS INSTRUMENTOS

A qualidade de um instrumento de medida se aprecia pela sua fidelidade (ou
confiabilidade) e pela sua validade. A confiabilidade a capacidade de um instrumento
medir fielmente um fenmeno. A validade capacidade de um instrumento medir com
preciso o fenmeno a ser estudado

Confiabilidade Medir fielmente

Validade Medir com preciso

Recomenda-se pr-testar os instrumentos a fim de avaliar sua confiabilidade e
validade antes de trabalhar com a populao alvo.

1.4.11.1 CONFIABILIDADE DE UM INSTRUMENTO DE MEDIDA

A confiabilidade de um instrumento de pesquisa sua capacidade de reproduzir um
resultado de forma consistente no tempo e no espao, ou com observaes diferentes quando
for utilizado corretamente.

por definio, a apreciao da confiabilidade se baseia na repetio da
medida e na comparao dos resultados obtidos

Existem trs abordagens para avaliar a confiabilidade de um instrumento:

- a comparao com resultados obtidos pela utilizao de um mesmo instrumento,
em diferentes momentos, para avaliar sua estabilidade;
- a apreciao da equivalncia dos resultados obtidos, quando um mesmo
fenmeno medido por vrios observadores ao mesmo tempo;
- quando um instrumento composto por vrios itens ou indicadores, sua
confiabilidade pode ser apreciada medindo a homogeneidade de seus
componentes

A escolha do mtodo estatstico para medir confiabilidade de um instrumento depende
do mtodo de validao previsto e do tipo de dados por ele fornecidos. A confiabilidade se
avalia de forma diferente: se a medida obtida for uma varivel contnua (como a inteligncia
ou o peso do indivduo), uma varivel ordinal (a pertena a um nvel, como os da escala
scio-econmica), ou ainda, uma varivel nominal (como um diagnstico).
14

A confiabilidade de um instrumento de medida uma caracterstica
independente da questo de pesquisa. Ela pode, no entanto, variar em
funo das populaes

Os seguintes testes sero abordados para avaliar a confiabilidade dos instrumentos de
medida:

- coeficiente de correlao de Pearson;
- coeficiente alfa de Cronbach
- coeficiente de correlao intra-classe
- coeficiente Kappa de Cohen

Validade da medida. A validade se define como a capacidade de um instrumento
medir com preciso o fenmeno em estudo, isto , a adequao existente entre as variveis
escolhidas e o conceito terico a ser medido. Existem trs tipos de validade:

- Validade de contedo
- Validade prtica ou de critrio
- Validade de construo

1.4.12 ANLISE DOS DADOS

1.4.12.1 ANLISES QUALITATIVAS

No existe regra formal, no sentido estatstico, para a anlise qualitativa dos dados.
Porm, quando os dados se apresentam em forma de discurso, a anlise pode compreender
quatro etapas:

- a preparao e a descrio do material bruto;
- A reduo dos dados;
- a escolha e a aplicao dos modos de anlise;
- a anlise transversal das situaes ou dos casos estudados.

1.4.12.2. ANLISES QUANTITATIVAS

O planejamento das anlises deve ser feita em funo de cada uma das questes ou
hipteses da pesquisa. Devem ser considerados dois nveis de anlises: as descritivas e as
ligadas s hipteses.

1.4.12.3 DESCRITIVAS

As anlise descritivas servem para descrever o comportamento de uma varivel em
uma populao ou no interior de subpopulaes. Todos os estudos utilizando dados
quantitativos, independentemente das hipteses da pesquisa, requerem anlises descritivas.
15
1.4.12.4. ANLISES LIGADAS S HIPTESES

Cada uma das hipteses formuladas no quadro conceitual deve ser verificada. Quando
os dados coletados so de natureza quantitativa, esta verificao se faz com a ajuda de
ferramentas estatsticas. A natureza da hiptese constitui o primeiro determinante da escolha
da ferramenta estatstica a ser utilizada, devendo ser levados em conta os seguintes pontos:

- as caractersticas da estratgia da pesquisa;
- o modelo;
- as variveis medidas.

Esta a seo da anlise estatstica do projeto de pesquisa que ser desenvolvida ao
longo da disciplina. Em resumo podemos claramente distinguir seis etapas no processo de
anlise da pesquisa, sendo essas: Planejamento, Coleta, Crtica, Apurao e Exposio dos
dados, alm da anlise dos dados.

2. O USO DE COMPUTADORES EM ESTATSTICA

Foi mencionado anteriormente que o desenvolvimento da indstria de computadores
deu grande impulso ao uso da Estatstica. Vrios programas computacionais de uso comum
contm rotinas estatsticas incorporadas s suas funes bsicas. o caso das planilhas
eletrnicas, usualmente pr-instaladas em computadores novos. Programas especificamente
desenvolvidos para efetuar anlises estatsticas so conhecidos como pacotes estatsticos.
Existe um nmero considervel de pacotes, alguns voltados para anlises mais comuns na
rea de humanidades, outros para a rea de biomdicas; alguns so extremamente simples de
se utilizar atravs de menus, outros pressupem conhecimento de uma linguagem de
programao especfica ao programa. Qualquer que seja o programa a ser utilizado, trs so as
etapas que envolvem seu uso:

1. Entrada de Dados
2. Execuo da Anlise Estatstica
3. Interpretao de Resultados

A Entrada de Dados deve assumir certas convenes. Apesar de certos programas
terem rotinas desenvolvidas de forma a simplificar a criao do banco de dados,
intrinsecamente o que se tem a criao de uma matriz, em que cada linha corresponde a uma
unidade experimental e cada coluna a uma varivel.
Assim, quando estudamos uma nica varivel, consideramos a coluna correspondente.
Se estamos interessados em saber o comportamento desta varivel em dois grupos diferentes,
precisamos estudar os valores da coluna em que ela se encontra, conjuntamente com a coluna
que contm a informao dos grupos.
A fase da execuo da anlise estatstica pressupe o conhecimento de como o
programa que est sendo utilizado trabalha as informaes. Torna-se assim importante se ter
acesso ao manual do programa. A maioria dos programas tem rotinas de ajuda on-line.
Aps as informaes terem sido trabalhadas, vem a fase da interpretao dos
resultados obtidos. Nesta hora, aconselhvel consultar o manual sempre que houver dvida
se o que foi calculado relaciona-se, de fato, anlise estatstica desejada. Em seguida, d-se a
interpretao das caractersticas observadas a fim de verificar se resultados absurdos no esto
16
ocorrendo. Em caso positivo, releia o manual e certifique-se de ter executado a anlise correta
para os dados em questo. Em muitos casos, a fase de interpretao a mais difcil e
interessante, pois envolve o equacionamento das caractersticas apresentadas na anlise com
vistas a responder as questes inicialmente colocadas.

2.1 ACTION

Um software de estatstica desenvolvido para voc, com fcil utilizao, abrangente e
confivel. O sistema Action foi desenvolvido sob plataforma R, um dos sistemas de estatstica
mais utilizados atualmente. O Sistema Action representa uma grande evoluo em relao aos
softwares de estatstica:

- Permite que voc trabalhe junto com o Excel, de forma integrada;
- fcil de instalar, criativo e contempla as principais necessidades do usurio de
estatstica;
- Est cada vez mais intuitivo mais fcil de usar do que nunca, com uma grande
quantidade de funcionalidades.

Voc pode baixar o sistema Action sem nenhum custo e pode us-lo para qualquer
propsito em empresas privadas, entidades com ou sem fins lucrativos, escolas, governo e
administrao pblica em geral. Voc pode repassar cpias para seus familiares, amigos,
alunos, empregados, etc. Ajude a difundir o sistema Action! O site para download
<
http://www.portalaction.com.br/content/sobre-o-action
>.

2.2 O QUE H DE IMPORTANTE SOBRE O SISTEMA ACTION?

O sistema Action um sistema aberto e democrtico para o uso da estatstica:

- Este programa um software livre; voc pode utiliza-lo sob os termos da Licena
Pblica Geral GNU;
- Sem barreira de idioma est disponvel em Portugus e Ingls;
- Primeiro sistema de estatstica que utiliza a plataforma R e o Excel de forma
integrada, tudo para facilitar e agilizar suas anlises estatsticas;

2.3 O SISTEMA ACTION SINNIMO DE QUALIDADE

- Suas razes remontam a cerca de 10 anos, que resulta numa grande experincia
acumulada;
- Todas as anlises estatsticas esto baseadas sob a plataforma R, o sistema de
estatstica que mais cresce no mundo, sendo o sistema oficial da maioria dos
estatsticos e empresas de tecnologia;
- Atualmente contamos com milhares de usurios dos mais diversos ramos da industria,
governo e universidades;
- Com um processo de desenvolvimento totalmente aberto, o sistema Action no tem
nada a esconder o produto se mantm devido aos esforos e reputao da Equipe
Estatcamp no cenrio da estatstica brasileira;

17
2.3 O ACTION AMIGVEL

- O programa se parece e se comporta de forma familiar e pode ser utilizado
imediatamente por quem j usou um produto concorrente;
- fcil mudar para o sistema Action, ele se comporta como um suplemento do Excel e
tem um manual detalhado com a descrio de todas as funcionalidades;
- O sistema Action suportado pela Estatcamp e uma comunidade de voluntrios, com
vasta experincia em Estatstica e Computao, dispostos a ajudar tanto os usurios
novos quanto os mais experientes;

2.4 O QUE TEM NO ACTION?

- Estatstica Bsica: contempla as ferramentas bsicas de anlise exploratria de dados,
distribuio de freqncias e os testes de mdia, varincia, propores e taxas. Alm
de testes de normalidade;

- Distribuies: para as principais distribuies de probabilidade discretas e contnuas,
calculamos os quantis, percentis, densidade e tambm geramos amostras aleatrias;

- ANOVA: este mdulo apresenta as principais ferramentas de comparao de fatores
na performance de produtos e servios. Temos o modelo de ANOVA com efeitos fixo,
misto e aleatrio, os mtodos clssicos de comparao mltipla (testes de Tuckey,
Fisher, Dunnett e HSU) e os testes de varincia (Levene e Bartlet). Tambm dispomos
diversos grficos (Grfico de Efeitos Principais, Grfico de Interaes, Grfico de
Intervalo de Confiana) que simplificam suas anlises e diagnsticos. Finalmente,
dispomos o teste de Welch para o caso em que os dados no apresentam
homogeneidade da varincia e o teste no paramtrico de Kruskal-Wallis para o caso
em que a hiptese de normalidade dos dados seja violada.

- Modelos: as principais ferramentas de modelos lineares e modelos lineares
generalizados so contemplados neste mdulo. Neste mdulo, realizamos anlise de
regresso linear e no linear, regresso binomial e regresso multinomial. Tambm,
fazemos diversos tipos de grficos para facilitar a sua anlise.

- No-paramtrico: as principais tcnicas no paramtricas para anlise de dados esto
disponveis neste mdulo. Entre elas, temos os testes de Wilcoxon e o teste de
Kruskal-Wallis.

- Grficos: Uma variedade de grficos esto disponveis neste mdulo. Temos os
tradicionais, histograma, Box-Plot, Pareto, Dot Plot e grficos 3D. Tudo para tornar a
sua apresentao dinmica, fcil e compreensvel.

- Confiabilidade: as principais tcnicas de confiabilidade e anlise de sobrevivncia
esto disponveis neste mdulo. Desde tcnicas simples, como ajuste da distribuio
Weibull e o estimador de Kaplan-Meier at s tcnicas de testes de vida acelerada e os
modelos de regresso locao-escala. Tambm apresentamos uma tcnica para
determinar o quantidade de itens necessrios para atender s especificaes do seu
cliente, denominado plano de determinao.
18

- Ferramentas da Qualidade: contemplamos as principais ferramentas da qualidade,
como CEP, Anlise de capacidade do processo, Anlise dos sistemas de medio
(MSA) e indicadores da qualidade. A ferramenta CEP contempla os principais tipos de
grficos, como o Xbar e R, Xbar e s, Valores individuais e amplitude mvel, entre
outros. Tambm temos os principais grficos por atributo. A ferramenta MSA
apresenta todas as tcnicas para anlise de sistemas replicveis e no replicveis (ou
destrutivos). Tambm temos um mdulo para anlise de sistemas atributivos. Nosso
mdulo de anlise de capacidade e performance do processo um dos mais completos.
Inicialmente, temos um mdulo para testar qual distribuio de probabilidade se
adequa ao seu conjunto de dados. Caso seu conjunto de dados se ajusta a distribuio
normal, voc pode aplicar as tcnicas tradicionais. Caso seu conjunto de dados no se
ajuste a distribuio normal, temos uma gama de possibilidades que vo desde
transformao de dados (Box-Cox), ajuste de outras distribuies (Weibul,
Lognormal, etc.) at tcnicas no paramtricas, como o mtodo de Ncleo. Alm
disso, temos um mdulo com indicadores da qualidade (DPU e DPMO) e grficos
como Ishikawa. Em resumo, um mdulo completo para que voc possa realizar suas
anlise e apresentar de forma fcil e compreensvel.

- DOE: este mdulo contempla uma das mais poderosas ferramentas para melhoria de
processos, produtos e servios. Aqui, fazemos o planejamento do seu experimento, as
principais tcnicas de anlise e os grficos adequados para que sua apresentao seja
compreendida por todos. Este mdulo tambm apresenta uma srie de tcnicas para
que voc possa realizar uma anlise da superfcie de resposta do processo e com isso,
determinar quais so os nveis dos fatores de impacto que maximizam a performance
de seu processo, produto ou servio.

- Anlise Multivariada: temos tcnicas simples para agrupamento de dados e formao
de cluster. Tambm, temos o recurso da MANOVA que lhe permite estudar fatores de
impacto em processo, produtos ou servios com mltiplas caractersticas da qualidade.

- Poder e o tamanho da amostra: aqui utilizamos a tcnica da funo poder para
determinar o tamanho da amostra necessrio para realizar o seu experimento. Neste
mdulo, aplicamos esta tcnica em teste simples como o teste t at testes mais
complexos como ANOVA e o teste qui-quadrado.
19
EXERCCIOS

1. O que voc entende por estatstica?
2. Quais os dois conjuntos de dados fundamentais manipulados pela estatstica?
3. Qual o conceito de amostra e suas principais caractersticas?
4. Como podemos garantir que uma amostra qualquer, extrada de uma populao, serve
para um estudo?
5. Quais as vantagens de desvantagens de um censo e de uma amostra?
6. O que um parmetro?
7. O que voc entende por varivel?
8. Como se classificao as variveis? D exemplos.
9. Quais as etapas de um trabalho estatstico? Explique cada uma.

10. Classifique em verdadeiro ou falso as seguintes afirmaes:
a) Estatstica um conjunto de tcnicas destinadas a organizar um conjunto de valores
numricos.
b) Sempre que estivermos trabalhando com nmeros, deveremos utilizar a Inferncia
Estatstica.
c) A Estatstica Descritiva fornece uma maneira adequada de tratar um conjunto de
valores, numricos ou no, com a finalidade de conhecermos o fenmeno de interesse.
d) Qualquer amostra representa, de forma adequada, uma populao.
e) As tcnicas estatsticas no so adequadas para casos que envolvam experimentos
destrutivos como, por exemplo, queima de equipamentos, destruio de corpos de
provas, etc.

11. Para as situaes descritas a seguir, identifique a populao e a amostra
correspondente e discuta a validade do processo de inferncia estatstica para cada um
dos casos.

a) Para avaliar a eficcia de uma campanha de vacinao no Estado de So Paulo, 200
mes de recm-nascidos durante o primeiro semestre de um dado ano, em uma dada
maternidade em So Paulo, foram perguntadas a respeito da ltima vez que vacinaram
seus filhos.
b) Uma amostra de sangue foi retirada de um paciente com suspeita de anemia.
c) Para verificar a audincia de um programa de TV, 563 indivduos foram entrevistados
por telefone com relao ao canal em que estavam sintonizados.
d) A fim de avaliar a inteno de voto para presidente dos brasileiros, 122 pessoas foram
entrevistadas em Braslia.

20
12. Discuta para cada um dos casos abaixo, os cuidados que precisam ser tomados para
garantir uma boa concluso a partir da amostra.

a) Um grupo de crianas ser escolhido para receber uma nova vacina contra menigite.
b) Uma fbrica deseja saber se sua produo de biscoitos est com o sabor previsto.
c) Aceitao popular de um certo projeto do governo.

13. Classifique cada uma das variveis abaixo em qualitativa (nominal/ ordinal) ou
quantitativa (discreta/ contnua):

a) Ocorrncia de hipertenso pr-natal em grvidas com mais de 35 anos (sim ou no so
as possveis respostas para esta varivel).
b) Inteno de voto para presidente (possveis respostas so os nomes dos candidatos,
alm de no sabe).
c) Perda de peso de maratonistas na Corrida de So Silvestre (leve, moderada, forte).
d) Grau de satisfao da populao brasileira com relao ao trabalho de seu presidente
(valores de 0 a 5, com 0 indicando totalmente insatisfeito e 5 totalmente satisfeito).

21
Captulo 2

ESTATSTICA DESCRITIVA

1. DISTRIBUIES DE FREQUNCIAS

Os dados numricos, depois de coletados so colocados em srie e apresentados em
tabelas ou quadros. No estudo de uma varivel (seja esta qualitativa ou quantitativa), o maior
interesse do pesquisador conhecer a distribuio dessa varivel atravs das possveis
realizaes (valores) da mesma. Iremos, pois, ver uma maneira de se dispor um conjunto de
valores, de modo a se ter uma boa idia global sobre esses valores, ou seja, de sua distribuio.
Consideremos, para efeito de estudo, o quadro (banco de dados) apresentado abaixo, o
qual apresenta indivduos que foram contaminados pelo veneno de um certo tipo de inseto e
submetidos a trs tipos de tratamento. Neste est apresentado o nmero de identificao dos
pacientes, a idade (em anos) do pacientes no momento da admisso, o tempo (em horas) gasto
entre o contato com o inseto e a administrao do tratamento, o tempo (em horas) entre a
administrao do tratamento e a recuperao, o tipo de tratamento administrado e a presena
de cogulos no momento da admisso.

QUADRO 2.1 Indivduos contaminados pelo veneno de um certo tipo de inseto e submetidos a
trs tipos de tratamento.

No. idade Tempo Recuperao tratamento cogulos
2 9 42 39 I 0
3 33 53 46 I 1
4 30 52 45 I 0
5 11 46 42 I 0
6 34 59 51 II 0
7 27 53 46 I 1
8 10 44 40 I 1
9 21 58 50 II 1
10 36 54 47 I 1
11 35 55 47 I 0
12 31 10 4 II 1
13 32 9 3 II 0
14 21 3 2 II 0
15 31 9 3 II 0
16 40 20 11 III 1
17 39 12 5 II 1
18 31 9 3 II 1
19 28 7 3 II 0
20 24 3 1 II 0
21 21 1 2 II 1
22 39 17 8 III 1
23 38 30 22 III 1
24 46 13 11 III 1
25 47 13 12 III 1
26 54 18 16 III 0
27 56 30 23 III 1
22
1.1 DISTRIBUIES DE FREQUNCIAS POR VALORES

construda considerando-se todos os diferentes valores ou categorias, levando em
considerao suas respectivas repeties. Por exemplo, a tabela 2.1 apresenta a distribuio de
freqncia da varivel TRATAMENTO, usando-se os dados do quadro 2.1.

Tabela 2.1 - Freqncias e percentuais dos 26 pacientes segundo o tipo de tratamento
recebido.

Tratamento N %
I 8 30,8
II 11 42,3
III 7 26,9
Total 26 100,0
FONTE: Quadro1.1

1.2 DISTRIBUIES DE FREQUNCIAS POR INTERVALOS OU CLASSES

Constroem-se classes de valores, quando a variabilidade dos dados grande, levando
em considerao o nmero de valores que pertencem a cada classe. A construo de tabelas
de freqncias para variveis contnuas necessita de certos cuidados. Por exemplo, a tabela
1.2 apresenta a distribuio de freqncias da varivel IDADE (em anos), usando-se os dados
do quadro 1.1.

Tabela 2.2 - Freqncias e percentuais das IDADES dos 26 pacientes.

IDADE (em anos) N %
09,0 |-- 18,5 3 11,5
18,5 |-- 28,0 5 19,2
28,0 |-- 37,5 10 38,6
37,5 |-- 47,0 5 19,2
47,0 |-- 56,5 3 11,5
Total 26 100,0
FONTE: Quadro 2.1

OBSERVAO:

1) De um modo geral tem-se a destacar em uma tabela (disposio escrita que se obtm
referindo-se a uma coleo de dados numricos a uma determinada ordem de
classificao):

i) Elementos essenciais:
Ttulo: Indicao que precede a tabela e que contm a designao do fato observado, o
local e a poca em foi registrado.
Cabealho: Parte superior da tabela que especifica o contedo das colunas.
Coluna Indicadora: Parte da tabela que especifica o contedo das linhas.
Corpo da tabela: Conjunto de colunas e linhas que contm as informaes sobre a
varivel em estudo.
23
ii) Elementos complementares:

Fonte: Indicao da entidade responsvel pelo fornecimento dos dados ou pela sua
elaborao.
Notas: Informaes de natureza geral, estinadas a conceituar ou esclarecer o contedo
das tabelas ou a indicar a metodologia adotada no levantamento ou na
elaborao dos dados.
Chamadas: Informaes de natureza especfica sobre determinada parte da tabela,
destinada a conceituar ou a esclarecer dados.

2) As tabelas apresentadas oficialmente devem atender s normas do IBGE.

1.3 TABELAS DE CONTIGNCIA

Uma tabela de contingncia um arranjo de nmeros naturais, em forma matricial,
com r linhas e k colunas, onde estes nmeros representam quantidade ou freqncia. Assim,
existem r totais em linha, c totais em colunas e um total geral n.Uma tabela de contingncia
pode ser usada para apresentar uma tabulao dos dados contidos em vrias amostras onde os
dados so apresentados numa escala no mnimo nominal.
Um outro uso da tabela de contingncia k r quando observa-se uma nica amostra
de tamanho n, onde cada elemento pode ser classificado em uma de r categorias, de acordo
com um critrio e em uma de c outras categorias de acordo com um segundo critrio. Para o
estudo de medidas de associao entre duas variveis X e Y, apresentadas em tabelas de
contingncia, os dados so arrumados da seguinte forma:

Varivel B
Varivel A Categoria
1
Categoria
2
... Categoria
k
Totais
Categoria 1 O
11
O
12
... O
1k
A
1

Categoria 2 O
21
O
22
... O
2k
A
2

... ... ... ... ... ...
Categoria r O
r1
O
r2
... O
rk
A
r

Totais B
1
B
2
... B
k
N
N= A
1
+...A
r
= B
1
+...+B
k

EXEMPLO 2.1: Quinhentos escolares de primeiro grau menor foram classificados em uma
tabela criada, por grupo scio-econmico e a presena ou ausncia de um certo defeito na
fala. Os resultados foram os seguintes:

Grupo scio-econmico
Defeito na fala
Superior
Mdio
superior
Mdio
baixo
Baixo
TOTAL
Presente 8 24 32 27 91
Ausente 42 121 138 108 409
Total 50 145 170 135 500

24
2. APLICAES NO ACTION

25

26
EXERCCIOS

1. Em um experimento para verificar a relao entre crises de asma e incidncia de gripe 150
crianas foram escolhidas ao acaso, dentre aquelas acompanhadas pelo Posto de Sade do
bairro. Os dados referentes h uma semana so apresentados na tabela abaixo. A partir
desses voc acha que a ocorrncia de asma e a ocorrncia de gripe esto associadas?

Asma \ Gripe Sim No Total
Sim 27 34 61
No 42 47 89
Total 69 81 150

2. Responda certo ou errado, justificando.

a) Suponha duas amostras colhidas de uma mesma populao, sendo uma de tamanho 100 e
outra de tamanho 200. Ento, a amostra de tamanho maior mais representativa da
populao.
b) Duas variveis diferentes podem apresentar histogramas idnticos.
c) Duas variveis com box-plot iguais no podem ter valores diferentes.

3. Uma pesquisa com usurios de transporte coletivo na cidade de So Paulo indagou sobre
os diferentes tipos usados nas suas locomoes dirias. Dentre nibus, metro e trem, o
nmero de diferentes meios de transporte utilizados foi o seguinte: 2, 3, 2, 1,2, 1,2, 1,2,3,
1, 1, 1,2,2,3, 1, 1, 1, 1,2, 1, 1,2,2, 1,2, 1,2 e 3.

a) Organize uma tabela de freqncia.
b) Faa uma representao grfica.
c) Admitindo que essa amostra represente bem o comportamento do usurio paulistano, voc
acha que a porcentagem dos usurios que utilizam mais de um tipo de transporte grande?

4. Um novo medicamento para cicatrizao est sendo testado e um experimento feito para
estudar o tempo (em dias) de completo fechamento em cortes provenientes de cirurgia.
Uma amostra em trinta cobaias forneceu os valores: 15, 17, 16, 15, 17, 14, 17, 16, 16, 17,
15, 18, 14, 17, 15, 14, 15, 16, 17, 18, 18, 17, 15, 16, 14, 18, 18, 16, 15 e 14.

b) Que porcentagem das observaes esto abaixo de 16 dias?
c) Classifique como rpida as cicatrizaes iguais ou inferiores a 15 dias e como lenta as
demais. Faa um diagrama circular indicando as porcentagens para cada classificao.

5. O Posto de Sade de um certo bairro mantm um arquivo com o nmero de crianas nas
famlias que se utilizam do Posto. Os dados so os seguintes: 3, 4, 3, 4, 5, 1, 6, 3, 4, 5, 3, 4,
3, 3, 4, 3, 5, 5, 5, 5, 6, 11, 10, 2, 1, 2, 3, 1, 5 e 2.

b) Faa uma representao grfica.
c) Voc identifica valores muito discrepantes? Que fazer com eles?
27
3. MEDIDAS DE TENDNCIA CENTRAL E SEPARATRIZES

Vimos anteriormente a sintetizao dos dados sob a forma de tabelas, grficos e
distribuies de freqncias. Aqui, vamos aprender o clculo de medidas que possibilitem
representar um conjunto de dados (valores de uma varivel quantitativa, isto , informaes
numricas), relativos observao de determinado fenmeno de forma reduzida.
Estes ndices estatsticos so as MEDIDAS DE POSIO e, dentre as mais
importantes, citamos as Medidas de Tendncia Central, que recebem tal denominao pelo
fato dos dados observados tenderem, em geral, a se concentrar em torno de valores centrais.
Dentre as medidas de tendncia central, destacamos:

- a Mdia aritmtica ou Mdia;
- a Moda;
- a Mediana.

As outras medidas de posio so as SEPARATRIZES, que englobam:

- a prpria mediana;
- os quartis;
- os decis.
- os percentis.

3.1 MDIA ARITMTICA

Dada uma populao constituda de N elementos, X
1
, X
2
, ..., X
N
sua mdia, denotada
por , mede o valor mdio do conjunto de dados, sendo expressa na mesma unidade, e
definida por:

=
+ + + X X X
N
N 1 2
...
ou =

X
N
i
( Mdia populacional ) Eq. (1)

Dada uma amostra constituda de n elementos, X
1
, X
2
, ..., X
n
, sua mdia, denotada
X , ser definida por:

n
X X X
X
n
+ + +
=
2 1
ou X =
X
n
i
( Mdia amostral ) Eq. (2)

EXEMPLO 2.2: Determinar a mdia do seguinte conjunto (amostra) de valores X
i
: 3, 7, 8,
10, 11. Logo,
8 , 7
5
11 10 8 7 3
X =
+ + + +
= =

n
X
i

28

PROPRIEDADES

- uma medida de tendncia central que por uniformizar os valores de um conjunto de
dados, no representa bem os conjuntos que revelam tendncias extremas. Ou seja,
grandemente influenciada pelos valores extremos (grandes) do conjunto.
- Serve para compararmos conjuntos semelhantes.
- particularmente indicada para sries (conjuntos) que possuem os valores simtricos
em relao a um valor mdio e de freqncia mxima.
- Depende de todos os valores do conjunto de dados.
- A soma dos desvios tomados em relao mdia nula, isto ,
( )
X X
i
i
n
=
=
1
0.
- Somando-se ou subtraindo-se uma constante (c) a todos os valores de uma varivel, a
mdia do conjunto fica aumentada ou diminuda dessa constante, isto ,
Y X c Y X c
i i
= = .
- Multiplicando-se ou dividindo-se todos os valores de uma varivel por uma constante
(c), a mdia do conjunto fica multiplicada ou dividida por essa constante, isto ,
Y X c Y X c
i i
= - = - ou Y X c Y X c
i i
= = , para c=0.

3.2 MODA

Dado um conjunto de valores, a moda, denotada Mo, o valor que ocorre com maior
freqncia, ou seja, o valor mais frequente do conjunto de dados.

- A moda de um conjunto de dados pode no existir (figura (a))
- A moda de um conjunto de dados pode no ser nica (figura (c))

EXEMPLO 2.3: Determine a moda dos seguintes conjuntos de dados abaixo

a) 2, 2, 3, 3, 5, 5, 8, 8 No existe moda.
b) 2, 2, 3, 5, 5, 5, 8, 8 Mo = 5
c) 2, 2, 2, 3, 3, 5, 5, 5, 8 Mo = 2 e Mo = 5
29
PROPRIEDADES

- No depende de todos os valores do conjunto de dados, podendo mesmo no se alterar
com a modificao de alguns deles.
- No influenciada por valores extremos (grandes) do conjunto de dados.

3.3 MEDIANA

Considere uma srie (conjunto de dados) ordenada, constituda de n valores. A
mediana, denotada Md, o valor que divide o conjunto em duas partes iguais (isto , em duas
partes de 50% cada).

EXEMPLO 2.4: Calcular a mediana do conjunto: 2, 3, 5, 8, 9, 11, 13.

Md = 8 (termo de ordem central)

EXEMPLO 2.5: Calcular a mediana do conjunto: 2, 3, 5, 8, 9, 11, 13, 15.
5 , 8
2
9 8
= |
.
|
\
| +
= Md (Mdia aritmtica dos termos de ordens centrais)

Verificamos que, estando ordenados os valores de uma srie (conjunto de dados) e
sendo n o nmero de elementos da srie, o valor mediano ser:

- o termo de ordem central
n +1
2
,
2
1 +
=
n
X Md se n for mpar;
- a mdia dos termos de ordem
n n
2 2
1 e + ,
2
1
2 2
+
+
=
n n
X X
Md se n for par.

PROPRIEDADES

- A mediana no influenciada por valores extremos (grandes) de uma srie ou
conjunto de dados.

3.4 QUARTIL

Considere uma srie (conjunto de dados) ordenada, constituda de n valores. Os
quartis, denotados por Q
i,
, so os valores que dividem o conjunto em quatro partes iguais (isto
, em quatro partes de 25% cada). Podem ser obtidos atravs da aplicao da seguinte
expresso:

(
=
2
1
4
n i i
X Q

EXEMPLO 2.6: encontre os quartis da seguinte srie bruta de dados : 1, 3, 2, 6, 5, 9. Para
encontrar os quartis, valores que dividem a srie ordenada em quatro partes iguais, torna-se
necessrio a obteno do Rol : 1, 2, 3, 5, 6, e 9. Temos ento:
30

| | 2
2
1
4
6 1 1
X X Q = =
(
=> o primeiro quartil igual segundo elemento da srie ordenada, que

igual a 2.

| | 5 , 3
2
1
4
6 2 2
X X Q = =
(
=> o segundo quartil igual ao elemento 3,5 (entre o elemento3 e o

elemento 4) da srie ordenada, que igual a mdia entre 3 e 5, que
igual a 4.

| | 5
2
1
4
6 3 3
X X Q = =
(
=> o terceiro quartil igual ao elemento 5 da srie ordenada, que

igual a 6.

3.5 DECIL

Considere uma srie (conjunto de dados) ordenada, constituda de n valores. Os decis,
denotados por D
i,
, so os valores que dividem o conjunto em dez partes iguais (isto , em dez
partes de 10% cada). Podem ser obtidos atravs da aplicao da seguinte expresso:
(
=
2
1
10
n i i
X D

3.6 PERCENTIL

Considere uma srie (conjunto de dados) ordenada, constituda de n valores. Os
percentis, denotados por P
i,
, so os valores que dividem o conjunto em cem partes iguais (isto
, em cem partes de 1% cada). Podem ser obtidos atravs da aplicao da seguinte expresso:
(
=
2
1
100
n i i
X P
31
EXERCCIOS

1) Os dados abaixo so referentes a taxa de glicose, em miligramas por 100 ml de sangue,
em ratos machos da raa Wistar, com 20 dias de idade. Calcule a taxa mdia de glicose
desse conjunto de ratos.

100,0 100,0 97,5 80,0 97,5 85,0 85,0 80,0

2) Os dados abaixo so referentes ao peso corporal, em gramas, de ratos machos com 25 dias
de idade. Determine mediana deste conjunto de dados.

76 84 91 87 81 78 - 83

3) Foram coletadas 150 observaes de uma varivel X, a qual representa o nmero de
vestibulares FUVEST (um por ano) que um mesmo nmero de estudantes prestaram.
Assim foi observado que 75 estudantes prestaram um vestibular, e assim por diante. Os
dados esto na tabela abaixo:

X n
1 75
2 47
3 21
4 7
Total 150

Para este conjunto determine a mdia, moda e mediana.

4) Para o quadro abaixo calcule o peso mdio ao nascer.

Quadro Nascidos vivos segundo o Peso ao nascer, em quilogramas

CLASSE FREQNCIA
1,5 |-- 2,0 3
2,0 |-- 2,5 16
2,5 |-- 3,0 31
3,0 |-- 3,5 34
3,5 |-- 4,0 11
4,0 |-- 4,5 4
4,5 |-- 5,0 1

32

5) O quadro abaixo apresenta a distribuio de um grupo de indivduos segundo o tipo de
sangue. Para esta calcule a moda.

TIPO DE SANGUE FREQNCIA
O 547
A 441
B 123
AB 25

6) Discuta quais medidas de posio seriam mais adequadas para os conjuntos de dados
abaixo. Comente as escolhas.

a) Esto disponveis dados mensais sobre incidncia de envenenamento por picada de cobras.
Deseja-se planejar a compra mensal de antdoto.
b) O nmero dirio de usurios, entre 17 e 19 horas, de determinada linha de nibus foi
anotado. Pretende-se utilizar esta informao para dimensionar a frota em circulao.
c) Um laboratrio deseja divulgar o tempo de efeito de um novo anestsico. Para isso aplicou
o anestsico em 100 pessoas e o tempo de efeito foi anotado.
d) Num vo internacional uma companhia serve dois tipos de pratos no jantar: peixe ou
frango. Um banco de dados contendo os pedidos feitos nos ltimos 200 vos obtido.
Pretende-se planejar o nmero de cada tipo de prato que deve se colocar disposio dos
passageiros.

7) Os nveis de cido rico, em (mg/ 100 ml), encontrados nos exames bioqumicos de
sangue de 10 pacientes do Laboratrio de Pesquisas Clnicas do Hospital Escola da FMIt,
so os seguintes:

Paciente AJF CHJ WT APC MD SEG HS BET RM CR
cido rico (mg%) 4,0 5,2 6,5 5,0 4,5 9,0 5,5 4,5 6,0 7,0

Com base nessas informaes, pede-se:

a) Calcular a taxa mdia de cido rico no sangue dos dez pacientes.
b) Calcular a mediana dos valores referidos no quadro.
c) Calcular a moda das taxas de cido rico.
d) Qual das trs medidas acima poderia ser convenientemente adotada com valor tpico ou
referencial do grupo de pacientes. Por qu?
33

8) As amostras de exames bioqumicos de sangue de trs diferentes laboratrios
apresentaram os nveis de creatinina (mg%) mostrados no quadro abaixo. Pede-se:

Exame 1 2 3 4 5 6 7
Laboratrio A 0,6 0,4 0,5 0,8 0,2 0,8 -
Laboratrio B 0,7 0,8 0,6 0,9 0,5 1,1 0,3
Laboratrio C 0,6 0,7 2,0 0,5 0,8 0,9 0,9

a) Calcular a mdia, moda e mediana para os dados do laboratrio A.
b) Calcular a mdia, moda e mediana para os dados do laboratrio B.
c) Calcular a mdia, moda e mediana para os dados do laboratrio C.
d) Calcular a MDIA GLOBAL dos dados.
e) Calcular a MEDIANA GLOBAL dos dados.
f) Calcular a MODA GLOBAL dos dados.
g) Os problemas verificados com a mdia, no caso dos dados do laboratrio C, continuam no
caso da mdia de todos os dados?
34
4. MEDIDAS DE DISPERSO

Na seo anterior, aprendemos a calcular e entender convenientemente as medidas de
posio representativas de um determinado conjunto de dados, onde destacamos a mdia, a
moda e a mediana.

Sejam quatro conjuntos A, B, C e D com os seguintes valores:
Conjunto A => 7, 7, 7, 7, 7
Conjunto B => 5, 6, 7, 8, 9
Conjunto C => 4, 5, 7, 9, 10
Conjunto D => 0, 5, 10, 10, 10

Para representarmos cada conjunto, podemos calcular a sua respectiva mdia
encontrando X X X X A B C D = = = = 7. Vemos assim que apesar de constitudos de valores
diferentes, os grupos revelam uma mesma mdia aritmtica.
Observando-os mais detalhadamente, notamos que em cada grupo os valores se
distribuem diferentemente em relao mdia 7. Necessitamos assim de uma medida
estatstica complementar para melhor caracterizar cada conjunto apresentado.
As medidas estatsticas responsveis pela variao ou disperso dos valores de um
conjunto so as medidas de disperso ou de variabilidade, onde se destacam a varincia, o
desvio padro e o coeficiente de variao. Em princpio, diremos que entre dois ou mais
conjuntos de dados, o mais disperso (ou menos homogneo) aquele que tem a maior medida
de disperso.

4.1 VARINCIA

A varincia de um conjunto de dados (amostra ou populao) mede a variabilidade do
conjunto em termos de desvios quadrados em relao mdia aritmtica do conjunto. uma
quantidade sempre no negativa e expressa em unidades quadradas do conjunto de dados,
sendo de difcil interpretao.
Seja um conjunto ( populao ) constitudo de N elementos X
1
, X
2
, . . ., X
N
. Sua
varincia denotada o
2
, definida por:

( )
o

2
2
=

X
N
i
, onde =

X
N
i
a mdia populacional

Seja um conjunto (amostra) constitudo de n elementos X
1
, X
2
, . . . , X
n
. Sua
varincia, denotada
2
S , definida por:

( )
1
2
2
=

n
X X
S
i
, onde X
X
n
i
=

a mdia amostral

A equao acima utilizada quando nosso interesse no se restringe descrio dos
dados, mas partindo da amostra, visamos tirar inferncias vlidas para sua respectiva
35
populao. No caso de estarmos interessados apenas na descrio dos dados, podemos usar no
divisor n em lugar de n 1.

EXEMPLO 2.7: Determine a varincia do seguinte conjunto (amostra) X
i
: 2, 3, 5, 7, 8.
De acordo com a equao (6) temos:

X
X
n
i
= = =
25
5
5

( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )
5 , 6
4
26
4
3 2 0 2 3
1 5
5 8 5 7 5 5 5 3 5 2
2 2 2 2 2 2 2 2 2 2
2
= =
+ + + +
=
+ + + +
= S

4.2 DESVIO-PADRO

uma outra medida de disperso mais comumente empregada do que a varincia, por
ser expresso na mesma unidade do conjunto de dados. Mede a "DISPERSO ABSOLUTA"
de um conjunto de valores e obtida a partir da varincia.

Desvio Padro = + Varincia (Raiz quadrada positiva da Varincia)

Conforme, o conjunto de dados, trate-se de uma populao ou uma amostra, teremos o
desvio padro dado por:

Populao =>
( )
o

=

X
N
i
2
Amostra =>
( )
S
X X
n
i
=

1
2

EXEMPLO 2.8: Para o exemplo anterior, temos que o desvio padro dado por
55 , 2 5 , 6 = = S

4.3 COEFICIENTE DE VARIAO

uma quantidade adimensional e serve para comparar dois ou mais conjuntos de
dados de unidades diferentes. Mede a "DISPERSO RELATIVA" de um conjunto de dados.
expresso, usualmente, em percentagem (%).
Populao => CV =
o
100 Amostra => CV

S
X
= 100.

EXEMPLO 2.9: Calcule o coeficiente de variao (disperso relativa) os dados do exemplo
2. Temos que a mdia 5 = X e o desvio padro 55 , 2 = S . Portanto,
0 , 51 100
00 , 5
55 , 2
100 = = =
X
S
CV , ou seja % 0 , 51 = CV .

36

37
EXERCCIOS

1) Os resultados de 12 provas de coagulao, encontrados em exames hematolgicos de
pacientes do HE-FMIt., so os seguintes:

Paciente 1 2 3 4 5 6 7 8 9 10 11 12
Tempo de coagulao (min) 6 5 6 7 9 6 8 7 4 10 6 12

Com base nesses dados, pede-se que se calcule:
a) a Varincia.
b) o Desvio Padro.
c) o Coeficiente de Variao dos tempos de coagulao.

2) Seja os dados abaixo referentes s alturas de 22 alunos do curso de Bioestatstica.

1,73 1,68 1,64 1,55 1,60 1,65 1,60 1,72 1,55 1,75 1,63
1,65 1,80 1,75 1,84 1,73 1,80 1,80 1,74 1,70 1,79 1,77

Para estes:
a) Construa uma tabela de distribuio de freqncia em intervalos de mesmo tamanho.
b) Construa o histograma.
c) Calcule a mdia, moda e mediana.
d) Calcule a tabela de quartis.
e) Calcule o coeficiente de variao.

3) Um hospital maternidade est planejando a ampliao dos leitos para recm nascidos.
Para tal, fez um levantamento dos ltimos 50 nascimentos obtendo a informao sobre o
nmero de dias que os bebs permaneceram no hospital, antes de terem alta. Os dados, j
ordenados, so apresentados a seguir.

Nmero de dias Freqncia
1 3
2 11
3 16
4 9
5 6
6 1
7 2
8 1
15 1

a) Calcule a mdia, moda e mediana.
b) Determine o desvio padro.
c) Dentre as medidas de posio calculadas em (a), discuta quais delas seria mais adequada
para este conjunto.
d) Voc identificou algum valor excepcional dentre os que foram observados. Se sim,
remova-o e recalcule os itens (a) e (b). Comente as diferenas encontradas.
38
6. REPRESENTAO GRFICA

Uma forma ldica e bastante interessante de apresentar dados consiste no uso de
grficos. A seguir so apresentados alguns dos principais tipos de grficos empregados na
estatstica. Uma maior explicao sobre grficos e sua utilizao pode ser visto nos livros
indicados.
O grfico estatstico uma forma de apresentao dos dados estatsticos, cujo
objetivo o de produzir, no investigador ou no pblico em geral, uma impresso rpida e viva
do fenmeno em estudo, j que os grficos falam mais rpidos que as sries (tabelas).
Para tornarmos possvel uma representao grfica, estabelecemos uma
correspondncia entre os termos da srie e determinada figura geomtrica, de tal modo que
cada elemento da srie seja representado por uma figura proporcional.
A representao grfica de um fenmeno deve obedecer aos seguintes requisitos
primordiais:

a) Simplicidade - indispensvel devido necessidade de levar a uma rpida apreenso
do sentido geral do fenmeno apresentado a fim de no nos perdermos na
observao de mincias de importncia secundria.
b) Clareza - o grfico deve possibilitar uma correta interpretao dos valores
representativos do fenmeno em estudo.
c) Veracidade - indispensvel qualquer comentrio, posto que, se no representa uma
realidade, o grfico perde sua finalidade.

Os principais tipos de grficos estatsticos para as distribuies de freqncias so os
DIAGRAMAS, os quais so grficos geomtricos de, no mximo duas dimenses. Para sua
construo, em geral, fazemos uso do sistema cartesiano.
Dentre os principais tipos de diagramas destacamos, segundo a varivel em estudo:

- Varivel Qualitativa

- GRFICOS EM BARRAS
- GRFICOS EM COLUNAS
- GRFICOS EM SETORES

- Varivel Quantitativa

- Distribuio por valores

- GRFICOS EM BARRAS
- GRFICOS EM COLUNAS
- BOXPLOT
- DIAGRAMA DE DISPERSO
- GRFICO DE LINHA OU CURVA
- GRFICO EM REA

- Distribuio por intervalos

- HISTOGRAMA
- POLGONO DE FREQUNCIAS

39
6.1 BOXPLOT

Representa a disperso dos dados, revelando a mediana e os quartis (medidas de
posio a serem apresentadas mais a seguir no texto). Infelizmente, este grfico no
disponibilizado pelo Excel, embora esteja presente em quase todos os softwares estatsticos
(como o R, SPSS, S-PLUS, Minitab, etc.).

Grfico 2.1 Notas de matemtica de turmas de uma escola X.

0
2
4
6
8
10
12
14
16
18
20
Turma A Turma B
N
o
t
a
s

d
e

m
a
t
e
m
t
i
c
a

6.2 DIAGRAMA DE DISPERSO

Mostra a relao grfica existente entre duas variveis numricas. Sua anlise ser
aprofundada no segundo mdulo de estatstica.

Grfico 2.2 Relao entre concentrao da substncia e ganho de peso aps 30 dias de 15
bois de uma dada regio de Bocaina, SP.
0
5
10
15
20
25
30
0 1 2 3 4 5 6 7
Concentrao da Substncia (mL)
G
a
n
h
o

d
e

P
e
s
o

(
K
g
)

40
6.3 GRFICO DE LINHA OU CURVA

Grfico 2.3 - Incidncia de Tuberculose (Todas as Formas). Pernambuco e
Brasil, 1980 2000

Incidncia de Tuberculose(todas as formas)
40,0
50,0
60,0
70,0
80,0
1
9
8
0
1
9
8
2
1
9
8
4
1
9
8
6
1
9
8
8
1
9
9
0
1
9
9
2
1
9
9
4
1
9
9
6
1
9
9
8
2
0
0
0
Anos
T
a
x
a

(
p
o
r

1
0
0
0
0
0

h
a
b
)
Brasil
Pernambuco

6.4 GRFICO EM REA

Grfico 2.4 - Proporo de casos de aids por ano de diagnstico e subcategoria de exposio,
no Rio Grande do Norte, de 1990 a 1999.

0%
20%
40%
60%
80%
100%
90 91 92 93 94 95 96 97 98 99
Ano de diagnstico
HTS HSH UDI Sangue Perinatal Ignorado

41
6.5 GRFICO EM COLUNAS

a representao de uma srie por meio de retngulos, dispostos verticalmente (em
colunas).

Grfico 2.5 Total de casos de meningites bacterianas em maiores de 15 anos,
Brasil, 1987-1991
0
200
400
600
800
1000
1200
87 88 89 90 91

6.6 GRFICO EM COLUNAS JUSTAPOSTAS

Grfico 2.6 Distribuio por tipo de casos de meningites bacterianas em maiores
de 15 anos, Brasil, 1987-1991

0
100
200
300
400
500
600
87 88 89 90 91
HAEMOPHILUS DM PNEUMOCOCO OUTROS

42
6.7 GRFICO EM COLUNAS SUPERPOSTAS

de 15 anos, Brasil, 1987-1991

0
200
400
600
800
1000
1200
87 88 89 90 91

6.8 GRFICO EM BARRAS

a representao de uma srie por meio de retngulos, dispostos horizontalmente
(em barras).

Grfico 2.8 Total de casos de meningites bacterianas em maiores de 15 anos,
Brasil, 1987-1991

0 200 400 600 800 1000 1200
87
88
89
90
91

43
6.9 GRFICO EM BARRAS JUSTAPOSTAS

de 15 anos, Brasil, 1987-1991.

0 100 200 300 400 500 600
87
88
89
90
91

6.10 GRFICO EM BARRAS SUPERPOSTAS

Grfico 2.10 Distribuio por tipo de casos de meningites bacterianas em
maiores de 15 anos, Brasil, 1987-1991.

0 200 400 600 800 1000 1200
87
88
89
90
91

44
6.11 GRFICO EM SETOR OU SECTOGRAMA (PIZZA)

o grfico que representa as partes de um todo, por setores de um crculo, visando
justamente comparar estas partes entre si e em relao ao todo.

Grfico 2.11 Distribuio por sexo de 96 recm-nascidos, HE-FMIt, 1996

6.12 HISTOGRAMA

a representao grfica de uma distribuio de freqncias de uma varivel
quantitativa (dados agrupados) por meio de retngulos justapostos centrados nos pontos
mdios das classes e cujas reas so proporcionais s freqncias das classes.

Grfico 2.12 Histograma de freqncia das idades em classes dos 26 pacientes apresentados
no quadro 1.1.

52,1%
47,9%
Masculino Feminino
0
2
4
6
8
10
12
4,25 13,75 23,25 32,75 42,25 51,75 61,25
Idade
F
r
e
q
n
c
i
a

a
b
s
o
l
u
t
a
45

6.13 GRFICO DA FREQUNCIA ACUMULADA CRESCENTE

Representa o histograma, com base em classes de freqncia ordenadas: da de menor
freqncia para a de maior freqncia.

Grfico 2.13 Distribuio da freqncia acumulada crescente das idades em classes dos 26
pacientes apresentados no quadro 1.1

6.14 GRFICO DA FREQUNCIA ACUMULADA DECRESCENTE

Representa o histograma, com base em classes de freqncia ordenadas: da de maior
freqncia para a de menor freqncia. Exemplo Grfico5.

Grfico 2.14 Distribuio da freqncia acumulada decrescente das idades em classes dos
26 pacientes apresentados no quadro 1.1

0
5
10
15
20
25
30
4,25 13,75 23,25 32,75 42,25 51,75 61,25
Idade
F
r
e
q
n
c
i
a

a
b
s
o
l
u
t
a
0
5
10
15
20
25
30
4,25 13,75 23,25 32,75 42,25 51,75 61,25
Idade
F
r
e
q
n
c
i
a

a
b
s
o
l
u
t
a
46
6.15 POLGONO DE FREQUNCIAS

a representao grfica de uma distribuio de freqncias por meio de uma linha
poligonal fechada ou polgono, cuja rea total igual a do histograma.

Grfico 2.15 Histograma e polgono de freqncia das idades em classes dos 26 pacientes
apresentados no quadro 1.1

0
2
4
6
8
10
12
4,25 13,75 23,25 32,75 42,25 51,75 61,25
Idade
F
r
e
q
n
c
i
a

a
b
s
o
l
u
t
a
47
7 APLICAES NO ACTION

48
EXERCCIOS

1. Quinze pacientes de uma clnica de ortopedia foram entrevistados quanto ao nmero de
meses previstos de fisioterapia, se haver (S) ou no (N) seqelas aps o tratamento e o
grau de complexidade da cirurgia realizada: alto (A), mdio (M) ou baixo (B). Os dados
so apresentados na tabela abaixo:

Pacientes 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Fisoterapia 7 8 5 6 4 5 7 7 6 8 6 5 5 4 5
Seqelas S S N N N S S N N S S N S N N
Cirurgia A M A M M B A M B M B B M M A

a) Classifique cada uma das variveis.
b) Para cada varivel, construa a tabela de freqncia e faa uma representao
grfica.
c) Para o grupo de pacientes que no ficaram com seqelas, faa um grfico de
barras para a varivel Fisioterapia. Voc acha que essa varivel se comporta de
modo diferente nesse grupo?

2. De acordo com o IBGE(1988), em 1986 ocorreram, em acidentes de trnsito, 27306
casos de vtimas fatais, assim distribudos: 11712 pedestres, 7116 passageiros e 8478
condutores. Faa uma tabela para apresentar esses dados. Apresente as freqncias
relativas e o total. Faa um grfico de barras e um de setores para representar estes
dados.

3. Represente graficamente:

Tabela 1 Nmero e proporo de bitos, segundo regies. Brasil, 1996 e 1999.

Regio N %
Norte 16.117 4,9
Nordeste 69.811 21,4
Sudeste 170.050 52,0
Sul 48.921 15,0
Centro-Oeste 21.830 6,7

Tabela 2 Nmero e proporo de bitos, segundo sexo e regies. Brasil, 1996 e 1999.

Masculino Feminino
Regio
N % N %
Norte 10.857 4,9 5.260 5,1
Nordeste 46.242 20,7 23.569 22,9
Sudeste 118.774 52,9 51.276 49,9
Sul 33.113 14,8 15.808 15,4
Centro-Oeste 14.958 6,7 6.872 6,7

Tabela 3 Suicidas segundo o sexo. Brasil, 1986

49
Sexo N %
Masculino 3.562 74,9
Feminino 1.192 25,1

4. Faa um histograma e um polgono de freqncias para os dados apresentados no
quadro abaixo.

Quadro 1 Ces adultos anestesiados e aps laparotomia, segundo a presso
arterial, em milmetros de mercrio

Classe Freq.
80 |-- 90 1
90 |-- 100 4
100 |-- 110 16
110 |-- 120 8
120 |-- 130 9
130 |-- 140 7
140 |-- 150 3
150 |-- 160 1

5. Os dados referem-se ao peso, em quilogramas, de ces. Para estes construa uma tabela
de distribuio de freqncias completa. Depois construa o histograma de freqncias.

23,0 19,0 23,8 15,0 20,0 22,7 19,5 22,0 14,9 18,3 21,2 20,1 18,7 15,1
22,3 21,5 25,5 19,5 22,2 24,0 17,0 24,1 28,0 13,6 15,8 28,4 23,0 15,0
16,1 16,0 19,0 18,0 18,8 18,0 15,0 14,5 19,0 20,5 16,0 16,0 16,0

6. Um estudo pretende verificar se o problema da desnutrio (medida pelo peso, em
quilos, das pessoas) em uma regio agrcola (denotada regio A), maior que em uma
regio industrial (Regio B). para tanto, uma amostra foi tomada em cada regio,
fornecendo a tabela de freqncias a seguir:

Regio A
Regio B
Peso N % Peso N %
< 40 46 43,0 < 40 10 3,1
40 |--50 22 20,6 40 |--50 34 10,7
50 |-- 60 18 16,8 50 |-- 60 109 34,2
60 |-- 70 12 11,2 60 |-- 70 111 34,8
70 e + 9 8,4 70 e + 55 17,2
Total 107 100,0 Total 319 100,0

Os dados apresentados sugerem que o grau de desnutrio diferente nas duas regies?
(Note que o total de observaes difere em cada regio).

50
Captulo 3

PROBABILIDADE

1. CONCEITO

Embora o conceito de probabilidade esteja estreitamente relacionado forma pela qual
esta definida, consensual interpretar a probabilidade como a possibilidade de um
determinado fato vir a ocorrer, avaliada numericamente e em termos percentuais.

2. A MENSURAO DA PROBABILIDADE

Ao definir o conceito de probabilidade, foi visto que a idia passa pela mensurao ou
avaliao das chances de um certo acontecimento. Existem duas maneiras pelas quais esta
avaliao pode ser feita:
- Pela observao e conhecimento completo dos fatores que influenciam o fato;
- Pela observao do comportamento passado do fato e das circunstncias nas quais
ocorreu.

O primeiro processo implica definir todos os fatores que de alguma forma poderiam
afetar o resultado final. Este processo conduz a definio de probabilidade dita a priori.
Embora esta definio de probabilidade exija uma avaliao exata da probabilidade de uma
ocorrncia, sua aplicabilidade est restrita a situaes muito particulares, como os jogos.
O segundo processo de natureza completamente diferente.Consiste em trabalhar com
o conceito de freqncia relativa, que prprio da probabilidade dita a posteriori. A
probabilidade baseada em freqncia relativa impe, evidentemente, uma estimativa da
verdadeira probabilidade de ocorrncia de um determinado fenmeno.Contudo, aquela que
pode ser aplicada aos problemas do mundo real e, especificamente, Medicina.
Para ilustrar as duas formas de pensar o conceito de probabilidade, suponha o seguinte
exemplo: Imagine a avaliao da probabilidade de um individuo sofrer um infarto. Utilizando
um critrio a priori, seria necessrio listar todos os fatores que poderiam conduzir ao
infarto.Embora os estudos que existem sobre o assunto, no estgio atual da cincia mdica,
sejam razoavelmente completos o que permitem indicar dezenas de fatores de risco, tais
como: idade, sexo, hereditariedade, estresse, fumo, dieta, condio fsica etc.- ,dificilmente
seria possvel colocar numericamente a conjuno de todos esses fatores. Ainda mais, se a
tolerncia de cada indivduo em particular a estes fatores no conhecida. Em sntese,
praticamente impossvel pensar, neste exemplo em avaliao a priori de probabilidade. Por
outro lado, consultando arquivos de dados cardiolgicos, possvel verificar o nmero de
casos de infarto em indivduos com caractersticas prximas daqueles cuja probabilidade quer-
se avaliar e, assim, tomar este dado como um indicativo da possibilidade de o fato
efetivamente vir a ocorrer. Por outro lado, tomando um determinado nmero de pacientes,
possvel conhecer a freqncia com que determinados fatores esto associados com a
ocorrncia do infarto.Desta forma, conhecendo as caractersticas de um determinado paciente,
seria possvel verificar com qual intensidade estes fatores esto presentes e, dessa forma,
chegar a um prognstico sobre seu risco de infartar.
51
3. PROBABILIDADE COMO UM NMERO

Quando o conceito de probabilidade foi definido, deixou-se claro que a probabilidade
expressa numrica e percentualmente. Assim, a probabilidade a priori de um acontecimento
A vir a ocorrer pode ser posta:

Onde A um subconjunto do conjunto universal de todas as possibilidades de
ocorrncia, s. O conjunto s tambm denominado espao amostral e cada parte elementar ou
elemento dele um ponto amostral.
Como corolrio imediato, vem que A estar sempre contido em s e, conseqentemente,
para qualquer A, ( ) 1 0 s s A P . De modo geral, denotando probabilidade por p, 1 0 s s p ou
% 100 % 0 s s P .
Em termos de probabilidade a posteriori, coloca-se:

As observaes anteriores, referentes probabilidade a priori, so tambm vlidas
para esse caso.

EXEMPLO 3.1: Suponha o lanamento de uma moeda. A probabilidade a priori seria
calculada da seguinte forma:
S = {c, k}, onde:
s = espao amostral = 2 elementos;
c = cara = ponto amostral = 1 elemento;
k = coroa = ponto amostral = 1 elemento.

O evento: A = resultado cara no lanamento de uma moeda constitudo por um nico
elemento. Portanto, a probabilidade de A ocorrer igual a:
( ) %. 50 5 , 0
2
1
ou A P = =

O clculo da probabilidade a posteriori implicaria ter efetuado um nmero n de
experincias de lanamento da moeda. Suponha-se que foram feitas 100 experincias. Ento n
= 100. Suponha-se ainda que destas 100 experincias, 48 resultaram cara e 52 resultaram
coroa. Desta forma, pode-se concluir que a probabilidade de ocorrer o evento A, tal como
foi definido anteriormente, igual a:
( ) %. 48 48 , 0
100
48
ou A P = =

Por extenso, conclui-se que o evento B = resultado coroa no lanamento de uma
moeda de 52%. Ainda, definido o evento C = resultado cair em p no lanamento de uma
moeda, possvel concluir que P(C) = 0%.

( )
| |
| | s
A
ades possibilid de total nmero
A a favorveis idades depossibil nmero
A P = =
" "
( )
| |
| | n
A
realizada foi erincia a que vezes de nmero
ocoreu A que vezes de nmero
A P = =
exp
52
4. PROBABILIDADE NA MEDICINA

Pelo exposto at agora, possvel perceber que os dois processos de mensurao no
levam necessariamente a resultados iguais. Ainda, no exemplo da moeda, possvel intuir que
o resultado obtido ao se fazer o clculo pelo primeiro processo correto, enquanto o clculo a
posteriori tomado como algo estranho (afinal, todo mundo sabe que q chance de sair cara
50%). De fato, a probabilidade verdadeira, ou real, naquele caso de 50%. Ainda, se outras
sries de experincias forem efetuadas com a mesma moeda, em condies absolutamente
iguais, os resultados obtidos em termo de avaliao de probabilidade no tero por que ser
coincidentes, podendo as diferenas (os erros) com respeito probabilidade real serem
maiores ou menores e estarem para baixo ou pra cima deste valor.
A pergunta que se faz, ento, por que no se utiliza sempre o primeiro processo e se
descarta o segundo.Ocorre que na cincia de modo geral e, por extenso, na medicina, a
relao entre causas e efeitos extremamente complexa, de forma que os resultados so
previsveis com um grau varivel de certeza e, desta forma, no possvel construir
corretamente os espaos amostrais necessrios ao clculo da probabilidade a priori.
Conseqentemente, as probabilidades so avaliadas historicamente ou por experimentao
e,os resultados,so estimativas de probabilidade sujeitas a erros de maior ou menor magnitude,
dependendo da forma como a pesquisa cientfica conduzida.
Conclui-se que, de modo geral, os resultados da cincia mdica no so cem por
cento exatos e que a presena de erro nas avaliaes ou conjecturas infelizmente, inevitvel.
A estatstica, enquanto cincia que trata de como controlar estes erros, auxiliar a pesquisa
mdica na construo de toda a base de conhecimentos dedutivos da medicina, como
possvel constatar em grande parte do material que promove a sua divulgao e difuso.

5. CLCULO DAS PROBABILIDADES

Foi visto que a estimativa de uma probabilidade obtida como uma proporo,
independentemente do seu critrio de definio. Entretanto, uma vez estabelecida
probabilidade de um ou de vrios eventos, existem diversos clculos de probabilidades que
podem ser feitos, combinando-se os resultados. Algumas situaes clssicas so vistas a
seguir.

5.1 LEI MULTIPLICATIVA

Dado um evento A, com probabilidade P(A), a probabilidade de que esses evento se
repita n vezes dada por:
( ) ( ) ( ) ( )
n n
A P A P A P A A A P ... . ...
2 1 2 1
=

A sentena acima pode ser lida: A probabilidade de que ocorra o evento A na
primeira vez e na segunda vez e assim por diante at a ensima vez igual ao produto das
probabilidades de ele ocorrer em cada uma das vezes.
Se a ocorrncia do evento A em cada uma das vezes no for afetada pelas ocorrncias
anteriores, diz-se que as ocorrncias de A em cada uma das vezes so independentes, e a
expresso anterior pode ser escrita:

( ) ( )
n
n
A P A A A P = ...
2 1

53
5.2 LEI ASSOCIATIVA

Dados dois eventos, A e B, a probabilidade de que ocorra um destes dois eventos, isto
, que ocorra A ou B, dada por:

( ) ( ) ( ) ( ) B A P B P A P B A P + =

que pode ser lido: A probabilidade de ocorrncia de A ou B dada pela soma das
probabilidades de ocorrer A mais a probabilidade de ocorrer B menos a probabilidade de que
ambos ocorram simultaneamente.
Evidentemente, se A e B no tiverem elementos em comum, sero representados por
conjuntos disjuntos, e a expresso anterior passa a:

( ) ( ) ( ) B P A P B A P + =

Em um determinado momento, se forem definidos dois eventos cuja ocorrncia
simultnea no possvel, diz-se que os eventos so mutuamente excludentes, ou seja, ocorre
um ou ocorre o outro. o caso, por exemplo, do lanamento de um dado e os eventos A =
resultado 6 e B = resultado 5. Sabe-se que P(A) = 1/6 e P(B) = 1/6, mas a probabilidade de
ocorrer A e B simplesmente no existe.

5.3 EVENTOS DEPENDENTES

Quando a ocorrncia de um evento a depende da ocorrncia prvia de um outro evento
B, diz-se que o evento A depende de B, e denota-se (A|B). comum ler a sentena (A|B)
como A dado B.
Para que dois eventos sejam dependentes, basta verificar a desigualdade

( ) ( ) ( ) B P A P B A P . =

Em outras palavras, a probabilidade do nmero de ocorrncias que satisfazem ambas
as condies (A e B) diferente do produto das probabilidades dos eventos A e B tomadas
isoladamente. Obviamente, os eventos sero independentes se ( ) ( ) ( ) B P A P B A P . = .

EXEMPLO 3.2: Suponha que um levantamento estatstico efetuado em certa populao
verificou que 23% de indivduos do sexo masculino e 18% do sexo feminino so hipertensos.
Se nessa mesma populao o nmero de casais hipertensos de 7,2%, ento existe
dependncia (ou associao) entre o fato de o homem e a mulher do casal apresentarem
hipertenso, pois, denotando H = homem hipertenso e M = mulher hipertensa, ter-se-ia

P(HM)=P(H).P(M)
P(HM)=0,23 . 0,18 = 0,0414 = 4,14% = 7,2%

Observe-se que no esto sendo nem procuradas nem analisadas as razes por que se o
primeiro membro do casal hipertenso, o outro tem mais chances de ser hipertenso do que se
o primeiro no for hipertenso. Simplesmente apresenta-se este fato a partir das estatsticas do
nmero de homens, mulheres e casais hipertensos. Quanto aos motivos para esta dependncia,
54
eles devem ser procurados, analisando-se outras variveis ligadas ao sexo e hipertenso.
Num estudo de campo, poder-se-ia sugerir que sejam verificadas caractersticas do casal no
que diz respeito ao tipo de alimentao, teor dirio ingerido de NaCl, ambiente familiar,
ambiente de trabalho, etc.

6. PROBABILIDADE CONDICIONADA

Quando existem dois eventos dependentes, a probabilidade de ocorrncia de um deles
afetada pelo fato de outro ter ou no ter ocorrido. Se estes eventos so os eventos A e B,
quando se diz que a probabilidade de ocorrncia de A est condicionada ocorrncia de B,
est-se querendo dizer que as chances de ocorrer A dependem de B.
De modo geral, a probabilidade de A condicionada a B dada por:

( )
( )
( ) B P
B A P
B A P

= |

Onde P(A|B) = probabilidade de A dado ou condicionada a B.

A relao anterior pode ser compreendida, observando-se a Figura 3.1.

Figura 3.1: Probabilidade condicionada

Na Figura 3.1, os eventos A e B possuem elementos comuns. A probabilidade de
ocorrer A dado B implica a ocorrncia prvia de B. Desta forma, o espao amostral se reduz
de U para B e as ocorrncias favorveis ao evento Apara a interseo de A com B, resultando
a expresso mostrada anteriormente.
As probabilidades condicionadas podem ocorrer, associando-se dois eventos, ou
quando um mesmo evento repetido e os seus resultados so o afetados pelos resultados
anteriores.
Como por exemplo do primeiro caso, imagine dois eventos associados a um conjunto
de indivduos.O primeiro evento, A, seria cirrose; o segundo, B, alcolatra. possvel
estimar, de acordo a esses dados, a probabilidade de um indivduo ter cirrose dado que
alcolatra.Para isto, de acordo definio dada, basta verificar o nmero de indivduos que
apresentam simultaneamente as duas caractersticas P(AB) e dividir pelo nmero total de
indivduos que apresentam a segunda caracterstica P(B).
Este tipo de problema costuma ser colocado em forma de tabelas conjuntas ser
colocado em forma de tabelas conjuntas de freqncias, ou tabelas conjuntas de
55
probabilidades, dependendo e os dados so valores absolutos (primeira denominao) ou
relativos (segunda denominao). Uma tabela conjunta simples (Tabela 3.1), de dimenso 2x2,
mostrada a seguir:

Tabela 3.1 - Associao de eventos dependentes.

Eventos B B Totais
A AB AB A
A AB AB A
Totais B B T

No exemplo que vem sendo analisado, ter-se-ia:

A = cirrose A= no-cirrose
B = alcolatra B= no-alcolatra

Evidentemente, os eventos associados so:

AB = cirrose e alcolatra;
AB = cirrose e no-alcolatra;
AB = no-cirrose e alcolatra;
AB = no-cirrose e no-alcolatra;
T = total de indivduos, ou probabilidade total.

De modo geral, se o evento A pode ocorrer de k maneiras diferentes A={a
1
, a
2
,..., a
k
}
e cada um destes resultados est condicionado ocorrncia do evento B, tem-se

P(A
1
\B) + P(A
2
\B) + ... + P(A
k
\B) = 1

Particularmente, se k = 2, ento

P(A
1
\B) =1- P(A
2
\B) e P(A
2
\B) = 1- P(A
1
\B)

O risco relativo pode ser calculado a partir das tabelas conjuntas de freqncia ou de
probabilidades que foram apresentadas para definir a probabilidade condicionada. um
conceito bastante empregado em medicina e pode ser entendido como risco adicional de estar
em uma determinada condio patolgica (A) devido ao fato de apresentar uma caracterstica
particular (B). No exemplo em que A = cirrose e B = alcolatra, o risco relativo de um
alcolatra em relao cirrose representa a probabilidade adicional de um alcolatra
desenvolver cirrose em relao a um indivduo no-alcolatra.
Genericamente, empregando a notao da Tabela 1 pode-se escrever:

56
EXEMPLO 3.3: Suponha que os valores para o exemplo da Tabela 3.1, num estudo efetuado
com 80 pacientes, sejam os mostrados na Tabela 3.2.

Tabela 3.2 - Associao entre cirrose e alcoolismo

Alcoolismo (B)
Cirrose (A)
Sim No
Presente 9 2
Ausente 26 43

Empregando a notao sugerida, o risco de um alcolatra apresentar cirrose de

( ) 2571 , 0
26 9
9
' | =
+
= B A P

O risco de cirrose entre os no-alcolatras resulta

( ) 0444 , 0
43 2
2
' | =
+
= B A P

O risco relativo resulta ento
79 , 5
0444 , 0
2571 , 0
= = RR

Este valor indica que o risco de um alcolatra desenvolver cirrose, em comparao a
um indivduo no-alcolatra, 4,79 (5,79 1) vezes maior.

7. TEOREMA DE BAYES

Suponha que a ocorrncia (ou no) de um determinado evento A possa ter sido
originado de k diversas maneiras c
1
, c
2
,..., c
k
(Fig. 3.2).

Fig. 3.2 Causas d evento A.

Figura 3.2: Causas do evento A

57
Observe que as causas c
1
, c
2
, ..., c
k
so eventos mutuamente exclusivos, ou
u =
k
c c c ...
2 1
. Desta forma, o conjunto A pode ser escrito como
) ( ... ) ( ) (
2 1 k
c A c A c A A = . Em termos de probabilidades
) ( ... ) ( ) ( ) (
2 1 k
c A P c A P c A P A P + + + = . Lembrando a definio de probabilidade
condicional, pode-se escrever:

) (
) (
) | (
i
i
i
c P
c A P
c A P

=

de onde vem

) | ( ). ( ) (
i i i
c A P c P c A P =

Ento, a probabilidade do evento A, P(A), resulta igual expresso

) | ( ). ( ... ) | ( ). ( ) | ( ). ( ) (
2 2 1 1 k k
c A P c P c A P c P c A P c P A P + + + =

ou
=
=
k
i
i i
c A P c P A P
1
) | ( ). ( ) (

Ento, a probabilidade de que o evento A tenha sido originado pela causa c
i
,
) | ( A c P
i
, dada por:

=
= =
k
i
i i
i i
i
i i
i
c A P c P
c A P c P
A c P ou
A P
c A P c P
A c P
1
) | ( ). (
) | ( ). (
) | (
) (
) | ( ). (
) | (

Esta a expresso final do Teorema de Bayes, tambm chamada de Teorema das
Causas. Possui aplicao direta em vrios problemas relacionados ao diagnstico de doenas.

EXEMPLO 3.4: Suponha que em um levantamento de dados uma determinada populao foi
classificada de acordo com uma das caractersticas abaixo:

P1 Heterossexuais 63%
P2 Homossexuais 18%
P3 Hemoflicos 5%
P4 Usurios de drogas injetveis 14%

Ainda, imagine que levantamentos estatsticos anteriores permitam presumir que o
risco de transmisso de HIV entre os heterossexuais de ordem de 2,3%; entre a populao
homossexual 9,3%; entre os hemoflicos 12% e entre os usurios de drogas 17,1%.
58
Como estas informaes seria possvel determinar, por exemplo, a probabilidade de
transmisso do HIV e, tambm, a chance de um HIV+ ser proveniente do grupo de
heterossexuais. No primeiro caso:

Seja A = HIV+ e A= HIV
ento,
P(A) = P(P
1
).P(A|P
1
) + P(P
2
).P(A|P
2
) + P(P
3
).P(A|P
3
) + P(P
4
).P(A|P
4
)
P(A) = 0,63.0,023 + 0,18.0,093 + 0,05.0,12 + 0,14.0,171 = 0,0617 ou 6,17%

Ento, o risco HIV+ de 6,17%.

A chance de HIV+ pertencer ao grupo heterossexual pode ser posta:

) (
) | ( ). (
) | (
1 1
1
A P
P A P P P
A P P =
2163 , 0
067 , 0
01449 , 0
067 , 0
023 , 0 . 63 , 0
) | (
1
= = = A P P ou 21,63%

Ento, dado um caso de HIV+, a probabilidade de ele pertencer ao grupo heterossexual
de 21,63%. Este resultado interesse (!), pois o valor calculado aparentemente alto diante
da pequena taxa de risco dos heterossexuais (2,3%).

59
EXERCCIOS

1. Um casal tem dois filhos. Qual a probabilidade de:
a) o segundo filho ser homem?
b) o segundo filho ser homem, dado que o primeiro homem?

2. A probabilidade de determinado teste para AIDS dar resultado negativo em portadores de
anticorpos contra o vrus 10%. Supondo que falsos negativos ocorrem
independentemente, qual a probabilidade de um portador de anticorpos contra o vrus da
AIDS, que se apresentou trs vezes para o teste, ter tido, nas trs vezes, resultado
negativo?

3. Suponha que a probabilidade de uma pessoa ser do tipo sangneo O de 40%, ser A de
30% e ser B de 20%. Suponha ainda que a probabilidade de Rh+ de 90% e o fator Rh
independe do tipo sangneo. Nestas condies, qual a probabilidade de uma pessoa
tomada ao acaso da populao ser:
a) O+?
b) AB-?

4. Em um artigo apresentado na XIV Semana Mdica da FMIt, Pinotti, A.L. relata 527
acasos operados de Colecistectomia no SCG do HE-FMIt no perodo de 1987 a 1993 e os
resultados em termos de deteco de Tumores da Vescula. Dentre as anlises realizadas,
foi efetuado um cruzamento entre o nmero de tumores encontrados e o sexo, como est
sintetizado na tabela abaixo.

Tabela Pacientes submetidos Colecistectomia Servio de Cirurgia Geral do HE-FMIt.

Tumores da Vescula Biliar
Sexo
Presente Ausente
Total
Masculino 5 274 279
Feminino 20 228 248
Total 25 502 527

Definindo os eventos: A={TVB presente} e B={sexo masculino}, estimar, com base nos
dados apresentados:

a) P( A )
b) P( A | B)
c) ) B | A ( P
d) P( B )
e) P( B | A)
f) ) A | B ( P
g) Qual o significado da relao entre os resultados dos itens (b) e (c)?
60

5. Acredita-se que numa certa populao, 20% de seus habitantes sofrem de algum tipo de
alergia e so classificados como alrgicos para fins de sade pblica. Sendo alrgico, a
probabilidade de ter reao a um certo antibitico de 0,5. Para os no alrgicos essa
probabilidade de apenas 0,05. Uma pessoa dessa populao teve reao ao ingerir o
antibitico, qual a probabilidade de:

a) Ser do grupo no alrgico?
b) Ser do grupo alrgico?

6. Estatsticas dos ltimos 2 anos do departamento estadual de estradas so apresentadas na
tabela a seguir, contendo o nmero de acidentes com vtimas, fatais ou no, e as condies
do principal motorista envolvido, sbrio ou alcoolizado.

Vtimas
Motoristas
No Fatais Fatais
Sbrio 1228 275
Alcoolizado 2393 762

Voc diria que o fato do motorista est ou no alcoolizado interfere na ocorrncia de
vtimas fatais?

EXERCCIOS RESOLVIDOS

7. O Distrbio de Hiperatividade com Dficit de Ateno, DHDA, uma desordem que afeta
entre 3 a 10% das crianas em atividade escolar. Assumindo que esta probabilidade seja
6,6%, estimar.

a) A probabilidade de que, entre duas crianas em idade escolar escolhidas ao acaso, as duas
apresentem DHDA.
b) A probabilidade de que, entre duas crianas em idade escolar escolhidas ao acaso,
nenhuma das duas apresentem DHDA.
c) A probabilidade de que, entre duas crianas em idade escolar escolhidas ao acaso, pelo
menos uma apresente DHDA.

SOLUO:
a) Seja o evento A = criana em idade escolar com DHDA. Ento,

P(A) = 6,6% ou 0,066, e

% 4356 , 0 004356 , 0 066 , 0 ) ( ) 2 ( ). 1 ( ) 2 1 (
2 2
ou A P A P A P A A P = = = =
Resposta: 0,004356 ou 0,4356%

b) Denotando o evento no-A por A, tem-se:

P(A1A2) = (1 0,066)
2
= (0,934)
2
=0,872
Resposta: 0,872 ou 87,2%
61
8. Ainda no tema da questo 7, imagine que em um dia de consultas, um neurologista tem na
sua agenda 8 pacientes, dos quais 2 possuem DHDA. Calcular a probabilidade de:

a) O primeiro paciente apresentar distrbio.
b) O segundo ter DHDA dado que o primeiro no tinha.
c) O terceiro no ter DHDA dado que os dois primeiros tinham.

Soluo:
Mantendo a notao usada no problema 1, tem-se:

a) % 25 25 , 0
8
2
) 1 ( ou A P = = Resposta: 0,25 ou 25%.
b) % 1 , 27 271 , 0
7
2
) ' 1 \ 2 ( ou A A P = = Resposta: 0,271 ou 27,1%.
c) % 100 1
6
6
) 2 1 '\ 3 ( ou A A A P = = Resposta: 1 ou 100%.

9. Sabendo que o DHDA ocorre cerca de dez vezes mais em crianas do sexo masculino, e
lembrando os dados do exerccio 7,

a) Qual a prevalncia do DHDA no sexo feminino? E no sexo masculino?
b) Com base na letra a do problema 1, calcular a probabilidade pedida sendo os dois
casos, um do sexo masculino e outro do sexo feminino.
c) Construa uma tabela 2x2, cruzando a presena ou ausncia de DHDA e o sexo, para
um total hipottico de 1.000 crianas, usando todos os dados apresentados nos itens
anteriores.

Soluo
1. Graficamente, possvel colocar o problema da seguinte forma (Fig. 3.3):

62
Onde:
Am = DHDA no sexo masculino;
Af = DHDA no sexo feminino;

Am = no-DHDA no sexo masculino;
Af = no-DHDA no sexo feminino.

Da Fig. 3.3, v-se que:
P(Am)+P(Af) = P(A)

Sabe-se ainda que

P(Am) = P(A).P(m)

P(Af) = P(A).P(f)

De forma que
P(A) = P(A).P(m) + P(A).P(f)

Ainda, pelos dados do problema, tem-se que P(Am) = 10.P(Af).
Ento, considerando as propores iguais de crianas do sexo masculino e do sexo
feminino, possvel escrever:
% 6 , 6
2
) ( ) (
, 6 , 6 ) (
2
1
) (
2
1
=
+
= +
Af P Am P
ou Af P Am P

Ento

% 2 , 1
11
% 6 , 6 . 2
) ( % 6 , 6
2
) ( ) ( . 10
= = =
+
Af P
Af P Af P

A probabilidade para o sexo masculino ser:

P(Am) = 10.P(Af) = 10.1,2% = 12%

Resposta: A probabilidade de uma criana do sexo feminino apresentar DHDA de 1,2%.
Para o sexo masculino, esta probabilidade de 12%.

c) A tabela conjunta de freqncias resulta em (Tabela 3.5):

63
Tabela 3.5

DHDA
Sexo
Presente Ausente
Totais
Masculino 60 440 500
Feminino 6 494 500
Totais 66 934 1.000

10. Para detectar a presena do vrus Z no organismo efetuado o teste X. Sabe-se que o vrus
Z est presente em 0,1% da populao, enquanto o teste X acusa + em 99% dos casos de
pessoas com o vrus e em 5% dos casos em pessoas sadias. Considerando essas
informaes:

a) Qual seria a probabilidade de ocorrer um falso-positivo?
b) E de ocorrer um falso-negativo?

SOLUO:

a) Adotando a notao:
V = vrus; V = no-vrus; R+ = exame positivo; R- = exame negativo.

Pelos dados do problema, tm-se P(V) = 0,001, P(R+|V) = 0,99 e P(R+|V) = 0,05.
O falso-positivo, de acordo com a notao que foi convencionada, pode ser escrito como
P(V|R+). Ento, pelo Teorema de Bayes:

O clculo da probabilidade de um exame positivo pode ser feito empregando-se o teorema da
multiplicao de probabilidades. Assim

) ' | ( ). ' ( ) | ( ). ( ) ( V R P V P V R P V P R P + + + = +
05094 , 0 05 , 0 . 999 , 0 99 , 0 . 001 , 0 ) ( = + = + R P
Finalmente,
% 05 , 98 9805 , 0
05094 , 0
05 , 0 . 999 , 0
) | ' ( ou V P = = +

Resposta: Falso-positivo = 98,05%. A chance de um falso-positivo surpreendentemente
grande!

Explicao: Se o teste fosse perfeito, detectaria um em cada mil casos, que a incidncia
verdadeira do vrus. Entretanto, o teste acusa cinco em cada cem pessoas testadas. Portanto,
dos indivduos que o teste declara positivos, a maioria efetivamente no tem o vrus.

b) O falso-negativo, de acordo com a notao que foi convencionada, dado por P(V|R-). Dos
dados do problema, possvel inferir P(R-|V) = 0,01; P(R-|V) = 0,95. Pelo Teorema de
Bayes:
) (
) ' | ( ). ' (
) | ' (
+
+
= +
R P
V R P V P
R V P
64
) (
) | ( ). (
) | (
=
R P
V R P V P
R V P
Ento
) ' | ( ). ' ( ) | ( ). ( ) ( V R P V P V R P V P R P + =
94906 , 0 95 , 0 . 999 , 0 01 , 0 . 001 , 0 ) ( = + = R P
% 00105 , 0 0000105 , 0
94906 , 0
01 , 0 . 001 , 0
) | ' ( ou V P = = +

Resposta: Falso-negativo = 0,001%, aproximadamente. A chance de um indivduo
efetivamente ter o vrus e o teste falhar mnima. O teste, clinicamente muito bom.

65
Captulo 4

DISTRIBUIO DE PROBABILIDADE

1. CONCEITO

Seja a varivel aleatria (v.a.) X, que pode assumir os valores correspondentes ao
conjunto
X = {x
1
, x
2
,..., x
n
}.

A relao
( )
i i
x f x

define uma correspondncia entre todos os valores que a varivel aleatria pode assumir, x
i
e
suas respectivas probabilidades de ocorrncia f(x
i
). Esta relao a funo de probabilidade
da varivel aleatria X.

EXEMPLO 4.1: Suponha que o nmero mximo de leitos que uma unidade de terapia
intensiva comporte seja 4. Definido a varivel aleatria X como nmero de bitos (na UTI),
os valores que a v.a. pode assumir, num certo perodo de tempo, so:

X = {0, 1, 2, 3, 4}

onde:
X = 0 significa nenhum bito (quatros pacientes vivos); X = 1 (um) bito (trs pacientes
vivos) e assim por diante. Supondo que as probabilidades associadas a cada um destes
possveis resultados sejam
1

f(0) = 0,3164
f(1) = 0,4219
f(2) = 0,2109
f(3) = 0,0461
f(4) = 0,0039

possvel construir a funo mostrada no quadro 1,

Quadro 4.1

X 0 1 2 3 4 Soma
f(x) 0,3164 0,4219 0,2109 0,0461 0,0039 1

que a funo de probabilidade do nmero de bitos, tomando quatro leitos (n = 4). Note que
a soma
( ) 1
1
=
=
k
i
i
x f

66
o resultado esperado, uma vez que esto sendo consideradas todas as possibilidades de
ocorrncia para a v.a. X. Veja a Fig. 1.

0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
0,4
0,45
0 1 2 3 4
densidade

Figura 4.1: Distribuio de probabilidades.

Note que a soma das reas sob a curva que representa a funo de probabilidade
igual a 1 ou 100%. Fica assim estabelecida uma correspondncia entre a rea sob a funo e a
probabilidade de ocorrncia da v.a. X.

2. CONSTRUO DA FUNO DE PROBABILIDADE DADA A PROBABILIDADE
DE UMA OCORRNCIA

Suponha que a probabilidade do bito de um paciente, ao dar entrada na terapia
intensiva de 25% (risco de vida).

Definindo a v.a. X como no exemplo anterior (nmero de bitos), se um paciente de
entrada no CTI (n = 1), tem-se
{ }
( )
( )
=
=
=
25 , 0 1
75 , 0 0
1 , 0
f
f
X

Se dois pacientes ingressarem no CTI (n = 2),

{ }
( ) ( ) ( )
( )
( ) ( )
( ) ( )
( ) ( ) ( )
= =
= =
= =
= =
=
0625 , 0 25 , 0 . 25 , 0 . 2
3750 , 0
1875 , 0 75 , 0 . 25 , 0 .
1875 , 0 25 , 0 . 75 , 0 .
1
5625 , 0 75 , 0 . 75 , 0 . 0
2 , 1 , 0
2 1
2 1
2 1
2 1
o p o p f
v p o p
o p v p
f
v p v p f
X

o ndice indica o paciente (1 ou 2), p(o) e p(v) so as probabilidades de bito e de sobrevida.

Evidentemente, a construo de f(x) para um nmero maior de casos uma tarefa
repetitiva e trabalhosa. Uma forma sistemtica de se calcular a probabilidade de um
67
determinado nmero de ocorrncias em n casos pode ser feita a partir da distribuio
binomial.

3. DISTRIBUIO BINOMIAL

Seja uma varivel aleatria definida em termos binrios.Ento a v.a.X tem duas
possibilidades de ocorrncia. Denominando a probabilidade de ocorrncia de X de p e a de
no ocorrer X de q, tem-se p + q = 1.

A probabilidade de k ocorrncias da v.a.X em n casos dada por:

k n k
q p
k
n
k X P

|
|
.
|
\
|
= = ) (

lembrando que e 0! = 1

Os parmetros da distribuio de probabilidade gerada por esta funo so
- Mdia = valor esperado =E [X] = = n.p
- Varincia =
2
n.p.q = n.p.(1- p)
- Desvio padro = =

Observe que o formato da distribuio binomial depende de p e de n exclusivamente.

EXEMPLO 4.2: Suponha que a probabilidade de um indivduo do sexo masculino, com mais
de 60 anos, vida sedentria e fumante ativo de desenvolver uma doena cardiovascular nos
prximos 8 anos seja de 40%. A partir de um estudo controle com dez indivduos com essas
caractersticas, a probabilidade de que nenhum destes indivduos sofra doenas
cardiovasculares no perodo determinado pode ser calculada da seguinte forma:

X = indivduo, masculino, +60, sedentrio, fumante, DCV
n = 10 p = 0,4

Ento a probabilidade de nenhuma DCV resulta

O nmero esperado de casos de DVC no estudo final igual a = 10.0,4 = 4 casos,
com um desvio padro de = .
A probabilidade de se ter menos de trs indivduos com DVC seria calculada:
68

A probabilidade de mais de dois indivduos afetados por DVC no perodo seria,
analogamente,

Contudo, como possvel escrever

Ento,

4. DISTRIBUIO POISSON

A funo de probabilidade de Poisson dada por
lembrando e = 2,71828...
Substituindo por vem

Esta ltima expresso d uma aproximao da distribuio binomial, tanto mais
precisa quanto menor o valor de p .Desta forma, sua aplicao em Medicina est relacionada
a patologias raras (valor de p baixo).

Os parmetros da funo de probabilidade de Poisson so os seguintes:

- Mdia = valor esperado =E [X] = =
- Varincia =
2

- Desvio padro = = \

EXEMPLO 4.3: Suponha que uma a cada mil pessoas que utilizam determinado anestsico
sofra uma reao negativa (choque). Num total de 500 cirurgias em que se empregou esse
anestsico, a probabilidade de que 1 pessoa sofra a reao pode ser calculada

= = n.p = 500.0,001 = 0,5

69
0,3033 = 30,33%
A probabilidade de nenhuma reao seria
0,6065 = 60,65%

A probabilidade de mais de uma reao:

5. DISTRIBUIO NORMAL OU DE GAUSS

5.1. CONCEITO

A distribuio Normal ou de Gauss dada pela funo

Como a distribuio de Gauss uma distribuio de probabilidade, a rea sob a curva
normal deve ser igual a 1 ou 100%, ou seja

5.2. CARACTERSTICAS DA DISTRIBUIO NORMAL

- Assinttica em relao ao eixo das abscissas.
- Simtrica em torno ao seu valor central (mdia = mediana = moda).
- Valores concentrados em torno da tendncia central. As reas (probabilidades) para
um, dois e trs desvios padres em torno da mdia so, respectivamente:

1. .
2. .
3.

- Para caracterizar a distribuio normal basta a mdia e o desvio padro. Por esta razo,
quando se quer informar que uma varivel se distribui normalmente, costuma-se
escrever: N[,].
70
5.3. VARIVEL ALEATRIA PADRONIZADA

Para calcular probabilidades associadas distribuio normal, costuma-se converter a
varivel original do problema, X, em unidades reduzidas ou padronizadas, z. Esta
transformao efetuada por meio da relao:

A varivel aleatria padronizada, VAP, tem mdia e desvio padro a 0 e 1,
respectivamente. Desta forma N[0,1] indica a VAP da distribuio normal. As reas sob a
distribuio normal, em funo da VAP, encontram-se na Tabela da Normal Padro
(tabela1/ver Apndice), como mostra a Fig. 4.2.

Figura4.2 - rea sob a curva normal de acordo com a tabela da normal padro (Tabela 1).

Pela figura 4.2 pode-se notar que a tabela fornece a rea sob a curva normal para
valores menores ou iguais a z (rea sombreada). Para encontrar reas direita de determinada
valor da VAP, ou entre dois valores de Z, devem ser efetuadas composies de reas, como
mostrado no exemplo a seguir.

EXEMPLO 4.4: Suponha que o comprimento de recm-nascidos do sexo feminino no-
portadores de anormalidade congnitas seja uma varivel aleatria com distribuio
aproximadamente normal de mdia 48,54cm e desvio padro 2,5cm.

A probabilidade estimada de um recm-nascido, escolhido ao acaso de ter
comprimento superior mdia, 48,54cm, de 50%, uma vez que a distribuio normal
simtrica e a mdia corresponde ao eixo de simetria da curva. A VAP, neste resulta igual a
zero:
71
0
5 , 2
54 , 48 54 , 48
=
=
o
x
z

Na Tabela 1, para z = 0, a rea sob a curva igual a 0,5 ou 50%.
A probabilidade do comprimento ser inferior a 44,79cm pode ser encontrada da
seguinte forma

5 , 1
5 , 2
54 , 48 79 , 44
=
=
o
x
z

Na Tabela 1, para z = -1,5, a rea sob a curva igual a 0,0668. Portanto,
% 68 , 6 ) 79 , 44 ( = s X P .
A probabilidade de o comprimento ser superior a 47,29cm, por exemplo, pode ser
encontrada
5 , 0
5 , 2
54 , 48 29 , 47
=
= z
Na mesma tabela, para - 0, 5 z = , a rea sob a curva igual a 0,3085. Este valor
corresponde rea esquerda de - 0, 5 z = , o que representa valores menores do que 47,29cm.
Como se deseja a probabilidade de uma criana com comprimento maior que 47,29cm, a rea
desejada est direita de z = -0,5. Como a rea total sob a curva igual a 1 ou 100%, basta
fazer

( ) %. 15 , 69 6915 , 0 3085 , 0 1 29 , 47 = = = > X P

Para calcular a probabilidade entre 46,04 e 51,04cm, deve-se fazer

1
5 , 2
54 , 48 04 , 46
=
= z 1
5 , 2
54 , 48 04 , 51
+ =
= z

Para z = -1, a rea sob a curva igual a 0,1587. Para z = +1, a rea resulta 0,8643.
Ento:
( ) %. 56 , 70 7056 , 0 1587 , 0 8643 , 0 04 , 51 04 , 46 = = = s s X P

Um outro clculo que pode ser efetuado a partir da normal determinar o limite
inferior de, por exemplo, as 5% das crianas de maior comprimento. Este valor corresponde,
no caso, ao percentil 95. Este clculo til na construo de curvas de crescimento ou
pndero-estaturais (peso, estatura, permetro ceflico etc.).
No caso, deve-se procurar no interior da tabela 1 at encontrar o valor 0,9500 (95%).
Este valor corresponde a um valor correspondente a um valor de z igual a +1,65
(aproximadamente). Ento:

cm x
x
67 , 52 54 , 48 5 , 2 . 65 , 1
5 , 2
54 , 48
65 , 1 = + =
= +
Este limite que apenas 5% das crianas nascem com comprimento superior a 52,67cm.

72
6. DISTRIBUIO T-STUDENT

O uso da distribuio de t-Student, ou simplesmente distribuio t, est associado a
estudos com pequenas amostras. Considera-se uma pequena amostra, uma amostra com n <
30. Em medicina, este tipo de situao bastante freqente, pelas limitaes muitas vezes
encontradas na obteno de dados clnicos. Quando a amostra grande, a distribuio de t-
Student se aproxima da distribuio Normal. Na prtica, para n > 100, as distribuies so
quase iguais. De modo geral, a distribuio de Student depende de

funo de probabilidade = f(t, v)

onde t o valor de abscissa (assim como z na distribuio normal) e v o que se denomina de
graus de liberdade. Quanto maior o valor de v, mais achatada se torna a curva de t-Student.
Para valores de v prximos a cem, a curva de t-Student quase igual curva de Gauss.

7. DISTRIBUIO DE FISHER

A distribuio de Fisher, ou distribuio F, est geralmente associada a estudos
relacionados varincia de dados. Como ser visto mais adiante, ao se desejar provar uma
hiptese referente comparao de conjuntos numricos, a determinao de relao entre as
varincias desses conjuntos fundamental.
De modo geral, a distribuio de Fisher, ou distribuio F, depende de

funo de probabilidade F = f(u, v
1
,v
2
)

onde u o valor de abscissa da distribuio de Fisher , v
1
e v
2
so os graus de liberdade da
distribuio.
Assim como ocorre com a distribuio de t-Student, a distribuio de Fisher s
aplicaes diretas, como no caso da distribuio Normal, no so interessantes. Suas
aplicaes esto relacionadas com testes estatsticos.

8. DISTRIBUIO QUI-QUADRADO

A distribuio de Qui-quadrado, ou
2
, corresponde distribuio de probabilidade
da soma dos quadrados de n variveis aleatrias independentes, distribudas normalmente e
padronizadas(mdia 0 e desvio padro 1).Ou seja,

2 2
2
2
1
2
...
n
x x x + = _

A distribuio de Qui-quadrado funo de funo de probabilidade

2
= f(x,v)

onde x o valor de abscissa e v os graus de liberdade.
Assim como as distribuies t e F, a distribuio e Qui-Quadrado tem aplicaes nas
realizaes de teste de hipteses, que sero desenvolvidos posteriormente. Os valores da
distribuio de
2
esto no final da apostila.
73

74

75
EXERCCIOS

1. Um estudo na rea de Medicina Ocupacional (MO) revelou que um em cada quatro motoristas de
nibus apresentavam algum grau de lombalgia. Tomando para uma experincia um grupo de 12
motoristas, quais so as chances de:

a) Nenhum motorista apresentar a doena.
b) Menos de dois apresentarem a doena.
c) Mais de quatro apresentarem a doena.

2. As pacientes diagnosticadas com cncer de mama precocemente tm 80% de probabilidade de
serem completamente curadas. Para um grupo de 12 pacientes nessas condies, calcule:

a) O nmero esperado de pacientes que devem ser curadas.
b) A probabilidade de exatamente oito ficarem completamente curadas.
c) A probabilidade de no mximo duas permanecerem com a doena.

3. Suponha que o tempo de coagulao (TC) em seres humanos seja uma varivel aleatria com
distribuio normal, de mdia 7 minutos e desvio padro de 1 minuto. Em um exame
hematolgico qualquer, determine a probabilidade de que um indivduo apresente (TC):

a) Menor que 8 minutos.
b) Maior que 10 minutos.
c) Entre 4 e 10 minutos.

4. Doentes sofrendo de uma certa molstia so submetidos a um tratamento intensivo, cujo tempo de
cura foi modelado por uma densidade Normal de mdia 15 e desvio padro de 2 (dias). Para esta
calcule:

a) A probabilidade de um paciente, escolhido ao acaso, apresentar tempo de cura superior a 17
dias para se recuperar.
b) A probabilidade de um paciente, escolhido ao acaso, apresentar tempo de cura inferior a 20
dias.
c) O tempo necessrio para recuperar 25% dos pacientes.
d) Considere que 100 pacientes so escolhidos ao acaso. Assim qual seria o nmero esperado de
pacientes curados em menos de 11 dias.

76
Captulo 5

ESTATSTICA DESCRITIVA

1. NOES ELEMENTARES

Dizemos que em determinadas ocasies, h de se proceder a coleta de dados
diretamente da origem, isto , dos sujeitos com quem pretendemos realizar determinado
estudo. Entretanto, quando impossvel se observar toda a populao em que desejamos
estudar o fenmeno, recorremos s tcnicas de amostragem, em que nos limitamos a uma
amostra do Universo.
Damos incio a determinao de uma frao da populao, que ir fornecer
informaes que sero generalizadas para a populao. Para que esta generalizao seja
possvel, os integrantes da amostra devem ser escolhidos adequadamente.
Existe a necessidade de definirmos o conjunto de elementos para os quais devem ser
observadas e/ou mensuradas as variveis de interesse dentro da questo ou problema
estabelecido. Vamos, ento, definir alguns termos necessrios.

1.1 POPULAO E AMOSTRA

Objetivando o estudo quantitativo e qualitativo dos dados (ou informaes), obtidos
nos vrios campos da atividade cientfica, a Estatstica manipula dois conjuntos de dados
fundamentais: a "populao" e a "amostra".
Chamamos de POPULAO o conjunto dos seres, objetos ou informaes que
interessam ao estudo de um fenmeno coletivo segundo alguma(s) caracterstica(s). ,
portanto, um conjunto definido de informaes relativas a qualquer rea de interesse,
podendo, quanto ao nmero de elementos, ser: finita (tamanho N) ou infinita. Assim, a
populao do bairro da Cidade Universitria exemplo de uma populao finita, j o nmero
e pacientes internados no Hospital das Clnicas da Universidade Federal de Pernambuco
exemplo de uma populao considerada infinita ou impossvel de enumerar.
Na maioria das vezes, no conveniente, ou mesmo possvel realizar o levantamento
dos dados referentes a todos os elementos de uma populao. Portanto, analisamos parte da
populao, isto amostramos.
J a AMOSTRA um subconjunto no vazio ou parte da populao. Duas
consideraes devem ser feitas sobre o estudo amostral dos fenmenos. Uma diz respeito aos
cuidados que se deve tomar para assegurar que a amostra seja representativa da populao.
Para atender a essa exigncia, deve-se selecionar os elementos de forma aleatria, de modo
que todo e qualquer elemento da populao tenha a mesma chance de participar da amostra.
A outra exigncia diz respeito preciso dos dados coletados, buscando minimizar os erros
que poderiam induzir a concluses equivocadas. O nmero de elementos de uma amostra
chamado o tamanho da amostra, e denotado por n.

1.2 PARMETRO, ESTIMADOR E ESTIMATIVA

- Uma caracterstica numrica estabelecida para toda uma populao denominada
parmetro.
- Uma caracterstica numrica estabelecida para uma amostra denominada estimador.
77
- O valor numrico assumido pelo estimador numa determinada amostra denominada
estimativa.

EXEMPLO 5.1: no fenmeno coletivo eleio para prefeito do municpio de Joo Pessoa, a
populao o conjunto de todos os eleitores habilitados na respectiva cidade. Um parmetro
a proporo de votos do candidato A. Uma amostra pode ser um grupo de 1.000 eleitores
selecionados em todo o municpio. Um estimador a proporo de votos do candidato A
obtida na amostra. O valor resultante do estimador, a proporo amostral, a estimativa.

Em aplicaes efetivas, onde aplica-se o processo de amostragem, o nmero de
elementos componentes de uma amostra , geralmente, bastante reduzido em relao ao
nmero de elementos componentes da populao.

1.3 PROCESSOS ESTATSTICOS DE ABORDAGEM

Quando solicitados a estudar um fenmeno coletivo podemos optar entre os seguintes
processos estatsticos:

- CENSO - avaliao direta de um parmetro, utilizando-se todos os componentes da
populao. Admite erro processual zero e tem confiabilidade 100%, caro, lento, quase
sempre desatualizado e nem sempre vivel.

- AMOSTRAGEM (Inferncia) - avaliao indireta de um parmetro, com base em
um estimador atravs do clculo das probabilidades. Admite erro processual positivo
e tem confiabilidade menor que 100%, barato, rpido, atualizado e sempre vivel.

1.4 VANTAGENS E DESVANTAGENS DA AMOSTRA EM RELAO AO CENSO

- Vantagens:

a) Economia: evidente que ao utilizarmos apenas uma frao de uma populao,
estaremos economizando dinheiro, material, pessoal, etc.
b) Rapidez: Quando desejamos urgncia nas informaes a economia de tempo ser
indiscutvel.
c) Maior amplitude do Universo: Com o mesmo custo do CENSO, temos condies
de pesquisar uma rea muito maior.
d) Maior exatido: Num planejamento em que utilizamos amostragem, consideramos
que o pessoal a ser utilizado mais treinado e especializado, concorrendo para que
os resultados encontrados sejam mais detalhados, o que no ocorre com o CENSO.

- Desvantagens:

a) Utilizao em populaes pequenas. Ou seja, em populaes menos de 100
elementos.
b) No proporciona informao sobre todos os elementos da populao.
78
1.5 CONCEITOS BSICOS EM AMOSTRAGEM

- Populao Objeto: a populao total de interesse sobre a qual desejamos obter
informaes. Por exemplo, as peas produzidas por uma fbrica.

- Populao de Estudo: o conjunto de indivduos de interesse especfico. Ex: as peas
que permanecem no estoque.

- Caracterstica Populacional: Este o aspecto da populao que interessa ser medido.
Ex: O dimetro das peas.

- Unidade Amostral: Deve ser definida de acordo com o interesse do estudo, podendo
ser uma pea, um indivduo, uma famlia, uma fazenda, etc. A escolha deve ser feita no
incio da investigao.

- Estrutura Amostral: a fonte do nosso estudo, ou seja, o conjunto de unidades
amostrais. Ex: O conjunto das peas selecionadas.

1.6 TIPOS DE AMOSTRAGEM

- Amostragem Probabilstica: o procedimento atravs do qual existe uma
probabilidade conhecida e diferente de zero para cada elemento da populao vir a
ser selecionado para constituir a amostra. Tambm dita amostragem aleatria.

- Amostragem No Probabilstica (ou No Aleatria): Quando, no processo de
seleo, no existe nenhum mecanismo de probabilidade associado.

1.7 PROCEDIMENTOS AMOSTRAIS PROBABILSTICOS SIMPLES

Segundo a definio de amostragem probabilstica, existe a suposio de sorteio com
regras bem determinadas, cuja realizao s ser possvel se a populao for finita e
totalmente acessvel. Essa amostragem probabilstica a melhor garantia da
representatividade da amostra, pois o acaso ser o nico responsvel por eventuais
discrepncias entre a populao e a amostra.

- Populao Finita: um conjunto de N elementos, onde N um nmero natural
inteiro.

- Amostragem Sem Reposio: um procedimento de amostragem tal que cada
elemento selecionado no retorna populao at que o tamanho pr-definido para a
amostra tenha se completado.
79
1.8 PRINCIPAIS PROCEDIMENTOS AMOSTRAIS

1.8.1 AMOSTRAGEM ALEATRIA SIMPLES

Dada uma populao finita com N elementos consideremos a seleo de n < N
elementos para constituir uma amostra, sem reposio. Pode-se demonstrar que o nmero total
de amostras possveis, nestas circunstncias :
C
N
n
N
n
N
n N n
=
|
\
|
.
| =
!
!( )!
,Definio 1.1: Um procedimento de amostragem dito CASUAL
SIMPLES, SEM REPOSIO, se cada uma das possveis amostras tm a mesma
probabilidade de seleo.

A partir da definio acima, possvel demonstrar que, cada elemento, na populao,
tem a mesma probabilidade de ser selecionada na amostra. Por isso, tal fato tem sido utilizado
para caracterizar uma amostragem casual simples.

EXEMPLO 5.2: Para poder distribuir, a cada elemento na populao, a mesma probabilidade
de ser selecionado, sem reposio, necessrio, inicialmente, estabelecer a identificao de
cada elemento atravs de um rtulo. Isto constitui a operao de listagem da populao de
estudo. Em geral, a listagem estabelecida identificando, cada elemento na populao, por um
nmero. Por exemplo, se a populao tem tamanho N = 350 ento, os elementos so
identificados pelos nmeros: 001; 002; 003; . . . . .; 348; 349; 350. Uma vez listada a
populao poder-se-ia utilizar procedimentos mecnicos para selecionar a amostra, digamos,
de tamanho n = 10. Poderamos utilizar, por exemplo, uma roleta (no viciada) com nmeros
de 001 a 350 e gir-la 10 vezes anotando os nmeros de parada da roleta (e excluindo as
possveis repeties). Os elementos populacionais rotulados com tais nmeros seriam os
componentes da amostra. Alternativamente, poderamos colocar 350 bolas numeradas de 001 a
350, em uma urna e selecionar 10 bolas numeradas. Outros procedimentos mecnicos
poderiam ser imaginados.

1.8.2 AMOSTRAGEM SISTEMTICA

realizada quando os elementos da populao esto ordenados e a retirada dos
elementos da amostra feita periodicamente, ou sistematicamente.
Suponhamos que se deseja selecionar uma amostra de tamanho n de uma populao
finita de tamanho N. Suponhamos que o quociente (N / n) = k seja um nmero inteiro. Uma
amostra sistemtica, de intervalo k, consiste em selecionar 1 a cada k elementos da populao
de interesse.
O carter aleatrio ou casual dado pela seleo do INCIO CASUAL. Este
determinado selecionando-se, aleatoriamente, um nmero entre 1 e k. Este nmero
corresponde ao primeiro elemento selecionado para compor a amostra. Os demais so obtidos
adicionando-se k ao incio casual. Por exemplo: k = 5. Incio casual 3. Ento, os elementos
selecionados sero os elementos numerados pelos nmeros 3, 8, 13, 18, ...
A amostragem sistemtica extremamente simples para ser operacionada em trabalho
de campo, razo pela qual, em muitas circunstncias utilizada em substituio da
amostragem aleatria simples.

80
EXEMPLO 5.3: De uma populao de N = 500 elementos ordenados, retirar uma amostra
sistemtica de 100.

5
100
500
=
(
= k

Seja 1 s k s 5. Suponhamos que k = 3. Logo temos:
1 elemento da amostra: 3
2 elemento da amostra: 3 + 5 = 8
.
.
.

1.8.3 AMOSTRAGEM ESTRATIFICADA

A estratificao de uma populao correspondente a uma subdiviso da mesma, em
subpopulaes, de tal forma que haja a maior homogeneidade possvel dentro e a maior
heterogeneidade possvel entre tais subpopulaes. Cada uma destas subpopulaes constitui
um estrato.
Um exemplo prtico disso ocorre ao supor que um tipo de opinio pblica de uma
cidade pudesse depender da renda do opinante, isto , ser influenciado pelo bairro de
residncia do opinante. Uma amostra casual simples, entre a grande quantidade de amostras
possveis, poderia favorecer o aparecimento de todos os opinantes de um bairro s e nenhum
dos demais, produzindo um vis nos resultados. Para evitar tal fato e garantir a presena de
elementos de todos os bairros ligados rea de influncia em questo, podemos subdividir a
populao por bairro de residncia e, ento, selecionar uma amostra aleatria simples ou uma
amostra sistemtica, dentro de cada bairro. Dizemos, neste caso, que o bairro a VARIVEL
DE ESTRATIFICAO, ou que a POPULAO foi ESTRATIFICADA POR BAIRROS.
Sempre que em uma investigao existe uma ou mais variveis que podem interferir
nos resultados da varivel sob anlise conveniente controlar o efeito de tais variveis
tomando-as como variveis de estratificao.

1.8.4 AMOSTRAGEM POR CONGLOMERADOS

Uma amostragem por conglomerado uma amostra aleatria simples na qual cada
unidade amostral um grupo, ou conglomerado, de elementos. Este esquema amostral
utilizado quando h uma subdiviso da populao em grupos que sejam bastante semelhantes
entre si, mas com fortes discrepncias dentro dos grupos, de modo que cada um possa ser uma
pequena representao da populao de interesse especfico. A esses grupos dar-se o nome de
CONGLOMERADOS.
O primeiro passo para se usar este processo especificar conglomerados apropriados.
Os elementos entre os conglomerados devem ter caractersticas similares. Como regra geral, o
nmero de elementos em um conglomerado deve ser pequeno em relao ao tamanho da
populao, e o nmero de conglomerados razoavelmente grande.
Tanto no caso da amostragem estratificada, como no da amostragem por
conglomerado, a populao deve est dividida em grupos. Na amostragem estratificada,
81
entretanto, seleciona-se uma amostra aleatria simples dentro de cada grupo (estrato),
enquanto que na amostragem por conglomerado selecionam-se amostras aleatrias simples de
grupos (conglomerados), e todos os itens dentro dos conglomerados selecionados faro parte
da amostra.
Para o exemplo da amostragem nos bairros da cidade, teramos os bairros como
ESTRATOS e as CASAS como CONGLOMERADOS. Uma vez feita a escolha do Bairro,
seleciona-se ao acaso as casas que faro parte da amostra. Uma vez escolhida a casa, todos os
seus moradores devem fazer parte da amostra. Desta forma, existe uma homogeneidade entre
as casas do mesmo bairro, devido s condies scio-econmicas que levaram seus moradores
para l, e uma heterogeneidade entre os moradores da casa em termos de idade, sexo, renda,
nvel de instruo, etc.
A amostragem por conglomerado recomendada quando: a) Ou no se tem um sistema
de referncia listando todos os elementos da populao, ou a obteno dessa listagem
dispendiosa; b) O custo da obteno de informaes cresce com o aumento da distncia entre
os elementos.

A inferncia estatstica embasada em conceitos e resultados da Teoria da
Probabilidade. Por outro lado, antes de iniciar qualquer anlise dos dados atravs dos mtodos
estatsticos da estatstica indutiva, preciso organiz-los, o que feito com as tcnicas da
estatstica descritiva. Um outro problema que surge paralelamente o da escolha da amostra,
pois nossas concluses, referentes populao, vo basear-se nos resultados dessa amostra.
Certos cuidados devem ser tomados no processo de obteno dessa amostra, ou seja, no
processo de amostragem, pois muitas vezes erros grosseiros e concluses falsas ocorrem
devido falhas nesse processo.

1.9 CLCULO AMOSTRAL

Para se fazer inferncia faz-se necessrio saber o nmero mnimo de elementos
(unidades amostrais) que devem ser selecionados na populao para dar seguimento ao estudo.
Dessa forma, pode-se utilizar frmulas desenvolvidas para o clculo do tamanho da amostra
de acordo com o tipo de estudo ou parmetros a serem estimados. A seguir temos alguns
exemplos para clculo do tamanho de uma amostra se estimar um parmetro.

1.9.1 CLCULO AMOSTRAL PARA AVALIAR UMA MDIA

Suponha, por exemplo, que queiramos estimar a renda mdia de pessoas que
concluram um curso superior, no primeiro ano aps a formatura. QUANTAS rendas devemos
incluir em nossa amostra? A determinao do tamanho de uma amostra problema de grande
importncia, porque:

- amostras desnecessariamente grandes acarretam desperdcio de tempo e de dinheiro;
- e amostras excessivamente pequenas podem levar a resultados no confiveis.

Em muitos casos possvel determinar o tamanho mnimo de uma amostra para
estimar um parmetro estatstico, como por exemplo, a MDIA POPULACIONAL ( ).
82
A frmula para clculo do tamanho da amostra para uma estimativa confivel da
MDIA POPULACIONAL ( ) dada por:

2
2 2
0
d
z
n
o
=
onde:
n = nmero de elementos na amostra
o= desvio padro populacional da varivel em estudo (no exemplo, renda)
d = margem de erro ou erro mximo de estimativa. Identifica a diferena mxima entre mdia
amostral e a verdadeira mdia populaconal.
z = nvel de confiana.

Os valores de confiana mais utilizados e os valores de z correspondentes podem ser
encontrados na Tabela 1:

Tabela 5.1 Valores crticos associados ao grau de confiana na amostra

Grau de Confiana o z
90% 0,10 1,65
95% 0,05 1,96
99% 0,01 2,58

EXEMPLO 5.4: Um economista deseja estimar a renda mdia para o primeiro ano de
trabalho de um bacharel em direito. Quantos valores de renda devem ser tomados, se o
economista deseja ter 95% de confiana em que a mdia amostral esteja a menos de R$500,00
da verdadeira mdia populacional? Suponha que saibamos, por um estudo prvio, que para
tais rendas, o=R$6250,00

SOLUO: queremos determinar o tamanho n da amostra, dado que o = 0,05 (95% de
confiana). Desejamos que a mdia amostral seja a menos de R$ 500,00 da mdia
populacional, de forma que d = 500. Supondo o = 6250, aplicamos a equao, obtendo:
601
500
250 . 6 96 , 1
2
2 2
2
2 2
0
~
= =
d
z
n
o

Devemos, portanto, obter uma amostra de ao menos 601 rendas de primeiro ano,
selecionadas aleatoriamente, de bacharis de faculdades que tenham feito um curso de direito.
Com tal amostra teremos 95% de confiana em que a mdia amostral difira em menos de
R$500,00 da verdadeira mdia populacional .

E se no for conhecido?

83
A equao acima exige que se substitua por algum valor o desvio-padro populacional
o, mas se este for desconhecido, devemos poder utilizar um valor preliminar obtido por
processos como os que se seguem:
- Utilizar a aproximao
4
amplitude
~ o .
- Realizar um estudo piloto, iniciando o processo de amostragem. Com base na primeira
coleo de pelo menos 31 valores amostrais selecionados aleatoriamente, calcular o
desvio-padro amostral S e utiliz-lo em lugar de o. Este valor pode ser refinado com
a obteno de mais dados amostrais.

1.9.2 CLCULO AMOSTRAL PARA DETECTAR UMA PROPORO

Enquanto a amostragem probabilstica viabiliza a validade interna do estudo, a
preciso na estimativa da prevalncia obtida depende do tamanho de amostra. Assim, a
amplitude do intervalo de confiana (estimativa por intervalo da prevalncia populacional)
reflete o grau de preciso decorrente do tamanho da amostra fixado. O clculo do tamanho da
amostra dado por:
2
2
0
) 1 (
d
p p z
n

=
onde:
p = prevalncia esperada da varivel de interesse na populao
d = margem de erro ou preciso
z = nvel de confiana (1,96 para um nvel de confiana de 95% ou IC de 95%)
A correo para populao finita
|
.
|
\
|
+
=
N
n
n
n
0
0
1

E se p e q no forem conhecidos?

A equao acima exige que se substituam os valores populacionais p e q, por valores
amostrais p e q . Mas se estes tambm forem desconhecidos, substitumos p e q por 0,5.

EXEMPLO 5.5: Para se estimar a soropositividade ao vrus da dengue em uma populao de
aproximadamente 1.000.000 habitantes tendo como parmetro uma prevalncia esperada de
15% (p=0,15), com amplitude do IC de 95% de 12% (d=0,06), o nmero de pessoas a serem
investigadas seria:
SOLUO: p = 0,15, d = 0,06 e z = 1,96 (IC 95%)
84
136
06 , 0
) 15 , 0 1 ( 15 , 0 96 , 1 ) 1 (
2
2
2
2
0
=

=
=
d
p p z
n
Na maioria dos estudos, ser necessrio aumentar cerca de 10% o tamanho da amostra,
para levar em considerao os no respondedores, isto , indivduos no selecionados que se
recusaram a participar.

EXEMPLO 5.6: Em um estudo para determinar a sensibilidade de um novo teste diagnstico
para malria, espera-se que 80% dos pacientes com malria tenham teste positivo (resultado
de um estudo piloto). Quantos indivduos com malria devero ser includos no estudo para se
estimar um intervalo de 95% de confiana para a sensibilidade do teste com uma margem de
erro de 0,04?
SOLUO: p = 0,8, d = 0,04 e z = 1,96 (IC 95%)
385
04 , 0
) 8 , 0 1 ( 8 , 0 96 , 1 ) 1 (
2
2
2
2
0
=

=
=
d
p p z
n
Se mais de 10% da populao amostrada necessrio fazer uma correo. Esta
correo consiste em multiplicar a varincia por (1-f) onde f = n/N (1-f Correo para a
populao finita). A correo para a populao finita tambm pode ser aplicado a n, assim a
frmula passa a ser:
|
.
|
\
|
+
=
N
n
n
n
0
0
1

Se no exemplo 1, tivssemos a informao que o nmero de pessoas na populao
onde ser aplicado o teste de 1.000 pessoas. O tamanho de amostra agora passaria a ser de:
278
000 . 1
385
1
385
1
0
0
=
|
.
|
\
|
+
=
|
.
|
\
|
+
=
N
n
n
n
EXEMPLO 5.7: Para encontrar o tamanho da amostra capaz de determinar a especificidade
do teste utiliza-se a mesma metodologia. Por exemplo, se o investigador espera que 90% dos
indivduos sem malria tenham teste negativo, para a determinao de uma especificidade de
90% com margem de erro de 0,04 e um intervalo de confiana de 95%, temos que
aproximadamente 216 indivduos sem malria deveriam ser includos no estudo.

2. DISTRIBUIO AMOSTRAL

Como j sabemos, o problema de Inferncia Estatstica fazer uma afirmao sobre os
parmetros da populao atravs da amostra. Digamos que nossa afirmao deva ser feita
sobre um parmetro u da populao (dia, varincia ou qualquer outra medida). Decidimos
que ser usada a amostragem aleatria simples (a.a.s.), de n elementos sorteados dessa
populao. Tambm decidimos que nossa deciso ser baseada na estatstica T, que ser uma
85
funo da amostra ( , , ... , ) X X X
n 1 2
. Colhida uma amostra, teremos observado um particular
valor de T, digamos t
o
, e baseado nesse valor que faremos a afirmao sobre u, o parmetro
populacional.
A validade de nossa afirmao seria melhor compreendida se soubssemos o que
acontece com a estatstica T, quando retiramos todas as amostras de uma populao conhecida
segundo o plano amostral adotado. Isto , qual a distribuio de T quando ( , , ... , ) X X X
n 1 2

assume todos os valores possveis. Esta distribuio chamada de distribuio amostral da
estatstica T e desempenha papel fundamental na teoria de Inferncia Estatstica.
Esquematicamente, teramos o procedimento representado na figura abaixo, onde temos:
i. Uma populao X, com um certo parmetro u de interesse.
ii. Todas as amostras retiradas da populao, de acordo com um certo procedimento.
iii. Para cada amostra, calculamos o valor t da estatstica T.
iv. Os valores de t formam uma nova populao, cuja distribuio recebe o nome de
distribuio amostral de T.

Figura 5.1: Distribuio amostral de um certo parmetro populacional.

86
2.1. DISTRIBUIO AMOSTRAL DA MDIA

Vamos estudar agora a distribuio amostral da estatstica X , a mdia amostral.
Consideremos uma populao identificada pela varivel X, cujos parmetros mdia
populacional e varincia populacional
2
o , so supostamente conhecidos. Vamos retirar
todas as possveis amostras casuais simples de tamanho n dessa populao, e para cada uma
calcular a mdia X . Em seguida, construamos a distribuio amostral e estudemos suas
propriedades.
Seja uma populao composta por 200 recm-nascidos. Para estes foram mensurados
os pesos ao nascer. A distribuio dos pesos dos recm-nascidos segue segundo apresentado
no grfico abaixo.

0
10
20
30
40
50
60
70
80
90
<= 2250 2250 - 2550 2550 - 2850 2850 - 3150 3150 - 3450 3450 - 3750 >3750
Peso (kg)
N

Figura 5.2: Polgono de freqncia dos 200 recm-nascidos.

Para esta populao temos que o peso mdio de 2982 311 gramas. Assim vamos
retirar todas as possveis amostras de tamanhos 5, 10, 15, 20 e 40 e ver o que acontece com a
distribuio amostral da mdia.

n=5
3183 2666 3131 3174 2933 2667 2857 2936 2856 3392
3012 3143 2547 2902 2861 2903 3124 2889 3017 2631
2953 2312 3046 2996 2510 3103 2783 3585 3024 2394
3255 2896 2937 3079 3123 2312 2547 2547 2969 3161
3422 2558 3125 3454 2995 3014 2699 2837 3123 3351
Mdia 3.165 2.715 2.957 3.121 2.884 2.800 2.802 2.959 2.998 2.986
DP 189,0 318,4 242,3 211,6 230,4 317,8 213,7 381,4 97,0 448,7
87

n=10
2589 2471 2963 3222 3189 2631 3360 3189 3222 3764
3177 3161 3617 2510 2847 2891 2207 3764 2979 2948
3140 2837 2967 3048 2861 2889 2559 2882 3319 2903
3617 3141 2798 3265 3130 3161 3433 3473 2848 2823
2847 2773 3351 2755 3143 3177 2682 3022 3806 3145
2798 3048 3422 2640 2759 2798 3108 2953 2965 2819
2594 2722 2896 3130 3433 2961 3152 3143 3121 3095
2631 2877 3585 2722 2807 3088 2649 2525 2883 3079
3122 3174 3143 2783 2370 3594 3183 2963 2961 2906
2979 3165 3046 2965 2903 3319 3124 3070 2699 3522
Mdia 2949 2937 3179 2904 2944 3051 2946 3098 3080 3100
DP 325,8 239,5 294,6 258,6 293,2 278,2 397,1 335,9 312,9 312,1

n=15
2948 3108 3319 2948 3419 2737 2837 2234 3041 3039
3161 3210 3174 3473 3222 2883 2666 3594 2967 2649
3145 2953 3130 2889 3255 2234 3351 3176 2821 3108
3270 3376 2967 2471 3145 2370 2767 2414 3226 2909
2495 3041 3056 2661 3376 2821 2635 3177 3058 3210
2965 2891 3567 2821 3639 2763 3394 3178 3319 3329
3143 2847 3641 3012 3174 3222 2838 3210 3567 3246
2617 3048 3360 2967 2759 3152 3255 3108 3123 2823
3394 2889 3546 3293 2776 3268 2873 2877 3346 3046
2631 2423 3806 3070 3072 2819 3012 2682 2423 3376
3346 2883 2414 3329 2661 2953 2805 3165 3433 2861
3070 2666 3041 3015 2595 3210 3070 2635 2672 3764
3121 3319 2902 2883 3024 2995 2902 2631 3183 2819
3546 2776 3103 3106 2856 2525 2394 2823 3230 3301
2903 3130 3376 3246 2856 3394 3641 3015 2979 2312
Mdia 3.05 2.971 3.227 3.012 3.055 2.89 2.963 2.928 3.093 3.053
DP 298,3 248,6 348,3 260,4 302,3 335,6 329,6 358,5 296,9 347,5

88

n=20
2903 3246 3058 2279 3061 3131 3346 3276 3473 3123
2547 3088 3298 2414 2722 3210 3255 2635 3106 2995
2984 2547 2776 2965 2414 2763 3174 2810 2595 2965
2778 2783 2903 3319 2312 3058 3594 2996 2889 2948
3481 2933 2961 3070 3130 3048 3268 2873 3123 2837
3222 3152 3068 3456 3070 3233 3293 2539 2882 3065
3070 2661 3072 2837 2234 3456 2857 2961 3639 3124
2847 3061 3226 3265 3140 2672 3030 2778 3124 3070
2798 2423 2805 3230 3639 3319 3061 2891 2967 3268
3088 3451 3473 2967 2924 2902 2558 2902 3222 3050
3585 2891 3177 3124 2423 2764 3319 2661 3376 2823
3329 3022 3143 2975 3419 2857 3276 2889 2778 2672
2877 3046 3222 3012 2975 3014 2952 2882 2807 2889
2882 3546 2975 3108 3125 3124 2894 2821 2279 2819
2969 3265 2924 3293 3022 3030 2937 3293 3265 3246
3015 2856 2414 2933 2495 2755 3360 2798 2821 3178
2649 3178 2234 3123 3124 2510 3567 2763 2759 3106
2559 2778 3617 2952 2767 2783 2882 3301 2370 2589
2558 2838 3433 2623 3145 3226 2936 2819 2798 3079
3454 2773 2782 3125 3456 2635 3143 3246 2963 3177
Mdia 2.98 2.977 3.028 3.004 2.93 2.975 3.135 2.907 2.962 3.001
DP 308,9 286,1 333,5 292,3 392,1 252,9 258,1 219,1 342,8 183,3

89

n=40
3178 2547 3346 2933 2857 2394 2902 2821 3014 3419
2847 2894 2937 3130 2996 2737 3806 2967 3070 2847
3268 3165 3130 2969 3106 3222 3022 3454 3050 3319
3226 2782 2965 2794 3396 3070 2810 2933 3046 2967
3270 2984 2821 2963 2279 2312 3176 2285 2821 2495
2778 3293 3068 3161 3041 2906 3594 3130 2963 3070
3385 3015 3140 2798 2810 3145 3088 3015 2759 2471
2794 2969 2667 3017 2394 2967 2423 3394 3385 2635
3617 3255 2640 2894 3178 2525 3079 2903 3103 3130
3124 3329 3046 3079 2471 3522 2234 2672 3177 2525
3301 2394 3210 2617 2722 3276 3183 3246 2783 2953
3233 2856 2975 3189 3222 3268 2995 2937 2207 3255
3046 3806 2848 2623 2582 2370 3177 2773 2937 2207
3764 2856 2953 2856 2763 3070 3061 2967 3143 3124
2595 3183 2948 3639 2495 3210 2936 2819 2995 2953
3174 3265 3106 2471 3072 2649 2967 2716 3130 3276
2924 2889 2279 2857 2767 3141 3106 2701 2672 2823
2882 2764 3351 3360 2863 3451 2819 2759 2856 2794
2995 2883 2495 3061 3145 3079 3639 3268 2961 3265
2617 3122 3293 2961 2755 2701 2699 2883 2279 3641
2807 3056 3639 2996 2666 3270 3617 2279 3639 3177
2894 2539 2672 3022 3130 3056 2682 2953 3065 2778
3017 2820 3422 2495 2847 3124 2963 2882 2882 2782
2776 2776 3072 2783 2891 3419 3014 2810 2967 3039
2969 3174 3454 2394 3070 2525 3048 3056 2617 2961
3140 2810 2207 2312 2820 2965 3141 3124 3124 3178
2221 3161 2861 2856 2877 2207 3451 3594 3176 2863
3106 3168 3022 2861 2782 3106 2783 2776 3268 3233
3103 2781 3451 3226 2594 2782 3121 2722 2819 3210
3068 2975 2764 2781 3276 2558 2807 3161 3276 3079
3022 3143 2856 2667 2889 2883 3246 3222 2883 2948
3806 2961 3456 3121 2631 3594 2394 3050 2838 3210
3061 2794 2953 2906 3265 3454 2312 3422 3641 3176
2666 2737 2778 2906 2781 3124 2539 3108 3121 2525
2965 2722 2819 2221 2821 2471 3293 3070 2936 2539
3546 2471 2595 3123 3168 2896 2755 2649 2525 3293
3070 3270 2370 3301 2924 2909 3070 2906 2471 3268
2967 2896 3617 3058 2547 2547 2805 3319 2896 2883
2234 2967 3298 2847 3293 3125 3255 2539 3764 2821
2963 2837 2889 2995 3015 2821 3585 2906 2764 2640
Mdia 3.035 2.958 2.985 2.906 2.880 2.946 3.015 2.955 2.976 2.969
DP 333,6 268,3 346,0 284,3 265,5 355,5 363,0 287,5 322,7 2.958

90

Figura 5.3: Convergncia da mdia amostral.

A diminuio da variabilidade da distribuio da mdia amostral no acontece por
acaso, pois fcil mostrar que:

Isso implica que a medida que o tamanho da amostra tende ao tamanho da populao a
varincia da mdia amostral tende para zero. No caso extremo quando amostramos a
populao inteira, no existe variao. Logo, o desvio padro da mdia amostral igual ao
desvio padro da populao dividido pela raiz quadrada do tamanho da populao, chamado
de erro padro:

Quando a populao segue uma distribuio normal, ento, a mdia amostral segue
exatamente uma distribuio normal com a mesma mdia e com a varincia dividida pelo
tamanho da amostra.

Logo, podemos calcular probabilidades e valores muitos teis para construo dos
intervalos de confiana e teste de hipteses. Mas, o que acontece se a populao segue uma
distribuio uniforme, exponencial, binomial, Poisson, ou simplesmente desconhecida?
n=1
n=5 n=10
n=40
n=20 n=15
Erro padrao
n
x
_ = = o
o
o
o
x
n
N n
N
=

|
\
|
.
|
1
Para populaes finitas ou
amostragem sem reposio
X X
i=1
n
=
i
n /
V(X)
n
=
o
2
E(X)=
X
n
N

o
~ ( , ) 0 1
Se X ~ N (, o
2
) X ~ N (, o
2
/n)

91

Se X ~ ? (, o
2
) X ~ N (, o
2
/n) ?

2.2. O TEOREMA CENTRAL DO LIMITE

Neste caso, apelamos para o Teorema Central do Limite, que garante que a
distribuio da mdia amostral tende para uma distribuio normal, a medida que o tamanho
da amostra tende para infinito, ou no jargo estatstico, quando o tamanho da amostra for
suficientemente grande (n > 30):

Se X ~ ? (, o
2
) ento lim X ~ N (, o
2
/n)

A convergncia para normalidade ser mais rpida se a distribuio dos dados for
simtrica, j quando a distribuio for muito assimtrica ou bimodal, a convergncia ser mais
lenta.

Em outras palavras temos que:

1. Se a populao de onde se retira uma amostra possui distribuio normal, a
distribuio das mdias amostrais ser tambm normal para qualquer que seja o
tamanho da amostra.

2. Se a populao de onde se retira uma amostra possui distribuio no-normal, a
distribuio das mdias amostrais ser praticamente normal para grandes amostras.
Entendam-se por grandes amostras, aquelas com mais de 30 elementos.

Este teorema de fundamental importncia, uma vez que independentemente da
distribuio de probabilidade contnua que a varivel aleatria estudada assume, normal ou
no, para amostras grandes, a distribuio das mdias amostrais tem distribuio normal. Isto
de grande valor para muitos casos em estatstica.

n
) 1 , 0 ( ~ N
n
X
o

92

Figura 5.4: Histogramas correspondentes distribuio amostral de algumas populaes.

93
EXERCCIOS

1. Uma reprter da revista Byte deseja fazer uma pesquisa para estimar a verdadeira proporo
de todos os universitrios que tm computador pessoal, e quer ter 95% de confiana de que
seus resultados tenham uma margem de erro de 0,04. Quantos universitrios devem ser
pesquisados?

a) Suponha que tenhamos uma estimativa da proporo, obtida em estudo anterior, revela
uma percentagem de 27% (com base em dados de America Passage Media
Corporation).
b) Suponha que no temos qualquer informao anterior que sugira um possvel valor da
proporo.

2. Quantas residncias com TV a Nielsen deve pesquisar para estimar a percentagem das que
esto sintonizadas no programa J Soares Onze e Meia? Adote a margem de 97% de
confiana em que sua percentagem amostral tenha uma margem de erro de dois pontos
percentuais. Admita tambm que nada se sabe sobre a percentagem de residncias
sintonizadas para qualquer show de TV aps 11 horas da noite.

3. A Nielsen Media Research deseja estimar o tempo mdio (em horas) que os estudantes
universitrios de tempo integral passam vendo televiso em cada dia da semana. Determine
o tamanho da amostra necessrio para estimar essa mdia com uma margem de erro de 0,25
h (ou 15 minutos). Suponha que se exija um grau de 96% de confiana. Suponha tambm
que um estudo piloto tenha indicado que o desvio-padro populacional de 1,87 horas.

4. Uma pesquisa planejada para determinar as despesas mdicas anuais das famlias dos
empregados de uma grande empresa. A gerncia da empresa deseja ter 95% de
confiana de que a mdia da amostra est no mximo com uma margem de erro de $50
da mdia real das despesas mdicas familiares. Um estudo-piloto indica que o desvio-
padro pode ser calculado como sendo igual a $400.

a) Qual o tamanho de amostra necessrio?
b) Se a gerncia deseja estar certa em uma margem de erro de $25, que tamanho de
amostra ser necessrio?

5. O teste de QI padro planejado de modo que a mdia seja 100 e o desvio-padro para
adultos normais seja 15. Ache o tamanho da amostra necessria para estimar o QI mdio
dos instrutores de estatstica. Queremos ter 99% de confiana em que nossa mdia amostral
esteja a menos de 1,5 pontos de QI da verdadeira mdia. A mdia para esta populao
obviamente superior a 100, e o desvio-padro provavelmente inferior a 15, porque se trata
de um grupo com menor variao do que um grupo selecionado aleatoriamente da
populao geral; portanto, se tomamos o = 15, estaremos sendo conservadores, por
utilizarmos um valor que dar um tamanho de amostra no mnimo to grande quanto
necessrio. Suponha o = 15 e determine o tamanho da amostra necessrio.
94
Captulo 6

ESTIMAO

1. INTRODUO

O problema de estimao informalmente definido por: Assuma que alguma
caracterstica dos elementos da populao possa ser representada por uma varivel aleatria X,
a qual tem densidade f x
X
( ; ) u , onde a forma da densidade conhecida, mas o parmetro u
desconhecido (se u fosse conhecido, a funo de probabilidade seria completamente
especificada, e no haveria necessidade de fazer inferncia). Assuma que os valores
x x x
n 1 2
, , ... , de uma amostra aleatria X X X
n 1 2
, , ... , de f x
X
( ; ) u possa ser observada. Em
base dos valores amostrais observados x x x
n 1 2
, , ... , desejvel estimar o valor do parmetro
desconhecido u ou o valor de alguma funo do parmetro desconhecido.
Esta estimao pode ser feita de duas maneiras. A primeira, chamada de estimao
pontual, o valor que alguma estatstica, digamos T X X X
n
( , , )
1 2
... , , assume ou estima, o
desconhecido u. Tal estatstica chamada de estimador pontual. A segunda, chamada de
estimao por intervalo, definida por duas estatsticas, digamos T X X X
n 1 1 2
( , , ) ... , e
T X X X
n 2 1 2
( , , ) ... , , onde T X X X T X X X
n n 1 1 2 2 1 2
( , , . . . , ) ( , , . . . , ) < , tal que
( ) T X X X T X X X
n n 1 1 2 2 1 2
( , , . . . , ), ( , , . . . , ) constitua um intervalo com probabilidade conhecida
de conter o desconhecido u.

2. ESTIMAO PONTUAL

Lembrando o que j foi dito na primeira unidade, chama-se estimador, quantidade
calculada em funo da amostra, que sendo uma funo amostral, considerada uma
estatstica, e como tal uma varivel aleatria, caracterizada por uma distribuio de
probabilidade e seus respectivos parmetros prprios. Estimativa um particular valor
nmerico assumido por um estimador.

Notao: u o parmetro de interesse.
T um estimador de u
T
o
uma estimativa de u

Quando falamos em um estimador queremos frisar que podem existir vrios
estimadores para o mesmo parmetro, determinado por algum mtodo estatstico. Sendo,
portanto, a escolha do melhor, feita atravs de critrios que satisfazem propriedades de um
bom estimador. A seguir descrevemos algumas das principais propriedades.

2.1. PROPRIEDADES DOS ESTIMADORES

No exemplo abaixo, procuraremos mostrar como as propriedades de um estimador
podem ajudar-nos a analis-lo.

EXEMPLO 6.1.: Desejamos comprar um rifle e, aps algumas selees, restou-nos 4
alternativas que chamaremos de rifles A, B, C e D. Foi-nos permitido fazer um teste com cada
95
rifle. Este teste consistiu em fixar o rifle num cavalete, mirar o centro do alvo e disparar 15
tiros. Repetiu-se o procedimento para cada rifle e os resultados esto ilustrados na figura
abaixo.

Figura 6.1: Resultados de 15 tiros dados por 4 rifles.

Para analisar qual a melhor arma, podemos fixar critrios. Por exemplo, segundo o
critrio de em mdia acertar o alvo, escolheramos as armas A e C. Segundo o critrio de
no ser muito dispersivo (varincia pequena), a escolha recairia nas armas C e D. A arma C
aquela que rene as duas propriedades e, segundo esses critrios, essa seria a melhor arma.
Mas, se outro critrio fosse introduzido (por exemplo, preo), talvez essa no fosse a arma
mais interessante. s vezes, a soluo deve ser um compromisso entre todas as propriedades.
Esse exemplo nos permite introduzir alguns conceitos informalmente. Diremos que um
estimador no tendencioso se em mdia acerta o alvo. Chamaremos de preciso
proximidade de cada observao de sua prpria mdia. Acurcia mede a proximidade de cada
observao ao valor alvo que se procura atingir.

Desse modo, podemos descrever cada arma do seguinte modo:

Arma A: No tendenciosa, baixa preciso e pouco acurada.
Arma B: Tendenciosa, baixa preciso e pouco acurada.
Arma C: No tendenciosa, boa preciso e muito acurada.
Arma D: Tendenciosa, alta preciso e pouco acurada.

Do exposto acima, notamos a importncia de se definir propriedades desejveis para
estimadores. O primeiro critrio que iremos abordar o de no tendenciosidade.

96
a) No-Tendenciosidade (Sem Vcio): Diz-se que um estimador T no viciado (ou
ainda no tendencioso) de u, quando seu valor esperado o prprio parmetro
populacional que ele pretende estimar u.

b) Consistncia: Diz-se que uma sequncia de estimadores T
n
consistente se, alm de
ser no viciado, sua varincia tende a zero, quando o tamanho da amostra (n)
suficientemente grande. Isto significa que, sendo T um estimador consistente, pode-se
aumentar significativamente o tamanho da amostra, de modo a tornar o erro de
estimao to prximo a zero quanto se deseje.
c) Eficincia: Sejam T
1
e T
2
dois estimadores no viciados de u, e ainda a
Var T Var T ( ) ( ),
1 2
< ento, T
1
dito mais eficiente que T
2
.

Por exemplo, pode-se mostrar que a mdia e a mediana so estimadores no
tendenciosos para a mdia de uma populao Normal, mas X mais eficiente, pois a sua
varincia menor.

2.2. ESTIMADORES PONTUAIS

Para se proceder estimao pontual, deve-se escolher o melhor estimador possvel,
colher a amostra e, em funo de seus elementos, verificar a estimativa obtida, a qual
corresponder a um ponto sobre o eixo de variao da varivel.

MDIA: O melhor estimador da mdia populacional, , a mdia amostral, X . fcil
provar que este estimador satisfaz as propriedades de um bom estimador. Pela distribuio
amostral da mdia observa-se facilmente que este um estimador no-tendencioso e
consistente. Alm disso, podemos provar que tambm eficiente.

VARINCIA: Quando a mdia desconhecida, que a situao mais comum na prtica,
deve-se substituir o valor de por X , a mdia amostral, e estimar a varincia amostral.
Embora para grandes amostras seja indiferente o uso de n ou n-1. Estes estimadores tambm
satisfazem algumas propriedades de um bom estimador: no tendencioso, consistente e
eficiente para o
2
. Observe a distribuio amostral da varincia para se convencer que este
um estimador no-tendencioso e consistente.

PROPORO: O estimador da proporo populacional, p dado pela proporo amostral.
Observando-se a distribuio amostral da proporo, verifica-se que um estimador no-
tendencioso e consistente.

3. ESTIMAO POR INTERVALO

Assuma que uma amostra aleatria X X X
n 1 2
, , ... , , que tem densidade f x
X
( ; ) u possa
ser observada. Com base nos valores amostrais observados, estimamos o valor do parmetro
desconhecido u, ou o valor de alguma funo do parmetro desconhecido. Entretanto, por
melhores que sejam as qualidades do estimador utilizado, no devemos esperar que essa
estimativa coincida com o verdadeiro valor do parmetro. Na verdade, a probabilidade de que
isto acontea extremamente pequena, sendo igual a zero, quando T for uma varivel aleatria
97
contnua. Ento, desejvel que a estimativa pontual seja acompanhada por alguma medida do
erro possvel da estimativa. nesse sentido que a estimao por intervalo complementa a
estimao pontual. Na verdade, procuramos um intervalo em torno da estimativa, onde este
intervalo produzido pelo estimador pontual acompanhado de uma medida de confiabilidade
de que o verdadeiro valor do parmetro pertena ao intervalo encontrado. Ento, a amplitude
desse intervalo uma medida natural da preciso da estimativa.
Esses intervalos so chamados Intervalo de Confiana, e a probabilidade de que esse
intervalo contenha o verdadeiro valor do parmetro, denomina-se Nvel de Confiana ou
Grau de Confiana, sendo representado por (1-o ). Logo, o ser a probabilidade de erro ao
se afirmar que o intervalo contm o verdadeiro valor do parmetro.
Por exemplo, se retomarmos a populao composta por 200 recm-nascidos para os
quais foram mensurados os pesos ao nascer, podemos verificar que as estimaes intervalares
de modo geral sempre contm o parmetro verdadeiro. Assim, considerando que a mdia
populacional de 2982g e o desvio padro populacional de 311g temos:

2400
2500
2600
2700
2800
2900
3000
3100
3200
3300
1 2 3 4 5 6 7 8 9 10
Amostra (n=1)
P
e
s
o

(
e
m

g
r
a
m
a
s
)
2400
2500
2600
2700
2800
2900
3000
3100
3200
3300
3400
3500
1 2 3 4 5 6 7 8 9 10
Amostra (n=5)
P
e
s
o

(
e
m

g
r
a
m
a
s
)
2400
2500
2600
2700
2800
2900
3000
3100
3200
3300
3400
3500
1 2 3 4 5 6 7 8 9 10
Amostra (n=10)
P
e
s
o

(
e
m

g
r
a
m
a
s
)
2400
2500
2600
2700
2800
2900
3000
3100
3200
3300
3400
3500
1 2 3 4 5 6 7 8 9 10
Amostra (n=15)
P
e
s
o

(
e
m
g
r
a
m
a
s
)
2400
2500
2600
2700
2800
2900
3000
3100
3200
3300
3400
1 2 3 4 5 6 7 8 9 10
Amostra (n=20)
P
e
s
o

(
e
m
g
r
a
m
a
s
)
2400
2500
2600
2700
2800
2900
3000
3100
3200
1 2 3 4 5 6 7 8 9 10
Amostra (n=40)
P
e
s
o

(
e
m
g
r
a
m
a
s
)
Figura 6.2: Intervalos de confiana para as amostras de tamanhos 1, 5, 10, 15, 20 e 40.
3.1. INTERVALO DE CONFIANA PARA A MDIA DA POPULAO
98

Duas situaes so consideradas quando desejamos estabelecer um Intervalo de
Confiana para , a mdia da populao: Quando a varincia populacional ou no
conhecida. Vamos considerar tambm que a distribuio de X Normal, sendo esta
suposio feita ou a partir da distribuio dos elementos da populao ou atravs de grandes
amostras, isto , estamos considerando que a populao que origina X Normal ou que, o
tamanho da amostra, n > 30.

3.1.1 INTERVALO DE CONFIANA PARA A MDIA POPULACIONAL COM
VARINCIA POPULACIONAL o
2
CONHECIDA.

Ao nvel de 95% de confiana o intervalo dado por:

I.C.( ) =
\
|

n
X
o
96 , 1 ;
|
|
.
|
+
n
X
o
96 , 1

EXEMPLO 6.2: Num certo grupo de pacientes, o nvel de colesterol uma varivel aleatria
com distribuio normal, de mdia desconhecida e varincia o
2
= 64(mg/ml)
2
.

a) Para uma amostra de 46 indivduos, a qual teve nvel mdio de colesterol de 120 mg/ml,
construa o intervalo de confiana de 95%.
b) Se voc desejasse diminuir a amplitude do intervalo encontrado em (a) quais seriam suas
alternativas.

SOLUO: n = 46, 120 = X , o = 8
a) ( ) 31 , 122 ; 69 , 117
46
8
* 96 , 1 120 ;
46
8
* 96 , 1 120 ) ( =
|
|
.
|
\
|
+ = IC

Isto significa dizer que, com probabilidade 0,95 o verdadeiro valor da taxa mdia de
colesterol pertence ao intervalo (117,7mg/ml;122,3mg/ml).

b) Aumentar o tamanho da amostra, diminuir o nvel de confiana ou aumentar o nvel de
significncia.

3.1.2 INTERVALO DE CONFIANA PARA A MDIA POPULACIONAL COM
VARINCIA POPULACIONAL o
2
DESCONHECIDA.

Para um nvel de significncia o qualquer o intervalo dado por:
.
I.C.( ) =
\
|

n
S
t X ;
|
|
.
|
+
n
S
t X e P(t
(n-1)
< t) = 1
2
o

99
EXEMPLO 6.3: Os pulsos em repouso de 920 pessoas sadias foram tomados, e uma mdia
de 72,9 batidas por minuto (bpm) e um desvio padro de 11,0 bpm foram obtidos. Construa
um intervalo de confiana de 95% para a pulsao mdia em repouso de pessoas sadias com
base nesses dados.

SOLUO: n = 920, 11 e 9 , 72 = = S X , com 1-o = 0,95
96 , 1 0,025 2 05 , 0
) 025 , 0 ; 920 (
= = = t o o

) 6 , 73 ; 2 , 72 (
920
11
* 96 , 1 9 , 72 ;
920
11
* 96 , 1 9 , 72 ) ( =
|
|
.
|
\
|
= IC

Logo, com 95% de confiana o nmero de batidas mdias por minuto deste grupo de
pessoas est entre 72 e 74.

3.2. INTERVALO DE CONFIANA PARA A PROPORO DA POPULAO

O intervalo de confiana para uma proporo p, ao nvel de 95% de confiana, dado por:

I.C.(p) =
|
|
.
|
\
|

+
n
p p
p
n
p p
p
1 (
96 , 1 ;
1 (
96 , 1 (otimista)
ou
I.C.(p) =
|
|
.
|
\
|
+
n
p
n
p
4
1
96 , 1 ;
4
1
96 , 1 (conservador).

EXEMPLO 6.4: Uma amostra aleatria de 1000 eleitores de certo distrito eleitoral d 350
como favorveis a certo candidato. Determine um intervalo de confiana ao nvel de 95% para
a proporo de eleitores favorveis ao candidato.

SOLUO: n = 1000, , p = =
350
1000
0 35 e 1- o = 0,95

IC p ( ) , , *
, ( , )
; , , *
, ( , )
( , ; , ) =

+

|
\
|
.
| = 0 35 1 96
0 35 1 0 35
1000
0 35 1 96
0 35 1 0 35
1000
0 32 0 38

Ento, a proporo de eleitores do candidato est entre 32% e 38% com 95% de
confiana.

EXEMPLO 6.5: Num experimento cientfico, doentes contaminados com cercaria, que uma
das formas do verme da esquistossomose, recebem um certo medicamento e observa-se a
proporo p de cura. Em 200 pacientes verifica-se que 160 so curados. Determine com 95%
de confiana a verdadeira proporo de cura do medicamento.
SOLUO: n = 200, 8 , 0
200
160
= = p e 1- o = 0,95

100
) 855 , 0 ; 745 , 0 (
200
) 8 , 0 1 ( 8 , 0
* 96 , 1 8 , 0 ;
200
) 8 , 0 1 ( 8 , 0
* 96 , 1 8 , 0 ) ( =
|
|
.
|
\
|

+
= p IC

Ento, a proporo de cura do medicamento est entre 75% e 86% com 95% de
confiana.

3.3. INTERVALO DE CONFIANA PARA DUAS MDIAS

3.3.1. AMOSTRAS INDEPENDENTES

O intervalo de confiana associado a um determinado grau de confiana (1-)%, para a
diferena entre duas mdias populacionais A e B, dado por:
( )
(
(
+ =
B
B
A
A
B A B A
n
S
n
S
t X X IC
2 2
) ( e P(
2 n n
B A
t
+
<t)=1
2
o
.

EXEMPLO 6.6: Imagine que se deseja determinar se as taxas mdias de creatinina dos
grupos A=pacientes com insuficincia renal aguda (IRA) e B=pacientes sem IRA, so iguais.
Sejam as mdias, varincias e o nmero de indivduos em cada grupo:

Grupo N Mdia Varincia
A=IRA 7 2,47 1,13
B=no-IRA 5 0,76 0,13

Determine um intervalo com 95% de confiana.

SOLUO: Isto equivale, de certa forma, a verificar se existe associao entre IRA e as
taxas de creatinina. O valor da estatstica
2 n n
B A
t
+
para 95% de confiana e 10
(7+5-2) graus de liberdade 2,23. Assim o intervalo de confiana dado por:

| | | | 67 , 2 ; 75 , 0 43 , 0 23 , 2 71 , 1
5
13 , 0
7
13 , 1
23 , 2 ) 76 , 0 47 , 2 ( ) ( IC
B A
= =
(
+ =

Observe que o limite inferior do intervalo de confiana das diferenas, para este nvel de
confiana 0,75>0. Desta forma, poder-se-ia dizer que a este nvel de confiana no possvel
admitir que a mdia das taxas de creatinina do grupo IRA seja igual a do grupo sem IRA.

3.3.2. AMOSTRAS PAREADAS

Amostras pareadas ou pares de amostras so dados referentes a um mesmo conjunto de
indivduos (elementos), tomados em duas situaes diferentes. Genericamente, estas duas
situaes so denominadas antes e depois. De modo geral, deseja-se verificar se estas duas
situaes podem ser consideradas iguais ou no. Por exemplo, se ao mesmo grupo de
pacientes foi administrado um antitrmico, as situaes antes e depois seriam caracterizadas
pelos conjuntos de temperaturas corporais verificadas antes e depois da administrao do
antitrmico. O objetivo, naturalmente, o de comprar ambos os conjuntos de dados para
determinar se so diferentes, o que equivaleria a verificar se o antitrmico est tendo alguma
101
influncia (e quanto) na temperatura corporal. Esta situao pode ser generalizada do seguinte
modo:

Antes Depois d
i
1 , A
x
1 , B
x

1 , A
x -
1 , B
x
2 , A
x

2 , B
x

2 , A
x -
2 , B
x

n , A
x

n , B
x

n , A
x -
n , B
x
A
x
B
x
d

onde
i , A
x
representa um valor genrico da varivel X na situao antes, enquanto
i , B
x
se
refere situao depois. O intervalo de confiana, associado a um determinado grau de
confiana (1-), resulta neste caso:
|
|
.
|
+
\
|
=
n
S
t d
n
S
t d
d d
; = ) - I.C.(
B A
,
com
n
d
d
i
=
( )
=
n
i
i
d
n
d d
S
1
2
2
1
e P(t
(n-1)
< t) =1
2
o
.

interessante notar que, empregando-se os mesmo dados, o intervalo para amostras
pareadas possui amplitude menor que o intervalo para amostras independentes. Tal situao
decorre do fato de que, ao se empregarem amostras aos pares, eliminam-se eventuais fontes de
variao dos dados, j que os resultados do experimento provm dos mesmos indivduos. Em
pesquisa mdica, quando possvel montar experincias aos pares, suas concluses so
preferidas s de outro tipos de desenho experimental.

EXEMPLO 6.7: A Amiodarona um antirrtmico empregado para o tratamento dos
distrbios do ritmo de origem ventricular em pacientes com Insuficincia Cardaca. Apesar de
seus vrios efeitos colaterais, considerado como o melhor antirrtmico, alm de ser uma
substncia que age sobre a musculatura lisa dos vasos de resistncia, provocando
vasodilatao e diminuio da presso arterial, bem como a diminuio do ritmo cardaco. A
insuficincia cardaca uma das principais causas de mortalidade, atingindo 70% ao cabo de
dois anos. A taquiarritmia ventricular mata de forma sbita um tero desses pacientes, o que
explica a importncia do pronto diagnstico e tratamento adequado.Uma experincia
hipottica, baseada em um estudo publicado nos Anais da Academia nacional de Medicina,
tem por objetivo avaliar os efeitos da Amiodarona sobre uma das manifestaes clnicas da
Insuficincia Cardaca de pacientes portadores de prtese valvar normofuncional: a freqncia
cardaca. Abaixo esto os resultados de 6 pacientes de ambos os sexos e variadas faixas
etrias.
Antes Depois
128 83
106 72
113 80
135 86
92 68
140 85
102
Com base nesses dados, elabore uma estimativa comentada para a alterao do ritmo
cardaco provocada pela Amiodarona, com um grau de confiana de 95%.

SOLUO: Construa inicialmente o vetor de diferenas

Antes Depois d
i

128 83 45
106 72 34
113 80 33
135 86 49
92 68 24
140 85 55

Depois calcule a sua mdia e desvio padro:
40 =
i
d
( )
59 , 11
1
1
2
=
=

=
n
i
i
d
n
d d
S

E por fim substitua na frmula:
( )
|
|
.
|
\
|
+ =
6
59 , 11
40 ;
6
59 , 11
40 t t IC
B A

( ) 73 , 4 57 , 2 40 ; 73 , 4 57 , 2 40 + =

( ) 16 , 52 ; 84 , 27 =
103
EXERCCIOS

1. A cadeia de hotis American Resort d um teste de aptido aos candidatos a emprego, e
considera fcil uma questo do tipo mltipla escolha se ao menos 80% das respostas so
corretas. Uma amostra aleatria de 6503 respostas a determinada questo apresenta 84% de
respostas corretas. Construa o intervalo de confiana de 99% para a verdadeira
percentagem de respostas corretas. admissvel que a questo seja realmente fcil?

2. Os valores relacionados so tempos de espera (em minutos) de clientes no Jefferson Valley
Bank, onde os clientes entram em uma fila nica que atendida por trs guichs. Construa
um intervalo de 95% de confiana para o tempo mdio de espera.

6,5 6,6 6,7 6,8 7,1 7,3 7,4 7,7 7,7 7,7

3. Uma amostra aleatria de 1000 eleitores de certo distrito eleitoral d 450 como favorveis a
certo candidato. Determine um intervalo de confiana ao nvel de 95% para a proporo de
eleitores favorveis ao candidato.

4. Uma pessoa jogou uma moeda 100 vezes e dessas apareceram 64 caras. A moeda honesta?
(Use o nvel de confiana de 95%)

5. Em uma experincia sobre percepo extra-sensorial (P.E.S.) um indivduo, em uma sala,
solicitado a declarar a cor vermelha ou preta de uma carta escolhida, de um baralho. Se o
sujeito identifica corretamente 32 cartas, h alguma evidncia de que este possua percepo
extra-sensorial? (Use o nvel de confiana de 95%)

6. Em testes de coliso feitos em 15 minivans Honda Odyssey, os custos de conserto
apresentam uma distribuio aproximadamente em forma de sino, com mdia de $1786 e
desvio-padro de $937 (com base em dados do Highway Loss Data Institute). Construa um
intervalo de confiana de 99% para o custo mdio de conserto para as colises de todos os
veculos desse tipo.

7. Em um estudo sobre aplicao do tempo, constatou-se que 20 administradores,
selecionados aleatoriamente gastam uma mdia de 2,40 horas por dia com trabalho
burocrtico. O desvio padro amostral foi de 1,30 horas. Os dados aparentam ter uma
distribuio normal. Construa o intervalo de confiana de 95% para o tempo mdio gasto
em trabalho burocrtico por todos os administradores.

8. Construa um intervalo de 98% de confiana para a renda mdia de todos os empregados de
tempo integral que tm grau de bacharel. Uma amostra de 25 desses empregados revelou
que a distribuio das rendas aproximadamente normal, com mdia de $39.271 e desvio-
padro de $18.933 (com base em dados do Ministrio do Trabalho dos EUA).

9. O tempo de reao de um novo medicamento, por analogia a produtos similares, pode ser
considerado como tendo distribuio normal com mdia desconhecida () e desvio padro
o, tambm desconhecido. Vinte pacientes foram sorteados, receberam o medicamento e
tiveram o seu tempo de reao anotado. Os dados foram os seguintes (em minutos): 2,9
104
3,4 3,5 4,1 4,6 4,7 4,5 3,8 5,3 4,9 4,8 5,7 5,8 5,0 3,4 5,9 6,3
4,6 5,5 e 6,2. Obtenha um intervalo com 95% de confiana que contenha o verdadeiro
tempo mdio de reao dessa populao.

10. Repita a questo anterior ao nvel de confiana de 95% e utilizando o desvio padro
populacional, o qual de 0,8 minutos.

11. Um experimento com 6 pacientes que apresentaram o diagnstico de rubola e em estado
febril proporcionou as temperaturas corpreas sublinguais apresentadas abaixo:

Paciente 1 2 3 4 5 6
Temperatura (C) 38,6 37,5 38,0 37,3 38,6 39,0

Encontre o intervalo de confiana paras as temperaturas corpreas de todos os pacientes
com diagnstico de rubola e em estado febril. (Use o nvel de confiana de 95%)

12. So apresentados no quadro abaixo os valores de Amilase encontrados em esxames
qumicos de urina de um grupo de 10 pacientes com insuficincia renal, em (u/ml):

Paciente 1 2 3 4 5 6 7 8 9 10
Amilase (u/ml) 6 12 8 4 5 9 3 4 5 4

Calcule o intervalo com 95% de confiana para a taxa mdia populacional de Amilase.

13. Em uma pesquisa sobre Doenas Sexuais Transmissveis (DST), foi perguntado aos
entrevistados do sexo masculino se sentiam alguma dificuldade no uso de preservativos.
Na amostra de 150 indivduos do sexo masculino, escolhidos aleatoriamente na
populao, 68 responderam afirmativamente a essa questo. Determine o intervalo de
95% de confiana para a proporo de indivduos com dificuldades no uso de
preservativos.

14. A prescrio de anticoncepcionais orais deve ser efetuada aps uma avaliao completa da
paciente, uma vez que seu uso pode alterar diversas funes normais do organismo.
Suponha que uma experincia, com dois grupos de mulheres, apresentou os seguintes
dados relativos presso arterial sistlica (PAS):

Grupo N
Mdia
(PAS, mmHg)
Desvio
(PAS, mmHg)
Tratamento 19 120,4 8,31
Controle 25 115,6 16,22

Com base nos dados experimentais apresentados:
a) Construa o intervalo de confiana de 95% para as diferenas das mdias da PAS dos
grupos Tratamento e Controle.
b) A experincia para testar o Anticoncepcional Oral poderia ter sido formulada de
maneira diferente? (Justifique).
105

15. Para se avaliar o nvel de tenso ocasionada por exames escolares, doze alunos foram
escolhidos e sua pulsao foram mensuradas antes e aps o exame. Segundo os valores
esto apresentados abaixo:

Estudante
Instante da Medio
1 2 3 4 5 6 7 8 9 10 11 12
Antes 87 78 85 93 76 80 82 77 91 74 76 79
Depois 83 84 79 88 75 81 74 71 78 73 76 71

Verifique ao nvel de 95% de confiana se existe maior tenso (isto , maior pulsao)
antes da realizao dos exames.
106
Captulo 7

TESTES PARAMTRICOS

1. INTRODUO

Estudaremos uma forma de tratar o problema de fazer uma afirmao sobre o
parmetro desconhecidou associado a uma varivel aleatria X, baseado em uma amostra
aleatria simples, extrada da populao.
Em vez de procurarmos uma estimativa pontual do parmetro ou um intervalo de
confiana deste parmetro, freqentemente nos parecer conveniente admitir um valor
hipottico para o parmetrou , e depois utilizar a informao da amostra para confirmar ou
rejeitar esse valor hipottico.
Antes de falarmos de testes de hipteses, precisamos introduzir algumas notaes e
darmos algumas definies.

2. CONCEITOS FUNDAMENTAIS

Define-se por H
0
a hiptese existente, chamada hiptese nula, a ser testada e por H
1

a hiptese alternativa. O teste ir levar a aceitao ou rejeio de H
0
, o que corresponde
rejeio ou aceitao de H
1
, respectivamente. Entretanto, para manter a uniformidade
enuncia-se o resultado final sempre em termos da hiptese H
0
, ou seja aceitar ou rejeitar H
0
.
Qualquer que seja a deciso tomada, estamos sujeitos a cometer erros. Para facilitar a
linguagem, necessitamos das seguintes definies:

Erro tipo I: rejeitar a hiptese nula, quando esta verdadeira. Chamamos de o a
probabilidade de cometer esse erro, isto ,
o = P(erro tipo I) = P(rejeitar H
0
/ H
0
verdadeira)

Erro tipo II: no rejeitar H
0
quando H
0
falsa. A probabilidade de cometer esse erro
indicada por | , logo,
| = P(erro tipo II) = P(no rejeitar H
0
/ H
0
falsa)

Nossas decises em um teste de hiptese podem ser resumidas na seguinte tabela:

Tabela 1 - Acertos e Erros nas decises tomadas em um teste de hiptese

Realidade
H
0
Verdade H
0
Falsa (=H
1
)
Aceita H
0
Deciso Correta (1-o) Erro tipo II (|)
Deciso
Rejeita H
0
Erro tipo I (o) Deciso Correta (1-|)

A probabilidade o de cometer um erro de primeira espcie um valor arbitrrio e
recebe o nome de Nvel de Significncia do teste. O resultado da amostra cada vez mais
Populao
Amostra
107
significante para rejeitar H
0
quanto menor for esse nvel. Usualmente, esses valores so
fixados em 10%, 5% ou 1%.
A probabilidade | uma funo que depende dos valores do parmetro sob H
1
e 1- |
denominado de Potncia do Teste, ou seja a capacidade de rejeitar H
0
quando H
0
falsa,
uma medida de qualidade do teste. Um teste de hiptese que fornece uma regra de deciso
com uma funo potncia maior que outro dito mais poderoso.

Note que na prtica no conhecemos a realidade. Jamais saberemos se a deciso
tomada foi certa ou errada. O certo que podemos cometer dois tipos de erro: o erro tipo I
quando nossa deciso rejeitar H
0
sendo H
0
verdadeira e o erro tipo II quando nossa deciso
for aceitar H
0
sendo H
0
falsa. Pensamos ento que um teste de hiptese ideal aquele em
que a regra de deciso que ele oferece torna mnimo os erros tipo I e II. Isto no possvel,
pois ao tentar minimizar o erro tipo I estamos aumentando o erro tipo II e vice-versa. No
entanto, quando fixamos o erro tipo I, conseguiremos diminuir o erro tipo II aumentando o
tamanho da amostra o mximo possvel, dentro das limitaes, de tempo e custo, permitidas.
Sendo um teste de hiptese uma regra de deciso, e esta Aceitar ou Rejeitar H
0
, o
conjunto de valores que levam a rejeitar H
0
chamado de Conjunto Crtico ou Regio
Crtica, denotado por RC. O complemento de RC chamado de Conjunto de Aceitao ou
Regio de Aceitao.

3. PASSOS PARA CONSTRUO DE UM TESTE DE HIPTESES

Vimos, na seo anterior, o procedimento que se deve usar para realizar um teste de
hiptese, discutindo as notaes tcnicas. Daremos abaixo uma seqncia que pode ser usada
sistematicamente para qualquer teste de hipteses.

Primeiro Passo: Formule as hipteses nula e alternativa. No nosso caso:

A alternativa mais geral seria:
=
=
0 1
0 0
:
:
u u
u u
H
H
(a)
Poderamos ainda ter alternativas da forma:
<
>
0 1
0 0
:
:
u u
u u
H
H
(b)
ou
>
s
0 1
0 0
:
:
u u
u u
H
H
(c)

dependendo das informaes que o problema traz.

Segundo Passo: Especifique o nvel de significncia o . Em geral, 0,01; 0,05 ou 0,10.

Terceiro Passo: Use a teoria estatstica e as informaes disponveis para decidir qual
estatstica ser usada para julgar H
0
. No se esquea de identificar a
distribuio amostral adequada.
108

Quarto Passo: Determine a regio crtica do teste, RC.

Quinto Passo: Use as informaes fornecidas pela amostra para encontrar o valor da
estatstica do teste do terceiro passo.

Sexto Passo: Se o valor da estatstica observada da amostra no pertencer regio crtica,
aceite H
0
; caso contrrio, rejeite.

Stimo Passo: Concluir a respeito do problema em estudo.

4. TESTES DE SIGNIFICNCIA PARA UMA AMOSTRA

4.1 TESTES PARA UMA MDIA

Vejamos agora uma aplicao dos sete passos, definidos na seo anterior, para testar a
hiptese de que a mdia de uma populao igual a um nmero fixado
0
. Vamos dividir
este estudo em duas partes:

a) o
2
conhecida ou n > 30:

1. Hipteses:

=
=
0 1
0 0
:
:

H
H
(a)
<
>
0 1
0 0
:
:

H
H
(b)
>
s
0 1
0 0
:
:

H
H
(c)

2. Fixar o .
3. Estatstica do teste X tem distribuio Normal.
4. A Regio Crtica ir depender da hiptese alternativa (Regio Grifada). Ento,

a)
=
=
0 1
0 0
:
:

H
H

b)
<
>
0 1
0 0
:
:

H
H

-z
z
-z z
109
c)
>
s
0 1
0 0
:
:

H
H

5. Calcular a Estatstica Z
x
n
c
=

o
0

6. Deciso: Rejeita-se ou no H
0
? Depende da Regio Crtica do passo 4.
Se Z RC
c
e , rejeita-se H
0
. Caso contrrio, aceita-se H
0
.
7. Concluso

EXEMPLO 7.1: Para estudar o efeito de uma certa substncia em seres vivos, um
experimento desenvolvido com cobaias que so inoculadas com a substncia e submetidas a
um estmulo eltrico e tm seus tempos de reao (em segundos) anotados. Obtivemos os
valores: 9,1 9,3 7,2 7,5 13,3 10,9 7,2 9,9 8,0 10,4. Admite-se que o tempo de reao
segue o modelo Normal com mdia 8 e desvio padro de 2 segundos. O pesquisador desconfia
que o tempo mdio sofre alterao influncia da substncia. Teste ao nvel de significncia de
0,01.

SOLUO: n = 10 28 , 9 = x segundos, o = 2,0 e
0
= 8,0

1. 0 , 8 :
0
= H
0 , 8 :
1
= H

2. o o = = 0 01 2 0 005 , ,
3. Estatstica do teste X tem distribuio Normal.
4. Da tabela da distribuio Normal, obtemos que: -z = -2,58 e z = 2,58.

5. Calcular a estatstica: 02 , 2
10
2
0 , 8 28 , 9
=
=
c
Z
6. Como RC Z
c
e = ) 02 , 2 ( , a nossa deciso ser no rejeitar H
0
.
7. Ao nvel de significncia de 1%, no podemos afirmar que o tempo de reao foi alterado
por influncia da substncia.
-2,58 +2,58
110
b)o
2
desconhecida e n < 30:

1. Hipteses:

=
=
0 1
0 0
:
:

H
H
(a)
<
>
0 1
0 0
:
:

H
H
(b)
>
s
0 1
0 0
:
:

H
H
(c)

2. Fixar o .

3. Estatstica do teste X tem t-Student com n-1 graus de liberdade.

4. A Regio Crtica ir depender da hiptese alternativa. Ento,

a)
=
=
0 1
0 0
:
:

H
H

b)
<
>
0 1
0 0
:
:

H
H

c)
>
s
0 1
0 0
:
:

H
H

5. Calcular a Estatstica t
x
S
n
c
=

0

0
Se t RC
c
e , rejeita-se H
0
0
.

7. Concluso
-t
t
-t t
111
EXEMPLO 7.2: Um fabricante afirma que seus cigarros contm no mais que 30 mg de
nicotina. Uma amostra de 25 cigarros forneceu mdia de 31,5mg e desvio padro de 3mg. Ao
nvel de 5%, os dados refutam ou no a afirmao do fabricante?

SOLUO: n = 25, x mg S mg = = 315 3 , e , o = 0,05

1. 30 :
0
s H
H
1
30 : >

2. o = 0 05 ,
3. Estatstica do teste X tem distribuio t-Student com 24 graus de liberdade
4. Da tabela da distribuio t-Student, obtemos que t
(24;0,05)
= 1,71.

Logo, RC = { t t
c c
e9 > / , } 1 71

5. t
c
=

=
315 30
3 25
2 5
,
,

6. Como ( , ) t RC
c
= e 2 5 , a nossa deciso ser de rejeitar H
0
.

7. Ao nvel de significncia de 5%, h evidncia de que os cigarros contenham mais que 30mg
de nicotina.

4.2. TESTES PARA UMA PROPORO

Vamos usar os passos descritos na seo 3 para mostrar a construo do teste para
propores. Temos uma populao, e temos uma hiptese sobre a proporo p de indivduos
portadores de uma certa caracterstica. Essa hiptese afirma que essa proporo igual a um
certo nmero p
0
. Ento, o problema deve fornecer informaes sobre a forma da alternativa.
Que ter uma das trs formas abaixo:

1. Hipteses:

=
=
0 1
0 0
:
:
p p H
p p H
(a)
<
>
0 1
0 0
:
:
p p H
p p H
(b)
>
s
0 1
0 0
:
:
p p H
p p H
(c)

2. Fixar o .
3. Estatstica do Teste p tem distribuio Normal.
4. A Regio Crtica ir depender da hiptese alternativa. Ento,

1,71
112
a)
=
=
0 1
0 0
:
:
p p H
p p H

b)
<
>
0 1
0 0
:
:
p p H
p p H

c)
>
s
0 1
0 0
:
:
p p H
p p H

5. Calcular a Estatstica
n
p p
p p
Z
c
) 1 (
0 0
0
=
0
Se Z RC
c
e , rejeita-se H
0
0
.

7. Concluso

EXEMPLO 7.3: Entre milhares de casos de pneumonia no tratados com sulfa, a
porcentagem que desenvolveu complicaes foi de 10%. Com o intuito de saber se o emprego
das sulfas diminuiria essa porcentagem, 120 casos de pneumonia foram tratados com
sulfapiridina e destes, 6 apresentaram complicaes. Admitindo que os pacientes so
comparveis em tudo, exceto quanto ao tratamento, teste a hiptese de que a proporo de
casos com complicaes entre os pacientes tratados com sulfas significativamente menor que
os no tratados (considere o = 0 05 , ).

SOLUO: n = 120

1. 10 , 0 :
0
> p H
10 , 0 :
1
< p H

2. o = 0 05 ,
3. Estatstica do Teste p tem distribuio Normal.
4. Da tabela da distribuio Normal, obtemos que z = -1,65.
z
-z
-z z
113

5. 05 , 0
120
6
= = p
83 , 1
120
9 , 0 1 , 0
10 , 0 05 , 0
) 1 (
0 0
0
=
=
n
p p
p p
Z
c

6. Como RC Z
c
e = ) 83 , 1 ( , a nossa deciso ser rejeitar H
0
.
7. Ao nvel de 5% de significncia, podemos dizer que h evidncias de que a proporo de
casos de pneumonia com complicaes tratados com sulfa seja menor que os no tratados.

5. TESTES DE SIGNIFICNCIA PARA DUAS AMOSTRAS

Suponhamos a seguinte situao: Um pesquisador acredita que existe alguma diferena
entre os nveis de um marcador bioqumico sangneo de homens que moram em uma regio
(RA) quando comparado outra (RB), sem indicar qual grupo teria maior ou menor. Como
ele pode fazer para testar sua hiptese? A resposta a princpio parece simples: toma-se uma
amostra de tamanho nA da populao A e de tamanho nB da populao B, faz-se o exame de
sangue e calcula-se a mdia para cada regio. A questo , certamente uns indivduos da
amostra da regio RA tero valores diferentes da RB, uns maiores e outros menores, assim
como haver, tambm, variao entre os indivduos de uma mesma regio. Sendo assim,
muito provvel que as mdias no sejam exatamente iguais. A pergunta : as mdias no so
iguais por que as populaes realmente apresentam valores diferentes ou por causa das
variaes casuais intrnsecas amostragem? Lembre-se de que as mdias amostrais tendem a
diferir uma da outra!

5.1 TESTES DE SIGNIFICNCIA PARA DUAS AMOSTRAS INDEPENDENTES

Lembremos do conceito de distribuio de mdias amostrais e suas relaes com
distribuio normal e distribuio t. Se agora pensarmos em uma distribuio para a
diferenas entre as mdias amostrais, poderamos definir uma curva de distribuio para
essas diferenas, e, ento, estipularmos um intervalo de confiana para a diferena ser nula.
Isto significa dizer que dentro de uma faixa de valores consideraremos nossa diferena
como igual e fora da faixa, como diferente. Quem define se a diferena de mdias est
dentro ou fora da faixa o ndice de significncia (o). Se a nossa diferena de mdias pode
ser considerada como tendo distribuio normal podemos recorrer a esta estatstica z ou
mesmo estatstica t para fazer nosso teste.
-z =-1,65
114
A figura a seguir ilustra o que falamos. A nossa varivel aleatria
2 1
x x tem
distribuio normal e podemos calcular a probabilidade de
2 1
x x assumir valores que
consideraremos zero. A regio em cinza na curva mostra a regio de aceitao para a nossa
hiptese nula ao compararmos as mdias de A e B. Fora da regio, consideraremos que as
mdias so diferentes. Observe que o a probabilidade que estamos admitindo para cometer
o erro tipo I (dizer que as mdias so diferentes quando na verdade elas so iguais). Como a
hiptese alternativa a de mdias diferentes temos que considerar metade para cada lado.

Figura 7.1: Distribuio de probabilidade da varivel
2 1
x x .

5.1.1 TESTES PARA DUAS MDIAS COM VARINCIAS CONHECIDAS

1. Hipteses:

=
=
2 1 1
2 1 0
:
:

H
H

2. Fixar o .
3. Estatstica do Teste:
2 1
X X tem distribuio Normal.
4. A Regio Crtica:

2
2
2
1
2
1
2 1
n n
x x
Z
c
o o
+
=

-z z
115

0
Se Z RC
c
e , rejeita-se H
0
0
.
7. Concluso

EXEMPLO 7.4: Suponha que a freqncia cardaca de uma amostra de 45 mulheres tenha
mdia de 70 bpm, e de 50 homens tenha mdia 72 bpm. Considerando que o desvio padro
populacional de mulheres de e 8 bpm e, de homens, 5 bpm. Podemos afirmar que, para o
grupo estudado existe diferena entre as FC basais de homens e mulheres com 5% de chance
de erro?

SOLUO:

1. Hipteses:

=
=
2 1 1
2 1 0
:
:

H
H

2. Fixar o =0,05.
2 1
X X tem distribuio Normal.
4. Da tabela da distribuio Normal, obtemos que Z = 1,96.

5. Calcular a estatstica: 04 , 1
45
8
50
5
70 72
2 2
2
2
2
1
2
1
2 1
=
+
=
+
=
n n
x x
Z
c
o o

6. Como RC Z
c
e = ) 04 , 1 ( , a nossa deciso ser no rejeitar H
0
.
7. Isto significa dizer que, neste exemplo hipottico, no existe diferena significativa entre a
freqncia cardaca basal de homens e mulheres.

5.1.2 TESTES PARA DUAS MDIAS COM VARINCIAS NO CONHECIDAS

O teste z exige que conheamos o desvio padro populacional, e isto no ocorre na
maioria dos casos. Se no conhecemos o desvio padro populacional devemos recorrer
distribuio t. Realizaremos ento o teste t (na verdade, o teste t ser o mais utilizado, pois
raramente se conhece o desvio padro populacional).
-z = -1,96 z = 1,96
116

1. Hipteses:
=
=
2 1 1
2 1 0
:
:

H
H

2. Fixar o .
2 1
X X tem distribuio t-Student com (n
1
+n
2
2) graus de liberdade

|
|
.
|
\
|
+
+
+

=
2 1 2 1
2
2
2 1
2
1
2 1
1 1
2
) 1 ( ) 1 (
n n n n
n s n s
x x
T
c

0
? Depende da Regio Crtica do passo 4. Se RC T
c
e ,
rejeita-se H
0
0
.
7. Concluso

EXEMPLO 7.5: Para o VO
2
max de uma amostra de 12 mulheres encontrou-se o VO
2
max de
52,8 ml/kg para a mdia e de 3,2 ml/kg para o desvio padro, e, de uma amostra de 12
homens, um valor de 58,2 para mdia, e de 4,4 para o desvio padro. Testar a hiptese de que
homens tm VO
2
max maior que mulheres para uma significncia de 5%.

SOLUO:

1. Hipteses:

=
=
2 1 1
2 1 0
:
:

H
H

2. Fixar o =0,05.
2 1
X X tem distribuio t-Student com (n
1
+n
2
2) graus de liberdade
4. Da tabela da t-student com (12 + 12 - 2) temos que t
o
= 2,07

-t t
t = 2,07
-t = 2,07
117
5. Calcular a Estatstica 44 , 3
12
1
12
1
2 12 12
) 1 12 ( 2 , 3 ) 1 12 ( 4 , 4
8 , 52 2 , 58
2 2
=
|
.
|
\
|
+
+
+

=
c
T

6. Como RC T
c
0
.
7. Podemos dizer que Homens tm VO
2
max maior que mulheres ao nvel de significncia de
5%.

5.2 TESTES DE SIGNIFICNCIA PARA DUAS AMOSTRAS RELACIONADAS

No exemplo acima, as amostras so independentes, ou seja no existem, por
pressuposto, caractersticas comuns a ambas as amostras. Na verdade, para amostras
independentes queremos saber se as mdias provm de uma nica populao.
Suponhamos agora o caso do teste do efeito de um medicamento. Mensuramos os
valores da nossa amostra antes e depois de tomar o medicamento. Devemos agora aplicar um
teste que leve em considerao a dependncia entre os resultados obtidos, uma vez que as
caractersticas que no queremos avaliar da nossa amostra no variaram, ou seja, nossas
amostras so dependentes. Neste caso, utilizamos o teste t para amostras dependentes.
Este teste calcula a estatstica T, baseado na mdia e no desvio padro das diferenas
entre os valores medidos antes e depois. Matematicamente, significa expressar que, dada uma
amostra de tamanho n, medida antes e depois de uma interveno, para saber se houve efeito
da interveno na nossa varivel. Assim, temos:

1. Hipteses:

=
=
0 :
0 :
1
0
dif
dif
H
H

2. Fixar o .
3. Estatstica do teste
dif
X tem distribuio t-Student com n-1 graus de liberdade.
4. A Regio Crtica ser:

n
S
x
t
dif
dif
c
=
0
? Depende da Regio Crtica do passo 4. Se t RC
c
e ,
rejeita-se H
0
0
.
7. Concluso

-t t
118
EXEMPLO 7.6: Suponha que um laboratrio tenha encontrado uma substncia que pode
reduzir o colesterol (LDL) sangneo. Para tanto submeteu 29 indivduos ao teste do
medicamento. Mediu o colesterol antes e depois de dar o medicamento. Os resultados esto na
tabela a seguir (prxima pgina). Testar se o medicamento reduziu o colesterol para um nvel
de significncia de 1%.

Individuo LDL (antes) LDL (depois)
Diferena (Antes -
Depois)
1 142 131 11
2 149 143 6
3 160 122 38
4 142 137 5
5 138 147 -9
6 151 139 12
7 152 154 -2
8 158 136 22
9 145 119 26
10 151 130 21
11 147 153 -6
12 151 141 10
13 170 146 24
14 145 152 -7
15 137 121 16
16 158 136 22
17 142 135 7
18 153 132 21
19 145 140 5
20 159 157 2
21 159 142 17
22 150 154 -4
23 128 135 -7
24 154 142 12
25 171 134 37
26 164 148 16
27 134 140 -6
28 151 147 4
29 144 149 -5
Mdia 150,00 140,07 9,93
Desvio 10,05 9,98 13,11

119

SOLUO:

1. Hipteses:

=
=
0 :
0 :
1
0
dif
dif
H
H

2. Fixar o =0,01.
3. Estatstica do teste
dif
X tem distribuio t-Student com 28 graus de liberdade.
4. Da tabela da t-student temos que t

= 2,76

5. Calcular a Estatstica 078 , 4
29
11 , 13
93 , 9
= =
c
t
6. Como RC t
c
0
.
7. Logo temos que o medicamento produziu reduo significativa do colesterol para um
ndice de significncia de 0,01.

6. TESTE QUI-QUADRADO

Apresentamos aqui um teste de hipteses estatstica que utiliza o modelo Qui-
Quadrado e por esta razo so denominados, de testes Qui-Quadrado. O objetivo dos teste para
dados categorizados determinar, segundo algum critrio vlido de deciso, se o fator
discriminante exerce alguma influncia sobre o fator discriminado. As hipteses so
construdas como de costume, H
0
: p
A1
= p
A2
= ... = p
Ar,
ou seja, que as categorias de A exeram
a mesma influncia sobre as categorias de B, contra H
1
de que pelo menos uma categoria
apresenta diferenas em relao a B. Neste caso particular, importante salientar que as
tabelas do tipo 2x2 (duas classificaes para cada varivel) so as que apresentam resultados
mais claros, uma vez que, provada a existncia de uma diferena, ela somente pode existir
entre as duas categorias de A.
t = 2,76 -t = -2,76
120

Tabela 7.1 - Valores Observados

Varivel B
Varivel A Categoria
1
Categoria
2
... Categoria
k
Totais
Categoria 1 O
11
O
12
... O
1k
A
1

Categoria 2 O
21
O
22
... O
2k
A
2

... ... ... ... ... ...
Categoria r O
r1
O
r2
... O
rk
A
r

Totais B
1
B
2
... B
k
N

Partindo da tabela de contingncia gerada atravs do cruzamento das duas variveis
em estudo (Tabela 1), o primeiro passo consiste em construir a tabela de valores esperados, de
dimenses k r . Os valores desta tabela so calculados da seguinte forma:
k j r i
n
B A
E
j i
ij
,..., 1 e ,..., 1 , = = =

Assim podemos formar a seguinte tabela:

Tabela 7.2 - Valores Esperados

Varivel B
Varivel A Categoria
1
Categoria
2
... Categoria
k
Totais
Categoria 1 E
11
E
12
... E
1k
A
1

Categoria 2 E
21
E
22
... E
2k
A
2

... ... ... ... ... ...
Categoria r E
r1
E
r2
... E
rk
A
r

Totais B
1
B
2
... B
k
n

Posteriormente, calcula-se a estatstica de teste:

( )
= =
=
r
i
k
j ij
ij ij
c
E
E O
1 1
2
2
_

Essa expresso corresponde ao teste Qui-Quadrado de independncia clssico. Sua
utilizao, contudo, no pode ser indiscriminada. O teste Qui-Quadrado clssico pode ser
usado quando o nmero total de observaes maior que 40. Se o nmero de dados estiver
entre 20 e 40, e o valor esperado das clulas for maior do que 5, o teste Qui-Quadrado pode
ser empregado utilizando-se a expresso:
( )
= =

=
r
i
k
j ij
ij ij
c
E
E O
1 1
2
2
5 , 0
_

121
denominada correo de Yates.

O valor obtido comparado com o valor Qui-quadrado referncia (tabelado ou obtido
computacionalmente),
2
c
_ versus
2
TAB
_ . O valor tabelado est associado a um determinado
nmero de graus de liberdade e de nvel de significncia. Os graus de liberdade so calculados
fazendo G.L. = (r-1)(k-1). Aplica-se, ento, a seguinte regra de deciso:

Se e
2
c
_ RC, ento, H
0
deve ser rejeitada, caso contrrio aceito H
0
.

EXEMPLO 7.7: A tabela abaixo mostra os resultados de um ensaio com 154 pacientes que
apresentavam dor abdominal, tratada pela administrao de brometo de pinavrio (dois
comprimidos/ dia), grupo tratamento. Ao grupo controle foi administrado um placebo.

Ingesto de brometo de pinavrio e alvio da dor abdominal

Dor abdominal
Grupo
Sim No
Total
Tratamento 6 57 63
Controle 30 61 91
Total 36 118 154

Para testar a eficincia do uso do sal no tratamento da dor abdominal, pode ser
efetuado o teste Qui-Quadrado Clssico. (n>40)

1 passo: Hipteses
Nesse caso, as hipteses seriam,
=
=
T C
T C
P P H
P P H
:
:
1
0

A hiptese nula refere que os resultados dos grupos tratamento e controle so iguais.
Dessa forma, do ponto de vista clnico, interessa rejeio de H
0
(aceitao de H
1
), que
indicaria a eficincia da droga.
RC
122

2 passo: Construo da matriz de valores esperados

Dor abdominal
Grupo
Sim No
Total
Tratamento 14,73 48,27 63
Controle 21,27 69,73 91
Total 36 118 154

73 , 14
154
36 63
11
=
= E
,
27 , 48
154
118 63
12
=
= E
,
27 , 21
154
36 91
21
=
= E
e
73 , 69
154
118 91
22
=
= E

3 passo: Quantificao das diferenas entre as tabelas de valores Observados e Esperados:

( )
4290 , 11
73 , 69
) 73 , 69 61 (
27 , 21
) 27 , 21 30 (
27 , 48
) 27 , 48 57 (
73 , 14
) 73 , 14 6 (
2 2 2
1 1
2
2
2
=
= =
r
i
k
j ij
ij ij
c
E
E O
_

4 passo: Deciso estatstica

O nmero de graus de liberdade para uma tabela 2x2 igual a 1. para estes graus de
liberdade, os nveis clssicos de significncia tm valores:

6354 , 6
2
TAB
= _

Como o valor calculado maior que o valor tabelado ao nvel de significncia de 1%,
ento, H
0
deve ser rejeitada. Assim fica comprovado o efeito teraputico do brometo de
pinavrio no alvio das dores abdominias.

7. TESTES DE SIGNIFICNCIA PARA MAIS DE DUAS AMOSTRAS

Geralmente, comum o pesquisador se deparar com situaes em que se deseja avaliar
a diferena entre mais de duas mdias. Por exemplo, suponha que algum suspeite que a
populao brasileira, em termos de altura, no homognea ao se comparar s regies: sul
(1), sudeste (2) e nordeste (3). Tomaramos uma amostra de cada regio e mensuraramos a
altura. Por fim, o que faramos para testar se a regio influncia na altura?
Inicialmente, parece razovel fazer testes t, dois a dois para verificar as diferenas.
Entretanto, lembre-se de que quando definimos a significncia ou regio de rejeio para o
teste t, o fazemos, baseados na probabilidade de cometer o erro do tipo I. Cada teste teria um
123
ndice de significncia o. Ou seja, no podemos estabelecer um ndice de significncia nico
para testar a hiptese H0:
3 2 1
= = baseado nas hiptese formuladas nos testes t.
Portanto, usar testes t dois a dois no resolve nosso problema, pois no saberemos quando
aceitar ou rejeitar a hiptese nula original que
3 2 1
= = .

7.1 TESTES DE SIGNIFICNCIA PARA MLTIPLA MDIAS

No existe um teste para a diferena entre mais de duas mdias baseadas apenas nas
mdias. O teste a ser empregado ento a anlise de varincia ou ANOVA (do ingls,
analysis of variance). A esta altura pode-se perguntar: como que vou testar as mdias
baseados nas varincias? Em primeiro lugar, lembre-se de que um dos pressupostos
utilizao dos testes paramtricos que as varincias sejam iguais. Se H
0
verdadeira,
conceitualmente, como se todas as amostras tivessem sido tiradas de uma mesma populao,
se falsa vm de populaes diferentes, mesmo assim, devem ter varincias iguais. Vamos
ento entender como avaliar a diferena entre as mdias baseado nas diferenas entre as
varincias de nossas amostras.
Para estudarmos a situao apresentada anteriormente consideramos um modelo
estatstico, onde cada observao Y
i
pode ser decomposta em duas componentes: sistemtica
e aleatria, esta ltima representando variaes individuais e todos os fatores que no so
explicados pela parte sistemtica. Matematicamente, temos
i i
e Y + = , . , , 1 n i =
Assim, se Y
i
representa a observao associada ao i-simo indivduo, a parte
sistemtica pode ser vista como a mdia populacional que fixa e a parte aleatria e
i
como
a informao referente ao indivduo e outros fatores que podem influir nas observaes e no
so modelados por . Assim, suponha que estamos interessados em comparar as mdias de K
populaes, isto , queremos testar:
= =
= =
j i um menos pelo para H
H
j i
, :
:
1
3 2 1 0

Para tanto, obtemos K amostras independentes, com n
k
indivduos cada. Nesta
situao, temos que de um modo geral, o modelo estatstico para o j-simo indivduo, da i-
sima populao dado por:

Modelo 1:
ij i ij
e Y + = , k i , , 1 = ; . , , 1
k
n j =

Caso a hiptese H
0
seja verdadeira, ento teremos que todas as mdias para as K
populaes sero iguais, digamos, a , e o modelo pode ento ser escrito como:

Modelo 0:
*
ij ij
e Y + = , k i , , 1 = ; . , , 1
k
n j =
Note que, em ambos os modelos, temos alguma informao que no est sendo
explicada pela parte sistemtica que, para o j-simo indivduo do grupo i est sendo deixada
em
ij
e no Modelo 1 e em
*
ij
e no Modelo 0. Uma forma de levar em conta estas quantidades
para todos os indivduos atravs das somas de quadrados:

124
( )

= = = =
=
K
i
n
j
i ij
K
i
n
j
ij
i i
Y e
1 1
2
1 1
2
e ( )

= = = =
=
K
i
n
j
ij
K
i
n
j
ij
i i
Y e
1 1
2
1 1
2 *
) (

]Essas expresses envolvem as quantidades desconhecidas
i
, k i , , 1 = e .
Utilizaremos os dados para obter as estimativas correspondentes. Levando-se em conta que no
Modelo 1 estamos supondo diferentes mdias paras as K populaes, consideremos os dados
oriundos de cada uma dessas populaes para estimar a correspondente mdia. Assim,
segundo o Modelo 1 temos:
i
i
n
j
ij
i
Y
n
Y
i
= =

=1
com k i , , 1 =
e para o Modelo 0:
Y Y
n
K
i
n
j
ij
i
= =

= = 1 1
1
com .
1 k
n n n + + =

Assim, definimos as quantidades SQD, SQT e SQE, dadas por:

( ) ( )

= = = = = = =
= = =
K
i
n
j
K
i
n
j
K
i
i i ij i ij
K
i
n
j
i ij
i i i
Y n Y Y Y Y SQD
1 1 1 1 1
2 2
2
1 1
2

( )

= = = =
= =
K
i
n
j
ij
K
i
n
j
ij
i i
Y n Y Y SQT
1 1
2 2
1 1
2

( )

= =
= = =
K
i
i i
K
i
ij i
Y n Y n Y Y n SQD SQT SQE
1
2 2
1
2
.

As siglas SQT, SQD e SQE baseiam-se na seguinte interpretao. SQT corresponde
variao total dos dados; SQD uma combinao da variabilidade presente dentro dos grupos
e SQE a variabilidade entre os grupos.
Cada uma das somas de quadrados definidas envolve um certo nmero de quantidades
que esto sendo estimadas. Por exemplo, SQT contm Y , SQD contm
i
Y , k i , , 1 = , etc. A
fim de levar este fato em considerao, definimos os correspondentes quadrados mdios:
1
=
n
SQT
QMT ; quadrado mdio total;
K n
SQD
QMD
= ; quadrado mdio dentro; e

1
=
K
SQE
QME ; quadrado mdio entre.

O teste estatstico para testar a hiptese H
0
deve envolver estas quantidades. Se a
hiptese H
0
no for verdadeira, ento, o Modelo 1 deve ser mais adequado aos dados do que o
Modelo 0. Em outras palavras, os resduos produzidos pelo Modelo 1 sero menores que os
do Modelo 0. Dessa forma podemos interpretar QME como sendo a quantificao da
informao contida nos dados que captada pelo Modelo 1 e QMD a quantificao da parte
que no explicada pelo Modelo 1. Portanto, se QME for grande quando comparado a QMD,
125
a parte sistemtica do Modelo 1 estar captando grande parte da informao dos dados e a
hiptese H
0
dever ser rejeitada. Assim temos a estatstica de teste:
QMD
QME
F =
Quanto maior for o valor de F, maior ser QME comparado a QMD e assim maiores as
evidncias contra H
0
. Por fim, precisamos encontrar a distribuio de probabilidade da
estatstica F.
Supondo as seguintes condies:
ij
Y so variveis aleatrias independentes,
Todas as K populaes tm varincias iguais a o
2
,
ij
Y tem distribuio Normal.

Pode ser mostrado que a estatstica de teste F tem distribuio de Fisher-Snedecor com
(K-1) graus de liberdade no numerador e (n-K) graus de liberdade no denominador.
Das trs suposies a mais importante a de homocedasticidade, ou seja, de que as
varincias so iguais, e a suposio de normalidade pode ser relaxada se n for grande.

Passos para aplicao do teste de ANOVA

1. Hipteses:

= =
= =
H
j i
, :
:
1
3 2 1 0

2. Fixar o .

3. Estatstica do Teste: F tem distribuio de Fisher com K-1 graus de liberdade no numerador
e n-K graus de liberdade no denominador.


5. Calcular a estatstica de teste:

Fonte de
Variao
Graus de
Liberdade
Soma de
Quadrados
Quadrado
Mdio
F
C

Entre K 1 SQE QME QME/QMD
Dentro n K SQD QMD -
Total n-1 SQT QMT -

F
o

126
0
? Depende da Regio Crtica do passo 4. Se RC F
c
e ,
rejeita-se H
0
0
.

7. Concluso

EXEMPLO 7.8: Trs treinadores de voleibol discutiam sobre as suas formas diferentes de
melhorar a altura do salto vertical de atletas. Para testar a eficincia de um mtodo sobre o
outro, cada um treinou 5 indivduos com o seu mtodo particular. Depois do treinamento,
mediram a altura que cada indivduo saltava. A resposta est apresentada na tabela abaixo.
Considerando a varivel altura do salto vertical como tendo distribuio normal, verificar se
existe um mtodo melhor que outro para uma significncia de 5%. A seguir a tabela contendo
a altura atingida pelos atletas em metros nos trs mtodos de treinamento.

Atleta Mtodo 1 Mtodo 2 Mtodo 3
Mdia
geral
1 43,4 46,6 46,1
2 45,1 47,2 47,5
3 45,3 44,5 46,4
4 45,2 45,8 48,5
5 46,1 45,7 46,6
Mdia 45,0 46,0 47,0 46,0

SOLUO:

1. Hipteses:

= =
= =
H
j i
, :
:
1
3 2 1 0

2. Fixar o =0,05.

3. Estatstica do Teste: F tem distribuio de Fisher com 2 graus de liberdade no numerador e
12 graus de liberdade no denominador.


6. Calcular a estatstica de teste:

F
o
=3,88
127
Fonte de
Variao
Graus de
Liberdade
Soma de
Quadrados
Quadrado
Mdio
F
C

Entre 2 10,01 5,01 5,04
Dentro 12 11,91 0,99 -
Total 14 21,92 - -

7. Deciso: Como F
C
> F
, ento rejeitamos H
0.

A altura do salto vertical dos atletas diferem em funo dos mtodos 1, 2 e 3.

Uma pergunta a seguir seria: Qual o melhor mtodo?

Realmente desejamos saber qual mtodo produziu saltos mais altos. Sem entrar em
detalhes, existem testes post hoc para nos dar tal informao. Um deles o de Tukey. Se
olharmos para as mdias, parece que a mdia do mtodo 3 a maior. Basicamente, o teste de
Tukey calcula a diferena mnima a ser considerada significativa a partir de uma estatstica
que se utiliza da varincia total, e a compara com as diferenas entre as mdias, calculadas
duas a duas. Se a diferena for maior que a mnima, considera-se que a diferena
significativa. Podemos perguntar ento, por que no fazemos direto o teste de Tukey?
Lembremos que o teste de Tukey s faz sentido se a diferena for significativa pela ANOVA.

7.2 TESTE DE TUKEY

Aps concluirmos que existe diferena signicativa entre tratamentos, por meio do
teste F, podemos estar interessados em avaliar a magnitude destas diferenas utilizando um
teste de comparaes mltiplas.
O teste de Tukey permite testar qualquer contraste, sempre, entre duas mdias de
tratamentos, ou seja, no permite comparar grupos entre si. E baseia-se na Diferena Mnima
Signicativa (DMS).

A estatstica do teste para grupos de mesmo tamanho dada da seguinte forma:

i
n
QMD
q DMS =

onde q a amplitude total studentizada, tabelada (Tabela 13), QMD o quadrado mdio
dentro dos grupos e n
i
o nmero de observaes em cada grupo. O valor de q depende do
nmero de tratamentos e do nmero de graus de liberdade dentro dos grupos.

A estatstica do teste para grupos de tamanhos diferentes dada da seguinte forma:

QMD
n n
q DMS
j i
|
|
.
|
\
|
+ =
1 1
2
1

128
Sero consideradas significativas ao nvel de significncia pr determinado aquelas
diferenas entre mdias cujo valor absoluto for maior que o DMS calculado.
Deve-se lembrar que o teste de Tukey , de certa forma, independente do teste F, e
assim possvel que, mesmo sendo signicativo o valor de F calculado, no se encontrem
diferenas signicativas entre contrastes de mdias.

EXEMPLO 7.9: Para o exemplo acima, calculando as diferenas entre as mdias dos trs
grupos encontramos :

1 46 45
2 1
= = X X
2 47 45
3 1
= = X X
1 47 46
3 2
= = X X

A estatstica do teste de Tukey para grupos de mesmo tamanho dada da seguinte
forma:

68 , 1
5
99 , 0
77 , 3 = = =
i
n
QMD
q DMS .

Assim podemos dizer que ao nvel de significncia de 5% h diferena entre os
mtodos 1 e 3, ou seja, o mtodo 3 foi melhor que o mtodo 1, e que no houve diferenas
entre os mtodos 2 e 1 e os mtodos 2 e 3.

129

130

131

132

133
EXERCCIOS

1. Para um certo tipo de leso da coluna vertebral, a recuperao completa quase certa. O
Dr. Vertebroni, suspeita que o tempo de recuperao est relacionado terapia
administrada. De 50 pacientes que ele tratou por mtodos fsicos, somente 38
recuperaram-se durante o primeiro ano e 12 recuperaram-se durante o segundo ano. De
75 pacientes que ele tratou com uma combinao de drogas e repouso, 43 recuperaram-se
durante o primeiro ano e 32 durante o segundo ano. Estes resultados do suporte teoria
do Dr. Vertebroni com nvel de significncia de 1%?

2. O tempo de permanncia de psiclogos recm formados no 1 emprego, em anos, foi
estudado considerando um modelo Normal com mdia e varincia desconhecidas. Por
analogia com outras categorias profissionais, deseja-se testar se o tempo mdio superior
a 2 anos. Para uma amostra de 15 psiclogos, a mdia obtida foi de 2,7 anos e o desvio
padro de 1,4 anos. Ao nvel de significncia de 1%, qual a concluso do teste?

3. Uma empresa de informtica lana um novo software no mercado. Com o objetivo de
estimar o tempo mdio para aprender a usar o software, a empresa utiliza uma amostra
aleatria com 12 usurios, registrando o tempo (em horas) gasto por cada um dos
selecionados para aprender a usar o novo produto:

1,75 2,25 2,40 1,90 1,50 2,75
2,15 2,25 1,80 2,20 3,25 2,60

Supondo que o tempo de aprendizado tem distribuio normal, teste a hiptese de que
o tempo mdio de aprendizado do novo software menor que 2,5 horas, ao nvel de
4% de significncia.

4. Suponha que um laboratrio alegue que uma determinada droga que ele comercializa
eficiente em pelo menos 80% dos casos em que utilizada. Suponha que, para comprovar
a alegao do laboratrio, um organismo de controle testou em 180 pacientes, verificando
a ao da droga em 147 casos. O teste a eficincia alegada pelo laboratrio, ao nvel de
significncia de 10%.

5. Uma vacina que se supe eficaz para prevenir os resfriados, foi testada em 500 indivduos
e os resultados foram comparados, durante um ano, com os correspondentes a 500
indivduos no vacinados. Os resultados foram os seguintes:

Freqncias Observadas
Nenhum
Resfriado
Um
resfriado
Mais de um
Resfriado
Total
Vacinados 252 145 103 500
No vacinados 224 136 140 500
476 281 243 1.000

H evidncias quanto eficincia da vacina ao nvel de significncia de 5%?
134

6. A cada elemento de uma amostra de 250 homens de uma populao de suspeitos de
possurem enfermidade nas articulaes foi perguntado qual de trs sintomas o
incomodava mais. A mesma questo foi perguntada a uma amostra de 300 mulheres com
a mesma suspeita de enfermidades. Os resultados foram os seguintes:

Sintoma que mais incomodava Homens Mulheres
Rigidez matinal 111 102
Dor noturna 59 73
Articulao inchada 80 125
TOTAL 250 300

Os sintomas diferem entre os sexos?

7. Quinhentos escolares de primeiro grau menor foram classificados em uma tabela criada,
por grupo scio-econmico e a presena ou ausncia de um certo defeito na fala. Os
resultados foram os seguintes:

Grupo Scio Econmico
Defeito da Fala Superior Mdio
Superior
Mdio
Baixo
Baixo TOTAL
Presente 8 24 32 27 91
Ausente 42 121 138 108 409
TOTAL 50 145 170 135 500

Ento estes dados compatveis com a hiptese que o defeito na fala no correlacionado
com o status scio-econmico?

8. Seis estudantes aprenderam lgebra pelo mtodo padro de ensino, com o professor
expondo o assunto na sala de aula e doze outros estudantes aprenderam lgebra de acordo
com um curso televisionado. As notas alcanadas pelos alunos no final de um nico teste
foram:

Sala de aula 68 69 74 79 80 84
Pela TV 60 64 65 66 67 70 72 73 76 77 78 81

O ensino televisionado mais proveitoso que o ensino ao vivo? (Use o=0,05).

9. Os dados da tabela a seguir so escores de autoritarismo de uma amostra aleatria de 14
estudantes de uma escola pblica e de 14 estudantes de uma escola da rede particular de
ensino. Suponha que um estudante que tem um escore, digamos 93, mais autoritrio do
que um estudante que tem um escore, digamos 88:

Pblica 60 80 65 100 95 88 70 104 75 85 110 55 40 45
Particular 98 87 133 115 93 140 67 134 106 81 111 56 41 42

135
razovel assumir a um nvel de significncia de 1% que os estudantes da escola
particular so mais autoritrios que os estudantes das escolas pblicas?

10. Uma loja de departamentos est interessada em saber se existem diferenas entre as
quantias faturadas em trs formas de pagamento: dinheiro(D), cheque(C) e carto de
crdito(CC). Um levantamento das vendas em um dado perodo de tempo foi feito,
produzindo os dados apresentados na tabela a seguir que representam o valor de algumas
vendas em reais. Existe diferena entre os tipos de vendas? (Use o nvel de significncia
de 5%).

Formas de pagamento
D C CC
52,10 80,90 73,25
20,99 54,29 56,65
32,38 40,95 126,21
28,64 72,65 56,50
132,47 39,29
65,32 44,65
60,00 39,64

11. Pacientes resolveram processar a clnica de emagrecimento Linha Fina sob a alegao de
que o tratamento empregado no contribui para a diminuio do peso. O advogado de
defesa contratou um estatstico, que selecionou aleatoriamente 12 pronturios que
continham informao a respeito dos pesos dos pacientes, tomados no incio e no final do
tratamento. Os dados obtidos foram (em kg):

1 2 3 4 5 6 7 8 9 10 11 12
Incio 82 104 94 63 70 80 103 56 79 84 81 78
Final 78 93 87 61 71 82 94 65 79 80 81 82

Verifique se alegao procede ao nvel de significncia de 5%.
136
Captulo 8

TESTES NO-PARAMTRICOS

1. INTRODUO

A estatstica No-Paramtrica pode ser definida como uma coleo de mtodos
estatsticos aplicada a conjuntos de dados onde as suposies distribucionais necessrias para
aplicao de uma tcnica clssica (Intervalo de Confiana, Teste de Hiptese) no so
satisfatoriamente atendidas. tambm bastante til no tratamento de dados onde o nvel de
mensurao das observaes no dos melhores.
Tais procedimentos so usados desde h muitos anos atrs embora no com o mesmo
nome atual. Por exemplo, o rei Nabucodonossor aplicou informalmente o teste da permutao,
600 anos AC. Clculos da probabilidade binomial foram feitos em 1710 pelo mdico ingls
Arbuthnott. O primeiro livro-texto denotado aos mtodos No-Paramtricos foi escrito por
Siegel (1956) e usado at hoje pela facilidade de leitura.
No entanto, Savage designa o ano de 1936 como o verdadeiro incio da Estatstica
No-Paramtrica, marcado pela publicao do artigo de Hotelling e Pabst sobre correlao por
postos. O seu maior crescimento ocorreu nos ltimos 40 anos e atualmente esta rea da
estatstica est bastante desenvolvida e os tpicos modernos so Estimao de Densidade,
Regresso No-Paramtrica e Semi-Paramtrica. Em 1991 foi lanado o Journal of
Nonparametric Statistics.
O tema central em estatstica a chamada Inferncia Estatstica que aborda dois tipos
de problemas fundamentais: a estimao de parmetros de uma populao e o teste de
hipteses. Este ltimo ser tratado nesse captulo. Na Inferncia Estatstica procuramos tirar
concluses sobre um grande nmero de eventos com base na observao de apenas parte
deles. Os testes relacionados a Inferncia Estatstica nos dizem qual a margem de diferena
que deve ser encontrada na amostra para que possamos afirmar que elas representam
realmente diferenas nos tratamentos (grupos). Como nesses procedimentos, na verdade so
testadas hipteses a respeito dos parmetros populacionais, esses so chamados de
Paramtricos.
Algumas tcnicas no so to rigorosas na especificao de condies acerca dos
parmetros da populao da qual a amostra foi obtida. Consequentemente as concluses no
so to poderosas quanto as obtidas por tcnicas paramtricas. Essas tcnicas so chamadas
de distribuio livre ou noparamtricas.

2. MTODOS ESTATSTICOS NO-PARAMTRICOS

2.1 VANTAGENS

- Dispensam Normalidade dos dados;
- O p-valor exato (no caso paramtrico o clculo do p-valor se baseia na distribuio
Normal);
- So testes mais simples;
- So teis quando difcil estabelecer uma escala de valores quantitativa para os dados;
- So mais eficientes que os paramtricos quando no existe Normalidade.

2.2 DESVANTAGENS

137
- Proporcionam um desperdcio de informaes, j que em geral no consideram a
magnitude dos dados;
- Quando as suposies do modelo estatstico so atendidas so menos eficientes que os
paramtricos;
- A utilizao das tabelas dos testes mais complicada.

2.3 DEFINIO DE POSTOS

Toda a estatstica no-paramtrica baseada no clculo dos postos. Quando atribumos
s observaes, nmeros correspondentes s suas posies na classificao (ranking em
ordem crescente). Cada nmero chamado de posto.

2.4 DISCUSSO GERAL DOS TESTES ESTATSTICOS

Mostraremos aqui, em forma de exemplo, os problemas que surgem ao utilizarmos
testes paramtricos quando as suposies no so atendidas. Considere por exemplo um
experimento onde foram observadas concentraes de partculas em 28 amostras de solo aps
aplicao de um pesticida. O histograma para o conjunto de dados observado dado abaixo:

Grfico 8.1: Distribuio de freqncia para a concentrao de partculas das 28 amostras de solo aps a
aplicao do pesticida.

Sendo a mdia amostral de 0,314g/cm
3
com desvio padro de 0,264g/cm
3
ao testarmos
a afirmao do fabricante de que a concentrao mdia de pesticida se dar na ordem de
0,35g/cm
3
, no rejeitaremos a hiptese nula. Assim a afirmao do fabricante estar
comprovada ao usarmos um teste de hiptese paramtrico. Porm:

- Podemos notar uma grande assimetria na distribuio dos dados, o que causou um
aumento do valor da mdia em favor da hiptese nula;

138
- Observamos que 8 amostras apresentaram alto teor de concentrao de inseticida
(>0,60) e a grande maioria (71%) no passou de 0,40;

- Essas amostras de solo foram obtidas perto de um rio (parte baixa da rea) para onde
provavelmente desceu o pesticida levado pela ao das chuvas;

- O que notamos na verdade que o produto parece no ter se espalhado
homogeneamente;

- Neste caso talvez se tivssemos testado a mediana (0,19) ao invs da mdia teramos
obtido resultados diferentes;

- Essas 8 amostras com alto teor de concentrao no podem simplesmente ser
eliminadas do estudo, pois constituem um nmero considervel de informaes alm
de apontar o fato do pesticida se espalhar de forma desigual na rea considerada.

interessante, no momento oportuno, que retornemos a este exemplo, aplicando a
tcnica adequada e comparando com o resultado obtido no teste paramtrico (testando a
mdia e a varincia).

2.5 ESCOLHA DO TESTE ESTATSTICO ADEQUADO

importante a definio de critrios que nos ajudem a decidir qual o teste ideal para
determinado problema. Um desses critrios, sem dvida o Poder do Teste (1|). O teste
que apresenta uma maior probabilidade de rejeitar H0 quando H0 falsa, entre todos os testes
de nvel o deve ser escolhido. Mas s isto no basta e nem sempre simples de ser obtido,
portanto precisamos de outras informaes para escolher o teste mais adequado:

- Como foi obtida a amostra, ou seja, o plano experimental;
- Natureza da Populao (pessoas, objetos, reas, animais, etc.);
- Tipo de Mensurao dos dados (escala de mensurao).

Quando se usa um teste paramtrico existe uma srie de pressupostos a serem
verificados, alm do nvel mnimo de mensurao exigido ser a escala intervalar. Quando
essas suposies no so verificadas possvel que o teste nos leve a resultados errneos. No
caso no-paramtrico, o primeiro critrio a ser verificado deve ser o nvel de mensurao dos
dados.

2.6 NVEL DE MENSURAO

Escala Nominal

o mais baixo nvel de mensurao. Utiliza smbolos ou nmeros simplesmente para
distinguir elementos em diferentes categorias (como um nome), no havendo entre eles,
geralmente, possibilidade de comparao do tipo maior-menor, melhor-pior. Ex: Masculino,
Feminino.

Escala Ordinal
139

Utiliza nmeros apenas para classificarmos elementos numa ordem crescente ou
decrescente. Existe assim algum tipo de relao entre as categorias embora a diferena entre
elas seja de difcil quantificao. EXEMPLO: Classes scio-econmicas (A, B, C, D, E).

Escala Intervalar (Intervalo de medida)

Ocorre quando a escala tem as caractersticas da escala ordinal e ainda possvel
quantificar a diferena entre dois nmeros desta escala. EX: Temperatura, Peso, Altura,
Rendimentos, etc.

obs: Alguns autores apontam ainda a existncia de outra escala: a Escala de Razo,
equivalente a escala intervalar porm, o valor zero o verdadeiro ponto de origem.

3. TESTES PARA UMA AMOSTRA

3.1 TESTE DE KOLMOGOROV-SMIRNOV

Este teste de aderncia proposto em 1933 avalia a concordncia entre a distribuio
observada da amostra e uma determinada distribuio terica. Avalia se os dados amostrais se
aproximam razoavelmente de uma determinada distribuio. Para isso utilizamos a funo
distribuio acumulada observada, compara-se com a terica, determina-se o ponto em que
estas distribuies mais divergem, e testamos se essa divergncia aleatria ou no.
O teste de Kolmogorov-Smirnov, abreviadamente K-S no se aplica a dados
qualitativos nem a variveis discretas, pois a tabela disponvel para este teste s exata caso a
distribuio em teste seja contnua. No entanto, tem a vantagem de no estar dependente de
classificaes dos dados, que alm de serem sempre algo arbitrrias envolvem perdas de
informao. O teste K-S s pode ser aplicado quando a distribuio indicada na hiptese nula
est completamente especificada.
No caso de pretendermos, por exemplo, efetuar um ajustamento de uma distribuio
normal, sem especificar e o, podemos recorrer a outro teste, neste caso o teste desenvolvido
por Lilliefors (teste de normalidade de Lilliefors) que ser abordado mais adiante. O teste K-S
aplicvel a pequenas amostras.

Exigncia do Teste

Os dados devem seguir ao menos uma escala ordinal.

O Mtodo

Seja ) (
i Esp
x F uma distribuio terica acumulada e ) (
i Obs
x F uma distribuio
observada em uma amostra de n observaes (distribuio emprica). Encontra-se a seguir o
maior valor das diferenas entre ) (
i Esp
x F e ) (
i Obs
x F , ou seja,
) ( ) (
i Obs i Esp
x F x F mx D =
+
e ) 1 ( ) ( =
i Obs i Esp
x F x F mx D
Ento,
{ }
+
= D D mx D ,
140

Compara-se o valor observado com o valor crtico apresentados na tabela 5 no final da
apostila. Se D > D
crtico
ento conclui-se que a distribuio terica no vlida, com certo
nvel de significncia.

EXEMPLO 8.1: Verifique se os dados abaixo podem ser ajustados por uma distribuio de
Poisson com mdia igual a 1,2 ao nvel de significncia de 5%.

X
i
f
i
0 15
1 25
2 10
3 5
4 4
5 1

SOLUO:
,2 om mdia 1 Poisson c ibuio de uma distr no seguem :Os dados H

dia 1,2 sson com m o de Poi distribui seguem uma :Os dados H
1
0

x
i
) (
i Esp
x F ) (
i Obs
x F ) 1 (
i Obs
x F
D
+
D
-
0 0,3012 0,250 0,233 0.0512 0.0682*
1 0,6626 0,666 0,650 0.0034 0.0126
2 0,8794 0,833 0,817 0.0464 0.0624
3 0,9661 0,917 0,900 0.0491 0.0661
4 0,9921 0,983 0,967 0.0091 0.0251
5 0,9983 1,000 0,983 0.0017 0.0153

Concluso: { } 0682 , 0 , = =
+
D D mx D e D
crtico
= 0,1756. Ento como D menor que D
crtico

no podemos rejeitar a hiptese nula.

EXEMPLO 8.2: Um certo Politcnico do pas efetuou um contrato com uma determinada
empresa que ficou responsvel pelo abastecimento da carne que compunha as refeies na
cantina dessa Escola. O contrato refere uma mdia de 290 gramas de carne por refeio, por
estudante. No entanto, alguns alunos queixaram-se acerca da comida, em particular acerca da
quantidade de carne servida por refeio. Os alunos falaram com o cozinheiro chefe, que lhes
disse que a quantidade de carne servida por refeio a cada estudante tinha aproximadamente
distribuio normal de mdia 290 gramas com um desvio padro de 56 gramas. Aps esta
conversa com o cozinheiro, alguns alunos concordaram em recolher as suas refeies ao
longo de vrios dias, resultando assim uma amostra de 10 refeies, que foram levadas para
um laboratrio afim de serem pesados os pedaos de carne nelas contidos. Os dados obtidos
so os seguintes:
198 254 262 272 275 278 285 287 287 292

141
Ao nvel de significncia de 5%, h evidncia para rejeitar a hiptese de que o cozinheiro
seguia as regras que afirmou em relao quantidade de carne servida?

SOLUO: Denote-se por X a quantidade, em gramas, de carne servida por refeio a cada
estudante. As hipteses a testar so, neste caso so:

gramas vio de 56 amas e des de 290 gr com mdia o Normal distribui no seguem :Os dados H
as de 56 gram e desvio 290 gramas mdia de Normal com tribuio seguem dis :Os dados H
1
0

Note-se que a funo de distribuio proposta em H
0
, F
0
, a funo de distribuio
normal com mdia 290 gramas e desvio padro de 56 gramas. Assim, sendo uma distribuio
contnua completamente especificada, podemos usar o teste de Kolmogorov-Smirnov. A
estatstica de teste { }
+
= D D mx D , e o ponto crtico da estatstica de teste para =0.05
0.410.
A funo de distribuio emprica definida para a amostra dada foi calculada conforme
apresentado na tabela abaixo:

x
i
56
290
i
x

) (
i Esp
x F ) (
i Obs
x F ) 1 (
i Obs
x F
D
+
D
-
198 -1,64 0,0505 0,10 0,00 0,0495 0,0505
254 -0,64 0,2611 0,20 0,10 0,0611 0,1611
262 -0,50 0,3085 0,30 0,20 0,0085 0,1085
272 -0,32 0,3745 0,40 0,30 0,0255 0,0745
275 -0,27 0,3936 0,50 0,40 0,1064 0,0064
278 -0,21 0,4168 0,60 0,50 0,1832 0,0832
285 -0,09 0,4641 0,70 0,60 0,2359 0,1359
287 -0,05 0,4801 0,90 0,80 0,4199 0,2199
292 0,04 0,5160 1,00 0,90 0,4840* 0,3840

Concluso: { } 4840 , 0 , = =
+
D D mx D e D
crtico
= 0,410. Ento como D maior que D
crtico

podemos rejeitar a hiptese nula. Ou seja, os dados no seguem uma distribuio normal com
mdia de 290 gramas e desvio padro de 56 gramas.

3.2 TESTE DE LILLIEFORS

No caso em que se deseja testar normalidade e a mdia e a varincia no so
previamente especificadas, mas sim estimadas atravs dos dados da amostra, deve-se utilizar
o teste de Lilliefors. Este teste tem procedimento anlogo ao KolmogorovSmirnov porm
utiliza uma tabela prpria e mais adequada a este tipo de situao.
Assim, sejam X1, X2,...,Xn uma amostra aleatria de uma populao X com
distribuio F desconhecida. Pretende-se testar se X tem distribuio N(, o
2
) sem especificar
e o, isto , para algum e algum o. As hipteses a testar so:

o
o
e desvio com mdia o Normal distribui :X no tem H
e desvio m mdia Normal co stribuio : X tem di H
1
0

142

Foi dito anteriormente que a aplicao do teste de Kolmogorov-Smirnov carece da
especificao completa da funo de distribuio proposta em H
0
, o que no sucede no
problema. proposto ento o teste de normalidade Lilliefors. Este teste processa-se como o
teste de Kolmogorov-Smirnov, mas os dados originais so padronizados, usando estimativas
de e o:
n , 1, i , =
=
s
x x
Z
i
i

Assim as hipteses em teste passam a ser:

padro o Normal distribui :X no tem H

dro Normal pa stribuio : X tem di H
1
0

O Mtodo

Seja ) (
i Esp
x F uma distribuio terica acumulada e ) (
i Obs
x F uma distribuio
observada em uma amostra de n observaes (distribuio emprica). Encontra-se a seguir o
maior valor das diferenas entre ) (
i Esp
x F e ) (
i Obs
x F , ou seja,

) ( ) (
i Obs i Esp
x F x F mx D =
+
e ) 1 ( ) ( =
i Obs i Esp
x F x F mx D
Ento,
{ }
+
= D D mx D ,

Compara-se o valor observado com o valor crtico apresentados na tabela 5 no final da
apostila. Se D > D
crtico
ento conclui-se que a distribuio terica no vlida, com certo
nvel de significncia.

EXEMPLO 8.3: Um distribuidor pretende estimar o tempo mdio de entrega dos seus
produtos a um cliente bastante importante. Foi recolhida uma amostra aleatria de cinco
tempos:

29, 33, 35, 36 e 36.

O distribuidor quer estimar o tempo mdio pretendido atravs de um intervalo de
confiana, mas no sabe nada acerca da distribuio do tempo de entrega X, e alm disso, a
dimenso da amostra muito pequena (n=5). Poder faz-lo?

SOLUO: Sabemos que caso X tenha distribuio normal o intervalo pode ser calculado
usando a frmula:
\
|

n
S
t X ;
|
|
.
|
+
n
S
t X

Assim, interessa testar, em primeiro lugar, as hipteses:
143
o Normal distribui :X no tem H

Normal stribuio : X tem di H
1
0

Uma vez que nada sabemos acerca de e o, podemos utilizar o teste de Lilliefors,
recorrendo s estimativas 8 , 33 = x e 95 , 2 = s . O valor crtico da estatstica de teste, ao nvel
de significncia de 0.05 D
crtico
= 0,337, e assim a distribuio normal rejeitada se D >
0,337.

x
i
95 , 2
8 , 33
i
x
) (
i Esp
x F ) (
i Obs
x F ) 1 (
i Obs
x F
D
+
D
-
29 -1,63 0,0516 0,2 0,0 0,1484 0,0516
33 -0,27 0,3936 0,4 0,2 0,0064 0,1936
35 0,41 0,6591 0,6 0,4 0,0591 0,2591*
36 0,75 0,7734 1,0 0,8 0,2266 0,0266

Conluso: Observamos que { } 2591 , 0 , = =
+
D D mx D e D
crtico
= 0,337. Ento como D
menor que D
crtico
no rejeitamos a hiptese de a populao em estudo ter distribuio normal
ao nvel se significncia de 5%. O clculo do intervalo de confiana pretendido fica como
exerccio.

4. TESTES PARA DUAS AMOSTRAS INDEPENDENTES

Estes testes se aplicam a planos amostrais onde se deseja comparar dois grupos
independentes. Esses grupos podem ter sido formados de duas maneiras diferentes:
- Extraiu-se uma amostra da populao A e outra amostra da populao B;
- Indivduos da mesma populao foram alocados aleatoriamente a um dos dois
tratamentos em estudo.

Diferente do caso de dados pareados, no se exige que as amostras tenham o mesmo
tamanho. Quando as suposies paramtricas so atendidas, o teste t de Student para amostras
independentes mais adequado para comparao das mdias dos grupos. Quando estas no
so atendidas, deveremos aplicar alguma das provas no-paramtricas.

4.1 TESTE EXATO DE FISHER

A prova de Fisher constitui uma tcnica no-paramtrica extremamente til para
analisar dados discretos (nominais ou ordinais), quando o tamanho das duas amostras
independentes pequeno. utilizado quando os escores das duas amostras aleatrias
independentes se enquadram todos em uma ou outra de duas classes mutuamente excludentes.
Em outras palavras, a cada indivduos em ambos os grupos atribudo um entre dois escores
possveis.
Este teste faz uso de tabelas de contingncia 2x2, para se comparar 2 grupos.
indicado quando o tamanho das duas amostras independentes pequeno e consiste em
determinar a probabilidade exata de ocorrncia de uma freqncia observada, ou de valores
mais extremos.

144
Exigncia do Teste

- Amostras aleatrias e independentes;
- Duas classes mutuamente exclusivas;
- Nvel de Mensurao em escala nominal ao menos.

O Mtodo

Considere a definio de duas amostras I e II, agrupadas em duas classes positivo e
negativo.

Grupos + - Total
I a b a+b
II c d c+d
Total a+c b+d n

As hipteses a serem testadas so:
=
=
+ +
+ +
II I
II I
P P H
P P H
:
:
1
0

Calculamos, em seguida, a probabilidade de interesse. Por exemplo, a probabilidade
de ocorrncia das freqncias observadas nas caselas acima, e isso se faz com o uso da
distribuio hipergeomtrica, ou seja:

( ) ( ) ( ) ( )
! ! ! ! !
! ! ! !
n d c b a
d b c a d c b a
c a
n
c
d c
a
b a
P
a
+ + + +
=
|
|
.
|
\
|
+
|
|
.
|
\
| +
|
|
.
|
\
| +
=

+ - Total
I a 1 b + 1 a+b
II c + 1 d 1 c+d
Total a+c b+d n

( ) ( ) ( ) ( )
! )! 1 ( )! 1 ( )! 1 ( )! 1 (
! ! ! !
1 1
1
n d c b a
d b c a d c b a
c a
n
c
d c
a
b a
P
a
+ +
+ + + +
=
|
|
.
|
\
|
+
|
|
.
|
\
|
+
+
|
|
.
|
\
|
+
=

145

+ - Total
I a 2 b + 2 a+b
II c + 2 d 2 c+d
Total a+c b+d n

( ) ( ) ( ) ( )
! )! 2 ( )! 2 ( )! 2 ( )! 2 (
! ! ! !
2 2
2
n d c b a
d b c a d c b a
c a
n
c
d c
a
b a
P
a
+ +
+ + + +
=
|
|
.
|
\
|
+
|
|
.
|
\
|
+
+
|
|
.
|
\
|
+
=

+ - Total
I 0 b + a a+b
II c + a d a c+d
Total a+c b+d n

( ) ( ) ( ) ( )
! )! ( )! ( )! ( ! 0
! ! ! !
0
0
n a d a c a b
d b c a d c b a
c a
n
a c
d c a b
P
+ +
+ + + +
=
|
|
.
|
\
|
+
|
|
.
|
\
|
+
+
|
|
.
|
\
| +
=

Assim o P final ser dado por:

0 2 1
P P P P P
a a a
+ + + + =

Se P for inferior ao nvel de significncia o que escolhermos para o nosso teste,
devemos rejeitar a hiptese de independncia ou a hiptese de homogeneidade que
estipulamos. Assim, o Teste Exato de Fisher a alternativa ao caso de duas amostras
independentes, quando o tamanho da amostra pequeno, pois nesse caso o teste _
2
no se
aplica.

EXEMPLO 8.4: De uma maneira geral os doentes psiquitricos podem ser classificados em
psicticos e neurticos. Um psiquiatra realiza um estudo sobre os sintomas suicidas em duas
amostras de 20 doentes de cada grupo. Os resultados tabelados so:
Tipo de Doente Sintomas
suicidas Psictico Neurtico
Total
Presente 2 6 8
Ausente 18 14 32
Total 20 20 40
A nossa hiptese de que a proporo de psicticos com sintomas suicidas igual a
proporo de neurticos com estes sintomas (em um teste de independncia, a hiptese nula
146
seria, a presena ou ausncia de sintomas suicidas independente do tipo de doente
envolvido).
SOLUO: As hipteses a serem testadas so:
=
=
NS PS
NS PS
P P H
P P H
:
:
1
0

Calculamos, em seguida, a probabilidade de interesse que dada por:
0 1 2
P P P P + + = .

( ) ( ) ( ) ( )
095760 , 0
! 40 ! ! 14 ! 18 ! 6 ! 2
! 20 ! 20 ! 32 ! 8
! ! ! ! !
! ! ! !
2
=

=
+ + + +
=
n d c b a
d b c a d c b a
P

( ) ( ) ( ) ( )
020160 , 0
! 40 ! )! 1 14 ( )! 1 18 ( )! 1 6 ( )! 1 2 (
! 20 ! 20 ! 32 ! 8
! )! 1 ( )! 1 ( )! 1 ( )! 1 (
! ! ! !
1
=
+ +

=
+ +
+ + + +
=
n d c b a
d b c a d c b a
P
( ) ( ) ( ) ( )
001638 , 0
! 40 )! 2 14 ( )! 2 18 ( )! 2 6 ( ! 0
! 20 ! 20 ! 32 ! 8
! )! ( )! ( )! ( ! 0
! ! ! !
0
=
+ +

=
+ +
+ + + +
=
n a d a c a b
d b c a d c b a
P

E portanto a aplicao do teste exato de Fisher, resultaria em calcular:

117558 , 0 001638 , 0 020160 , 0 095760 , 0
0 1 2
= + + = + + = P P P P ,
que nos d a probabilidade de observar que, entre os 8 doentes com sintomas suicidas, 2 ou
menos so psicticos, quando a hiptese de igualdade da proporo de psicticos e neurticos
com sintomas suicidas verdadeira. Verificamos que a probabilidade da discrepncia maior
ou igual do que a observada ter ocorrido por acaso de 0,117558, ou seja, consideravelmente
elevada. Logo no existe evidncia de que os psicticos difiram dos neurticos no que diz
respeito aos sintomas suicidas. claro que este teste que realizamos foi um teste unilateral,
enquanto que se tivssemos usado o teste Qui-Quadrado tnhamos realizado um teste bilateral
que media as diferenas relativamente igualdade de propores nos dois sentidos. Mas o
teste de Fisher tambm pode ser realizado bilateralmente. Duas propostas podem ser feitas
nesse sentido.
- Como neste exemplo, as duas amostras tm a mesma dimenso, podemos multiplicar o
valor de P por 2, e decidir do mesmo modo por comparao com o valor de o.
- Caso as amostras sejam muito diferentes (ou os totais de coluna, num teste de
independncia), poderamos ainda calcular a probabilidade de ter a freqncia mais
discrepante do que a observada, mas, no outro sentido, isto , no nosso exemplo,
medindo os casos mais extremos em que a proporo de ausncia de sintomas suicidas
dos neurticos muito maior do proporo de ausncia de sintomas suicidas dos
psicticos. Neste caso, as tabelas seriam:

suicidas Neurtico Psictico
Total
Presente 6 2 8
Ausente 14 18 32
Total 20 20 40
147

Total
Presente 7 1 8
Ausente 13 19 32
Total 20 20 40

Total
Presente 8 0 8
Ausente 12 20 32
Total 20 20 40

E 235116 , 0
8 7 6 0 1 2
= + + + + + = P P P P P P P , logo as concluses seriam do mesmo
tipo. (Experimente a fazer o teste Qui-Quadrado mesmo admitindo as frequncias esperadas
inferiores a 5 e a aplicar a correo de Yates).

4.2 TESTE U DE MANN-WHITNEY

Esta prova se aplica na comparao de dois grupos independentes, para se verificar se
pertencem ou no mesma populao. Na verdade, verifica-se se h evidncias para acreditar
que valores de um grupo A so superiores aos valores do grupo B. Trata-se de uma das mais
poderosas provas no-paramtricas, e constitui uma alternativa extremamente til ao teste t-
Student, quando o pesquisador deseja evitar as suposies exigidas por este ltimo, ou quando
a mensurao atingida inferior da escala de intervalos.

Exigncia do Teste

- Nvel de Mensurao em escala nominal ao menos.
- Amostras independentes.

O Mtodo

Seja n
1
= o nmero de casos no menor dos dois grupos independentes, e n
2
= o nmero
de casos no maior grupo. Para aplicar o teste U, em primeiro lugar combinamos as
observaes ou escores de ambos os grupos, relacionando-os em ordem ascendente.
Primeiramente ordenam-se os valores misturados dos dois grupos, em ordem crescente
indicando sempre a que grupo cada valor pertence. Em seguida, fixando-se nos valores
referentes ao menor dos grupos (I), contamos o nmero de vezes que um valor no grupo (I)
precede um valor no grupo (II).
Para no restar dvidas sobre qual o grupo que deve ser fixado para o clculo da
estatstica U, conveniente calcular-se para cada grupo. U ser o menor deles. O maior ser
U.

148
EXEMPLO 8.5: Suponha um grupo experimental de 3 casos e um grupo controle de 4 casos.
Aqui, n
1
= 3 e n
2
=4. Admitamos observados os seguintes escores:

Escores E 9 11 15
Escores C 6 8 10 13

Para determinar U, relacionamos primeiro esses escores em ordem ascendente tendo o
cuidado de reter a identidade de cada escore (E ou C):

6 8 9 10 11 13 15
C C E C E C E

Consideremos agora o grupo de controle, e contemos o nmero de escores E que
precedem cada escore do grupo de controle. Nenhum escore E precede o escore C de 6. Isto
tambm verdade para o escore C de 8. O prximo escore C (10) precedido por um escore
E, e o escore C final (13) precedido por dois escores E. Assim,

U = 0 + 0 + 1 + 2 = 3
e
U = 2 + 3 + 4 = 9.

Empates

Quando dois ou mais valores so semelhantes atribui-se como posto a mdia dos
postos que seriam atribudos a eles caso no ocorresse empate.

Amostras muito pequenas (n
1
, n
2
s 8)

Quando nem n
1
nem n
2
superior a 8, pode-se utilizar as tabelas 7A, 7B ou 7C para
determinar a probabilidade exata associada ocorrncia, sob H
0
, de qualquer U to extremo
quanto valor observado de U. Para determinar a probabilidade, sob H
0
, associada a seus
dados, o pesquisador precisa conhecer somente n
1
, n
2
e U. Ento se a probabilidade
encontrada for inferior ou igual ao nvel de significncia o a hiptese nula H
0
dever ser
rejeitada, caso contrrio, aceita-se H
0
.
Pode, entretanto, ocorrer que o valor observado de U seja to grande que no conste da
subtbua correspondente ao valor observado de n
2
. Tal situao surge quando o pesquisador
focaliza o grupo errado na determinao de U. Por exemplo, suponha que no caso acima
tivssemos contado o nmero de escores c que precedem cada E, ao invs de contar os escores
E que precedem cada C. Teramos encontrado U = 2 + 3 +4 = 9. A subtbua para n
2
= 4 no
vai at 9. Nosso valor observado ser ento U = 9. Podemos transformar qualquer U em U
mediante

'
2 1
U n n U = .

Em nosso exemplo, por esta transformao, 3 9 4 3 = = U . Naturalmente, este o
prprio valor de U que obtivemos quando contamos o nmero de escores que precediam cada
C.

149
Amostras pequenas (9 s n
2
s 20)

Quando o tamanho da maior amostra n
2
superior a 8 deveremos utilizar as tabelas
7D, 7E, 7F ou 7G, que d valores crticos de U para nveis de significncia 0,001, 0,01, 0,025
e 0,05 para uma prova unilateral. Para provas bilaterais os nveis de significncia dados so
0,,002, 0,02, 0,05 e 0,10.
Assim as tabelas 7D, 7E, 7F ou 7G fornecem valores crticos de U, e no
probabilidades exatas. Isto , se um valor observado de U para um dado n
1
s 20 e 9 s n
2
s 20,
no supera o valor dado na tabela, podemos ento rejeitar H
0
ao nvel de significncia
indicado no cabealho da tabela.
O valor da estatstica de teste U calculado por:

1
1 1
2 1
2
) 1 (
R
n n
n n U
+
+ =
ou equivalentemente,

2
2 21
2 1
2
) 1 (
R
n n
n n U
+
+ =

onde R1 = a soma dos postos atribudos aos valores do grupo cujo o tamanho da amostra n
1
e
R
2
= a soma dos postos atribudos aos valores do grupo cujo o tamanho da amostra n
2
.

Amostras grandes (n
2
> 20)

Nenhumas das tabelas podem ser utilizadas nesse caso. Todavia, Mann e Whitney
mostraram (1947), que, na medida que n
1
, n
2
aumentam, a distribuio amostral de U tende
rapidamente para a distribuio normal, dada por:

2
2 1
n n
U
= ,
( )
12
1
2 1 2 1
+ +
=
n n n n
U
o e
U
U
U
Z
o

=

que tem distribuio praticamente normal com mdia zero e varincia unitria. Ou seja, a
probabilidade associada ocorrncia, sob H0, de valores to extremos quanto um Z observado
pode ser determinada com o auxlio das tabelas 1 e 1B.

EXEMPLO 8.6: Num experimento onde se comparavam ratos treinados e ratos sem
treinamento (controle), com relao a um teste de aprendizado, registraram-se os seguintes
valores:

Ratos treinados (E) 78 64 75 45 82
Ratos controle (C) 110 70 53 51

150
SOLUO: n
1
= 4, n
2
= 5, U = nmero de escores E que precedem cada escore C.

As hipteses so:

>
=
C E H
C E H
:
:
1
0

E os dados ordenados so:

45 51 53 64 70 75 78 82 110
E C C E C E E E C

E a estatstica de teste U

9 5 2 1 1 = + + + = U e 11 3 3 3 2 0 ' = + + + + = U

Concluso: Pela Tabela 7A verificamos que para n
2
= 5 e U = 9 temos para um teste
unilateral um p-valor = 0,452, portanto no podemos rejeitar a hiptese nula H
0
.

EXEMPLO 8.7: Dois tipos de soluo qumica, A e B, foram ensaiadas para a determinao
do pH. As anlises de 10 amostras de cada soluo esto apresentadas na tabela que segue..

A 7,49 7,35 7,54 7,48 7,48 7,37 7,51 7,50 7,52 7,56
B 7,28 7,35 7,52 7,50 7,38 7,48 7,31 7,22 7,41 7,45

Verifique, com um teste bilateral, se h diferena entre elas ao nvel de significncia de 5%.

SOLUO: n
1
=n
2
=10.

As hipteses so:

=
=
B A
B A
pH pH H
pH pH H
:
:
1
0

E os dados ordenados so:

Valores 7,22 7,28 7,31 7,35 7,35 7,37 7,38 7,41 7,45 7,48
Grupo B B B A B A B B B A
Posto 1 2 3 4,5 4,5 6 7 8 9 11

Valores 7,48 7,48 7,49 7,50 7,50 7,51 7,52 7,52 7,54 7,56
Grupo A B A A B A A B A A
Posto 11 11 13 14,5 14,5 16 17,5 17,5 19 20

O valor da estatstica de teste U calculado por:

151
5 , 22 5 , 132
2
) 1 10 ( 10
10 10
2
) 1 (
1
1 1
2 1
=
+
+ =
+
+ = R
n n
n n U
e
5 , 77 5 , 22 10 10 '
2 1
= = = U n n U

O valor crtico para n
1
= n
2
= 10 em que o = 0,05 (teste bilateral) ser U
c
=23.

Concluso: No temos evidncias de que existam diferenas entre as solues qumicas.

5. TESTES PARA DUAS AMOSTRAS PAREADAS

Muitas vezes estamos interessados na comparao de dois tratamentos. No entanto
muito comum ocorrer uma grande disparidade entre os elementos dos grupos. Para evitar que
um grupo de indivduos seja naturalmente superior ao outro, comum proceder algum tipo de
pareamento entre os indivduos. O tipo mais comum de pareamento utilizando cada
indivduo como seu prprio controle, submetendo-o aos dois tratamentos em ocasies
diferentes. Outro tipo de pareamento tentar selecionar, para cada par, indivduos que sejam
to semelhantes quanto possvel. Por exemplo: Gmeos, rgos (ouvidos, braos, ps, etc).

5.1 TESTE DE WILCOXON

O teste de Wilcoxon extremamente til para os cientistas do comportamento. Este
teste para dados pareados, ao invs de considerar apenas o sinal das diferenas entre os pares,
considera o valor dessas diferenas, sendo assim um teste No-Paramtrico dos mais
poderosos e populares.

Exigncia do Teste

- Os pares (X
i
,Y
i
) so mutuamente independentes;
- As diferenas d
i
so variveis contnuas, com distribuio simtrica;
- Nvel de mensurao em escala intervalar.

O Mtodo

Considere, as diferenas d
i
s onde di = Yi - Xi. Devemos ordenar os d
i
s, porm sem
considerar o sinal da diferena (em mdulo).

Empates

Consideremos duas situaes:

- Quando X
i
= Y
i
, ou seja, a informao pr eqivale a informao ps para um
mesmo indivduo, descarta-se este par da anlise e redefinimos n como sendo o
nmero de pares tais que X
i
= Y
i
para i = 1, 2, 3, ... , n.
- Quando duas ou mais d
i
s tem o mesmo valor atribui-se como posto a mdia
dos postos que seriam atribudos a eles caso no ocorresse empate.

152
Pequenas Amostras

Considere T sendo a menor soma dos postos de mesmo sinal. Ou seja, T a soma dos
postos positivos, ou a soma dos postos negativos (a que for menor). A Tabela 8 apresenta
diversos valores de T tabelados e respectivos nveis de significncia associados. Compara-se
ento o valor de T calculado com aqueles tabelados e o objetivo verificar se a mediana
nula, ou seja,

=
=
0 :
0 :
1
0
Md H
Md H

Grandes Amostras (n>25)

Neste caso T tem distribuio aproximadamente Normal e podemos usar a
aproximao considerando:
4
) 1 ( +
=
n n
T
e
24
) 1 2 )( 1 ( + +
=
n n n
T
o
Calcula-se assim a estatstica
T
T
T
Z
o

= e compara-se com os valores tabelados da
distribuio normal padro apresentados nas tabelas 1A e 1B.

EXEMPLO 8.8: Num experimento estudando a prevalncia de ocluso normal em crianas
do sexo masculino e feminino de 11 escolas, obtiveram-se os seguintes resultados:

% de ocluso Normal
Escola
Masculino (X) Feminino (Y)
d
i
Posto
1 8,7 7,7 1,0 4
2 18,6 9,6 9,0 9
3 8,0 16,0 -8,0 6
4 12,9 13,4 -0,5 2
5 10,9 9,6 1,3 5
6 13,4 13,0 0,4 1
7 11,9 23,7 -11,8 11
8 14,3 6,2 8,1 7
9 20,0 9,6 10,4 10
10 14,4 13,8 0,6 3
11 6,6 15,1 -8,5 8

Verifique se h influncia do sexo na % de ocorrncia de ocluso normal ao nvel de
significncia de 5%.

SOLUO: n = 11. As seguintes hipteses a serem testadas so:
=
=
0 :
0 :
1
0
Md H
Md H

153

Pela Tabela 8, T = 27 e considerando o = 0,05 (bilateral) o valor crtico T
C
=11.

Concluso: No podemos rejeitar H
0
, ou seja, a porcentagem de ocluso normal no sofre
influncia do sexo.

EXEMPLO 8.9: Considere o quadro de notas abaixo referente a estudo para comparar a
eficincia de um novo mtodo de aprendizagem. Teste a eficincia do novo mtodo ao nvel
de significncia de 5%.

Aluno Nota 1 Nota 2 di Postos
1 5.1 5.8 0.7 10.5
2 4.2 4.7 0.5 7.5
3 3.3 6.1 2.8 18.5
4 6 7.4 1.4 14
5 7.1 6.5 -0.6 9
6 3.2 3.2 0 -
7 2.8 4.5 1.7 15.5
8 1.4 3.5 2.1 17
9 0.8 4 3.2 20
10 5.6 5.5 -0.1 1.5
11 3.8 3.9 0.1 1.5
12 4.7 4.5 -0.2 3
13 6.2 5 -1.2 13
14 5.4 5.4 0 -
15 1.2 6 4.8 23
16 2.2 5 2.8 18.5
17 1.9 2.2 0.3 5
18 5.4 1.8 -3.6 22
19 5.5 5.2 -0.3 5
20 5.2 6 0.8 12
21 3.8 4.5 0.7 10.5
22 4.2 4.7 0.5 7.5
23 1.8 5.1 3.3 21
24 2.6 2.9 0.3 5
25 4.3 2.6 -1.7 15.5
26 1.4 6.5 5.1 24

SOLUO: Utilizaremos uma aproximao para a normal dado que a amostra aqui
considerada grande. E as hipteses a serem testadas so:
eficiente foi mtodo novo O : H

eficiente no mtodo novo O : H
1
0

150
4
) 1 24 ( 24
4
) 1 (
=
+
=
+
=
n n
T
, 35
24
49 25 24
24
) 1 2 )( 1 (
=

=
+ +
=
n n n
T
o e 69 = T .

154
Calcula-se assim a estatstica 31 , 2
35
150 69
=
=
T
T
T
Z
o

Concluso: Como Z < -1,96 ento rejeitamos H
0
. Ou seja, existem evidncias para se
acreditar que o novo mtodo eficiente.

6. TESTES PARA MAIS DE DUAS AMOSTRAS INDEPENDENTES

Neste captulo sero abordados testes no-paramtricos de comparao de 3 ou mais
grupos independentes entre si, teis quando as suposies paramtricas no forem atendidas.
Consideremos ento, a seguinte estrutura de dados:

Tratamentos
1 2 3 ... k
X
11
X
21
X
31
... X
k1

X
12
X
22
X
32
... X
k2

X
13
X
23
X
33
... X
k3

... ... ... ... ...
X
1l
X
2m
X
3n
... X
kp

Onde as informaes do tratamento i no esto relacionadas s informaes do
tratamento j, e os tamanhos das amostras em cada tratamento no necessariamente so iguais.
A prova que ser apresentada equivalente ao teste de Anlise de Varincia (ANOVA).

6.1 TESTE DE KRUSKAL-WALLIS

O teste de Kruskal-Wallis uma prova extremamente til para decidir se k amostras
independentes provm de populaes diferentes. Os valores amostrais quase que
invariavelmente diferem entre si, e o problema decidir se essas diferenas entre as amostras
significam diferenas efetivas entre as populaes, ou se representam apenas variaes
casuais, que podem ser esperadas entre amostras aleatrias de uma mesma populao. A
tcnica de Kruskal-Wallis comprova a hiptese de nulidade, de que k amostras provenham da
mesma populao ou de populaes idnticas em relao a mdias.
um teste til na comparao de k tratamentos independentes. Nos indica se h
diferena entre pelo menos dois deles. E na verdade uma extenso do teste de Mann-
Whitney para duas amostras independentes e se utiliza dos postos atribudos aos valores
observados.

Exigncia do Teste

- Nvel de mensurao em escala ordinal (pelo menos).

-1,96 1,96
155
O Mtodo

Primeiramente deve-se atribuir a cada valor observado, um posto, sempre atribuindo o
menor posto ao menor valor e o maior posto ao maior valor. Aps se efetuar a soma dos
postos para cada tratamento (Rj) calcula-se a estatstica H, onde

) 1 ( 3
) 1 (
12
1
2
+
+
=

=
n
n
R
n n
H
k
j j
j

onde k = nmero de amostras, n
j
= nmero de observaes na amostra j, n = o nmero de
observaes de todas as amostras combinadas e R
j
= soma dos postos na amostra j.

A estatstica de teste tem distribuio aproximadamente Qui-quadrado com k - 1 graus
de liberdade para tamanhos de amostras (n
j
) suficientemente grandes.

Empates

Quando ocorrem empates entre dois ou mais escores, atribui-se a cada um deles a
mdia dos postos respectivos. Como o valor de H influenciado de certo modo pela
ocorrncia de empates a frmula anterior deve ser corrida. Assim a estatstica de teste passa a
ser:
n n
T
n
n
R
n n
H
i
k
j j
j
+
+
=
=
3
1
2
1
) 1 ( 3
) 1 (
12

onde k = nmero de amostras, n
j
= nmero de observaes na amostra j, n = o nmero de
observaes de todas as amostras combinadas, R
j
= soma dos postos na amostra j, t = o
nmero de observaes empatadas em um grupo de escores empatados,
i i i
t t T =
3
e
i
T indica somatrio sobre todos os grupos de empates.

Regra de deciso quando k = 3 e n
1
, n
2
e n
3
s 5

Quando k =3 e o nmero de observaes em cada uma das trs amostras menor ou
igual a 5, a aproximao pela Qui-quadrado para a distribuio de H, no suficiente. Para
tais casos, tabelaram-se probabilidades exatas para a partir da estatstica de H e essas
probabilidades esto apresentadas nas tabelas 9A e 9B. A primeira coluna da tabela fornece os
possveis tamanhos de n
1
, n
2
e n
3
. A segunda coluna fornece diversos de H calculados. E a
terceira coluna d a probabilidade associada ocorrncia, sob H
0
, de valores to grandes
quanto um H observado.
156
Regra de deciso quando k >3 ou h pelo menos um n
j
> 5

Quando k > 3 ou h pelo menos um n
j
> 5, o valor crtico para a deciso de rejeio ou
no da hiptese nula pode Sr obtido na tabela 2. Assim, se o valor observado de H igual ou
superior ao valor crtico para o nvel de significncia previamente fixado e para k - 1 graus de
liberdade, ento H
0
deve ser rejeitada.

6.2 COMPARAES MLTIPLAS

Este teste til para complementar a anlise do teste de Kruskal-Wallis e verificar
entre que pares de tratamentos existem diferena significativa.

O Mtodo

Amostras pequenas

- Para n
j
iguais

Primeiramente, calcula-se para cada par de tratamentos a diferena entre a soma dos
postos dos tratamentos:
j i
R R .

Em seguida obtm-se a Diferena Mnima Significativa (DMS) na tabela 10A. As
diferenas observadas entre as somas de postos, superiores a DMS indicam diferenas
significativas entre aqueles tratamentos.

- Para n
j
diferentes


j i
R R
onde
i
i
i
n
R
R = .
Em seguida obtm-se a Diferena Mnima Significativa (DMS) pela frmula:

h
n n
n n
DMS
j i
|
|
.
|
\
|
+
+
=
1 1
12
) 1 (

onde h obtido nas tabelas 10B, 10C e 10D. As diferenas observadas entre
j i
R R ,
superiores a DMS indicam diferenas significativas entre aqueles tratamentos.

157

Amostras grandes

- Para n
j
iguais


j i
R R
onde
i
i
i
n
R
R = .


12
) 1 ( +
=
n k
Q DMS

onde Q obtido na tabela 10E. As diferenas observadas entre
j i
R R , superiores a
DMS indicam diferenas significativas entre aqueles tratamentos.

- Para n
j
diferentes


j i
R R

onde
i
i
i
n
R
R = .


|
|
.
|
\
|
+
+
=
j i
n n
n n
z DMS
1 1
12
) 1 (

onde
) 1 (
=
k k
z z
o
obtido nas tabelas 1A e 1B. As diferenas observadas entre
j i
R R ,

158
EXEMPLO 8.10: Suponha-se que um pesquisador resolva investigar o grau de autoritarismo
do pessoal de escolas, usando a escala de autoritarismo de Adorno e colegas. Os escores esto
apresentados abaixo. Verificar se h diferena entre os grupos ao nvel de significncia de
5%.

Professores de
E.F.
Outros
professores
Administradores
96 82 115
128 124 149
83 132 166
61 135 147
101 109

SOLUO:

grupos 3 os entre diferena alguma H : H

diferem no grupos 3 Os : H
1
0

Os postos calculados so:

Professores de
E.F.
Outros
professores
Administradores
4 2 7
9 8 13
3 10 14
1 11 12
5 6

Como no h empates a estatstica de teste dada por:

406 , 6 ) 1 14 ( 3
4
46
5
37
5
22
) 1 14 ( 14
12
) 1 ( 3
) 1 (
12
2 2 2
1
2
= +
|
|
.
|
\
|
+ +
+
= +
+
=

=
n
n
R
n n
H
k
j j
j

Como k = 3 e n
1
, n
2
e n
3
s 5 o valor crtico ser obtido na tabela 9B. Assim como o H
observado maior que o H
crtico
= 5,643, rejeitamos H
0
ao nvel de significncia de 5%. Ou
seja, h diferena estatisticamente significante entre os trs grupos. Por esta razo teremos que
realizar o teste de comparaes mltiplas entre os grupos:

3
5
37
5
22
2 1
= = R R e 28 , 6 643 , 5
5
1
5
1
12
15 14 1 1
12
) 1 (
2 1
= |
.
|
\
|
+
=
|
|
.
|
\
|
+
+
= h
n n
n n
DMS

159
1 , 7
4
46
5
22
3 1
= = R R e 66 , 6 643 , 5
4
1
5
1
12
15 14 1 1
12
) 1 (
3 1
= |
.
|
\
|
+
=
|
|
.
|
\
|
+
+
= h
n n
n n
DMS

1 , 4
4
46
5
37
3 2
= = R R e 66 , 6 643 , 5
4
1
5
1
12
15 14 1 1
12
) 1 (
3 1
= |
.
|
\
|
+
=
|
|
.
|
\
|
+
+
= h
n n
n n
DMS

Dessa verificamos diferenas significantes apenas entre Professores de E.F. e
Professores de E.F., pois, a nica diferena superior DMS.

EXEMPLO 8.11: Considere um experimento de alimentao de sunos, em que se usaram 4
raes (A, B, C, D), cada uma fornecida a 5 animais. Os aumentos de peso observados, em
Kg, aps 1 anos foram os seguintes:

A B C D
n Posto n Posto n Posto n Posto
35 14,5 40 17 39 16 27 6,5
19 4 35 14,5 27 6,5 12 1
31 12 46 20 20 5 13 2
15 3 41 18 29 9 28 8
30 10,5 33 13 45 19 30 10,5
44 82,5 55,5 28

Verifique se existe diferenas entre as raes ao nvel de significncia de 5%.

SOLUO: Observa-se pela tabela acima 3 empates. Considere agora t
1
, t
2
, t
3
, o nmero de
casos em cada empate. Assim temos dois valores empatados em 6,5, dois em 10,5 e mais dois
em 14,5. Ento, 2
3 2 1
= = = t t t .


diferem no raes de grupos 4 Os : H
1
0

Assim a estatstica de teste dada por:

( ) ( ) ( )
058 , 9
20 20
2 2 2 2 2 2
1
) 1 20 ( 3
5
28
5
5 , 55
5
5 , 82
5
44
21 20
12
1
) 1 ( 3
) 1 (
12
3
3 3 3
2 2 2 2
3
1
2
=
+ +
+
|
|
.
|
\
|
+ + +
+
+
=
=
n n
T
n
n
R
n n
H
k
j j
j

160
Ao nvel de significncia de 5% o h
crtico
= 5,66, logo, como h > 5,66, rejeitamos a
hiptese nula. Ento podemos dizer que h diferena entre os 4 tipos de rao. Por esta razo
teremos que realizar o teste de comparaes mltiplas entre os grupos:

7 , 7 5 , 16 8 , 8 = =
B A
R R
3 , 2 1 , 11 8 , 8 = =
C A
R R
2 , 3 6 , 5 8 , 8 = =
D A
R R
4 , 5 1 , 11 5 , 16 = =
C B
R R
9 , 10 6 , 5 5 , 16 = =
D B
R R
5 , 5 6 , 5 1 , 11 = =
D C
R R

Pela tabela 10E verificamos que ao nvel de significncia de 5% 633 , 3 = h e
61 , 9
12
) 1 20 ( 4
633 , 3 =
+
= DMS . Assim verificamos diferena significante apenas entre B e D,
pois a nica diferena superior a 9,61.

7. TESTES PARA MAIS DE DUAS AMOSTRAS PAREADAS

Neste captulo sero abordadas tcnicas no-paramtricas de comparao de 3 ou mais
grupos relacionados entre si. Imagine ento a seguinte estrutura de dados:

Tratamentos
Blocos
1 2 3 ... k
Bloco 1 X
11
X
21
X
31
... X
k1

Bloco 2 X
12
X
22
X
32
... X
k2

Bloco 3 X
13
X
23
X
33
... X
k3

... ... ... ... ... ...
Bloco n X
1l
X
2m
X
3n
... X
kp

Onde os blocos representam as unidades amostrais utilizadas no experimento e os
tratamentos so as k condies de avaliao (tempo, dietas, distncia, etc).

7.1 TESTES DE FRIEDMAN

Este teste til quando deseja-se comprovar a hiptese de que as k amostras
relacionadas provm da mesma populao. Neste tipo de estudo observa-se o mesmo grupo de
indivduos sob cada uma das k condies, ou ento se formam conjuntos de indivduos
homogneos entre si, e estes so alocados aleatoriamente a cada uma das condies. Como as
k amostras so pareadas o nmero de observaes em cada uma delas o mesmo.
Para o teste de Friedman os dados se dispem em uma tabela de dupla entrada com n
linhas e k colunas. As linhas representam os vrios indivduos ou unidades de anlise, e as
161
colunas representam os diversos momentos nos quais os indivduos foram avaliados. Aos
escores de cada linha atribuem-se postos separadamente. Isto , com k condies em estudo,
os postos em qualquer linha vo de 1 a k.O teste de Friedman determina se provvel que as
diferentes colunas de postos (amostras) provenham da mesma populao.

Exigncia do Teste

- Nvel de mensurao em escala ordinal (pelo menos).

O Mtodo

Considera-se aqui a mesma disposio dos dados observada anteriormente, com n
linhas e k colunas. Para cada linha da tabela atribui-se postos de 1 a k. Calcula-se em seguida
a estatstica
2
r
_

de Friedman, que dada por:

) 1 ( 3
) 1 (
12
1
2 2
+
+
=

=
k n R
k nk
k
i
i r
_

onde n = nmero de linhas, k = nmero de colunas,
i
R = soma dos postos na coluna j e
=
k
i
i
R
1
2
indica o somatrio dos quadrados das somas de postos sobre as k condies.
de liberdade para tamanhos de amostras suficientemente grandes.

Pequenas amostras

Note que a estatstica
2
r
_ tem distribuio Qui-quadrado somente quando o nmero de
linhas ou colunas no muito pequeno. Quando o nmero de linhas ou de colunas inferior
ao mnimo, existem tabelas de probabilidades exatas, que devem ser utilizadas. Assim se k =
3 e n tiver valores entre 2 e 9 deve ser utilizada a tabela 11A. J se k = 4 e n tiver valores entre
2 e 4 a tabela 11B dever ser utilizada. Para a regra de deciso deve-se verificar se o valor de
2
r
_ calculado superior ao valor observado nas tabelas, para um dado nvel de significncia.
Se ocorrer a hiptese nula dever ser rejeitada caso contrrio aceite-a.

Grandes amostras

de liberdade para tamanhos de amostras suficientemente grandes. Para a regra de deciso
deve-se verificar se o valor de
2
r
_ calculado superior ao valor observado na tabela 2, para
um dado nvel de significncia. Se ocorrer a hiptese nula dever ser rejeitada caso contrrio
aceite-a.

162
7.2 COMPARAES MLTIPLAS

Com a finalidade de complementar a anlise do teste de Friedman, quando a hiptese
H
0
rejeitada, devemos proceder ao teste de comparaes mltiplas para identificar as
diferenas entre pares de tratamentos.

O mtodo

Amostras pequenas (k e n s 15)

Primeiramente, calcula-se para cada par de tratamentos a diferena | Ri - Rj | onde Ri
a soma de postos atribuda ao tratamento i. Em seguida obtm-se a Diferena Mnima
Significativa (DMS) na tabela 12. As diferenas observadas entre as somas de postos,

Amostras grandes (k ou n > 15)

Primeiramente, calcula-se para cada par de tratamentos a diferena
j i
R R onde Ri
a soma de postos atribuda ao tratamento i. Em seguida obtm-se a Diferena Mnima
Significativa (DMS) atravs da formula:

12
) 1 ( +
=
k nk
Q DMS
onde Q obtido na tabela 10E. As diferenas observadas entre
j i
R R , superiores a DMS
indicam diferenas significativas entre aqueles tratamentos

EXEMPLO 8.12: Um teste de consumo de combustvel envolvendo carros produzidos por
trs fabricantes foi realizado e os resultados, em quilmetros por litro de combustvel esto
apresentados na tabela abaixo. Verifica se existe diferena entre os grupos de fabricantes ao
nvel de significncia de 5%.

Fabricante
Modelo
G F C
Pequeno 9,0 11,3 10,6
Mdio-6 cil. 9,4 10,9 10,2
Mdio-8 cil. 8,1 8,6 9,1
Grande-8 cil. 8,3 8,6 8,8
Esporte 8,2 9,2 9,5

SOLUO: k = 3 e n = 5.

163


diferem no grupos 3 Os : H
1
0


Fabricante
Modelo
G F C
Pequeno 1 3 2
Mdio-6 cil. 1 3 2
Mdio-8 cil. 1 2 3
Grande-8 cil. 1 2 3
Esporte 1 2 3
i
R
5 12 13

Calcula-se em seguida a estatstica
2
r
_

de Friedman, que dada por:

( ) 6 , 7 4 5 3 13 12 5
4 3 5
12
) 1 ( 3
) 1 (
12
2 2 2
1
2 2
= + +

= +
+
=

=
k n R
k nk
k
i
i r
_

Pela tabela 11A verificamos que o p-valor = 0,024. Ao nvel de significncia de 5%
rejeitamos a hiptese nula. Ento podemos dizer que h diferena entre os 3 fabricantes. Por
esta razo teremos que realizar o teste de comparaes mltiplas entre os grupos. Como n s
15 utilizamos o mtodo para pequenas amostras e a tabela 12A, assim temos:

7 12 5 = =
F G
R R ,

8 13 5 = =
C G
R R , p-valor=0,039

1 13 12 = =
C F
R R .

Assim com base na tabela s podemos afirmar diferenas significantes entre os
fabricantes G e C.

EXEMPLO 8.13: Uma pesquisa foi delineada para determinar a eficcia de um programa de
grupo para a reduo do estresse baseado em meditao para pacientes com problemas de
ansiedade. Os sujeitos foram selecionados dentre os encaminhados para programas de reduo
do estresse e de relaxamento. Foram coletados dados da Escala Hamilton de Ansiedade em
quatro momentos diferentes: recrutamento (IR), pr-tratamento (Pr), ps-tratamento (Ps) e
trs meses aps o ps-tratamento (3M). Os dados esto apresentados abaixo. O tratamento
teve algum resultado?

Sujeito IR Pr Ps 3M
1 21 21 16 19
2 30 38 10 21
3 38 19 15 6
164
4 43 33 30 24
5 35 34 25 10
6 40 40 31 30
7 27 15 11 6
8 18 11 4 7
9 31 42 23 27
10 21 23 21 17
11 18 24 16 13
12 28 8 5 2
13 40 37 31 19
14 35 32 12 21

SOLUO: k = 4 e n = 14.


momentos 4 os entre diferena alguma H : H

momentos 4 nos diferem no indivduos Os : H
1
0


Sujeito IR Pr Ps 3M
1 3,5 3,5 1 2
2 3 4 1 2
3 4 3 2 1
4 4 3 2 1
5 4 3 2 1
6 3,5 3,5 2 1
7 4 3 2 1
8 4 3 1 2
9 3 4 1 2
10 2,5 4 2,5 1
11 3 4 2 1
12 4 3 2 1
13 4 3 2 1
14 4 3 1 2
i
R
50,5 47 23,5 19

Calcula-se em seguida a estatstica
2
r
_

de Friedman, que neste caso dada por:

( ) 11 , 33 5 14 3 19 5 , 23 47 5 , 50
5 4 14
12
) 1 ( 3
) 1 (
12
2 2 2 2
1
2 2
= + + +

= +
+
=

=
k n R
k nk
k
i
i r
_

O valor crtico, ao nvel de significncia de 5%, na tabela 2 da Qui-quadrado para 3
graus de liberdade de 7,815. Dessa rejeitamos a hiptese nula e podemos dizer que h
diferena significante entre os quatro momentos. Por esta razo teremos que realizar o teste de
165
comparaes mltiplas entre os grupos. Como n s 15 utilizamos o mtodo para pequenas
amostras e a tabela 12A, assim temos:

5 , 3 47 5 , 50
2 1
= = R R ,
27 5 , 23 5 , 50
3 1
= = R R *,
5 , 31 19 5 , 50
4 1
= = R R *,
5 , 23 5 , 23 47
3 2
= = R R *,
28 19 47
4 2
= = R R *,
28 19 47
4 2
= = R R .

Assim as diferenas indicadas com * so sigificantes.
166

167
EXERCCIOS

1. Num ensaio pareado sobre adubao nitrogenada de alface, compararam-se 4
tratamentos: Tratamento 1 - controle, Tratamento 2 - 5 g de salitre/10 litros de gua,
Tratamento 3 - 10g de salitre/10 litros de gua e Tratamento 4 - 20g de salitre/10 litros
de gua. Os resultados de produo se encontram abaixo. Verifique a existncia de
diferenas entre os tratamentos ao nvel de significncia de 5%.

Blocos Trat.1 Trat.2 Trat.3 Trat.4
I 3640 4200 4700 5300
II 4890 4550 6020 5900
III 4800 5320 5250 5150
IV 4460 5500 5580 5560

2. Numa pesquisa sobre qualidade de vinho, foram provados trs tipos por cinco
degustadores. Cada degustador provou 12 amostras (4 de cada tipo) e atribuiu a cada
uma delas uma nota de zero a dez. As mdias das notas atribudas pelos 5
degustadores a cada uma das amostras esto apresentadas abaixo. Verifique se h
preferncia dos degustadores por algum dos tipos de vinho ao nvel de significncia de
5%.

Tipo 1 Tipo 2 Tipo 3
5,0 8,3 9,2
6,7 9,3 8,7
7,0 8,6 7,3
6,8 9,0 8,2

3. Numa pesquisa sobre desquites, realizada entre as classes mdia e alta, foram obtidos
os resultados abaixo apresentados. Ao nvel de significncia de 5% voc acredita que a
proporo de desquites amigveis maior na classe alta?

Classe Amigvel No-Amigvel Total
Alta 6 4 10
Mdia 2 8 10
Total 8 12 20

4. Num ensaio sobre competio de variedades de tomates foram considerados as
produes individuais (em kg) de 15 plantas de uma variedade A e dez de uma
variedade B, obtendo-se os resultados abaixo apresentados. Verifique se as variveis A
e B diferem em produtividade ao nvel de significncia de 5%.

Var. A 4,3 3,8 5,2 2,5 3,5 4,1 5,1 4,0 2,2 1,8 4,5 1,7 3,6 4,5 5,0
Var. B 4,2 4,8 4,7 6,5 6,3 5,9 7,2 5,1 6,2 6,8

168

5. Um grupo de 8 indivduos se submete a um estmulo. A tabela abaixo apresenta as
medidas de presso sangnea (mm/Hg) antes e depois do estmulo. O pesquisador
desconfia que os estmulos aumentem a presso sangnea. Teste esta afirmao ao
nvel de significncia de 5%.
Paciente Antes Depois
1 118 127
2 120 128
3 128 136
4 124 131
5 130 135
6 136 138
7 128 125
8 140 136

6. Pacientes resolveram processar a clnica de emagrecimento Linha Fina sob a alegao de que
o tratamento empregado no contribui para a diminuio do peso. O advogado de defesa
contratou um estatstico, que selecionou aleatoriamente 12 pronturios que continham
informao a respeito dos pesos dos pacientes, tomados no incio e no final do tratamento. Os
dados obtidos foram (em kg):

1 2 3 4 5 6 7 8 9 10 11 12
Incio 82 104 94 63 70 80 103 56 79 84 81 78
Final 78 93 87 61 71 82 94 65 79 80 81 82

Verifique se alegao procede ao nvel de significncia de 5%.

7. Seis estudantes aprenderam lgebra pelo mtodo padro de ensino, com o professor
expondo o assunto na sala de aula e doze outros estudantes aprenderam lgebra de
acordo com um curso televisionado. As notas alcanadas pelos alunos no final de um
nico teste foram:

Sala de aula 68 69 74 79 80 84
Pela TV 60 64 65 66 67 70 72 73 76 77 78 81

O ensino televisionado mais proveitoso que o ensino ao vivo? (Use o=0,05).

8. Os dados da tabela a seguir so escores de autoritarismo de uma amostra aleatria de
14 estudantes de uma escola pblica e de 14 estudantes de uma escola da rede
particular de ensino. Suponha que um estudante que tem um escore, digamos 93,
mais autoritrio do que um estudante que tem um escore, digamos 88:

Pblica 60 80 65 100 95 88 70 104 75 85 110 55 40 45
Particular 98 87 133 115 93 140 67 134 106 81 111 56 41 42

169
razovel assumir a um nvel de significncia de 1% que os estudantes da escola
particular so mais autoritrios que os estudantes das escolas pblicas?

9. Uma loja de departamentos est interessada em saber se existem diferenas entre as
quantias faturadas em trs formas de pagamento: dinheiro(D), cheque(C) e carto de
crdito(CC). Um levantamento das vendas em um dado perodo de tempo foi feito,
produzindo os dados apresentados na tabela a seguir que representam o valor de
algumas vendas em reais. Existe diferena entre os tipos de vendas? (Use o nvel de
significncia de 5%).

Formas de pagamento
D C CC
52,10 80,90 73,25
20,99 54,29 56,65
32,38 40,95 126,21
28,64 72,65 56,50
132,47 39,29
65,32 44,65
60,00 39,64

170
Captulo 9

REGRESSO LINEAR SIMPLES

1. INTRODUO

Estamos interessados em saber se existe relao entre duas variveis, mas, alm disso,
temos interesse em verificar sua relao de casualidade, isto , queremos quantificar qual a
mudana observada em uma das variveis quando variamos os valores da outra.
O termo correlao significa relao em dois sentidos (co + relao), e usado em
estatstica para designar a fora que mantm unidos dois conjuntos de valores. A verificao
da existncia e do grau de relao entre as variveis o objeto de estudo da correlao.
Uma vez caracterizada esta relao, procura-se descrev-la sob forma matemtica,
atravs de uma funo. A estimao dos parmetros dessa funo matemtica o objeto da
regresso.
Os pares de valores das duas variveis podero ser colocados num diagrama cartesiano
chamado diagrama de disperso. A vantagem de construir um diagrama de disperso est
em que, muitas vezes sua simples observao j nos d uma idia bastante boa de como as
duas variveis se relacionam.
Uma medida do grau e do sinal da correlao dada pela covarincia entre as duas
variveis aleatrias X e Y que uma medida numrica de associao linear existente entre
elas, e definida por:

( )
(
(
=

n
y x
xy
n
Y X Cov
1
, .

Porm mais conveniente usar para medida de correlao, o coeficiente de correlao
linear de Pearson, como estimador de
xy
, definido por:

( ) ( )
(
(
(
(

n
y
y
n
x
x
n
y x
xy
r
xy
2
2
2
2
.

O diagrama de disperso mostrar que a correlao ser tanto mais forte quanto mais
prximo estiver o coeficiente de 1 ou +1, e ser tanto mais fraca quanto mais prximo o
coeficiente estiver de zero:

a) Correlao perfeita negativa (
xy
r = -1): Quando os pontos estiverem perfeitamente
alinhados, mas em sentido contrrio, a correlao denominada perfeita negativa;

b) Correlao negativa (-1 <
xy
r < 0): A correlao considerada negativa quando
valores crescentes da varivel X estiverem associados a valores decrescentes da
varivel Y, ou valores decrescentes de X associados a valores crescentes de Y;
171

c) Correlao nula (
xy
r = 0): Quando no houver relao entre as variveis X e Y, ou
seja, quando os valores de X e Y ocorrerem independentemente, no existe
correlao entre elas;

d) Correlao positiva (0 <
xy
r < 1): Ser considerada positiva se os valores crescentes
de X estiverem associados a valores crescentes de Y;

e) Correlao perfeita positiva (
xy
r = 1): A correlao linear perfeita positiva
corresponde ao caso anterior, s que os pontos (X, Y) esto perfeitamente
alinhados;

f) Correlao espria: Quando duas variveis X e Y forem independentes, o
coeficiente de correlao ser nulo. Entretanto, algumas vezes, isto no ocorre,
podendo, assim mesmo, o coeficiente apresentar um valor prximo de 1 ou +1.
Neste caso a correlao espria.

2. TESTE DO COEFICIENTE DE CORRELAO LINEAR

O coeficiente de correlao
xy
r apenas uma estimativa do coeficiente de correlao
populacional
xy
e no devemos esquecer que o valor de
xy
r calculado com base em de n
pares de dados constituindo amostras aleatrias. Muitas vezes os pontos da amostra podem
apresentar uma correlao e, no entanto a populao no, neste caso, estamos diante de um
problema de inferncia, pois
xy
r = 0 no garantia de que
xy

= 0.
Podemos resolver o problema aplicando um teste de hipteses para verificarmos se o
valor de
xy
r coerente com o tamanho da amostra n, a um nvel de significncia o, que
realmente existe correlao linear entre as variveis. Assim,

1. Hipteses:

=
=
0 :
0 :
1
0
H
H

2. Fixar o .

3. Estatstica do teste T tem distribuio t-Student com n-2 graus de liberdade.

4. A Regio Crtica ser:

-t t
172
2
1
2
xy
xy
c
r
n r
t

=

0
? Depende da Regio Crtica do passo 4. Se t RC
c
e ,
rejeita-se H
0
0
.

7. Concluso

EXEMPLO 9.1: Em uma dada Regio Bocaina, SP, acredita-se que o gado que permanece
em um determinado pasto tem um ganho de peso maior que o usual. Estudos de laboratrio
detectaram uma substncia no pasto e deseja-se verificar se ela pode ser utilizada para
melhorar o ganho de peso dos bovinos, Foram escolhidos 15 bois de uma mesma raa e idade.
Cada animal recebeu uma determinada concentrao de substncia X (em ml/l) e o ganho de
peso G, em kg, aps 30 dias foi anotado. Os dados obtidos foram:

X 0,2 0,5 0,6 0,7 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0 5,5 6,0
G 9,4 11,4 12,3 10,2 11,9 13,6 14,2 16,2 16,2 17,7 18,8 19,9 25,5 24,7 23,1

Observando a tabela de dados notamos que, de fato, medida que aumenta a
concentrao da substncia, ocorre um aumento no ganho de peso. Calculando o coeficiente
de correlao linear entre a concentrao de X e o ganho de peso, obtemos 0.98 de forma que
a variao de uma das variveis sensivelmente influenciada pela variao da outra,
confirmando a relao entre elas.
Para observarmos como as variveis se relacionam, construmos um grfico de
disperso apresentado na Figura 9.1, onde nota-se que os pontos tendem a se alinhar sobre
uma reta. Como mencionamos anteriormente, a figura mostra que a medida que aumenta a
concentrao de X ocorre aumento no ganho de peso dos animais, o que confirmado pelo
sinal positivo do coeficiente de correlao.
0.0
5.0
10.0
15.0
20.0
25.0
30.0
0.0 1.0 2.0 3.0 4.0 5.0 6.0 7.0
Concentrao da Substncia (mL/l)
G
a
n
h
o

d
e

P
e
s
o

(
k
g
)

Figura 9.1: Relao entre concentrao da substncia e peso.

173
Utilizando o desenvolvimento da Anlise de Varincia apresentada na seo anterior,
iremos estudar situaes como a apresentada no ltimo exemplo. Dado o conjunto de valores
representado por (X
i,
Y
i
), i = 1,...,n, o modelo estatstico que iremos utilizar dados por

Yi = g(X
i
) + e
i

isto , o comportamento de Y
i
explicado em parte por X
i
, atravs da funo g(X
i
) e o que no
captado por essa funo, representado por e
i
. Vrias opes para g(X
i
) podem ser
utilizadas mas a que define o modelo de regresso linear simples

g(X
i
) = o + | X
i

Portanto, dado um valor pr-fixado x
i
para X
i
, o modelo pode ser reescrito como

Y
i
= o + | X
i
+ e
i

Alm disso, assumimos que os termos e
i ,
i = 1,..., n, so independentes e distribudos
conforme um modelo Normal de mdia 0 e varincia o
2
.
Em modelos de regresso, a varivel Y
i
comumente denominada de varivel resposta
ou varivel dependente, ao passo que cada varivel X
i
chamada de varivel independente,
explicativa ou ainda covarivel.
Como conseqncia da definio, temos que para X
i
= x
i ,
i = 1,...,n, as variveis Y
i
so
independentes e

Y
i
~N(o + |X
i
, o
2
), i = 1,,n.

Os parmetros do modelo sobre em que temos o maior interesse o e |. Alm de dar a
forma matemtica do modelo, eles tm interpretaes muito teis na prtica. O parmetro o
o valor esperado par a varivel dependente Y
i
quando X
i
igual a zero. Para melhor interpretar
o parmetro |, considere dois valores para X
i
, dados por x e x + 1 e represente por E(Y | X =
x) ao valor esperado da varivel resposta quando X = x. Ento,

E(Y
i
| X = x + 1) = o + |(x + 1)
= (o + |x) + |
= E(Y
i
| X
i
= x ) + |

Assim, vemos que | = E(Y
i
| X = x + 1) - E(Y
i
| X
i
= x ) representa o acrscimo
esperado na varivel resposta, quando a covarivel acrescida em uma unidade. Isto nos
fornece uma idia a respeito da intensidade com a qual a covarivel atua na resposta.
Temos agora que dois procedimentos a desenvolver: a estimao dos parmetros do
modelo e o desenvolvimento de testes de hiptese de interesse.
A estimao de o e | pode ser feita atravs do mtodo dos mnimos quadrados, que
consiste em minimizar a soma de quadrados dos resduos obtidos atravs da diferena entre
valores observados y e valores esperados E(Y

| X = x ) calculados para cada X = x. A Figura_2
ilustra essas quantidades. Note que caso o ajuste fosse perfeito, todos os pontos estariam
alinhados sobre a reta e os resduos e seriam todos iguais a zero.
174

Figura 9.2: Resduos mo modelo de regresso linear simples.

Portanto, dado que em geral os pontos esto perfeitamente alinhados, escolhemos a
melhor reta possvel no sentido de minimizar, com relao a o e a |, a soma de quadrados
SQ(o, |), dada por
( ) ( )
2
1
| ) , (

=
= =
n
i
i i i i
x X Y E y SQ | o

( )

= =
= =
n
i
i
n
i
i i
e x y
1
2
2
1
| o

Matematicamente, temos que resolver o sistema de equaes envolvendo as derivadas
SQ(o,|) em relao a o e |. Deixemos as contas a cargo do leitor, apresentando aqui a
soluo para o sistema, que fornecer os estimadores de mnimos quadrados para o e |, dados
por

=
=
= + =
n
i
i
n
i
i i
x n x
y x n y x
e x y
1
2 2
1

| | o

EXEMPLO 9.2: Vimos no exemplo anterior que uma reta pode ser utilizada para representar
a o efeito da concentrao X no ganho de peso. Para obtermos essa reta, utilizamos as
estimativas o e |
. Temos que n = 15,

= =
= = =
n
i
n
i
i i i
x x y x
1 1
2
70 , 2 ; 39 , 163 ; 35 , 790 e
. 21 , 16 = y Logo,

48 , 2
70 , 2 15 39 , 163
21 , 16 70 , 2 15 35 , 790
2
1
2 2
1
=

=
=
=
n
i
i
n
i
i i
x n x
y x n y x
|

e assim,
52 , 9 70 , 2 48 , 2 21 , 16
= = = x y | o

Portanto, dado X = x
i
, temos que a reta ajustada fornece valores
i
y dados por
175
i i i
x x y 48 , 2 42 , 9
+ = + = | o

A Figura 9.3 mostra os dados originais e a reta ajustada que foi obtida. Observe que o
modelo de regresso linear simples apresenta um ajuste adequado aos dados apresentados.

Figura 9.3: Reta ajustada aos dados de ganho de peso em bovimos.

A interpretao dos valores estimados feita da seguinte forma. O ganho de peso
esperado em bovinos que no recebem a substncia X 9,52kg (obtido substituindo X
i
= 0 na
equao calculada acima). Por outro lado, um aumento de 1mg/l na concentrao de X implica
em um ganho esperado de 2,48kg.
Teste de hipteses envolvendo os parmetros do modelo de regresso linear simples
baseiam-se na decomposio da variao total discutida na seo anterior. O principal teste de
interesse se a covarivel influencia na resposta, o que equivalente a testar a hiptese:

H
0
: | = 0

Caso est hiptese no seja rejeitada, temos o modelo dado por:

Modelo 0: Y
i
= + e
i
i = 1,..., n

Por outro lado, caso a hiptese seja rejeitada, o modelo :

Modelo 1: Y
i
= o + |X
i
+ e
i
i = 1,...,n

O Modelo 0 gera a soma de quadrados total, dada por

( ) ,
1
2
=
=
n
I
i
y y SQT

que contm a variao total contida os dados. Por outro lado, o Modelo 1 gera a soma de
quadrados residual, dada por
176
( ) ,
Re
2
1
=
=
n
i
i i
y y s SQ | o

que contm a variao dos dados que no explicada pelo modelo. A diferena entre as duas
fornece a chamada soma de quadrados da regresso, dada por

( )
=
=
=
n
i
i
x x
s SQ SQT g SQ
1
2 2
Re Re
|

Note que SQT envolve a mdia y , e assim, temos n-1 graus de liberdade associados a
essa quantidade; s SQRe envolve duas estimativas, o e |
, e assim temos n-2 graus de

liberdade. Logo, para g SQRe temos n 1 (n - 2) = 1 grau de liberdade.
Conseqentemente, definimos quadrados mdios por

2
Re
Re ,
1
2
= =
=
n
s SQ
s QM S
n
SQT
QMT e
1
Re
Re
g SQ
g QM =

Onde, dessa forma, a razo dada por

s QM
g QM
F
Re
Re
=

a estatstica de teste para verificar a hiptese de interesse. Pode ser mostrado que F tem
distribuio de Fisher com 1 e n-2 graus de liberdade. Em resumo, construmos a tabela de
ANOVA para o modelo
i i i
e X Y + + = | o , dada por:

Fonte de
Variao
Grau de
Liberdade
Soma de
Quadrados
Quadrado
Mdio
F
Regresso 1 g SQRe g QM Re s QM g QM Re Re
Residual 2 n s SQRe s QM Re -
Total 1 n SQT QMT -

EXEMPLO 9.3: Para o Exemplo1, que estuda o ganho de peso de bovinos, a evidncia
estatstica a respeito da influncia da concentrao de X no ganho de peso obtida atravs do
teste de hiptese:
0 :
0
= | H contra 0 :
1
= | H .

Para obter os valores de g QM Re e s QM Re pode-se usar a planilha eletrnica.
Temos,
( ) 37 , 332 04 , 54 48 , 2
Re
2
1
2 2
= = =

=
n
i
i
x x g SQ |
177
( ) ; 34 , 12
Re
2
1
= =
=
n
i
i i
y y s SQ | o
em que as contas intermedirias so apresentadas na tabela a seguir.

i
( )
2
i i
y y | o
( )
2
x x
i

1 0,25 6,25
2 0,58 4,84
3 1,92 4,41
4 0,95 4,00
5 0,00 2,89
6 0,24 1,44
7 0,02 0,49
8 0,39 0,04
9 0,40 0,09
10 0,18 0,64
11 0,34 1,69
12 0,40 3,24
13 2,68 5,29
14 2,54 7,84
15 1,46 10,89
Total 12,34 54,04

A tabela da varincia para o modelo de regresso proposto fica

Fonte de
Variao
Grau de
Liberdade
Soma de
Quadrados
Quadrado
Mdio
F
Regresso 1 332,37 332,37 349,86
Residual 13 12,34 0,95
Total 14 344,71 24,62

O valor crtico obtido da distribuio de Fisher com 1 e 13 graus de liberdade. Nesse
caso, considerando um nvel de significncia o = 0,01 obtemos f = 9,07.

Como 86 , 349 =
obs
F pertence a RC, ento, rejeitamos a hiptese nula

e conclumos
que existem evidncias estatsticas de que a concentrao da substncia X altera o ganho de
peso.

f = 9,07
178

179

180
EXERCCIOS

1. Um estudo deseja avaliar o efeito de determinado treinamento no tempo de reao de
atletas. O treinamento consiste na repetio de certo movimento e uma amostra de 37
atletas foi utilizada no experimento. Para cada atleta, um certo nmero de repeties foi
atribudo, denotado por X e o tempo de reao denotado por Y, foi medido (em ms). Uma
reta de mnimos quadrados foi ajustada aos dados, fornecendo a equao.

n i x y
i i
, , 1 90 , 0 5 , 80 = =

Interprete as estimativas, dos parmetros do modelo, obtidas.

2. Para verificar o efeito da varivel X sobre a varivel Y, foi realizado um experimento, que
forneceu os pares ( )
i i
y x , dados por ( ) ( ) ( ) 9 , 15 ; 5 , 3 , 24 ; 7 , 3 , 13 ; 3 ,
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ). 6 , 4 ; 1 , 0 , 12 ; 2 , 6 , 32 ; 8 , 3 , 23 ; 5 , 5 , 14 ; 3 , 5 , 29 ; 7 , 6 , 29 ; 9 , 8 , 12 ; 2 Obtenha a reta
ajustada. Faa o diagrama de disperso baseando-se nos pares de valores fornecidos e
sobreponha reta ajustada. Baseando-se apenas no grfico voc diria que o ajuste
adequado?

3. Para verificar se existe relao entre a renda familiar (em salrios mnimos) e o nmero
de filhos, foi coletada uma amostra de 8 famlias em uma cidade. Os resultados obtidos
esto na tabela a seguir:

Renda Familiar
12 14 15 17 23 27 34 43
Filhos 3 2 2 1 1 0 0 0

a) Que concluses podem ser tiradas baseando-se em um diagrama de disperso e no
coeficiente de correlao?
b) Calcule a reta de mnimos quadrados e interprete os parmetros. Realize o teste
estatstico para verificar se a renda influi no nmero de filhos, considerando o = 5%.

4. Um estudo foi conduzido para verificar se as pessoas estimam os prrpios pesos
corretamente. No experimento realizado, 15 pessoas foram selecionadas ao acaso e a cada
uma delas perguntou-se os pesos, que depois foram aferidos em balanas devidamente
calibradas. Os resultados so apresentados a seguir:

Indivduo
Peso
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Estimado 82 58 69 70 54 62 92 75 45 81 78 65 56 63 70
Real 83 57 73 76 55 60 98 74 44 82 76 67 54 60 71

O que pode ser concludo a partir dos dados?

181
5. esperado que a massa muscular de uma pessoa diminua com a idade. Para estudar essa
relao, uma nutricionista selecionou 18 mulheres, com idade entre 40 e 79 anos, e
observou em cada uma delas a idade (X) e a massa muscular (Y).

Massa muscular (Y) Idade (X)
82.0 71.0
91.0 64.0
100.0 43.0
68.0 67.0
87.0 56.0
73.0 73.0
78.0 68.0
80.0 56.0
65.0 76.0
84.0 65.0
116.0 45.0
76.0 58.0
97.0 45.0
100.0 53.0
105.0 49.0
77.0 78.0
73.0 73.0
78.0 68.0

a) Construa o diagrama de disperso e interprete-o.
b) Ajuste uma reta de regresso para a relao entre as variveis Y: massa muscular
(dependente) e X: idade (independente).
c) Considerando a reta estimada dada no item (c), estime a massa muscular mdia de
mulheres com 50 anos

6. Um pesquisador deseja verificar se um instrumento para medir a concentrao de
determinada substncia no sangue est bem calibrado. Para isto, ele tomou 15 amostras
de concentraes conhecidas (X) e determinou a respectiva concentrao atravs do
instrumento (Y), obtendo:

X 2,0 2,0 2,0 4,0 4,0 4,0 6,0 6,0 6,0 8,0 8,0 8,0 10,0 10,0 10,0
Y 2,1 1,8 1,9 4,5 4,2 4,0 6,2 6,0 6,5 8,2 7,8 7,7 9,6 10,0 10,1

a) Construa o diagrama de disperso para esses dados.
b) Trace no grfico a reta com 45 de inclinao passando pela origem. Como essa reta
pode ser til na avaliao do instrumento?
c) Obtenha a reta de regresso da varivel Y em funo de X.
d) Com base nos itens anteriores tire concluses sobre a eficincia do instrumento.
182
Captulo 10

Tabelas e Figuras

A seguir esto todas as tabelas apresentadas nos captulos anteriores necessrias a
aplicao dos diversos mtodos estatsticos de anlise de dados.
183
Tabela 1 Valores tabulados da distribuio Normal

(continua)
z 0,09 0,08 0,07 0,06 0,05 0,04 0,03 0,02 0,01 0
...
-3,7 ... etc <0,00010 0,0001 0,00011
-3,6 0,00011 0,00012 0,00012 0,00013 0,00013 0,00014 0,00014 0,00015 0,00015 0,00016
-3,5 0,00017 0,00017 0,00018 0,00019 0,00019 0,0002 0,00021 0,00022 0,00022 0,00023
-3,4 0,00024 0,00025 0,00026 0,00027 0,00028 0,00029 0,0003 0,00031 0,00032 0,00034
-3,3 0,00035 0,00036 0,00038 0,00039 0,0004 0,00042 0,00043 0,00045 0,00047 0,00048
-3,2 0,0005 0,00052 0,00054 0,00056 0,00058 0,0006 0,00062 0,00064 0,00066 0,00069
-3,1 0,00071 0,00074 0,00076 0,00079 0,00082 0,00084 0,00087 0,0009 0,00094 0,00097
-3,0 0,001 0,00104 0,00107 0,00111 0,00114 0,00118 0,00122 0,00126 0,00131 0,00135
-2,9 0,00139 0,00144 0,00149 0,00154 0,00159 0,00164 0,00169 0,00175 0,00181 0,00187
-2,8 0,00193 0,00199 0,00205 0,00212 0,00219 0,00226 0,00233 0,0024 0,00248 0,00256
-2,7 0,00264 0,00272 0,0028 0,00289 0,00298 0,00307 0,00317 0,00326 0,00336 0,00347
-2,6 0,00357 0,00368 0,00379 0,00391 0,00402 0,00415 0,00427 0,0044 0,00453 0,00466
-2,5 0,0048 0,00494 0,00508 0,00523 0,00539 0,00554 0,0057 0,00587 0,00604 0,00621
-2,4 0,00639 0,00657 0,00676 0,00695 0,00714 0,00734 0,00755 0,00776 0,00798 0,0082
-2,3 0,00842 0,00866 0,00889 0,00914 0,00939 0,00964 0,0099 0,01017 0,01044 0,01072
-2,2 0,01101 0,0113 0,0116 0,01191 0,01222 0,01255 0,01287 0,01321 0,01355 0,0139
-2,1 0,01426 0,01463 0,015 0,01539 0,01578 0,01618 0,01659 0,017 0,01743 0,01786
-2,0 0,01831 0,01876 0,01923 0,0197 0,02018 0,02068 0,02118 0,02169 0,02222 0,02275
-1,9 0,0233 0,02385 0,02442 0,025 0,02559 0,02619 0,0268 0,02743 0,02807 0,02872
-1,8 0,02938 0,03005 0,03074 0,03144 0,03216 0,03288 0,03362 0,03438 0,03515 0,03593
-1,7 0,03673 0,03754 0,03836 0,0392 0,04006 0,04093 0,04182 0,04272 0,04363 0,04457
-1,6 0,04551 0,04648 0,04746 0,04846 0,04947 0,0505 0,05155 0,05262 0,0537 0,0548
-1,5 0,05592 0,05705 0,05821 0,05938 0,06057 0,06178 0,06301 0,06426 0,06552 0,06681
-1,4 0,06811 0,06944 0,07078 0,07215 0,07353 0,07493 0,07636 0,0778 0,07927 0,08076
-1,3 0,08226 0,08379 0,08534 0,08692 0,08851 0,09012 0,09176 0,09342 0,0951 0,0968
-1,2 0,09853 0,10027 0,10204 0,10383 0,10565 0,10749 0,10935 0,11123 0,11314 0,11507
-1,1 0,11702 0,119 0,121 0,12302 0,12507 0,12714 0,12924 0,13136 0,1335 0,13567
-1,0 0,13786 0,14007 0,14231 0,14457 0,14686 0,14917 0,15151 0,15386 0,15625 0,15866
-0,9 0,16109 0,16354 0,16602 0,16853 0,17106 0,17361 0,17619 0,17879 0,18141 0,18406
-0,8 0,18673 0,18943 0,19215 0,19489 0,19766 0,20045 0,20327 0,20611 0,20897 0,21186
-0,7 0,21476 0,2177 0,22065 0,22363 0,22663 0,22965 0,2327 0,23576 0,23885 0,24196
-0,6 0,2451 0,24825 0,25143 0,25463 0,25785 0,26109 0,26435 0,26763 0,27093 0,27425
-0,5 0,2776 0,28096 0,28434 0,28774 0,29116 0,2946 0,29806 0,30153 0,30503 0,30854
-0,4 0,31207 0,31561 0,31918 0,32276 0,32636 0,32997 0,3336 0,33724 0,3409 0,34458
-0,3 0,34827 0,35197 0,35569 0,35942 0,36317 0,36693 0,3707 0,37448 0,37828 0,38209
-0,2 0,38591 0,38974 0,39358 0,39743 0,40129 0,40517 0,40905 0,41294 0,41683 0,42074
-0,1 0,42465 0,42858 0,43251 0,43644 0,44038 0,44433 0,44828 0,45224 0,4562 0,46017
0 0,46414 0,46812 0,4721 0,47608 0,48006 0,48405 0,48803 0,49202 0,49601 0,5
z 0,09 0,08 0,07 0,06 0,05 0,04 0,03 0,02 0,01 0

184

Tabela 1 (continuao)

(concluso)
z 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0 0,5 0,50399 0,50798 0,51197 0,51595 0,51994 0,52392 0,5279 0,53188 0,53586
0,1 0,53983 0,5438 0,54776 0,55172 0,55567 0,55962 0,56356 0,56749 0,57142 0,57535
0,2 0,57926 0,58317 0,58706 0,59095 0,59483 0,59871 0,60257 0,60642 0,61026 0,61409
0,3 0,61791 0,62172 0,62552 0,6293 0,63307 0,63683 0,64058 0,64431 0,64803 0,65173
0,4 0,65542 0,6591 0,66276 0,6664 0,67003 0,67364 0,67724 0,68082 0,68439 0,68793
0,5 0,69146 0,69497 0,69847 0,70194 0,7054 0,70884 0,71226 0,71566 0,71904 0,7224
0,6 0,72575 0,72907 0,73237 0,73565 0,73891 0,74215 0,74537 0,74857 0,75175 0,7549
0,7 0,75804 0,76115 0,76424 0,7673 0,77035 0,77337 0,77637 0,77935 0,7823 0,78524
0,8 0,78814 0,79103 0,79389 0,79673 0,79955 0,80234 0,80511 0,80785 0,81057 0,81327
0,9 0,81594 0,81859 0,82121 0,82381 0,82639 0,82894 0,83147 0,83398 0,83646 0,83891
1,0 0,84134 0,84375 0,84614 0,84849 0,85083 0,85314 0,85543 0,85769 0,85993 0,86214
1,1 0,86433 0,8665 0,86864 0,87076 0,87286 0,87493 0,87698 0,879 0,881 0,88298
1,2 0,88493 0,88686 0,88877 0,89065 0,89251 0,89435 0,89617 0,89796 0,89973 0,90147
1,3 0,9032 0,9049 0,90658 0,90824 0,90988 0,91149 0,91308 0,91466 0,91621 0,91774
1,4 0,91924 0,92073 0,9222 0,92364 0,92507 0,92647 0,92785 0,92922 0,93056 0,93189
1,5 0,93319 0,93448 0,93574 0,93699 0,93822 0,93943 0,94062 0,94179 0,94295 0,94408
1,6 0,9452 0,9463 0,94738 0,94845 0,9495 0,95053 0,95154 0,95254 0,95352 0,95449
1,7 0,95543 0,95637 0,95728 0,95818 0,95907 0,95994 0,9608 0,96164 0,96246 0,96327
1,8 0,96407 0,96485 0,96562 0,96638 0,96712 0,96784 0,96856 0,96926 0,96995 0,97062
1,9 0,97128 0,97193 0,97257 0,9732 0,97381 0,97441 0,975 0,97558 0,97615 0,9767
2,0 0,97725 0,97778 0,97831 0,97882 0,97932 0,97982 0,9803 0,98077 0,98124 0,98169
2,1 0,98214 0,98257 0,983 0,98341 0,98382 0,98422 0,98461 0,985 0,98537 0,98574
2,2 0,9861 0,98645 0,98679 0,98713 0,98745 0,98778 0,98809 0,9884 0,9887 0,98899
2,3 0,98928 0,98956 0,98983 0,9901 0,99036 0,99061 0,99086 0,99111 0,99134 0,99158
2,4 0,9918 0,99202 0,99224 0,99245 0,99266 0,99286 0,99305 0,99324 0,99343 0,99361
2,5 0,99379 0,99396 0,99413 0,9943 0,99446 0,99461 0,99477 0,99492 0,99506 0,9952
2,6 0,99534 0,99547 0,9956 0,99573 0,99585 0,99598 0,99609 0,99621 0,99632 0,99643
2,7 0,99653 0,99664 0,99674 0,99683 0,99693 0,99702 0,99711 0,9972 0,99728 0,99736
2,8 0,99744 0,99752 0,9976 0,99767 0,99774 0,99781 0,99788 0,99795 0,99801 0,99807
2,9 0,99813 0,99819 0,99825 0,99831 0,99836 0,99841 0,99846 0,99851 0,99856 0,99861
3,0 0,99865 0,99869 0,99874 0,99878 0,99882 0,99886 0,99889 0,99893 0,99896 0,999
3,1 0,99903 0,99906 0,9991 0,99913 0,99916 0,99918 0,99921 0,99924 0,99926 0,99929
3,2 0,99931 0,99934 0,99936 0,99938 0,9994 0,99942 0,99944 0,99946 0,99948 0,9995
3,3 0,99952 0,99953 0,99955 0,99957 0,99958 0,9996 0,99961 0,99962 0,99964 0,99965
3,4 0,99966 0,99968 0,99969 0,9997 0,99971 0,99972 0,99973 0,99974 0,99975 0,99976
3,5 0,99977 0,99978 0,99978 0,99979 0,9998 0,99981 0,99981 0,99982 0,99983 0,99983
3,6 0,99984 0,99985 0,99985 0,99986 0,99986 0,99987 0,99987 0,99988 0,99988 0,99989
3,7 0,99989 0,9999 >0,99990 etc...
...
z 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
185
Tabela 2 Valores tabulados da distribuio Qui-Quadrado

o 0.995 0.975 0.9 0.5 0.1 0.05 0.025 0.01 0.005 0.001
1 0.000 0.001 0.016 0.455 2.706 3.841 5.024 6.635 7.879 10.827
2 0.010 0.051 0.211 1.386 4.605 5.991 7.378 9.210 10.597 13.815
3 0.072 0.216 0.584 2.366 6.251 7.815 9.348 11.345 12.838 16.266
4 0.207 0.484 1.064 3.357 7.779 9.488 11.143 13.277 14.860 18.466
5 0.412 0.831 1.610 4.351 9.236 11.070 12.832 15.086 16.750 20.515
6 0.676 1.237 2.204 5.348 10.645 12.592 14.449 16.812 18.548 22.457
7 0.989 1.690 2.833 6.346 12.017 14.067 16.013 18.475 20.278 24.321
8 1.344 2.180 3.490 7.344 13.362 15.507 17.535 20.090 21.955 26.124
9 1.735 2.700 4.168 8.343 14.684 16.919 19.023 21.666 23.589 27.877
10 2.156 3.247 4.865 9.342 15.987 18.307 20.483 23.209 25.188 29.588
11 2.603 3.816 5.578 10.341 17.275 19.675 21.920 24.725 26.757 31.264
12 3.074 4.404 6.304 11.340 18.549 21.026 23.337 26.217 28.300 32.909
13 3.565 5.009 7.041 12.340 19.812 22.362 24.736 27.688 29.819 34.527
14 4.075 5.629 7.790 13.339 21.064 23.685 26.119 29.141 31.319 36.124
15 4.601 6.262 8.547 14.339 22.307 24.996 27.488 30.578 32.801 37.698
16 5.142 6.908 9.312 15.338 23.542 26.296 28.845 32.000 34.267 39.252
17 5.697 7.564 10.085 16.338 24.769 27.587 30.191 33.409 35.718 40.791
18 6.265 8.231 10.865 17.338 25.989 28.869 31.526 34.805 37.156 42.312
19 6.844 8.907 11.651 18.338 27.204 30.144 32.852 36.191 38.582 43.819
20 7.434 9.591 12.443 19.337 28.412 31.410 34.170 37.566 39.997 45.314
21 8.034 10.283 13.240 20.337 29.615 32.671 35.479 38.932 41.401 46.796
22 8.643 10.982 14.041 21.337 30.813 33.924 36.781 40.289 42.796 48.268
23 9.260 11.689 14.848 22.337 32.007 35.172 38.076 41.638 44.181 49.728
24 9.886 12.401 15.659 23.337 33.196 36.415 39.364 42.980 45.558 51.179
25 10.520 13.120 16.473 24.337 34.382 37.652 40.646 44.314 46.928 52.619
26 11.160 13.844 17.292 25.336 35.563 38.885 41.923 45.642 48.290 54.051
27 11.808 14.573 18.114 26.336 36.741 40.113 43.195 46.963 49.645 55.475
28 12.461 15.308 18.939 27.336 37.916 41.337 44.461 48.278 50.994 56.892
29 13.121 16.047 19.768 28.336 39.087 42.557 45.722 49.588 52.335 58.301
30 13.787 16.791 20.599 29.336 40.256 43.773 46.979 50.892 53.672 59.702
40 20.707 24.433 29.051 39.335 51.805 55.758 59.342 63.691 66.766 73.403
50 27.991 32.357 37.689 49.335 63.167 67.505 71.420 76.154 79.490 86.660
60 35.534 40.482 46.459 59.335 74.397 79.082 83.298 88.379 91.952 99.608
70 43.275 48.758 55.329 69.334 85.527 90.531 95.023 100.425 104.215 112.317
80 51.172 57.153 64.278 79.334 96.578 101.879 106.629 112.329 116.321 124.839
90 59.196 65.647 73.291 89.334 107.565 113.145 118.136 124.116 128.299 137.208
100 67.328 74.222 82.358 99.334 118.498 124.342 129.561 135.807 140.170 149.449
120 83.852 91.573 100.624 119.334 140.233 146.567 152.211 158.950 163.648 173.618
186

Tabela 3 Valores tabulados da distribuio t-Student

o 0,2 0,15 0,1 0,05 0,025 0,02 0,015 0,01 0,005
GL 1,37638 1,96261 3,07768 6,31375 12,70615 15,89447 21,20505 31,82096 63,6559
2 1,06066 1,38621 1,88562 2,91999 4,30266 4,84873 5,6428 6,96455 9,92499
3 0,97847 1,24978 1,63775 2,35336 3,18245 3,48191 3,89606 4,54071 5,84085
4 0,94096 1,18957 1,53321 2,13185 2,77645 2,99853 3,29763 3,74694 4,60408
5 0,91954 1,15577 1,47588 2,01505 2,57058 2,75651 3,00288 3,36493 4,03212
6 0,9057 1,13416 1,43976 1,94318 2,44691 2,61224 2,82893 3,14267 3,70743
7 0,89603 1,11916 1,41492 1,89458 2,36462 2,51675 2,71457 2,99795 3,49948
8 0,88889 1,10815 1,39682 1,85955 2,30601 2,44899 2,63381 2,89647 3,35538
9 0,8834 1,09972 1,38303 1,83311 2,26216 2,39844 2,57381 2,82143 3,24984
10 0,87|906 1,09306 1,37218 1,81246 2,22814 2,35931 2,52749 2,76377 3,16926
11 0,87553 1,08767 1,36343 1,79588 2,20099 2,32814 2,49067 2,71808 3,10582
12 0,87261 1,08321 1,35622 1,78229 2,17881 2,30272 2,4607 2,68099 3,05454
13 0,87015 1,07947 1,35017 1,77093 2,16037 2,2816 2,43585 2,6503 3,01228
14 0,86805 1,07628 1,34503 1,76131 2,14479 2,26378 2,4149 2,62449 2,97685
15 0,86624 1,07353 1,34061 1,75305 2,13145 2,24854 2,39701 2,60248 2,94673
16 0,86467 1,07114 1,33676 1,74588 2,1199 2,23536 2,38155 2,58349 2,92079
17 0,86328 1,06903 1,33338 1,73961 2,10982 2,22384 2,36805 2,56694 2,89823
18 0,86205 1,06717 1,33039 1,73406 2,10092 2,2137 2,35618 2,55238 2,87844
19 0,86095 1,06551 1,32773 1,72913 2,09302 2,2047 2,34565 2,53948 2,86094
20 0,85996 1,06402 1,32534 1,72472 2,08596 2,19666 2,33625 2,52798 2,84534
21 0,85907 1,06267 1,32319 1,72074 2,07961 2,18943 2,32779 2,51765 2,83137
22 0,85827 1,06145 1,32124 1,71714 2,07388 2,18289 2,32016 2,50832 2,81876
23 0,85753 1,06034 1,31946 1,71387 2,06865 2,17696 2,31323 2,49987 2,80734
24 0,85686 1,05932 1,31784 1,71088 2,0639 2,17155 2,30692 2,49216 2,79695
25 0,85624 1,05838 1,31635 1,70814 2,05954 2,16659 2,30113 2,4851 2,78744
26 0,85567 1,05752 1,31497 1,70562 2,05553 2,16203 2,29581 2,47863 2,77872
27 0,85514 1,05673 1,3137 1,70329 2,05183 2,15782 2,29092 2,47266 2,77068
28 0,85465 1,05599 1,31253 1,70113 2,04841 2,15394 2,28638 2,46714 2,76326
29 0,85419 1,0553 1,31143 1,69913 2,04523 2,15033 2,28218 2,46202 2,75639
30 0,85377 1,05466 1,31042 1,69726 2,04227 2,14697 2,27827 2,45726 2,74998
35 0,85201 1,05202 1,30621 1,68957 2,03011 2,13316 2,26219 2,43772 2,72381
40 0,8507 1,05005 1,30308 1,68385 2,02107 2,12291 2,25027 2,42326 2,70446
45 0,84968 1,04852 1,30065 1,67943 2,0141 2,115 2,24109 2,41212 2,68959
50 0,84887 1,04729 1,29871 1,67591 2,00856 2,10872 2,23378 2,40327 2,67779
60 0,84765 1,04547 1,29582 1,67065 2,0003 2,09936 2,22292 2,39012 2,66027
70 0,84679 1,04417 1,29376 1,66692 1,99444 2,09273 2,21523 2,3808 2,6479
80 0,84614 1,04319 1,29222 1,66413 1,99007 2,08778 2,20949 2,37387 2,6387
90 0,84563 1,04244 1,29103 1,66196 1,98667 2,08394 2,20504 2,3685 2,63157
100 0,84523 1,04184 1,29008 1,66023 1,98397 2,08088 2,2015 2,36421 2,62589
110 0,8449 1,04134 1,2893 1,65882 1,98177 2,07839 2,1986 2,36072 2,62127
120 0,84463 1,04093 1,28865 1,65765 1,97993 2,07631 2,1962 2,35783 2,61742

0,84198 1,03697 1,2824 1,64638 1,96234 2,05643 2,17319 2,33008 2,58075
187
Tabela 4 Valores tabulados da distribuio F

(continua)
GL num.
GL den. p
1 2 3 4 5 6 7 8 9 10
0.100 39.86 49.50 53.59 55.83 57.24 58.20 58.91 59.44 59.86 60.19
0.050 161.45 199.50 215.71 224.58 230.16 233.99 236.77 238.88 240.54 241.88 1
0.010 4052.20 4999.30 5403.50 5624.30 5764.00 5859.00 5928.30 5981.00 6022.40 6055.90

0.100 8.53 9.00 9.16 9.24 9.29 9.33 9.35 9.37 9.38 9.39
0.050 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37 19.38 19.40 2
0.010 98.50 99.00 99.16 99.25 99.30 99.33 99.36 99.38 99.39 99.40

0.100 5.54 5.46 5.39 5.34 5.31 5.28 5.27 5.25 5.24 5.23
0.050 10.13 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.81 8.79 3
0.010 34.12 30.82 29.46 28.71 28.24 27.91 27.67 27.49 27.34 27.23

0.100 4.54 4.32 4.19 4.11 4.05 4.01 3.98 3.95 3.94 3.92
0.050 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5.96 4
0.010 21.20 18.00 16.69 15.98 15.52 15.21 14.98 14.80 14.66 14.55

0.100 4.06 3.78 3.62 3.52 3.45 3.40 3.37 3.34 3.32 3.30
0.050 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.77 4.74 5
0.010 16.26 13.27 12.06 11.39 10.97 10.67 10.46 10.29 10.16 10.05

0.100 3.78 3.46 3.29 3.18 3.11 3.05 3.01 2.98 2.96 2.94
0.050 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10 4.06 6
0.010 13.75 10.92 9.78 9.15 8.75 8.47 8.26 8.10 7.98 7.87

0.100 3.59 3.26 3.07 2.96 2.88 2.83 2.78 2.75 2.72 2.70
0.050 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 3.64 7
0.010 12.25 9.55 8.45 7.85 7.46 7.19 6.99 6.84 6.72 6.62

0.100 3.46 3.11 2.92 2.81 2.73 2.67 2.62 2.59 2.56 2.54
0.050 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39 3.35 8
0.010 11.26 8.65 7.59 7.01 6.63 6.37 6.18 6.03 5.91 5.81

188
Tabela 4 Valores tabulados da distribuio F

(concluso)
GL num.
GL den. p
1 2 3 4 5 6 7 8 9 10
0.100 3.36 3.01 2.81 2.69 2.61 2.55 2.51 2.47 2.44 2.42
0.050 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14 9
0.010 10.56 8.02 6.99 6.42 6.06 5.80 5.61 5.47 5.35 5.26

0.100 3.29 2.92 2.73 2.61 2.52 2.46 2.41 2.38 2.35 2.32
0.050 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02 2.98 10
0.010 10.04 7.56 6.55 5.99 5.64 5.39 5.20 5.06 4.94 4.85

0.100 3.18 2.81 2.61 2.48 2.39 2.33 2.28 2.24 2.21 2.19
0.050 4.75 3.89 3.49 3.26 3.11 3.00 2.91 2.85 2.80 2.75 12
0.010 9.33 6.93 5.95 5.41 5.06 4.82 4.64 4.50 4.39 4.30

0.100 3.10 2.73 2.52 2.39 2.31 2.24 2.19 2.15 2.12 2.10
0.050 4.60 3.74 3.34 3.11 2.96 2.85 2.76 2.70 2.65 2.60 14
0.010 8.86 6.51 5.56 5.04 4.69 4.46 4.28 4.14 4.03 3.94

0.100 3.05 2.67 2.46 2.33 2.24 2.18 2.13 2.09 2.06 2.03
0.050 4.49 3.63 3.24 3.01 2.85 2.74 2.66 2.59 2.54 2.49 16
0.010 8.53 6.23 5.29 4.77 4.44 4.20 4.03 3.89 3.78 3.69

0.100 3.01 2.62 2.42 2.29 2.20 2.13 2.08 2.04 2.00 1.98
0.050 4.41 3.55 3.16 2.93 2.77 2.66 2.58 2.51 2.46 2.41 18
0.010 8.29 6.01 5.09 4.58 4.25 4.01 3.84 3.71 3.60 3.51

0.100 2.97 2.59 2.38 2.25 2.16 2.09 2.04 2.00 1.96 1.94
0.050 4.35 3.49 3.10 2.87 2.71 2.60 2.51 2.45 2.39 2.35 20
0.010 8.10 5.85 4.94 4.43 4.10 3.87 3.70 3.56 3.46 3.37

0.100 2.84 2.44 2.23 2.09 2.00 1.93 1.87 1.83 1.79 1.76
0.050 4.08 3.23 2.84 2.61 2.45 2.34 2.25 2.18 2.12 2.08 40
0.010 7.31 5.18 4.31 3.83 3.51 3.29 3.12 2.99 2.89 2.80

189

Tabela 5 Valores tabulados do teste de Kolmogorov-Smirnov

Nvel de significncia para

n
0.20 0.15 0.10 0.05 0.01
1 0.900 0.925 0.950 0.975 0.995
2 0.684 0.726 0.776 0.842 0.929
3 0.565 0.597 0.642 0.708 0.828
4 0.494 0.525 0.564 0.624 0.733
5 0.446 0.474 0.510 0.565 0.669

6 0.410 0.436 0.470 0.521 0.618
7 0.381 0.405 0.438 0.486 0.577
8 0.358 0.381 0.411 0.457 0.543
9 0.339 0.360 0.388 0.432 0.514
10 0.322 0.342 0.368 0.410 0.490

11 0.307 0.326 0.352 0.391 0.468
12 0.295 0.313 0.338 0.375 0.450
13 0.284 0.302 0.325 0.361 0.433
14 0.274 0.292 0.314 0.349 0.418
15 0.266 0.283 0.304 0.338 0.404

16 0.258 0.274 0.295 0.328 0.392
17 0.250 0.266 0.286 3.180 0.381
18 0.244 0.259 0.278 0.309 0.371
19 0.237 0.252 0.272 0.301 0.363
20 0.231 0.246 0.264 0.294 0.356

25 0.210 0.220 0.240 0.270 0.320
30 0.190 0.200 0.220 0.240 0.290
35 0.180 0.190 0.210 0.230 0.270

>35
n
07 , 1

n
14 , 1

n
22 , 1

n
36 , 1

n
63 , 1

( ) ( )
obs esp
D mx F X F X =
190

Tabela 6 Valores tabulados do teste de Lilliefors

o
n
0,10 0,05 0,01
4 .352 .381 .417
5 .315 .337 .405
6 .294 .319 .364
7 .276 .300 .348
8 .261 .285 .331
9 .249 .271 .311
10 .239 .258 .294
11 .230 .249 .284
12 .223 .242 .275
13 .214 .234 .268
14 .207 .227 .261
15 .201 .220 .257
16 .195 .213 .250
17 .189 .206 .245
18 .184 .200 .239
19 .179 .195 .235
20 .174 .190 .231
25 .158 .173 .200
30 .144 .161 .187
>30
n
805 , 0
n
886 , 0
n
031 , 1

191

Tabela 7A Valores tabulados do teste U de Mann-Whitney

192

Tabela 7B Valores tabulados do teste U de Mann-Whitney

193

Tabela 7C Valores tabulados do teste U de Mann-Whitney

194

Tabela 7D Valores tabulados do teste U de Mann-Whitney

Valores crticos de U para uma prova unilateral com o = 0,001 e uma prova bilateral com o =0,002.

195
Tabela 7E Valores tabulados do teste U de Mann-Whitney


196
Tabela 7F Valores tabulados do teste U de Mann-Whitney


197

Tabela 7G Valores tabulados do teste U de Mann-Whitney


198

Tabela 8 Valores tabulados do teste de Wilcoxon

Nvel de significncia para teste unilateral
0.025 0.010 0.005
Nvel de significncia para teste bilateral
n
0.050 0.020 0.010
6 0 - -
7 2 0 -
8 4 2 0
9 6 3 2
10 8 5 3

11 11 7 5
12 14 10 7
13 17 13 10
14 21 16 13
15 25 20 16

16 30 24 20
17 35 28 23
18 40 33 28
19 46 38 32
20 52 43 38

21 59 49 43
22 66 56 49
23 73 62 55
24 81 69 61
25 89 77 68

199
Tabela 9A Valores tabulados do teste de Kruskal-Wallis.

n
1
n
2
n
3
H p n
1
n
2
n
3
H p
2 1 1 2.7000 0.500 4 3 2 6.4444 0.008
6.3000 0.011
2 2 1 3.6000 0.200 5.4444 0.046
5.4000 0.051
2 2 2 4.5714 0.067 4.5111 0.098
3.7143 0.200 4.4444 0.102

3 1 1 3.2000 0.300 4 3 3 6.7455 0.010
6.7091 0.013
3 2 1 4.2857 0.100 5.7909 0.046
3.8571 0.133 5.7273 0.050
4.7091 0.092
3 2 2 5.3752 0.029 4.7000 0.101
4.7143 0.048
4.5000 0.067 4 4 1 6.6667 0.010
4.4643 0.105 6.1667 0.022
4.9667 0.048
3 3 1 5.1429 0.043 4.8667 0.054
4.5714 0.100 4.1667 0.082
4.0000 0.129 4.0667 0.102

3 3 2 6.2500 0.011 4 4 2 7.0364 0.006
5.3611 0.032 6.8727 0.011
5.1389 0.061 5.4545 0.046
4.5556 0.100 5.2364 0.052
4.2500 0.121 4.5545 0.098
4.4455 0.103
3 3 3 7.2000 0.004
6.4889 0.011 4 4 3 7.1439 0.010
5.6889 0.029 7.1364 0.011
5.6000 0.050 5.5985 0.049
5.0667 0.086 5.5758 0.051
4.6222 0.100 4.5455 0.099
4.4773 0.102
4 1 1 3.5714 0.200
4 4 4 7.6538 0.008
4 2 1 4.8214 0.057 7.5385 0.011
4.5000 0.076 5.6923 0.049
4.0179 0.114 5.6538 0.054
4.6539 0.097
4 2 2 6.0000 0.014 4.5001 0.104
5.3330 0.033
5.1250 0.052 5 1 1 3.8571 0.143
4.4583 0.100
4.1667 0.105 5 2 1 5.2500 0.036
5.0000 0.048
4 3 1 5.8333 0.021 4.4500 0.071
5.2083 0.050 4.2000 0.095
5.0000 0.057 4.0500 0.119
4.0556 0.093
3.8889 0.129
200
Tabela 9B Valores tabulados do teste de Kruskal-Wallis.

n
1
n
2
n
3
H p n
1
n
2
n
3
H p
5 2 2 6.5333 0.008 5.6308 0.050
6.1333 0.013 4.5487 0.099
5.1600 0.034 4.5231 0.103
5.0400 0.056
4.3733 0.090 5 4 4 7.7604 0.009
4.2933 0.122 7.7440 0.011
5.6571 0.049
5 3 1 6.4000 0.012 5.6176 0.050
4.9600 0.048 4.6187 0.100
4.8711 0.052 4.5527 0.102
4.0178 0.095
3.8400 0.123 5 5 1 7.3091 0.009
6.8364 0.011
5 3 2 6.9091 0.009 5.1273 0.046
6.8218 0.010 4.9091 0.053
5.2509 0.049 4.1091 0.086
5.1055 0.052 4.0364 0.105
4.6509 0.091
4.4945 0.101 5 5 2 7.3385 0.010
7.2692 0.010
5 3 3 7.0788 0.009 5.3385 0.047
6.9818 0.011 5.2462 0.051
5.6485 0.049 4.6231 0.097
5.5152 0.051 4.5077 0.100
4.5333 0.097
4.4121 0.109 5 5 3 7.5780 0.010
7.5429 0.010
5 4 1 6.9545 0.008 5.7055 0.046
6.8400 0.011 5.6264 0.051
4.9855 0.044 4.5451 0.100
4.8600 0.056 4.5363 0.102
3.9873 0.098
3.9600 0.102 5 5 4 7.8229 0.010
7.7914 0.010
5 4 2 7.2045 0.009 5.6657 0.049
7.1182 0.010 5.6429 0.050
5.2727 0.049 4.5229 0.099
5.2682 0.050 4.5200 0.101
4.5409 0.098
4.5182 0.101 5 5 5 8.0000 0.009
7.9800 0.010
5 4 3 7.4449 0.010 5.7800 0.049
7.3949 0.011 5.6600 0.051
5.6564 0.049 4.5600 0.100
4.5000 0.102

201
Tabela 10A DMS para comparaes mltiplas baseadas no teste de Kruskal-Wallis

k = nmero de tratamento
n = nmero de observaes por tratamento

n DMS o n DMS o n DMS o
k=3 k=5 k=10
2 8 0,067 4 44 0,056 2 33 0,050
46 0,033 34 0,025
3 15 0,064 50 0,010 35 0,009
16 0,029
17 0,011 k=6 k=11
2 19 0,030 2 37 0,040
4 24 0,045 20 0,010 38 0,020
25 0,031 39 0,008
27 0,011 3 35 0,055
37 0,024 k=12
5 33 0,048 39 0,009 2 40 0,062
35 0,031 41 0,033
39 0,009 k=7 43 0,006
2 22 0,056
6 43 0,049 23 0,021 k=13
51 0,011 24 0,007 2 44 0,052
45 0,028
k=4 3 42 0,054 46 0,014
2 12 0,029 44 0,026
46 0,012 k=14
3 22 0,043 2 48 0,044
23 0,023 k=8 49 0,024
24 0,012 2 26 0,041 50 0,012
28 0,005
4 34 0,049 k=15
36 0,026 3 49 0,055 2 52 0,038
38 0,012 51 0,029 54 0,010
54 0,010
k=5
2 15 0,048 k=9
16 0,016 2 29 0,063
30 0,031
3 28 0,060 31 0,012
30 0,023
32 0,007

202

Tabela 10B Limites da distribuio de h no teste de Kruskal-Wallis.

n
1
n
2
n
3
h o n
1
n
2
n
3
h o n
1
n
2
n
3
h o
1 1 4 3,571 0,200 1 4 5 4,860 0,0856 2 3 3 3,778 0,200
4,986 0,044 4,556 0,108
1 1 5 3,857 0,143 6,840 0,011 5,139 0,061
6,954 0,008 5,556 0,026
1 2 2 3,600 0,200 7,364 0,005 6,250 0,011

1 2 3 3,524 0,200 1 5 5 2,946 0,227 2 3 4 3,311 0,203
4,286 0,100 3,236 0,108 3,444 0,197
4,036 0,105 4,444 0,102
1 2 4 3,161 0,190 4,109 0,086 4,511 0,098
4,018 0,114 4,909 0,053 5,400 0,051
4,821 0,057 5,127 0,046 5,444 0,046
6,836 0,011 6,300 0,011
1 2 5 3,333 0,190 7,309 0,009 6,444 0,008
4,200 0,095 7,746 0,005 7,000 0,005
5,000 0,048 8,182 0,002
5,250 0,036 2 3 5 3,386 0,201
2 2 2 3,714 0,200 3,414 0,193
1 3 3 3,286 0,157 4,571 0,867 4,494 0,101
4,571 0,100 4,651 0,091
4,200 0,095 2 2 3 3,750 0,219 5,106 0,052
5,000 0,048 3,929 0,181 5,251 0,049
5,143 0,043 4,464 0,105 6,822 0,010
5,250 0,036 4,500 0,067 6,909 0,009
4,714 0,048 6,949 0,006
1 3 4 3,208 0,200 5,357 0,029 7,182 0,004
4,056 0,093
5,208 0,050 2 2 4 3,458 0,210 2 3 6 5,227 0,052
5,833 0,021 3,667 0,190 5,348 0,046
4,458 0,100 6,061 0,026
1 3 5 3,218 0,190 5,125 0,052 6,136 0,023
4,018 0,095 5,500 0,024 6,727 0,011
4,871 0,052 6,000 0,014 6,970 0,009
4,960 0,048
6,400 0,012 2 2 5 3,333 0,206 2 4 4 3,354 0,210
3,360 0,196 3,464 0,192
1 4 4 3,000 0,222 4,293 0,122 4,446 0,103
3,267 0,178 4,373 0,090 4,554 0,098
4,067 0,102 5,040 0,056 5,236 0,052
4,867 0,054 6,133 0,013 5,454 0,046
4,967 0,048 6,533 0,008 6,546 0,020
6,682 0,010 6,873 0,011
2 2 6 5,016 0,050 7,036 0,006
1 4 5 3,000 0,208 5,345 0,038 7,854 0,002
3,087 0,194 5,527 0,036
3,960 0,102 5,745 0,021 2 4 5 3,364 0,200
3,982 0,098 6,545 0,011 4,518 0,101
6,854 0,008 4,541 0,098
5,268 0,051

203

Tabela 10C Limites da distribuio de h no teste de Kruskal-Wallis.

(continua)
n
1
n
2
n
3
h o n
1
n
2
n
3
h o n
1
n
2
n
3
h o
2 4 5 5,273 0,048 3 3 4 6,746 0,010 3 4 5 7,641 0,007
6,504 0,020 7,000 0,006 7,906 0,005
7,118 0,010 7,310 0,004 8,446 0,002
7,500 0,007 7,430 0,002 8,503 0,001
7,573 0,005 8,018 0,001 9,118 0,001
8,114 0,001
3 3 5 3,394 0,209 3 4 6 5,604 0,050
2 4 6 5,263 0,050 3,442 0,196 5,610 0,049
5,340 0,049 4,412 0,109 6,500 0,025
6,109 0,025 4,533 0,097 6,538 0,025
6,186 0,024 5,515 0,051 7,467 0,010
7,212 0,011 5,648 0,049 7,500 0,010
7,340 0,010 6,303 0,026
6,376 0,020 3 5 5 3,306 0,202
2 5 5 3,369 0,203 6,982 0,011 3,429 0,195
3,392 0,198 7,079 0,009 3,798 0,152
4,508 0,100 7,467 0,006 4,545 0,100
5,246 0,051 7,515 0,005 4,993 0,075
5,338 0,047 8,048 0,002 5,626 0,051
6,346 0,025 8,242 0,001 5,706 0,046
6,446 0,020 8,727 0,001 6,488 0,025
7,269 0,010 6,752 0,021
7,762 0,007 3 3 6 5,551 0,051 6,866 0,019
8,131 0,005 5,615 0,050 7,543 0,010
8,685 0,001 6,385 0,025 7,894 0,007
6,436 0,022 8,237 0,005
7,192 0,010 8,334 0,005
7,410 0,008 8,950 0,002
9,055 0,001
9,398 0,001

204

Tabela 10C Limites da distribuio de h no teste de Kruskal-Wallis.

(concluso)
n
1
n
2
n
3
h o n
1
n
2
n
3
h o n
1
n
2
n
3
h o
2 5 6 5,319 0,050 3 4 4 3,394 0,201 3 5 6 5,554 0,052
5,338 0,047 3,417 0,195 5,600 0,050
6,189 0,026 3,848 0,150 6,621 0,026
6,196 0,025 4,477 0,102 6,867 0,024
7,299 0,010 4,540 0,099 7,560 0,010
7,376 0,010 5,576 0,051 7,590 0,010
5,598 0,049
2 6 6 5,352 0,051 6,394 0,025 3 6 6 5,600 0,052
5,410 0,050 6,659 0,020 5,625 0,050
6,171 0,026 7,144 0,010 6,683 0,025
6,210 0,024 7,636 0,004 6,725 0,025
7,410 0,010 8,227 0,002 7,683 0,010
7,467 0,010 8,909 0,001 7,725 0,010

3 3 3 3,467 0,196 3 4 5 3,312 0,204 4 4 4 3,231 0,212
4,622 0,100 3,318 0,199 3,500 0,197
5,600 0,050 3,831 0,150 3,846 0,151
5,956 0,025 4,523 0,103 3,962 0,145
6,489 0,011 4,549 0,099 4,500 0,104
7,200 0,004 4,939 0,075 4,654 0,097
5,631 0,050
3 3 4 3,391 0,196 6,410 0,025
3,836 0,150 6,676 0,020
4,700 0,101 7,445 0,010
4,709 0,092
5,727 0,050
6,154 0,025

205

Tabela 10D Limites da distribuio de h no teste de Kruskal-Wallis.

n
1
n
2
n
3
h o n
1
n
2
n
3
h o n
1
n
2
n
3
h o
4 4 4 5,115 0,074 4 5 5 3,311 0,200 5 5 5 5,040 0,075
5,654 0,055 3,846 0,151 5,660 0,051
5,692 0,049 3,883 0,148 5,780 0,049
6,577 0,026 4,520 0,101 6,740 0,025
6,615 0,024 4,523 0,098 7,020 0,020
8,731 0,021 5,023 0,075 7,980 0,011
6,962 0,019 5,643 0,050 8,000 0,009
7,538 0,011 6,671 0,025 8,060 0,009
7,731 0,007 6,760 0,025 8,420 0,007
8,000 0,005 6,943 0,020 8,720 0,005
8,346 0,002 7,766 0,010 8,820 0,005
8,654 0,001 7,860 0,010 9,420 0,002
9,269 0,001 8,226 0,007 9,620 0,002
8,371 0,005 9,680 0,001
4 4 5 3,330 0,200 8,543 0,005 10,220 0,001
3,826 0,151 9,163 0,002
4,819 0,100 9,323 0,001 5 5 6 5,698 0,050
5,014 0,076 9,926 0,001 5,729 0,050
5,024 0,074 6,781 0,025
5,618 0,050 4 5 6 5,656 0,051 6,788 0,025
6,597 0,026 5,661 0,050 8,012 0,010
6,676 0,024 6,736 0,025 8,028 0,010
6,943 0,020 6,750 0,025
7,744 0,011 7,896 0,010 5 6 6 5,752 0,050
7,760 0,009 7,936 0,010 5,765 0,050
7,810 0,009 6,838 0,025
8,140 0,005 4 6 6 5,721 0,050 6,848 0,025
8,189 0,005 5,724 0,050 8,119 0,010
8,782 0,002 6,783 0,025 8,124 0,010
8,997 0,001 6,812 0,024
8,680 0,001 7,989 0,010 6 6 6 5,719 0,050
8,000 0,010 5,801 0,049
4 4 6 5,867 0,050 5,877 0,026
5,891 0,049 5 5 5 3,380 0,201 6,889 0,025
6,585 0,026 3,420 0,190 8,187 0,010
6,867 0,025 3,860 0,150 8,222 0,010
7,724 0,010 4,580 0,100
7,795 0,010

206

Tabela 10E DMS para comparaes mltiplas baseadas no teste de Kruskal-Wallis

k = nmero de amostras

k 0,20 0,10 0,05 0,01 0,001
2 1,812 2,326 2,772 3,643 4,654
3 2,424 2,902 3,314 4,120 5,063
4 2,784 3,240 3,633 4,403 5,309

5 3,037 3,478 3,858 4,603 5,484
6 3,232 3,661 4,030 4,757 5,619
7 3,369 3,808 4,170 4,882 5,730
8 3,520 3,931 4,286 4,987 5,823
9 3,632 4,037 4,386 5,078 5,903

10 3,730 4,129 4,474 5,157 5,973
11 3,817 4,211 4,552 5,227 6,036
12 3,895 4,285 4,622 5,290 6,092
13 3,966 4,351 4,685 5,348 6,144
14 4,030 4,412 4,743 5,400 6,191

15 4,089 4,468 4,796 5,448 6,234
16 4,144 4,519 4,845 5,493 6,274
17 4,195 4,568 4,891 5,535 6,312
18 4,242 4,612 4,934 5,574 6,347
19 4,287 4,654 4,974 5,611 6,380

20 4,328 4,694 5,012 5,645 6,411
22 4,405 4,767 5,081 5,709 6,468
24 4,474 4,632 5,144 5,766 6,520
26 4,537 4,892 5,201 5,818 6,568
28 4,595 4,947 5,253 5,866 6,611

30 4,648 4,997 5,301 5,910 6,651
32 4,697 5,044 5,346 5,952 6,688
34 4,743 5,087 5,388 5,990 6,723
36 4,786 5,128 5,427 6,026 6,756
38 4,826 5,166 5,463 6,060 6,787

40 4,864 5,202 5,498 6,092 6,816
50 5,026 5,357 5,646 6,228 6,940
60 5,155 5,480 5,764 6,338 7,041
70 5,262 5,582 5,863 6,429 7,124
80 5,353 5,669 5,947 6,507 7,198

90 5,433 5,745 6,020 6,575 7,258
100 4,503 5,812 6,085 6,636 7,314

207
Tabela 11A Probabilidades associadas ao teste de Friedman.

k=3
n=2 n=3 n=4 n=5 n=6 n=7 n=8 n=9
2
r
_
p
2
r
_
p
2
r
_
p
2
r
_
p
2
r
_
p
2
r
_
p
2
r
_
p
2
r
_
p
0.000 1.000 0.000 1.000 0.000 1.000 0.000 1.000 0.000 1.000 0.000 1.000 0.000 1.000 0.000 1.000
1.000 0.833 0.667 0.944 0.500 0.931 0.400 0.954 0.330 0.956 0.286 0.964 0.250 0.967 0.222 0.971
3.000 0.500 2.000 0.528 1.500 0.653 1.200 0.691 1.000 0.740 0.857 0.768 0.075 0.794 0.667 0.814
4.000 0.167 2.667 0.361 2.000 0.431 1.600 0.522 1.330 0.570 1.143 0.620 1.000 0.654 0.889 0.865
4.667 0.194 3.500 0.273 2.800 0.367 2.330 0.430 2.000 0.486 1.750 0.531 1.556 0.569
6.000 0.028 4.500 0.125 3.600 0.182 3.000 0.252 2.571 0.305 .2.25 0.355 2.000 0.398
6.000 0.069 4.800 0.124 4.000 0.184 3.429 0.237 3.000 0.285 2.667 0.328
6.500 0.042 5.200 0.093 4.330 0.142 3.714 0.192 3.250 0.236 2.889 0.278
8.000 0.005 6.400 0.039 5.330 0.072 4.571 0.112 4.000 0.149 3.556 0.187
7.600 0.024 6.330 0.052 5.429 0.085 4.750 0.120 4.222 0.154
8.400 0.009 7.000 0.029 6.000 0.052 5.250 0.079 4.667 0.107
10.000 0.000 8.330 0.012 7.143 0.027 6.250 0.047 5.556 0.069
9.000 0.008 7.714 0.021 6.750 0.038 6.000 0.057
9.330 0.006 8.000 0.016 7.000 0.030 6.222 0.048
10.330 0.002 8.857 0.008 7.750 .0.018 6.889 0.031
12.000 0.000 10.286 0.004 9.000 0.010 8.000 0.019
10.571 0.003 9.250 0.008 8.222 0.016
11.143 0.001 9.750 0.005 8.667 0.010
12.286 0.000 10.750 0.002 9.556 0.006
12.000 0.001 10.667 0.004
12.250 0.001 10.889 0.003
13.000 0.000 11.556 0.001
12.667 0.001
13.556 0.000

208

Tabela 11B Probabilidades associadas ao teste de Friedman.

k=4
n=2 n=3 n=4
2
r
_ p
2
r
_ p
2
r
_ p
0.000 1.000 0.200 1.000 0.000 1.000
0.600 0.958 0.600 0.958 0.300 0.992
1.200 0.834 1.000 0.910 0.600 0.928
1.800 0.792 1.800 0.727 0.900 0.900
2.400 0.625 2.200 0.608 1.200 0.800
3.000 0.542 2.600 0.524 1.500 0.754
3.600 0.458 3.400 0.446 1.800 0.677
4.200 0.375 3.800 0.342 2.100 0.649
4.800 0.208 4.200 0.300 2.400 0.524
5.400 0.167 5.000 0.207 2.700 0.508
6.000 0.042 5.400 0.175 3.000 0.432
5.800 0.148 3.300 0.389
6.600 0.075 3.600 0.355
7.000 0.054 3.900 0.324
7.400 0.033 4.500 0.242
8.200 0.017 4.800 0.200
9.000 0.002 5.100 0.190
5.400 0.158
5.700 0.141
6.000 0.105
6.300 0.094
6.600 0.077
6.900 0.068
7.200 0.054
7.500 0.052
7.800 0.036
8.100 0.033
8.400 0.019
8.700 0.014
9.300 0.012
9.600 0.007
9.900 0.006
10.200 0.003
10.800 0.002
11.100 0.001
12.000 0.000

209

Tabela 12 DMS para comparaes mltiplas baseadas no teste de Friedman.

k = nmero de tratamento
n = nmero de observaes por tratamento

(continua)
k=3 k=3 k=4
3 6 0.028 15 13 0.047 12 17 0.038
14 0.028 18 0.023
4 7 0.042 15 0.010 20 0.008
8 0.005
k=4 13 18 0.032
5 8 0.039 2 6 0.083 19 0.021
9 0.008 21 0.008
3 8 0.049
6 9 0.029 9 0.007 14 18 0.042
10 0.009 19 0.028
4 10 0.026 21 0.011
7 9 0.051 11 0.005
10 0.023 15 19 0.037
11 0.008 5 11 0.037 20 0.024
12 0.013 22 0.010
8 10 0.039
11 0.018 6 12 0.037 k=5
12 0.007 13 0.016
14 0.006 2 8 0.050
9 10 0.048
11 0.026 7 13 0.037 3 10 0.067
12 0.013 14 0.020 11 0.018
15 0.008 12 0.002
10 11 0.037
12 0.019 8 14 0.034 4 12 0.054
13 0.010 15 0.019 13 0.020
16 0.009 14 0.006
11 11 0.048
12 0.028 9 15 0.032 5 14 0.040
14 0.008 17 0.010 16 0.006

12 12 0.038 10 15 0.046 6 15 0.049
13 0.022 16 0.029 16 0.028
14 0.012 18 0.010 17 0.013

13 12 0.049 11 16 0.041 7 16 0.052
13 0.03 17 0.026 17 0.033
15 0.009 19 0.009 19 0.009

14 13 0.038 8 18 0.036
14 0.023 19 0.022
16 0.007 20 0.012

210

(continua)
k=5 k=6 k=7
9 19 0.037 8 22 0.039 7 24 0.047
20 0.024 23 0.026 25 0.032
22 0.008 25 0.008 27 0.011

10 20 0.038 9 23 0.043 26 0.041
21 0.025 24 0.03 28 0.03
23 0.009 26 0.012 29 0.011

11 21 0.038 10 24 0.047 27 0.05
22 0.025 26 0.023 29 0.026
24 0.01 28 0.009 31 0.011

12 22 0.038 11 26 0.036 29 0.042
23 0.025 27 0.026 30 0.031
25 0.011 29 0.012 33 0.01

13 23 0.035 12 27 0.039 30 0.049
24 0.024 28 0.028 32 0.027
26 0.011 31 0.009 35 0.009

14 24 0.034 13 28 0.039 32 0.04
25 0.024 29 0.028 33 0.03
27 0.011 32 0.01 36 0.011

15 24 0.045 14 29 0.04 33 0.043
26 0.022 30 0.03 35 0.025
28 0.01 33 0.011 38 0.009

k=6 15 30 0.04 34 0.047
2 10 0.033 32 0.023 36 0.028
34 0.012 39 0.011
3 13 0.03
14 0.008 k=7 36 0.038
2 12 0.024 37 0.03
4 15 0.047 41 0.009
16 0.018 3 15 0.048
17 0.006 16 0.016 k=8
14 0.018
5 17 0.047 4 18 0.04
18 0.022 20 0.007 17 0.067
19 0.01 18 0.027
5 20 0.052 19 0.009
19 0.04 21 0.028
6 20 0.021 22 0.014 21 0.036
21 0.01 23 0.007
6 22 0.05
7 20 0.049 23 0.032 23 0.057
21 0.032 25 0.009 24 0.034
23 0.01 26 0.009

211

(continua)
k=8 k=9 k=10
6 26 0.045 4 23 0.054 17 0.056
27 0.027 24 0.034 18 0.011
29 0.009 26 0.008
22 0.057
7 28 0.048 5 27 0.04 23 0.026
29 0.032 28 0.023 24 0.01
31 0.012 29 0.013
26 0.06
8 30 0.046 6 29 0.058 27 0.033
31 0.033 30 0.038 29 0.009
34 0.009 33 0.008
30 0.047
9 32 0.043 7 32 0.046 31 0.029
33 0.032 33 0.032 33 0.01
36 0.01 36 0.008
33 0.051
10 34 0.04 8 34 0.049 34 0.033
35 0.031 36 0.026 37 0.008
38 0.01 38 0.012
36 0.047
11 35 0.048 9 36 0.05 37 0.033
37 0.028 38 0.03 40 0.01
40 0.01 41 0.01
38 0.052
12 37 0.042 10 36 0.05 40 0.031
39 0.026 40 0.031 43 0.01
42 0.01 43 0.011
41 0.046
13 39 0.039 11 40 0.048 43 0.027
40 0.03 42 0.03 46 0.009
44 0.009 46 0.009
43 0.047
14 40 0.042 12 42 0.046 45 0.03
42 0.027 44 0.029 49 0.009
45 0.012 48 0.009
45 0.049
15 42 0.037 13 44 0.042 47 0.032
43 0.03 46 0.027 51 0.01
47 0.011 50 0.009
48 0.04
k=9 14 46 0.041 50 0.027
2 15 0.069 48 0.026 54 0.009
16 0.014 52 0.009
50 0.039
3 20 0.041 15 47 0.048 52 0.026
22 0.005 50 0.025 56 0.009
54 0.009
52 0.039
54 0.026
58 0.01
212

(continua)
k=10 k=11 k=12
15 53 0,045 13 55 0,046 11 56 0,043
56 0,026 57 0,031 58 0,029
60 0,010 62 0,010 62 0,011

k=11 14 57 0,045 12 58 0,048
2 19 0,045 60 0,026 61 0,027
20 0,009 64 0,011 65 0,011

3 25 0,038 15 59 0,046 13 61 0,043
27 0,007 62 0,027 63 0,030
67 0,009 68 0,010
4 29 0,057
30 0,033 k=18 14 63 0,046
32 0,010 2 21 0,038 68 0,027
22 0,008 71 0,009
5 33 0,055
34 0,035 3 27 0,053 15 66 0,040
37 0,008 28 0,027 68 0,028
29 0,012 73 0,011
6 37 0,045
38 0,030 4 32 0,055 k=13
41 0,008 33 0,033 2 23 0,032
35 0,011 23 0,006
7 40 0,049
41 0,035 5 37 0,042 3 30 0,038
44 0,011 38 0,027 32 0,009
40 0,011
8 43 0,046 4 35 0,054
44 0,035 6 40 0,059 36 0,033
48 0,009 42 0,028 38 0,012
45 0,008
9 46 0,043 5 40 0,049
47 0,034 7 44 0,050 41 0,033
51 0,009 46 0,026 44 0,009
49 0,009
10 48 0,047 6 44 0,054
50 0,031 8 47 0,050 46 0,027
54 0,009 49 0,030 49 0,009
52 0,011
11 51 0,040 7 48 0,051
53 0,027 9 50 0,048 50 0,028
57 0,009 52 0,032 53 0,010
56 0,010
12 53 0,043 8 52 0,046
55 0,029 10 53 0,047 53 0,035
59 0,011 55 0,032 57 0,010
59 0,010
213


(concluso)
k=13 k=14 k=15
9 55 0,048 7 52 0,053 5 47 0,046
57 0,030 54 0,030 48 0,033
61 0,010 57 0,012 51 0,010

10 58 0,047 8 56 0,051 6 52 0,047
60 0,032 58 0,031 53 0,035
61 0,009 62 0,010 57 0,009

11 61 0,046 9 60 0,047 7 56 0,055
63 0,032 62 0,029 58 0,032
68 0,010 66 0,010 62 0,010

12 64 0,045 10 63 0,048 8 60 0,056
66 0,032 65 0,033 63 0,027
71 0,010 70 0,010 67 0,008

14 69 0,046 11 66 0,049 9 64 0,052
72 0,028 69 0,029 67 0,028
77 0,010 74 0,009 71 0,011

15 72 0,040 12 69 0,048 10 68 0,049
74 0,030 72 0,030 71 0,028
80 0,010 77 0,010 75 0,011

k=14 13 72 0,047 11 72 0,043
2 25 0,027 75 0,030 74 0,032
26 0,005 80 0,011 79 0,011

3 32 0,052 14 75 0,045 12 75 0,045
33 0,028 78 0,028 76 0,028
35 0,008 84 0,009 83 0,010

4 38 0,053 15 78 0,043 13 78 0,046
39 0,034 81 0,028 81 0,030
41 0,013 87 0,010 87 0,009

5 43 0,057 k=15 14 81 0,046
45 0,027 2 26 0,071 84 0,030
47 0,012 27 0,024 90 0,010
28 0,005
6 48 0,050 15 84 0,043
50 0,026 3 35 0,039 87 0,029
53 0,009 37 0,010 94 0,09

4 41 0,053
42 0,035
45 0,008

214

Tabela 13 Valores da amplitude Studentizada (q) para uso no teste de Tukey para o=0,05

GL = graus de liberdade do denominador
K = nmero de grupos

(continua)
k GL
2 3 4 5 6 7 8 9 10 11
1 17,97 26,98 32,82 37,08 40,41 43,40 45,40 47,36 49,07 50,59
2 6,09 8,33 9,80 10,88 11,74 12,44 13,03 13,54 13,99 14,39
3 4,50 5,91 6,83 7,50 8,04 8,48 8,85 9,18 9,46 9,72
4 3,93 5,04 5,76 6,29 6,71 7,05 7,35 7,60 7,83 8,03
5 3,64 4,60 5,22 5,67 6,03 6,33 6,58 6,80 7,00 7,17
6 3,46 4,34 4,90 5,31 5,63 5,90 6,12 6,32 6,49 6,65
7 3,34 4,17 4,68 5,06 5,36 5,61 5,82 6,00 6,16 6,30
8 3,26 4,04 4,53 4,89 5,17 5,40 5,60 5,77 5,92 6,05
9 3,20 3,95 4,42 4,76 5,02 5,24 5,43 5,60 5,74 5,87
10 3,15 3,88 4,33 4,65 4,91 5,12 5,31 5,46 5,60 5,72
11 3,11 3,82 4,26 4,57 4,82 5,03 5,20 5,35 5,49 5,61
12 3,08 3,77 4,20 4,51 4,75 4,95 5,12 5,27 5,40 5,51
13 3,06 3,74 4,15 4,45 4,69 4,89 5,05 5,19 5,32 5,43
14 3,03 3,70 4,11 4,41 4,64 4,83 4,99 5,13 5,25 5,36
15 3,01 3,67 4,08 4,37 4,60 4,78 4,94 5,08 5,20 5,31
16 3,00 3,65 4,05 4,33 4,56 4,74 4,90 5,03 5,15 5,26
17 2,98 3,63 4,02 4,30 4,52 4,71 4,86 4,99 5,11 5,21
18 2,97 3,61 4,00 4,28 4,50 4,67 4,82 4,96 5,07 5,17
19 2,96 3,59 3,98 4,25 4,47 4,65 4,79 4,92 5,04 5,14
20 2,95 3,58 3,96 4,23 4,45 4,62 4,77 4,90 5,01 5,11
24 2,92 3,53 3,90 4,17 4,37 4,54 4,68 4,81 4,92 5,01
30 2,89 3,49 3,85 4,10 4,30 4,46 4,60 4,72 4,82 4,92
40 2,86 3,44 3,79 4,04 4,23 4,39 4,52 4,64 4,74 4,82
60 2,83 3,40 3,74 3,98 4,16 4,31 4,44 4,55 4,65 4,73
120 2,80 3,36 3,69 3,92 4,10 4,24 4,36 4,47 4,56 4,64
2,77 3,31 3,63 3,86 4,03 4,17 4,29 4,39 4,47 4,55

215
Tabela 13 Valores da amplitude Studentizada (q) para uso no teste de Tukey para o=0,05

GL = graus de liberdade do denominador
K = nmero de grupos

(concluso)
k GL
12 13 14 15 16 17 18 19 20
1 51,96 53,20 54,33 55,36 56,32 57,22 58,04 58,83 59,56
2 14,75 15,08 15,33 15,65 15,91 16,14 16,37 16,57 16,77
3 9,95 10,15 10,35 10,53 10,69 10,84 10,98 11,11 11,24
4 8,21 8,37 8,53 8,66 8,79 8,91 9,03 9,13 9,23
5 7,32 7,47 7,60 7,72 7,83 7,93 8,03 8,12 8,21
6 6,79 6,92 7,03 7,14 7,24 7,34 7,43 7,51 7,59
7 6,43 6,55 6,66 6,76 6,85 6,94 7,02 7,10 7,17
8 6,18 6,29 6,39 6,48 6,57 6,65 6,73 6,80 6,87
9 5,98 6,09 6,19 6,28 6,36 6,44 6,51 6,58 6,64
10 5,83 5,94 6,03 6,11 6,19 6,27 6,34 6,41 6,47
11 5,71 5,81 5,90 5,98 6,06 6,13 6,20 6,27 6,33
12 5,62 5,71 5,80 5,88 5,95 6,02 6,09 6,15 6,21
13 5,53 5,63 5,71 5,79 5,86 5,93 6,00 6,06 6,11
14 5,46 5,55 5,64 5,71 5,79 5,85 5,92 5,97 6,03
15 5,40 5,49 5,57 5,65 5,72 5,79 5,85 5,90 5,96
16 5,35 5,44 5,52 5,59 5,66 5,73 5,79 5,84 5,90
17 5,31 5,39 5,47 5,54 5,61 5,68 5,73 5,79 5,84
18 5,27 5,35 5,43 5,50 5,57 5,63 5,69 5,74 5,79
19 5,23 5,32 5,39 5,46 5,53 5,59 5,65 5,70 5,75
20 5,20 5,28 5,36 5,43 5,49 5,55 5,61 5,66 5,71
24 5,10 5,18 5,25 5,32 5,38 5,44 5,49 5,55 5,59
30 5,00 5,08 5,15 5,21 5,27 5,33 5,38 5,43 5,48
40 4,90 4,98 5,04 5,11 5,16 5,22 5,27 5,31 5,36
60 4,81 4,88 4,94 5,00 5,06 5,11 5,15 5,20 5,24
120 4,71 4,78 4,84 4,90 4,95 5,00 5,04 5,09 5,13
4,62 4,69 4,74 4,80 4,85 4,89 4,93 4,97 5,01

216

217

Apostila Estatística

Hochgeladen von

Dokumentinformationen

Originalbeschreibung:

Originaltitel

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Apostila Estatística

Hochgeladen von

Copyright:

Verfügbare Formate

FUNDAO OSWALDO CRUZ

CENTRO DE PESQUISAS AGGEU MAGALHES

=> o primeiro quartil igual segundo elemento da srie ordenada, que

=> o segundo quartil igual ao elemento 3,5 (entre o elemento3 e o

=> o terceiro quartil igual ao elemento 5 da srie ordenada, que

100 Amostra => CV

= ; quadrado mdio dentro; e

,2 om mdia 1 Poisson c ibuio de uma distr no seguem :Os dados H

padro o Normal distribui :X no tem H

o Normal distribui :X no tem H

eficiente foi mtodo novo O : H

grupos 3 os entre diferena alguma H : H

grupos 4 os entre diferena alguma H : H

grupos 3 os entre diferena alguma H : H

momentos 4 os entre diferena alguma H : H

. Temos que n = 15,

, e assim temos n-2 graus de

Das könnte Ihnen auch gefallen