Sie sind auf Seite 1von 51

Curso Tcnico em Meio Ambiente

Estatstica Ambiental
Cristiano Poleto

INSTITUTO FEDERAL DE
EDUCAO, CINCIA E TECNOLOGIA
RIO GRANDE DO SUL

CRISTIANO POLETO

ESCOLA TCNICA ABERTA DO BRASIL E-TEC BRASIL


CURSO TCNICO EM MEIO AMBIENTE
Disciplina: Estatstica Ambiental

ESCOLA TCNICA DA UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL


Porto Alegre RS
2008

Presidncia da Repblica Federativa do Brasil


Ministrio da Educao
Secretaria de Educao a Distncia
Escola Tcnica da Universidade Federal
do Rio Grande do Sul
Este Caderno foi elaborado em parceria entre
a Escola Tcnica da Universidade Federal do
Rio Grande do Sul e a Universidade Federal de
Santa Catarina para o Sistema Escola Tcnica
Aberta do Brasil e-Tec Brasil.
Equipe de Elaborao
Escola Tcnica da Universidade Federal do Rio
Grande do Sul
Coordenao Institucional
Eduardo Luiz Fonseca Benites/Escola Tcnica
da UFRGS
Professor-autor
Cristiano Poleto/Escola Tcnica da UFRGS

Comisso de Acompanhamento e
Validao
Universidade Federal de Santa Catarina
UFSC
Coordenao Institucional
Araci Hack Catapan/UFSC
Coordenao de Projeto
Silvia Modesto Nassar/UFSC
Coordenao de Design Instrucional
Beatriz Helena Dal Molin/UNIOESTE
Design Instrucional
Dris Roncarelli/UFSC
Mrcia Freire Rocha Cordeiro Machado/
ETUFPR
Web Design
Beatriz Wilges/UFSC
Projeto Grfico
Beatriz Helena Dal Molin/UNIOESTE
Araci Hack Catapan/UFSC
Elena Maria Mallmann/UFSC
Jorge Luiz Silva Hermenegildo/CEFET-SC
Mrcia Freire Rocha Cordeiro Machado/ETUFPR
Silvia Modesto Nassar/UFSC
Superviso de Projeto Grfico
Ana Carine Garca Montero/UFSC
Diagramao
Rafaela Wiele Anton/UFSC
Lus Henrique Lindner/UFSC
Bruno Csar B. S. de vila/UFSC
Juliana Passos Alves/UFSC
Reviso
Lcia Locatelli Flres/UFSC

Catalogao na fonte elaborada na DECTI da Biblioteca da UFSC


P765e Poleto, Cristiano
Estatstica ambiental / Cristiano Poleto. - Porto Alegre :
Escola Tcnica da Universidade Federal do Rio Grande do Sul, 2008.
49p. : il
Inclui bibliografia
Curso Tcnico em Meio Ambiente, desenvolvido pelo Programa
Escola Tcnica Aberta do Brasil.
1. Meio ambiente Estatstica. 2. Probabilidades. 3. Amostragem
(Estatstica). 4. Ensino distncia. I. Ttulo. II.Ttulo: Curso Tcnico em
Meio Ambiente.
CDU: 577.4:519.2

PROGRAMA E-TEC BRASIL


Amigo(a) estudante!
O Ministrio da Educao vem desenvolvendo Polticas e Programas para expanso da Educao Bsica e do Ensino Superior no Pas. Um dos caminhos encontrados para que essa expanso se efetive com maior rapidez e eficincia a modalidade a
distncia. No mundo inteiro so milhes os estudantes que frequentam cursos a distncia. Aqui no Brasil, so mais de 300 mil os matriculados em cursos regulares de Ensino
Mdio e Superior a distncia, oferecidos por instituies pblicas e privadas de ensino.
Em 2005, o MEC implantou o Sistema Universidade Aberta do Brasil (UAB),
hoje, consolidado como o maior programa nacional de formao de professores, em
nvel superior.
Para expanso e melhoria da educao profissional e fortalecimento do Ensino
Mdio, o MEC est implementando o Programa Escola Tcnica Aberta do Brasil (e-Tec
Brasil). Espera, assim, oferecer aos jovens das periferias dos grandes centros urbanos
e dos municpios do interior do Pas oportunidades para maior escolaridade, melhores
condies de insero no mundo do trabalho e, dessa forma, com elevado potencial
para o desenvolvimento produtivo regional.
O e-Tec resultado de uma parceria entre a Secretaria de Educao Profissional e Tecnolgica (SETEC), a Secretaria de Educao a Distncia (SEED) do Ministrio da
Educao, as universidades e escolas tcnicas estaduais e federais.
O Programa apia a oferta de cursos tcnicos de nvel mdio por parte das escolas pblicas de educao profissional federais, estaduais, municipais e, por outro lado,
a adequao da infra-estrutura de escolas pblicas estaduais e municipais.
Do primeiro Edital do e-Tec Brasil participaram 430 proponentes de adequao
de escolas e 74 instituies de ensino tcnico, as quais propuseram 147 cursos tcnicos
de nvel mdio, abrangendo 14 reas profissionais. O resultado desse Edital contemplou
193 escolas em 20 unidades federativas. A perspectiva do Programa que sejam ofertadas 10.000 vagas, em 250 polos, at 2010.
Assim, a modalidade de Educao a Distncia oferece nova interface para a
mais expressiva expanso da rede federal de educao tecnolgica dos ltimos anos: a
construo dos novos centros federais (CEFETs), a organizao dos Institutos Federais
de Educao Tecnolgica (IFETs) e de seus campi.
O Programa e-Tec Brasil vai sendo desenhado na construo coletiva e participao ativa nas aes de democratizao e expanso da educao profissional no Pas,
valendo-se dos pilares da educao a distncia, sustentados pela formao continuada
de professores e pela utilizao dos recursos tecnolgicos disponveis.
A equipe que coordena o Programa e-Tec Brasil lhe deseja sucesso na sua formao profissional e na sua caminhada no curso a distncia em que est matriculado(a).
Braslia, Ministrio da Educao setembro de 2008.

SUMRIO
APRESENTAO 

PALAVRAS DO PROFESSOR-AUTOR

PROJETO INSTRUCIONAL

CONES E LEGENDAS

10

UNIDADE 1 INTRODUO

13

UNIDADE 2 PROBABILIDADE, AMOSTRAGEM E DISTRIBUIO

27

UNIDADE 3 TESTE DE HIPTESES E SIGNIFICNCIA ESTATSTICA

35

UNIDADE 4 CORRELAES BIVARIADAS

37

UNIDADE 5 REGRESSO LINEAR

41

UNIDADE 6 ANLISE FATORIAL

45

REFERNCIAS

47

GLOSSRIO

48

CURRCULO SINTTICO DO PROFESSOR-AUTOR

49

Apresentao

APRESENTAO
A Estatstica a rea do conhecimento humano que utiliza teorias
probabilsticas para explicar eventos, estudos e experimentos; portanto
uma cincia que se desenvolve atravs do uso de dados empricos. Tem
como objetivos a obteno, a organizao e anlise de dados, e a determinao de correlaes que sejam capazes de descrever e explicar o que
ocorreu e possibilitar uma previso de futuras ocorrncias.
Aplicabilidade da Estatstica
O papel da Estatstica na investigao cientfica vai alm de indicar
a seqncia de clculos a serem realizados com os dados obtidos. No planejamento, ela auxilia na escolha das situaes experimentais e na determinao da quantidade de indivduos a serem examinados. Na anlise dos
dados, indica tcnicas para resumir e apresentar as informaes, bem como
para comparar as situaes experimentais. Na elaborao das concluses,
os vrios mtodos estatsticos permitem generalizar a partir dos resultados

O que um experimento?
A essncia de um experimento
est em nos habilitar a comparar
os efeitos que dois ou mais
tratamentos tm sobre
alguns atributos das plantas,
dos animais ou de qualquer
outro material experimental.
Para que as comparaes sejam
vlidas, preciso que o material
a ser submetido a tratamentos
diferentes seja escolhido
sem qualquer predisposio.
O experimento, para ser
vlido, deve no s fornecer
informaes sobre a natureza
e a magnitude dos efeitos
aparentes, mas tambm permitir
uma estimativa de variabilidade
(HEATH, 1981).

obtidos. De um modo geral, no existe certeza sobre a correo das concluses cientficas. No entanto, os mtodos estatsticos permitem determinar
a margem de erro associada s concluses, com base no conhecimento da
variabilidade observada nos resultados (CALLEGARI-JACQUES, 2004).

Para compreender melhor a


aplicabilidade da estatstica,
acesse o link abaixo para
assistir a um vdeo de como
realizar uma pesquisa utilizando
a estatstica como uma
ferramenta:
http://br.youtube.com/watch?v=
GtL17QiqfOs&feature=related

Elabore uma lista de outros


tipos de pesquisas, nas quais
a utilizao da estatstica seja
possvel.

Estatstica Ambiental - Curso Tcnico em Meio Ambente

PALAVRAS DO PROFESSOR-AUTOR
Parabns e sejam bem-vindos disciplina de Estatstica Ambiental!
Essa disciplina aborda os principais tpicos da rea com a finalidade de auxiliar estudos de consistncia e interpretao de dados obtidos
atravs de estudos ambientais e de sade.
A Estatstica Ambiental pode ser utilizada como um instrumento
para validao de materiais, estudos de clima, estudos populacionais ou de
produtos. Alm disso, a Estatstica a base para a comprovao de vrios
estudos e teorias nas reas de biologia, qumica e engenharias.
Os conceitos adquiridos nessa disciplina podero ser utilizados em
diversos estudos ambientais, em prticas de laboratrio e nos resultados de
trabalhos de campo que sero desenvolvidas nas disciplinas de Bioindicadores, Geoprocessamento, Geografia Aplicada, Gesto de Recursos Hdricos e
Anlise de Impacto Ambiental.
As mdias e os exerccios propostos ao longo do material serviro
de apoio e devem ser utilizados para que os seus conhecimentos sejam mais
consistentes e aprofundados.
Sucesso e bons estudos!

Cristiano Poleto

PROJETO INSTRUCIONAL
MATERIAL
IMPRESSO

RECURSOS
DIGITAIS

Texto contendo
a Introduo e
as palavras do
professor.

Vdeo sobre a utilizao da Estatstica em pesquisas


cientficas.

01 hora

Aula expositiva
disponibilizada
em PowerPoint.

Apresentar
de forma simplificada o que e
para que serva
a Estatstica em
estudos ambientais.

Elaborao,
pelos estudantes
de uma lista de
possibilidades
de utilizao da
estatstica.

Descrio dos
tpicos bsicos
sobre Estatstica
Descritiva.

Hipertexto e vdeos abordando


os principais itens
da unidade.

05 horas

Apresentar
as principais
maneiras de
se tratar os
dados obtidos
por meio de
pesquisas quantitativas.

Aula expositiva
disponibilizada
em PowerPoint.
Utilizao de
textos, vdeos
e exerccios
resolvidos.

Resoluo
de exerccios
aplicados a dados
ambientais.

Apresentao
dos principais tpicos
relacionados
Probabilidade,
Amostragem e
Distribuio.

Hipertexto e vdeos abordando


os principais itens
da unidade.

05 horas

Aula expositiva
disponibilizada
em PowerPoint.
Utilizao de
textos, vdeos
e exerccios
resolvidos.

Resoluo
de exerccios
aplicados a dados
ambientais.

Analisar dados,
realizando estudos estatsticos
capazes de
generalizar e
obter concluses sobre uma
determinada
populao.

Elaborao de
um Teste de
Hipteses e
Significncia
Estatstica.

Hipertexto com
exerccios resolvidos.

05 horas

Conduzir a aplicao dos conhecimentos de


probabilidade
e distribuio
amostral para
realizar testes
de hipteses.

Aula expositiva
disponibilizada
em PowerPoint.
Utilizao de
textos, vdeos
e exerccios
resolvidos.

Resoluo de
exerccios aplicados a dados gerados por outras
disciplinas.

Verificar se existe um relacionamento entre


duas variveis
em estudo.

Apresentao
de anlises
sobre relaes
de Correlaes
Bivariadas.

Hipertexto abordando correlao


atravs do uso de
um software.

03 horas

Aula expositiva
disponibilizada
em PowerPoint.
Utilizao de
exerccios resolvidos.

Resoluo de
exerccios aplicados a dados gerados por outras
disciplinas.

Apresentar
como obtida
uma relao
de causa-efeito
entre duas
variveis quantitativas.

Mostra como se
obtm uma Regresso Linear
Simples.

Hipertexto sobre
Regresso Linear
Simples.

03 horas

Aula expositiva
disponibilizada
em PowerPoint.
Utilizao de
exerccios resolvidos.

Resoluo de
exerccios aplicados a dados gerados por outras
disciplinas.

Apresentar uma
extenso da
anlise multivariada.

Apresentao
da anlise de
componentes
principais e anlise de fatores.

Hipertexto
abordando os
principais itens
da unidade.

03 horas

Aula expositiva
disponibilizada
em PowerPoint.
Utilizao de textos e exerccios
resolvidos.

Resoluo de
exerccios aplicados a dados gerados por outras
disciplinas.

UNIDADE

OBJETIVOS

CARGA
HORRIA

ESTRATGIAS

Estatstica Ambiental - Curso Tcnico em Meio Ambente

ATIVIDADES DE
AVALIAO

CONES E LEGENDAS
Caro estudante! Oferecemos para seu conhecimento os cones e
sua legenda que fazem parte da coluna de indexao. A intimidade com estes e com o sentido de sua presena no caderno ajudar voc a compreender melhor as atividades e exerccios propostos (DAL MOLIN, et al.,2008).
Saiba mais
Este cone apontar para atividades complementares ou
para informaes importantes sobre o assunto. Tais inEx: http://www.
etecbrasil.mec.
gov.br

formaes ou textos complementares podem ser encontrados na fonte referenciada junto ao cone.

Para refletir...
Toda vez que este cone aparecer na coluna de indexao
indicar um questionamento a ser respondido, uma ativiEx: Analise o
caso... dentro
deste tema e
compare com...,
Assista ao filme...

dade de aproximao ao contexto no qual voc vive ou


participa, resultando na apresentao de exemplos cotidianos ou links com seu campo de atuao.

Mdias integradas
Quando este cone for indicado em uma dada unidade
significa que voc est sendo convidado a fazer atividades
que empreguem diferentes mdias, ou seja, participar do
ambiente AVEA, assistir e comentar um filme, um videoEx.: Assista
ao filme... e
comente-o.

clipe, ler um jornal, comentar uma reportagem, participar


de um chat, de um frum, enfim, trabalhar com diferentes
meios de comunicao.

10

Cristiano Poleto

Avaliao
Este cone indica uma atividade que ser avaliada dentro
de critrios especficos da unidade.

Lembre-se

A presena deste cone ao lado de um trecho do texto indiEx.: O canal de


satlite deve ser
reservado com
antecedncia
junto
Embratel.

car que aquele contedo significa algo fundamental para


a aprendizagem.

Destaque
A presena do retngulo de fundo
Retngulo com fundo colorido.

indicar trechos importantes do


texto, destacados para maior fixao do contedo.

Estatstica Ambiental - Curso Tcnico em Meio Ambente

11

Introduo

UNIDADE 1 INTRODUO
1.1 Objetivo de aprendizagem
Descrever estatisticamente os dados obtidos por meio de pesquisas
quantitavas.
1.2 Amostras e populao
Uma populao pode ser um grupo distinto de pessoas ou seres
vivos (homens, mulheres, pessoas destras, etc.) ou de objetos inanimados
(carros, computadores, etc.).
Uma amostra simplesmente uma seleo de alguns elementos de
uma determinada populao.
1.3 Variveis
As variveis so caractersticas a respeito dos mais diferentes fenmenos que podem ser mensurados (resultados possveis de um fenmeno).

1.3.1 Variveis qualitativas


So aquelas que fornecem dados de natureza no numrica (de-

importante identificar que tipo


de varivel est sendo estudada,
uma vez que procedimentos
estatsticos diferentes so
recomendados em cada
situao. A principal diviso
ocorre entre variveis qualitativas
e quantitativas.

notam categorias de respostas). Exemplos: Cor de uma flor, raa de um


animal, sexo de um paciente, etc.

1.3.2 Variveis quantitativas


So aquelas em que os dados so valores numricos que expressam quantidades, como a estatura das pessoas, nveis de metais pesados
em animais ou o nmero de sementes integradas em uma vagem. Elas po-

Acesse no link abaixo, a um


material complementar sobre
Dados, Tabelas e Grficos.
Aproveite para visualizar os
exemplos disponibilizados nesse
material.
http://alea-estp.ine.pt/html/
nocoes/html/cap3_1_i.html

dem ainda ser classificadas em:


a) Variveis quantitativas discretas: decorrem da contagem do
nmero de itens de uma populao, assumindo em geral, nmeros reais inteiros como possveis resultados. Por exemplo: nmero
de espcies encontradas num ecossistema, nmero de dias secos
(sem chuva) em determinada regio, nmero de testes que indica-

De um modo geral, as medies


do origem a variveis contnuas
e as contagens ou enumeraes,
a variveis discretas.

ram nveis de poluio acima do padro pr-estabelecido, etc.;


b) Variveis quantitativas contnuas: so aquelas cujos dados podem apresentar qualquer valor dentro de um intervalo de variao
possvel. Por exemplo: medies pluviomtricas, concentraes
qumicas, temperaturas, etc.

Estatstica Ambiental - Curso Tcnico em Meio Ambente

13

Introduo
1.4 Apresentao de dados (grficos e tabelas)
Os componentes mais importantes de uma tabela so:
--ttulo: explica o que a tabela contm ou expe;
--corpo: parte da tabela composta por linhas e colunas;
--cabealho: especifica o contedo das colunas;
Uma boa organizao dos
dados, para posterior anlise,
fundamental para facilitar a sua
interpretao.

--rodap: o espao onde so colocadas as notas de natureza informativa (fonte, notas e chamadas).
Ttulo
Cabealho
Corpo
Rodap

Tabela com distribuio de freqncia por ponto: A cada valor da varivel associam-se as freqncias.
Exemplo: Considere os valores seguintes representando a concentrao de um metal no sangue (g/ml) de 15 indivduos, de uma cidade X
num determinado ano.
X = 20 20 21 21 21 22 23 23 24 24 22 20 22 20 21
c) Identifique a populao:
Resposta: Indivduos de uma cidade X.
d) Identifique a amostra:
Resposta: 15 Indivduos de uma cidade X.
e) Identifique a varivel:
Resposta: concentrao de um metal no sangue.
f) Construa uma tabela para estes dados:
Resposta:

14

Cristiano Poleto

Introduo
Concentrao de um metal no sangue (g/ml) de 15 indivduos de
uma cidade X

Concentrao de metal

Nmero de
indivduos

19

26,67

20

26,67

21

20,00

22

13,33

23

13,33

Total

15

100

e) Construa dois grficos para estes dados (usar grfico de colunas


e de barras):
Obs.: Grficos de colunas e de
barras podem ser utilizados para
representar qualquer tipo de
varivel.

Grfico de colunas
Co nce n trao de um m e tal no s an gue (g/m l) de 15 in divduos
de uma cidade X

5
4
3
4

22

23

0
19

20

21

C o n c e n tr a o d e m e ta l ( g / m l )

Grfico de barras
Conce ntr ao de um m e tal n o s an gue (g/m l) de 15
indivduo s de u m a cidade X
23

22

2
3

21
20

19

N m e ro d e in d ivd u o s

Estatstica Ambiental - Curso Tcnico em Meio Ambente

15

Introduo
Tabela com distribuio de freqncia por classes (ou intervalo): Quando a varivel estudada assumir uma quantidade de valores distintos muito grande, recomenda-se o agrupamento por classes.
Exemplo: Os dados abaixo referem-se s precipitaes (mm), de
uma amostra de 15 cidades, que ocorreram no ms de agosto de 2005:
Como construir a tabela com
distribuio de freqncia por
classes:
- Determinar o valor mximo
(Vmx.), valor mnimo (Vmn.) e
a amplitude total (Vmx- Vmn);
- Determinar o nmero de
classes (K) que dado por
Sturges 1+3,3.log(n), onde n o
tamanho da amostra;
- Dividir a amplitude total pelo
nmero de classes desejado
(tamanho do intervalo pulo).

35

26

39

25

39

21

40

16

32

39

23

15

27

44

50

a) Quem a populao alvo desde estudo?


Resposta: Precipitaes que ocorreram no ms de agosto de
2005.
b) Construa uma tabela com 5 classes.
Precipitao (mm) em 15 cidades no ms de agosto
Precipitao(mm)

Nmero de cidades

15|---22

20

22|---29

26,67

29|---36

13,33

36|---43

26,67

43|---50

13,33

Total

15

100

Sobre o exerccio ao lado:


Qual a amostra estudada do
exerccio ao lado?
Resposta: 15 cidades.
Qual a varivel de estudo?
Resposta: Precipitaes (mm).

c) Histograma
P r e c ip it a o ( m m ) e m 1 5 c id a d e s n o m s d e
a g o s to

Obs.: Histogramas s devem


ser utilizados para representar
variveis quantitativas agrupadas
por classes.

4
3
3

2
1
0
1 5 |---2 2

2 2 |---2 9

2 9 |---3 6

3 6 |---4 3

P re c i p i ta e s (m m )

16

Cristiano Poleto

4 3 |---|5 0

Introduo
1.5 Medidas de tendncia central ou de posio
As medidas de tendncia central so as formas mais comumente
encontradas da estatstica descritiva. Uma medida de tendncia central de
um conjunto de dados ou amostra pode fornecer uma boa indicao sobre
as informaes de uma populao.
Mdia Aritmtica simples (mdia): a soma de todos os valores
de uma varivel dividida pelo nmero total de observaes (no disposto em
distribuio de freqncia).
Notao:

mdia populacional

x mdia amostral

Para saber mais, acesse o site


abaixo para ver uma animao
sobre Mdia e Mediana:
http://matefixe.blogspot.com/
search/label/Estatstica

xi

x=

Frmula:

importante que seja dada


uma maior nfase nos seguintes
tpicos:
- Mdia;
- Mediana;
- Moda;
- Mdia da populao;
- Erro amostral.

n , onde:

= somatrio; xi = varivel em estudo;


n = tamanho da amostra.
Exemplo: Considere o nmero de amostras de gua coletadas no
perodo de 1 ano em 5 corpos dgua.

42

43

36

32

40

Sobre o exerccio ao lado:


Qual a amostra?
Resposta: 5 corpos dgua.

Determine:

Qual a varivel?
Resposta: Nmero de amostras
de gua coletadas.

a) Qual a mdia?
Resposta:

x=

42 + 43 + 36 + 32 + 40
= 38,6
5

Mdia Ponderada: usada para clculos em que os valores dados


tm pesos diferentes. o mtodo apropriado para distribuio de freqncia por ponto ou por intervalo.
Frmula: x =

xi f i

, onde:

xi a varivel em estudo;
fi a freqncia absoluta (repeties associadas a cada valor de xi)
e para a distribuio por intervalo usa-se:
xi = (Ii + Li)/2, onde:
xi a varivel em estudo;

Estatstica Ambiental - Curso Tcnico em Meio Ambente

17

Introduo
Ii = limite inferior;
Li = limite superior.
Exemplo: A tabela abaixo apresenta a distribuio do nmero de
anlises dirias realizadas por 79 funcionrios de um determinado laboratrio.
Nmero de

Nmero de

anlises

funcionrios

3,8

10

23

29,1

15

43

54,4

20

10

12,7

Total

79

100

Resposta:
%

xi.fi

3,8

15

10

23

29,1

230

15

43

54,4

645

20

10

12,7

200

Total

79

100

1090

Nmero de an-

Nmero de fun-

lises (xi)

cionrios (fi)

A Mdia Ponderada pode


ser apresentada para dados
agrupados por pontos, como no
exemplo ao lado.

Sobre o exerccio ao lado:


Qual a amostra?
Resposta: 79 funcionrios.
Qual a varivel?
Resposta: Nmero de anlises.

a) Calcule a mdia.
Resposta: x =

15 + 230 + 645 + 200


= 13,8
79

Outra possibilidade a utilizao da Mdia Ponderada para dados agrupados em classes.


Exemplo: A tabela abaixo apresenta o tempo de durao (dias)
para se realizar anlises granulomtricas de solos em 28 laboratrios credenciados em todo o Brasil.

18

Cristiano Poleto

Tempo (dias)

N de anlises

4 |-- 6

20

71,4

6 |-- 8

10,7

8 |-- 10

17,9

Total

28

100

Introduo
Resposta:
Tempo (dias) (xi)

N de anlises(fi)

xi.fi

4 |-- 6

20

71,4

100

6 |-- 8

10,7

21

8 |-- 10

17,9

45

Total

28

100

166

Qual a amostra?
Resposta: 28 anlises
granulomtricas.
Qual a varivel?
Resposta: Tempo em dias.

a) Calcule a mdia.
Resposta: x =

Sobre o exerccio ao lado:

100 + 21 + 45
= 5,9
28

Mediana: uma medida de posio; encontra-se exatamente no


centro de um conjunto de dados.
Notao: md
Para calcular, pode-se seguir a ordem abaixo:

Acesse o site abaixo e saiba mais


sobre Mediana:
http://pt.wikipedia.org/wiki/
Mediana_(estatstica)

1) Ordenar o conjunto de dados em ordem crescente;


2) Encontrar a posio da mediana:
se n for par P.md = n/2
se n for impar P.md = (n + 1) / 2
Exemplo: Considere o Carbono Orgnico Total (COT) em g/kg de 6
amostras de solos: 89 89 90 92 100 120. Calcule a mediana (md).
Resposta: n=6, logo P.md = n/2 = 6/2 = 3
Pega-se a 3 e 4 posies: md= (90+92)/2 = 91 g/kg
Moda: o valor que ocorre com maior freqncia entre os dados.
Moda e mediana para dados agrupados por classes
(ou intervalo)
Para o clculo da Moda pode-se utilizar o Mtodo de Czuber que
considerado o mtodo mais preciso.

M o = li + c

Veja mais detalhes sobre Moda


no link abaixo:
http://pt.wikipedia.org/wiki/
Moda_(estatstica)

f mo f ant
, onde:
2. f mo ( f ant + f post )

li = Limite inferior da classe modal; c = Tamanho do intervalo de


classe; fmo = Freqncia absoluta da classe modal; fant = Freqncia absoluta
anterior classe modal; fpost = Freqncia absoluta posterior classe modal.
Estatstica Ambiental - Curso Tcnico em Meio Ambente

19

Introduo

Para o clculo da mediana pode-se seguir os seguintes passos:


1) Determina-se as freqncias acumuladas;
2) Calcula-se o Pmd =

n
;
2

3) Marca-se a classe correspondente freqncia acumulada imen


diatamente superior a classe mediana e, em seguida, emprega-se a fr2
mula:
n
Fant
Md= l + c 2
, onde:
i
f Md
li = Limite inferior da classe mediana;

c = Tamanho do intervalo de classe;


n
= posio da mediana, onde n o tamanho da amostra;
2
fant = Freqncia acumulada anterior classe mediana;

fMd = Freqncia absoluta da classe mediana.


Exemplo: As anlises de pH de 100 amostras de efluentes industriais de uma determinada empresa obteve os seguintes resultados.

pH

20

Cristiano Poleto

nmero de
amostras

2|---4

25

4|---6

35

6|---8

20

8|---10

15

10|---12

Total

100

Introduo
a) Calcule a moda e a mediana.
Resposta:
pH

Fi

nmero de
amostras

2|---4

25

25

4|---6

35

60

6|---8

20

80

8|---10

15

95

10|---12

100

Total

100

360

Determinao da classe modal (classe com maior freqncia absoluta): 4 |----6


Na seqncia, calcula-se:

M o = li + c

f mo f ant
= 4 + 2
2. f mo ( f ant + f post )

35 25
2 35 (25 + 20)

= 4,8

Para a determinao da mediana:


1) Determina-se as freqncias acumuladas;
2) Calcula-se Pmd =

n
= 50 posio;
2

3) Marca-se a classe correspondente freqncia acumulada imen


diatamente superior a classe mediana (4 |----6) e, em seguida, emprega-se
2
a frmula:

n
Fant
50 25
2
= 4 + 2
= 5,4
Md = l i + c
35
f Md
1.6 Grficos circulares ou de Setores (Pizza)
a representao grfica da freqncia relativa (percentagem) de
cada categoria da varivel. Este grfico utilizado, preferencialmente, para
representar variveis qualitativas. No se recomenda a sua utilizao quando a varivel assumir muitas categorias de respostas distintas.
A construo do grfico de setores segue uma regra de trs simples, onde as freqncias de cada classe correspondem ao ngulo que se
deseja representar em relao freqncia total que representa o total de
360.

Obs.: Uma das melhores formas


de se analisar e explorar os
dados de uma pesquisa atravs
de tcnicas grficas.
Assim, sugere-se a utilizao de
outras ferramentas grficas, tais
como:
- Histograma de freqncias;
- Diagrama de box plot.

Exemplo: A tabela a seguir apresenta o nmero de peixes contaminados e no-contaminados com PCBs em um determinado lago.
Estatstica Ambiental - Curso Tcnico em Meio Ambente

21

Introduo

As suas principais caractersticas


so:
- a rea do grfico equivale
totalidade de casos (360 =
100%);
- cada fatia representa
a percentagem de cada
categoria.

Para saber mais sobre os tipos


de grficos utilizados em
estatstica, veja o vdeo postado
no site abaixo:

Peixes

Amostras

Contaminados

32

38

No-contaminados

52

62

Total

84

100

Resposta:

No
Contaminados
62%

Contaminados
38%

http://br.youtube.com/watch?v=
ZRnwhwfsK_w&feature=related

1.7 Variao ou disperso de distribuies


Apenas as medidas de tendncia central so insuficientes para representar de forma adequada todos os conjuntos de dados, pois no so
Embora a amplitude total seja
de fcil soluo, esta medida
muito limitada, pois s
utiliza os valores extremos,
independentemente da forma
que se distribuem os demais
valores.

capazes de revelar a sua variabilidade.


Amplitude total (At): A amplitude total a diferena entre o maior
e o menor valor de um conjunto de dados.

At = Vmx - Vmn
Exemplo: Considere a concentrao de poluentes em 10 amostras
de um determinado rio.
15

20

17

30

40

35

23

37

17

Calcule a amplitude total para as 10 amostras.


Resposta: Vmx = 37 e Vmn = 15

At = Vmx Vmn = 37 15 = 22

22

Cristiano Poleto

20

Introduo

Amplitude total para dados agrupados por classes (ou intervalo)


Neste caso, a amplitude total a diferena entre o limite superior
da ltima classe e o limite inferior da primeira classe, isto :
At = Li - li
Exemplo: Foram analisadas 30 amostras do rio Paranapanema,
em diferentes pontos de coleta, para avaliar a concentrao de um tipo de
poluente. Os resultados foram agrupados em uma tabela de distribuio de
freqncias por classes, como a apresentada a seguir.
Concentrao

Nmero de amostras

10|---20

15

20|---30

10

30|---40

40|---50

50|---60

Geralmente faz-se uso da


amplitude total quando se
quer determinar a amplitude
da temperatura em um dia ou
de um determinado ano, no
controle de qualidade de um
processo ou como uma medida
de clculo rpido.

a) Determine a amplitude.
Resposta: At = 60 10 = 50
Varincia Absoluta
Notao: S2
Frmula: S2 =

xi = varivel;

(x

- x)

n -1

, onde:

x = mdia;
n = tamanho da amostra.
Exemplo: Os dados abaixo representam as concentraes de alumnio (mg/kg) de amostras de 4 solos.

400

350

450 300

Sobre o exerccio ao lado:


Qual a amostra?
Resposta: 4 solos.

a) Calcule a varincia.
Resposta:

S2 =

(400 375) + (350 - 375) + (450 - 375) + (300 - 375)


2

4 1

= 4166

Estatstica Ambiental - Curso Tcnico em Meio Ambente

Qual a varivel?
Resposta: Concentrao de
alumnio.

23

Introduo
1.8 Desvio-padro
Notao: S

S 2 (raiz quadrada da varincia)

Frmula: S =
Para saber mais, acesse o link
abaixo e veja um vdeo sobre
Mdia e Desvio-padro:
http://br.youtube.com/
watch?v=8X9apoqlbgs

Exemplo: Utilizando os dados do exemplo anterior, calcule o desvio-padro da amostra.

S 2 = 64,55

Resposta: S =

Portanto, a concentrao mdia de alumnio de 375 mg/kg com


uma variao de 64,55.
1.9 Varincia e desvio-padro para dados agrupados
Para dados agrupados, calcula-se a varincia com a seguinte equao:
Quanto ao desvio-padro para
dados agrupados, utiliza-se a
mesma frmula apresentada
anteriormente (S =

S2

S2 =

).

(x

- x) f i
2

n -1

Exemplo: A tabela a seguir apresenta o nmero de microorganismos encontrados em amostras de comida industrializada.
Nmero de

Nmero de

microorganismos

indstrias

33,3

41,7

25

Total

12

100

a) Calcule a mdia e o desvio padro.


Resposta:
Nmero de
microorganismos (xi)

24

Nmero de
indstrias (fi)

xi.fi

(xi- x )2.fi

33,3

20

3,2

41,7

30

0,05

25

21

3,6

Total

12

100

71

6,85

Cristiano Poleto

Introduo
x=

71
= 5,9;
12

S2 =

6,85
= 0,62;
11

S = 0,62 = 0,8

1.10 Coeficiente de variao (CV)


a relao percentual que o desvio-padro tem sobre a mdia
Frmula: CV =

S
100 , onde:
x

S = Desvio-padro; x = mdia.
Exemplo: Utilizando os dados do exemplo anterior, calcule o
Coeficiente de Variao (CV).
Resposta: CV =

0,8
100 = 13,56%
5,9

1.11 Varivel reduzida ou padronizada

Acesse o site abaixo e veja mais


sobre Coeficiente de Variao:
http://pt.wikipedia.org/wiki/
Coeficiente_de_variao

Mede a magnitude do desvio-padro em relao mdia


(dados atpicos Z>3).
Frmula: Z =

xi - x
, onde:
S

Z = nmero de desvios (S) a contar da mdia;


S = Desvio-padro;
xi = varivel em estudo;
x = mdia.
Exemplo: Com os dados do exemplo anterior, calcule a varivel
reduzida (Z).
Resposta: Z1 =

Z2 =

5 5,9
= - 1,125 desvios
0,8

7 5,9
6 5,9
= 1,3755 desvios
= 0,125 desvios e Z3 =
0,8
0,8

Estatstica Ambiental - Curso Tcnico em Meio Ambente

Para praticar e verificar se


voc compreendeu todos os
conceitos, refaa todos os
exerccios resolvidos desta
Unidade.

25

UNIDADE 2 PROBABILIDADE, AMOSTRAGEM E


DISTRIBUIO

Probabilidade,
Amostragem e
Distribuio

2.1 Objetivo de aprendizagem


Compreender o processo de anlise de dados por meio de estudos
estatsticos capazes de generalizar e obter concluses sobre uma determinada populao.
2.2 Probabilidade
Existe no nosso cotidiano uma srie de situaes de incerteza, das
quais, embora no saibamos efetivamente o que vai ocorrer, pode-se listar
os resultados possveis e suas respectivas probabilidades. Costumamos cha-

Para se entender os estudos


estatsticos, necessrio que
haja uma boa compreenso
do conceito de probabilidade.
Assim, deve-se dar uma maior
nfase nos tpicos abaixo:
- probabilidades condicionadas;
- aplicabilidade da probabilidade.

mar estas situaes de incerteza de fenmenos aleatrios.


Experimento aleatrio: qualquer fenmeno aleatrio que possa ser executado pelo homem.
Espao amostral (S): o conjunto de todos os possveis resultados de um experimento.
2.3 Estudos de Probabilidade

P(A) =

Nmero de eventos favorveis a "A"


Total de possveis resultados

Exemplo: Lanamento de um dado com S = {1, 2, 3, 4, 5, 6}

1
--P(1) =
= 0,17 = 17% (Probabilidade de sair o nmero 1)
6
1
--P(6) =
= 0,17 = 17% (Probabilidade de sair o nmero 6)
6

So as seguintes as propriedades
que devem ser respeitadas:
0 % e,
P( A) = 100% - P(A), onde:
P( A) = Probabilidade de no

acontecer.

--P(face par) = = 0,5 = 50% (Probabilidade de sair uma face par)


--P(mltiplo de 3) = = 0,33 = 33% (Probabilidade de sair um mltiplo de 3)
Operaes com probabilidade: so os estudos mais comumente

Acesse o site abaixo e assista ao


vdeo sobre probabilidade que
utiliza moedas como exemplo.
http://br.youtube.com/watch?v=
vPDI8Gz4saY&feature=related

encontrados e podem ser descritos como dois eventos independentes (A e


B):

P( A e B) = P( A) P( B)
P( A ou B) = P( A) + P( B)

Estatstica Ambiental - Curso Tcnico em Meio Ambente

27

Probabilidade,
Amostragem e
Distribuio

Exemplo: A probabilidade de um homem ter artrite daqui a 30


anos 30% e de sua mulher 40%. Qual a probabilidade de que daqui a
30 anos:
a) Ambos tenham artrite?
Resposta: P(H e M) = 0,3 x 0,4 = 0,12 = 12%
b) Somente a mulher tenha artrite?
Resposta: P(H e M) = 0,7 x 0,4 = 0,28 = 28%
c) Ambos no tenham artrite?
Resposta: P(H e M) = 0,7 x 0,6 = 0,42 = 42 %
d) Pelo menos 1 deles tenha artrite?
Resposta: P(H e M) ou P(H e M) ou P(H e M)
0,12 + 0,18 + 0,28 = 0,58 = 58%
Probabilidade condicional: A probabilidade dita condicional
quando a probabilidade de um evento depende da condio em que ele
est sendo considerado.
Exemplo: Faa os estudos de probabilidade para os dados referentes ao sexo versus aquisio de planos de sade.
Sexo

Plano de Sade (p.s.)

Total

Sim

No

Masculino

240

414

654

Feminino

323

100

423

Total

563

514

1077

a) Qual a probabilidade de se ter plano de sade (p.s.)?


Resposta: P(p.s.) =

563
= 0,52 = 52%
1077

b) Qual a probabilidade de um homem ter plano de sade?


Resposta: P(p.s./H) =

240
= 0,37 = 37%
654

c) Qual a probabilidade de uma mulher ter plano de sade?


Resposta: P(p.s./M) =

28

Cristiano Poleto

323
= 0,76 = 76 %
423

Probabilidade,
Amostragem e
Distribuio

2.4 Distribuio binomial


Utiliza-se o termo binomial para designar situaes em que os resultados de uma varivel aleatria possam ser agrupados em:
Sucesso ou Fracasso que ocorrem independentemente.
Modelo binomial

P( X = x) = Cnx . p x .(1 - p)n- x , onde:

Cnx =

n!
x!(n - x)!

Exemplo: A probabilidade de erros em leituras de coliformes fecais


de 10% em 5 placas selecionadas para contagem; qual a probabilidade
de:
a) 1 leitura estar errada?
Resposta: P(x = 1) = C51.0,11.0,94 = 0,33 = 33%

A distribuio binomial til


para determinar a probabilidade
de um certo nmero de sucessos
num conjunto de observaes e
segue estas determinaes:
- o experimento consiste em n
tentativas em iguais condies;
- cada tentativa tem dois
possveis resultados Sucesso ou
Fracasso;
- as probabilidades de
Sucesso (p) e Fracasso (1-p)
permanecem constantes.

b) 3 leituras estarem erradas?


Resposta: P(x = 3) = C51.0,11.0,94 = 0,008 = 0,8%
c) Todas as leituras estarem erradas?
1
1
4
Resposta: P(x = 5) = C5 .0,1 .0,9 = 0,00001 = 0,001%

d) Todas as leituras estarem corretas?


Resposta: P(x = 0) = C51.0,11.0,94 = 0,59 = 59 %

Veja como utilizar uma planilha


de Excel para clculos de uma
distribuio binomial no link
abaixo:
http://br.youtube.com/
watch?v=kbbP_sxclNE

2.5 Distribuio de Poisson


A distribuio de Poisson descreve as probabilidades do nmero
de ocorrncias num campo ou intervalo contnuo (em geral espao ou tempo).
Deve-se admitir que exista uma taxa mdia constante dada em
ocorrncia por unidades chamada de (lambda).

- x
Modelo Poisson: P( X = x) = e . , onde:
x!

So exemplos de variveis que


seguem uma distribuio de
Poisson: nmero de acidentes
por dia, nmero de telefonemas
por hora, nmero de defeitos
por metro, etc.

= n.p
Exemplo: Uma mquina produz 9 pipetas defeituosas a cada 1000
peas produzidas. Calcule a probabilidade de que em um lote com 200 pipetas ocorram:

Estatstica Ambiental - Curso Tcnico em Meio Ambente

29

Probabilidade,
Amostragem e
Distribuio

a) 2 defeituosas.
1,8

.1,82 = 0,26 = 26 %
2!

Resposta: P(x=2) = e
b) Nenhuma defeituosa.
Resposta: P(x=0) =

1,8

.1,82
= 0,16 = 16 %
2!

c) 1 defeituosa.
Resposta: P(x=1) =

1,8

.1,82
= 0,288 = 28,8 %
2!

2.6 Distribuio normal


A distribuio Normal uma das distribuies mais importantes.
Para que uma populao possa ser assim classificada, esta dever apre muito importante saber a
forma com que os dados se
distribuem, pois muitos testes
estatsticos s so vlidos se os
dados se distribuem de uma
determinada maneira.

sentar caractersticas de simetria em torno da mdia, as caudas devem encontrarem o eixo x no infinito, e a mdia, a mediana e a moda devem ser
coincidentes.
Considere uma varivel aleatria x com mdia e desvio padro
que apresenta as seguintes caractersticas:
-- simtrica em torno da mdia;
--prolonga-se de - a +;
--sua rea total 100%;
--sua distribuio de probabilidade produz uma curva em forma de
sino.
Nm e r o de a n lis e s x Nm e r o de dia s
60
50
50
40
30
20

20

20
10

0
8 0 0 |---9 0 0

9 0 0 | ---1 0 0 0

1 0 0 0 |---1 1 0 0

1 1 0 0 |---1 2 0 0

1 2 0 0 |---|1 3 0 0

N m e r o d e a n l i se s

Figura 2.1 Grfico de colunas do nmero de dias versus nmero de anlises que segue uma Distribuio Normal.

A rea sob a curva entre a mdia e um ponto arbitrrio (Figura 2.2)


funo do nmero de desvios-padro entre a mdia e aquele ponto.

30

Cristiano Poleto

Probabilidade,
Amostragem e
Distribuio

99,73%
95,44
68,26

Acesse ao link abaixo para ver


um vdeo sobre como se forma
uma curva Normal:
http://br.youtube.com/
watch?v=BMJGZuB1HCE
-3

-2

-1

mdia

+1

+ 2

+ 3

Figura 2.2 Exemplo de uma curva de Distribuio Normal

Para o clculo da probabilidade na curva normal, usa-se:

x-

Onde:
z = nmero de desvios () a contar da mdia;
x = valor arbitrado, diferente da mdia;

= mdia da distribuio normal;


= desvio-padro.
Calculado o valor de z, acha-se na tabela (em anexo) a probabilidade de que ocorra certo resultado entre dois pontos (limites), como se pode
observar na tabela abaixo.

rea entre a
mdia e Z

rea

1,00

0,3413

1,65

0,4505

1,96

0,4750

2,00

0,4772

Exemplo: O consumo de gua de uma comunidade tem distribuio Normal com mdia de 1000 litros e desvio-padro de 200 litros. Calcule
a probabilidade de um indivduo desta comunidade ter um consumo:
a) Inferior a 800 litros.
Resposta: Z = -1, logo P(x<800) = 0,158655 = 15,86 %
b) Inferior a 1300 litros.
Resposta: Z=1,5, logo P(x<1300) = 0,933193 = 93,31%

Estatstica Ambiental - Curso Tcnico em Meio Ambente

31

Probabilidade,
Amostragem e
Distribuio

c) Superior a 1100 litros.


Resposta: Z= 0,5, logo P(x < 1100) = 0,3085 = 30,85%
d) Entre 900 e 1200 litros.
Resposta: Z1 = -0,5 e Z2 = 1, logo P(900<x<1200) = 0,53 = 53 %
Distribuio normal padro: Os tpicos anteriores abordaram a
importncia de se identificar a forma de distribuio e se esta uma distribuio normal. A distribuio normal padro uma forma de distribuio
normal com mdia igual a 0 e desvio-padro igual a 1. Essa distribuio
muito importante, pois permite que se estabeleam comparaes entre
valores de amostras diferentes e valores de uma mesma amostra.
Distribuio amostral: A distribuio amostral calculada a partir da retirada do maior nmero possvel de amostras de uma dada populao.
Intervalos de confiana e erro-padro: Os intervalos de confiana so estimativas intervalares como, por exemplo, em relao mdia
de uma amostra, na qual estes so capazes de fornecer um raio de valores
(ou intervalo) em torno da mdia amostral. Este intervalo viabiliza a constatao com uma determinada confiana, se a mdia populacional est contida, ou no, em sua abrangncia.
Distribuio de mdias amostrais: uma distribuio de probabilidade que indica o quanto provveis so diversas mdias amostrais;
uma distribuio em funo da mdia, do desvio-padro da populao e do
tamanho da amostra, ou seja, para cada combinao desses trs elementos
haver uma nica distribuio amostral de mdias amostrais.
Segundo o Teorema do Limite Central, a mdia e, por conseqncia, a soma de n valores amostrais tende a seguir o modelo normal, independentemente da distribuio de origem que tais valores assumem. Portanto, a mdia das mdias amostrais igual mdia dos valores individuais,
e o desvio padro das mdias menor do que o desvio padro dos valores
individuais na razo de

Mdia: x =
As estimativas podem ser:
- Estimativa por ponto: dada
por um nico valor (parmetro)
populacional;
- Estimativa por intervalo:
fornece um intervalo de possveis
valores, dentre os quais se
admite que esteja o parmetro
populacional.

32

Desvio-padro: S

Estimao: o processo que consiste em utilizar dados amostrais


para estimar parmetros populacionais desconhecidos.
Erro de estimao: para o caso da mdia, significa a diferena
entre a mdia amostral e a verdadeira mdia populacional.

Cristiano Poleto

x erro

z s , onde:
n

x = Mdia da amostra e, tambm, mdia estimada para a

Probabilidade,
Amostragem e
Distribuio

populao;
z = Varivel padronizada, confiana desejada em % (valores da tabela curva normal); s = Desvio-padro; n = Tamanho da amostra.
2.7 Intervalo de Confiana (IC)
(IC) = ( x erro; x + erro)
Intervalos de confiana para estimao da mdia, quando o populacional conhecido.
Exemplo: Clculo de intervalo para: n = 36; S = 3; x = 24,2
Confiana

Z(valores da

desejada

Tabela)

90%

1,65

x 1,65

95%

1,96

99%

2,58

Frmula

Clculo

x 1,65

x 1,96 s

x 1,96

x 2,58 s

x 2,58

n
n

36
36
36

Continuao:
erro

intervalo

0,825
24,2 0,98
24,2 1,29

23,375 a 25,025

24,2

23,22 a 25,18
23,11 a 25,69

2.8 Distribuio t de Student (n < 30 e/ou desconhecido)


Usa-se essa distribuio quando o desvio padro da populao S
desconhecido e a amostra igual a 30 ou menor de 30 (pequenas amostras), desde que a populao submetida amostragem seja normal. Diferentemente da distribuio normal, que padro para qualquer amostra, h

Obs.: Utiliza-se essa distribuio


para pequenas amostras.

uma distribuio t para cada tamanho de amostra.

x erro

x t s

Para encontrar t, usa-se e g.l., onde:


= nvel de significncia (1 confiana)
g.l. = graus de liberdade = n - 1
Assim, quando a confiana desejada for 95%:
= 1-0,95 e o g.l. = graus de liberdade = n - 1
Estatstica Ambiental - Curso Tcnico em Meio Ambente

33

Probabilidade,
Amostragem e
Distribuio

Exemplo: Sabendo-se que uma amostra tem 25 unidades, que a


sua mdia 20 e que possui um desvio-padro igual a 1,5; represente um
intervalo de confiana ao nvel de 90%, 95% e 99%.
Resposta: n = 25, portanto graus de liberdade = n 1 = 24; S =
1,5; x = 20
Confiana

t (ver tabela)

Frmula

desejada
Procure uma pesquisa cientfica
em que o autor faa referncia
a intervalos de confiana e
refaa os clculos com dados
disponveis.

90%

1,711

x t s

95%

2,064

x t s

99%

2,797

x t s

Clculo

n
n
n

Intervalo

x 1,711 s

20

0,5739

x 2,064 s

20

0,6922

x 2,797 s

20

0,9381

n
n
n

Erro-padro
Em alguns casos, conveniente trabalhar com a mdia das mdias
amostrais. Nesse caso, o desvio-padro de uma distribuio de mdias ou
de diferenas entre mdias tambm chamado de erro-padro.

34

Cristiano Poleto

UNIDADE 3 TESTE DE HIPTESES E


SIGNIFICNCIA ESTATSTICA

Teste de Hipteses e Significncia


Estatstica

3.1 Objetivo de aprendizagem


Conhecer como aplicar a probabilidade e distribuio amostral
para realizar testes e hipteses.
3.2 Teste de hipteses
Ao se realizar um determinado estudo ou idealizar um experimento
cientfico, deve-se ter objetivos ou metas bem estabelecidos por meio de
afirmaes sobre o que se deseja verificar. Essas afirmaes provisrias so
denominadas de hipteses.

Por que formular uma


hiptese?
interessante destacar que
a maior parte dos estudos e
experimentos que se iniciam
sem um objetivo determinado
tornam-se estreis. Sem uma
hiptese clara a nos impulsionar,
guiar e a sugerir o que observar
e anotar, talvez todo o esforo
despendido durante o trabalho,
ou pesquisa, resulte em nada.

Com a obteno de dados e a aplicao dessa anlise estatstica,


possvel verificar se os resultados confirmam ou no essas hipteses.
Designa-se por Ho, chamada hiptese nula, a hiptese estatstica a
ser testada, e por H1, a hiptese alternativa. A hiptese nula expressa uma
igualdade, enquanto que a hiptese alternativa dada por uma desigualdade (, <, >). Os testes utilizados podem ser observados nas Figuras 3.1,
3.2 e 3.3:

Acesse o link, a seguir, para ver


um exerccio sobre testes de
hipteses:
http://br.youtube.com/watch?v=
UsffYlsUOU8&feature=related

rejeita-se Ho
/2

aceita-se Ho (1 - )

valor crtico

rejeita-se Ho
/2

valor crtico

Figura 3.1 Teste Bicaudal ou Bilateral

comum encontrar trabalhos


cientficos nos quais os
pesquisadores relatam seus
resultados como significativos
ou no-significativos.

rejeita-se Ho
= 0,05

aceita-se Ho (1 - =0,95)
0,5

0,45

Complemente seus estudos


pesquisando na Internet outros
exerccios sobre Testes de
Hipteses.

v.c. (z =1,65)
Figura 3.2 Teste Unilateral Direito

Estatstica Ambiental - Curso Tcnico em Meio Ambente

35

Teste de Hipteses e Significncia


Estatstica

rejeita-se Ho
= 0,05

aceita-se Ho (1 - =0,95)
0,45

0,5

v.c. (z = - 1,65)
Figura 3.3 Teste Unilateral Esquerdo

Nvel de significncia: Como os dados obtidos provm de amostras, a deciso sobre aceitar ou no uma determinada hiptese est associada a uma probabilidade de erro e este pode ser controlado ou mensurado
atravs do nvel de significncia (ou ponto de corte) utilizado durante os
Assim, o risco de rejeitar
incorretamente a hiptese nula
chamado de erro do Tipo I e tem
uma probabilidade de ocorrer
igual a . No entanto, tambm
possvel que se cometa o erro de
aceitar a hiptese nula quando
no se deveria e, portanto,
cometer um erro do Tipo II com
a probabilidade de ocorrer igual
a .

36

estudos.
Erro do Tipo I e do Tipo II: Durante os testes de hipteses, existe
a possibilidade de que se cometa um erro ao se considerar uma hiptese
verdadeira quando, na verdade, ela no . Nesse caso, pode-se concluir que
tal efeito ocorrido deve-se apenas ao acaso.

Cristiano Poleto

Correlaes
Bivariadas

UNIDADE 4 CORRELAES BIVARIADAS


4.1 Objetivo de aprendizagem
Compreender como se analisa o relacionamento entre duas variLeia mais sobre correlao
bivariada na apresentao de
um software de estatstica:

veis para verificar se existem correlaes bivariadas.


4.2 Caracterizando correlaes bivariadas
Considera-se uma correlao bivariada quando da ocorrncia de
relacionamento entre duas variveis e, se as mesmas estiverem associadas,

http://www2.dce.ua.pt/leies/
pacgi/SPSS_21_03_07/sessao_2.
pdf

usual dizer que estas so correlacionadas. A Figura 4.1, a seguir, apresenta


o diagrama de disperso para duas variveis (X e Y).
12
10
8
6
4
2
0
0

10

Varivel X
Figura 4.1 Diagrama de disperso para as variveis X e Y

Aplicabilidade das correlaes bivariadas: A aplicao de anlises de correlao permite descobrir se existe um relacionamento entre as
variveis em estudo. Entretanto, essa no a nica informao que essas
anlises oferecem, j que elas permitem determinar a direo do relacionamento e sua fora ou magnitude.
Entre as direes de relacionamento pode-se citar os positivos perfeitos, os positivos imperfeitos, os negativos perfeitos (Figura 4.2), os negativos imperfeitos e os no-lineares.

Estatstica Ambiental - Curso Tcnico em Meio Ambente

O coeficiente de correlao
tem duas propriedades que
caracterizam a natureza de uma
relao entre duas variveis.
Uma o seu sinal (+ ou -) e
a outra sua magnitude. O
sinal o mesmo do coeficiente
angular de uma reta imaginria
que se "ajustaria" aos dados
se essa reta fosse traada num
diagrama de disperso, e indica
se esta reta crescente (+),
relacionamento positivo, ou
decrescente (-), relacionamento
negativo. A magnitude de R
indica quo prximos da "reta"
esto os pontos individuais. Por
exemplo, valores de R prximos
de 1 (correlao negativa
perfeita) ou +1 (correlao
positiva perfeita) indicam
que os valores esto muito
prximos da reta ou mesmo
sobre a reta, enquanto que
os valores mais prximos do 0
(zero) sugerem maior disperso.
Quando as variveis caminham
ora no mesmo sentido, ora em
sentidos opostos, diz-se que
no h correlao. A forma mais
simples e intuitiva de verificar a
existncia de correlao entre
duas variveis atravs do
diagrama de disperso.

37

Correlaes
Bivariadas
14
12
10
8
6
4
2
0
0

10

12

Varivel X
Figura 4.2 Relacionamento negativo perfeito

4.3 Coeficiente de correlao de Pearson (r)


O coeficiente de correlao produto-momento (r) ou coeficiente de
correlao de Pearson, assim designado porque sua frmula foi proposta
por Karl Pearson em 1896, uma proporo entre a covarincia das duas
variveis e uma medida das variveis separadamente. Apresenta uma grande vantagem por ser um nmero puro, ou seja, independe da unidade de
medida das variveis (pode-se ter duas unidades de medida diferentes).
A Figura 4.3 apresenta um diagrama de disperso para duas variveis (X e Y) com problemas de homocedasticidade, isto , presena de
Este tipo de anlise
amplamente utilizado. Mas a
utilizao dessa anlise de forma
indiscriminada pode resultar
em erros de interpretao
e conduzir a concluses
equivocadas, como o caso da
violao da pressuposio de
homocedasticidade (Figura 4.3).

heterocedastidade.

12
10
8
6
4
2
0
0

Varivel X
Figura 4.3 Homocedasticidade

38

Cristiano Poleto

10

Correlaes
Bivariadas
Clculo do coeficiente de correlao (r):

rxy=

covarincia ( x, y )
desvio padro (x ) desvio padro ( y )
Variao do valor (r):

x. y
rxy=

( x).( y)

( x )
n

varia entre -1 e +1

n
2

rxy

( . y )
2

Estatstica Ambiental - Curso Tcnico em Meio Ambente

Tente aplicar os estudos de


correlao aos dados utilizados
nas unidades anteriores.

39

Regresso Linear

UNIDADE 5 REGRESSO LINEAR


5.1 Objetivo de aprendizagem
Entender como se obtm um modelo de relao entre duas variveis quantitativas.
5.2 Regresso linear simples
A anlise de regresso linear simples uma extenso da anlise de
correlao e aplica-se para se obter uma relao de causa-efeito entre duas
variveis quantitativas que seja expressa matematicamente.
A regresso linear simples um procedimento que fornece equaes de linhas reta, por isso o termo linear, que descrevem fenmenos nos

Utilidades da regresso linear:


- Estudar a existncia de
dependncia de y em relao
a x;
- Expressar matematicamente
esta relao atravs de uma
equao.
A sua principal utilidade
representar a dependncia de
uma varivel quantitativa em
relao a outra atravs de uma
equao simples.

quais h apenas uma varivel independente, por isso simples.


Podem-se prever valores para a varivel dependente (y) em relao
a valores no observados da varivel independente (x). Isto permitido dentro da faixa de valores estudados para x ou mesmo fora, desde que a extrapolao no seja exagerada, isto , no haja um afastamento muito grande
entre o valor de x desejado e o ltimo (ou primeiro) valor de x estudado.
Linha ou reta de regresso linear: A anlise de regresso linear
permite a confeco de uma linha real (conforme Figura 5.1) que possibilita

Obs.: Para que estes conceitos


bsicos e necessrios para o
prosseguimento do aprendizado
sejam elucidados, sugere-se uma
nfase nos seguintes tpicos:
- Varivel dependente (y) e
varivel independente (x);
- Obteno da reta.

prever um valor de y a partir de x.


muito comum, na prtica, termos duas variveis x e y, cujos valores se admitem relacionados.

12
10
8
6
4
2
0
0

10

Varivel X
Figura 5.1 Linha de regresso linear

Estatstica Ambiental - Curso Tcnico em Meio Ambente

41

Regresso Lienar
Simples
Pode-se citar, como um exemplo, o espaamento entre as rvores
de um bosque. A relao entre a produo de lenha (y) e a rea, a rea
ocupada por cada rvore (x) ser uma funo de x:

Y = f(x)
Se a relao entre as variveis puder ser expressa por uma equao
de primeiro grau, isto : y = a + bx, onde:

x = varivel independente;
y = varivel dependente;
a = parmetro ou coeficiente linear;
b = parmetro ou coeficiente angular,
tem-se uma regresso linear simples.
5.2.1 Equao de regresso
Para facilitar o uso das anlises de regresso linear, pode-se obter
uma equao de regresso, conforme Figura 5.1, que possibilitar a realizaClculo da equao de regresso
linear e valores de a e b:
A representao matemtica de
uma linha reta dada por:
y = a + bx.

o de previses conforme previamente apresentado pela reta de regresso


linear.
Para se encontrar a equao y = a + bx, que descreve o relacionamento entre as variveis x e y, temos que estimar os valores de a e b.
Para isso, vamos aplicar o chamado mtodo dos mnimos ou dos mnimos
quadrados, que tem como objetivo tornar mnima a soma dos quadrados
desvios.
Mtodo dos mnimos quadrados

Leia mais sobre Regresso Linear


Simples no arquivo do site:
http://www.inf.ufsc.br/~ogliari/
arquivos/Analise_de_Regressao_
linear_simples.ppt

y = an + b
xy = a

x2

x+b

x2

Resolvendo o sistema determina-se a e b, conforme as equaes


a seguir:

42

Cristiano Poleto

Regresso Linear

Regresso Linear Mltipla

onde:

http://www.ufv.br/saeg/saeg43.
htm

n = nmero de observaes realizadas;


= somatrio dos produtos dos pares de valores observados;
soma dos valores observados de x;
soma dos valores observados de y;
somatrio dos quadrados dos valores observados de x;
quadrado da soma dos valores observados de x.
5.3 Regresso linear mltipla
Muitas vezes, uma varivel
variveis (
e

,
e

, ...,

depende de um conjunto de outras

) independentes. Ento, a relao entre as variveis

pode ser expressa por uma equao polinomial mostrada

a seguir:

onde

so parmetros a serem estimados a partir

dos dados. Alm dos valores de

, consideramos que tambm

depende de outros fatores, representados no modelo por , chamado de


efeito aleatrio. O modelo desta relao denominado de Modelo de Regresso Linear Mltipla.
Os conceitos vistos anteriormente devem ser adequandamente generalizados, acrescidos da suposio de que as variveis

so

independentes, isto , a correlao entre elas deve ser baixa.

Estatstica Ambiental - Curso Tcnico em Meio Ambente

43

Anlise Fatorial

UNIDADE 6 ANLISE FATORIAL


As tcnicas estatsticas utilizadas para analisar um conjunto de variveis x1, x2, x3, ..., xk simultaneamente, compem a chamada Estatstica
Multivariada.
As tcnicas exploratrias multivariadas so orientadas por dois
grandes princpios: a reduo do nmero de variveis e a descoberta de
uma estrutura de associao entre as variveis originais. O propsito da
anlise substituir um conjunto de variveis correIacionadas, por um conjunto de novas variveis no correlacionadas. Essas novas variveis repre-

Acesse o link abaixo para saber


mais sobre Anlise Fatorial e
veja tambm os outros tpicos
disponveis nesta pgina:
http://www.ufv.br/saeg/saeg43.
htm

sentam combinaes lineares das iniciais e esto ordenadas de maneira que


suas varincias decresam da primeira ltima. com esta estratgia que
se obtm uma reduo do nmero de variveis sem perda considervel de
informao. Nesta unidade introduziremos os conceitos de duas tcnicas:
Componentes Principais e Anlise Fatorial.
Componentes Principais utilizada para analisar dados organizados em tabelas de freqncia, com o objetivo de identificar alguma correspondncia entre linhas e colunas. til para analisar um conjunto de
variveis categorizadas.
A Anlise Fatorial utilizada para analisar as correlaes entre as
variveis originais e encontrar padres de associao, chamados de fatores,
que identificam variveis no observveis na realidade pesquisada. Essa tcnica til para analisar um conjunto de variveis numricas.
Para fazer uma anlise utilizando essas tcnicas, necessrio dispor de programas computacionais especficos.

Estatstica Ambiental - Curso Tcnico em Meio Ambente

45

REFERNCIAS
CALLEGARI-JACQUES, S. M. Bioestatstica: princpios e aplicaes. Porto
Alegre: Artmed, 2004. 255p.
CASTRO, Lauro Sodr Viveiros. Exerccios de Estatstica. Rio de Janeiro:
Cientfica,1994.
CRESPO, A. Estatstica Fcil. 6. ed. So Paulo: Saraiava, 1989.
DAL MOLIN, Beatriz Helena et al. Mapa Referencial para Construo
de Material Didtico - Programa e-Tec Brasil. 2 ed. revisada.
Florianpolis: Universidade Federal de Santa Catarina - UFSC, 2008.
DORIA, U. Introduo Estatstica. So Paulo: Negcio Ed., 1999.
DOWNING, D.; CLARK, J. Estatstica Aplicada. So Paulo: Saraiva, 1999.
GRANER, E. A. Estatstica: bases para o seu emprego na experimentao
agronmica e em outros problemas biolgicos. 2.ed. Sao Paulo:
Melhoramentos, 1966. 184p.
HEATH, O. V. S. A Estatstica na Pesquisa Cientfica. So Paulo: EDUSP,
1981. 95p.
HOEL, P. G. Estatstica Elementar. 4.ed. Rio de Janeiro: Fundo da
Cultura, 1972. 311p.
LOPES, A. Probabilidade Estatstica. Rio de Janeiro: Reichman, 1999.
MEYER, P. L. Probabilidade: Aplicaes Estatstica. Rio de Janeiro: Ao
Livro Tcnico S.A./EDUSP, 1969. 391p.
PARADINE, C. G.; RIVETT, B. H. P. Mtodos Estatsticos para
Tecnologistas. So Paulo: EDUSP, 1974. 350p.
REIDY, J.; DANECY, C. Estatstica sem Matemtica usando SPSS para
Windows. Porto Alegre: Artmed, 2006.
VICENT, W. Statistic in Kinesiology. Champaing: Human Kineties, 1999.
YouTube. Disponvel em: <http://br.youtube.com>. Acesso em: 09 set.
2008.
Wikipdia. Disponvel em: <http://pt.wikipedia.org/wiki/P%C3%A1gina_
principal>. Acesso em: 09 set. 2008.

Estatstica Ambiental - Curso Tcnico em Meio Ambente

47

GLOSSRIO
DBO: Demanda Bioqumica de Oxignio
Amplie o Glossrio e,
conseqentemente, o seu
vocabulrio tcnico, com
pesquisas na Internet e baixando
o arquivo do Vocabulrio
Bsico de Recursos Naturais e
Meio Ambiente no site do IBGE:

PCBs: Bifenilas Policloradas


COT: Carbono orgnico total
pH: potencial hidrogeninico o ndice que indica a acidez, a neutralidade
ou a alcalinidade de um meio.

http://www.ibge.gov.br/home/
geociencias/recursosnaturais/
vocabulario.shtm?c=13

48

Cristiano Poleto

CURRCULO SINTTICO DO PROFESSOR-AUTOR


Cristiano Poleto possui graduao em Engenharia Civil (1996) e especializao em Engenharia de Segurana do Trabalho pela Universidade Estadual de Maring (2001), mestrado em Engenharia Civil com nfase em Recursos Hdricos e Tecnologias Ambientais pela Universidade Estadual Paulista
Jlio de Mesquita Filho (2003) e doutorado pela Universidade Federal do Rio
Grande do Sul em Recursos Hdricos e Saneamento Ambiental (2007). Tem
experincia nas reas de Meio Ambiente, Engenharia Sanitria e Recursos
Hdricos, atuando principalmente nos seguintes temas: qualidade da gua,
bacias hidrogrficas urbanas, sedimentos urbanos e qualidade dos sedimentos. docente na Universidade Federal do Rio Grande do Sul em cursos tcnicos e na ps-graduao em Recursos Hdricos e Saneamento Ambiental.
Tem experincia na organizao de cursos de extenso e eventos cientficos.
autor de trabalhos cientficos publicados em jornais e revistas nacionais e
internacionais, e de trs livros na rea de sedimentos e meio ambiente.

Estatstica Ambiental - Curso Tcnico em Meio Ambente

49

Curso Tcnico em Meio Ambiente


Estatstica Ambiental
Cristiano Poleto

INSTITUTO FEDERAL DE
EDUCAO, CINCIA E TECNOLOGIA
RIO GRANDE DO SUL

Das könnte Ihnen auch gefallen