Sie sind auf Seite 1von 47

Universidade de So Paulo

Disciplina: Climatologia II ACA 0226

Introduo Estatstica Aplicada Climatologia


Parte II Distribuies de Probabilidades
Projeto PAE
Bolsista: Michelle S. Reboita

So Paulo, 2005.

Sumrio
1
2

Introduo Distribuio de Probabilidades........................................3


Definies..............................................................................4
2.1
Varivel Aleatria.................................................................................................................. 4
2.2
Distribuio de Probabilidades.......................................................................................... 5
2.2.1 Noes Iniciais..................................................................................................................... 5
2.2.2 Distribuio Terica........................................................................................................... 8
2.2.3 Parmetros e Estatsticas................................................................................................ 8
2.2.4 Distribuio Discreta e Contnua...................................................................................9
3 Distribuies Contnuas................................................................9
3.1
Distribuio Normal............................................................................................................. 11
3.2
Distribuio Gamma............................................................................................................ 21
3.3
Distribuio de Valores Extremos..................................................................................27
3.4
Distribuio Exponencial................................................................................................... 34
4 Distribuies Discretas..............................................................36
4.1 Distribuio Binomial.......................................................................................................... 37
4.2 Distribuio de Poisson...................................................................................................... 39
4.3
Distribuio Geomtrica................................................................................................... 42
5 Referncias...........................................................................46

Projeto PAE Bolsista: Michelle S. Reboita

Introduo Distribuio de Probabilidades

Um erro muito comum em anlise de dados climatolgicos desprezar as


caractersticas da distribuio de probabilidades mais adequada para os dados em
estudo. O mais freqente adotar-se, a priori, a distribuio normal o que pode resultar,
se os dados no seguem essa distribuio, em concluses erradas. Isso ocorre,
provavelmente, porque a distribuio normal foi a primeira distribuio de probabilidades
estudada e pelo fato de existir facilidade na estimativa dos seus parmetros e das
probabilidades (Assis et al., 1996).
Contudo, os procedimentos para se determinar qual a distribuio de probabilidade
mais adequada para um certo conjunto de informaes relativamente simples e, uma
nica distribuio pode ter um vasto espectro de aplicao. Por exemplo: os totais anuais
de precipitao tm distribuio aproximadamente normal; os totais mensais da mesma
varivel tm distribuio fortemente assimtrica e a de totais dirios de chuva mais
assimtrica ainda. Entretanto, todos esses conjuntos de dados podem ser
adequadamente ajustados distribuio de probabilidades gamma.
Na figura 1 apresentado os tipos mais comuns de distribuies de probabilidades
encontrados em climatologia. A figura 1 A representa uma distribuio simtrica, tpica
da distribuio normal de probabilidades que, geralmente, se ajusta bem aos dados de
temperatura horria; o histograma da figura 1 B de uma distribuio com forte
assimetria, com forma de Jota invertido, forma tpica da distribuio dos totais dirios
de chuva; a figura 1 C representa uma forma de distribuio tpica de dados que variam
no intervalo (0,1), como umidade relativa, razo de insolao e ndice de seca; a figura 1 D
mostra uma distribuio cujo histograma de freqncias sugere a forma da letra U, a
qual comumente encontrada nos dados de insolao diria; a distribuio da figura 1 F
representa uma distribuio uniforme, um caso da distribuio beta com dois parmetros
iguais unidade.
Neste material abordaremos os conceitos de varivel aleatria, distribuio de
probabilidades e processos para clculo da esperana e varincia de uma distribuio de
probabilidades.

Projeto PAE Bolsista: Michelle S. Reboita

Figura 1. Tipos de distribuies mais comuns em climatologia (Assis, et al., 1996, pg. 36).
2

Definies

2.1 Varivel Aleatria


A varivel aleatria uma varivel que tem um valor nico (determinado
aleatoriamente) para cada resultado de um experimento. A palavra aleatria indica que
em geral s conhecemos aquele valor depois do experimento ser realizado (Triola, 1998).
Exemplos de variveis aleatrias:

Projeto PAE Bolsista: Michelle S. Reboita

a. nmero de alunos que no compareceram a aula de estatstica num determinado dia;


b. altura de um adulto do sexo masculino selecionado aleatoriamente.
No material correspondente a Parte I foi realizada uma distino entre dados
discretos e dados contnuos. As variveis aleatrias tambm podem ser discretas ou
contnuas.
Varivel aleatria discreta: aquela que assume valores inteiros e finitos.
Varivel aleatria contnua: aquela que pode assumir inmeros valores num intervalo
de nmeros reais e medida numa escala contnua.
2.2 Distribuio de Probabilidades
2.2.1 Noes Iniciais
Alm de identificar os valores de uma varivel aleatria, freqentemente podemos
atribuir uma probabilidade a cada um desses valores. Quando conhecemos todos os
valores de uma varivel aleatria juntamente com suas respectivas probabilidades, temos
uma distribuio de probabilidades.
A distribuio de probabilidades associa uma probabilidade a cada resultado
numrico de um experimento, ou seja, d a probabilidade de cada valor de uma varivel
aleatria. Por exemplo, no lanamento de um dado cada face tem a mesma probabilidade
de ocorrncia que 1/6.
Como os valores das distribuies de probabilidades so probabilidades, e como as
variveis aleatrias devem tomar um de seus valores, temos as duas regras a seguir que
se aplicam a qualquer distribuio de probabilidades:
1. A soma de todos os valores de uma distribuio de probabilidades deve ser igual a 1
P(x) = 1, onde x toma todos os valores possveis
2. A probabilidade de ocorrncia de um evento deve ser maior do que zero e menor do
que 1
0 P (x) 1 para todo x
No exemplo do lanamento de um dado, como todas as faces tm a mesma
probabilidade de ocorrncia que 1/6 ao som-las obtemos o valor 1, que corresponde a

Projeto PAE Bolsista: Michelle S. Reboita

6
primeira regra citada acima. O valor 1/6 maior do que zero e menor do que 1, assim
satisfaz a segunda regra acima.
A distribuio de probabilidades pode ser representada por um histograma de
probabilidades. Este se assemelha ao histograma de freqncias apresentado na Parte I,
entretanto a escala vertical representa probabilidades, em lugar das freqncias
relativas.
O histograma de probabilidades nos permite visualizar a forma da distribuio. A
mdia, a varincia e o desvio-padro traduzem outras caractersticas. Para uma
distribuio de probabilidades, essas medidas podem ser determinadas usando as
expresses mostradas na tabela 1.
Tabela 1. Expresses para clculo da mdia, varincia e desvio-padro das distribuies
de probabilidades.
Mdia
Varincia
Varincia
Desvio-Padro

=x P(x)
=[(x-)2 P(x)]
2=[x2 P(x)] - 2
=([x2 P(x)] - 2)1/2
2

Ao calcularmos a mdia de uma distribuio de probabilidades, obtemos o valor


mdio que esperaramos ter se pudssemos repetir as provas indefinitivamente. No
obtemos o valor que esperamos ocorrer com maior freqncia. J o desvio-padro nos d
uma medida de quanto a distribuio de probabilidades se dispersa em torna da mdia.
Um grande desvio-padro reflete disperso considervel, enquanto que um desvio-padro
menor traduz menor variabilidade, com valores relativamente mais prximos da mdia.
Estas frmulas podem ser utilizadas para qualquer distribuio de probabilidades,
entretanto, veremos mais adiante que elas podem ser simplificadas dependendo do tipo
de distribuio.
A mdia de uma varivel aleatria discreta o resultado mdio terico de um
nmero infinito de provas. Podemos encarar essa mdia como o valor esperado no sentido
de que o valor mdio que esperaramos obter se as provas se prolongassem
indefinitivamente. As aplicaes do valor esperado (tambm chamado esperana ou
esperana matemtica) so extensas e variadas e o mesmo desempenha um papel de
extrema importncia em uma rea de aplicao chamada teoria da deciso.
O valor esperado de uma varivel aleatria discreta denotado por E e representa
o valor mdio dos resultados:
E = x P(x)

Projeto PAE Bolsista: Michelle S. Reboita

(1)

7
Observamos que E=. Isto , a mdia de uma varivel aleatria discreta coincide
com seu valor esperado.
Exemplo (extrado de Triola, 1998, pag 96): Na tabela abaixo so fornecidas as
probabilidades de ocorrncias de um determinado evento. Entretanto, o objetivo da
mesma enfatizar o clculo da mdia, da varincia e do desvio-padro. Juntamente com a
tabela ser mostrado o histograma de probabilidades.
Tabela 2. Clculo da mdia, varincia e desvio-padro para uma distribuio de
probabilidades.
X

P(x)

x P(x)

x2

x2 P(x)

0
1
2
3
4
5
6
7

0,210
0,367
0,275
0,115
0,029
0,004
0
0

0,000
0,367
0,550
0,345
0,116
0,020
0,000
0,000

0
1
4
9
16
25
36
49

0,000
0,367
1,100
1,035
0,464
0,100
0,000
0,000

Total

1,000

1,398

3,066

=x P(x) = 1,398 = 1,4


2=[x2 P(x)] - 2 = 3,066-1,3982 =1,111596 = 1,1
=(1,111596)1/2 = 1,054323 = 1,1

Projeto PAE Bolsista: Michelle S. Reboita

Figura 2. Histograma de probabilidades.


As distribuies de freqncias construdas a partir de observaes podem ser
representadas atravs de formas matemticas. Ento, as formas matemticas utilizadas
para a idealizao dos dados reais so referidas como distribuies tericas.
As distribuies tericas representam os dados aproximadamente, embora em
muitos casos a aproximao pode ser muito boa. Basicamente, h trs aspectos em que o
emprego das distribuies de probabilidade tericas podem ser til (Wilks, 1995):
Compacidade: trabalhoso lidar com grandes conjuntos de dados brutos, sendo que s
vezes, tambm pode haver limitaes para a anlise. Uma distribuio terica bem
ajustada srie de dados reduz o nmero de trabalho exigido para a caracterizar as
propriedades da mesma.
Alisamento e interpolao: os dados reais esto sujeitos a variaes na amostragem que
podem levar a falha de dados ou a dados errneos nas distribuies empricas. Por
exemplo, numa amostra de dados de temperatura mxima de uma cidade, localizada na
regio tropical, no foram observadas temperaturas mximas entre 30 e 35C no vero,
embora certamente temperaturas mximas nesta faixa podem ocorrer. A imposio de
uma distribuio terica sobre estes dados representaria a possibilidade dessas
temperaturas ocorrerem, tanto quanto permitiria estimar a suas probabilidades de
ocorrncia.
Extrapolao: estimar a probabilidade de eventos extremos a variao de um conjunto
de dados particular exige a suposio de eventos ainda no observados. Isso pode ser
realizado com a imposio de um modelo de probabilidade (isto , uma distribuio
terica) ajustado a srie de dados.
2.2.2 Distribuio Terica
Uma distribuio terica um modelo matemtico. A natureza especfica de uma
distribuio terica determinada por valores particulares atravs de uma entidade
chamada parmetros da distribuio. As distribuies tericas tambm so chamadas de

Projeto PAE Bolsista: Michelle S. Reboita

9
distribuies paramtricas, porque seus atributos especficos dependem dos valores
numricos de seus parmetros.
2.2.3 Parmetros e Estatsticas
comum a confuso entre parmetros da distribuio e estatsticas da amostra.
Os parmetros da distribuio so as caractersticas de uma distribuio terica
particular. Eles representam sucintamente as propriedades fundamentais de uma
populao. J as estatsticas so quantidades calculadas a partir de uma amostra de
dados. A confuso entre eles pode ser devido a algumas distribuies tericas comuns
onde estatsticas so bons estimadores para os parmetros da populao. Por exemplo, o
desvio-padro da amostra, s, pode ser confundido com o parmetro da distribuio
Gaussiana porque os dois so iguais quando a distribuio Gaussiana representa bem os
dados amostrais. Para esta distribuio a mdia da amostra igual ao parmetro e o
desvio-padro igual ao parmetro . importante ressaltar que nem sempre os
parmetros das distribuies so encontrados usando estatsticas das amostras.
Normalmente, a notao para estatsticas da amostra envolve letras romanas e para os
parmetros envolve letras gregas.
2.2.4

Distribuio Discreta e Contnua

H dois tipos de distribuies tericas que correspondem a diferentes tipos de


dados ou variveis aleatrias: a distribuio discreta e a distribuio contnua.
A distribuio discreta descreve quantidades aleatrias (dados de interesse) que
podem assumir valores particulares e os valores so finitos. Por exemplo, uma varivel
aleatria discreta pode assumir somente os valores 0 e 1, ou qualquer inteiro no
negativo, etc. Um exemplo de varivel climatolgica discreta so as tempestades com
granizo.
A distribuio contnua representa quantidades aleatrias contnuas que podem
tomar qualquer valor dentro de um intervalo especificado dos nmeros reais. Por
exemplo, uma varivel aleatria contnua deve ser definida entre os nmeros reais 0 e 1,
ou nmeros reais no negativos ou, para algumas distribuies, qualquer nmero real. A
temperatura, a presso, a precipitao ou qualquer elemento medido numa escala contnua
uma varivel aleatria contnua.
Existem vrias distribuies discretas e contnuas, algumas delas sero mostradas
abaixo. As explicaes iniciaro com as distribuies contnuas.
3

Distribuies Contnuas

Projeto PAE Bolsista: Michelle S. Reboita

10
A maioria das variveis atmosfricas podem assumir valores contnuos. A
temperatura, a precipitao, a altura geopotencial, a velocidade do vento, e outras
quantidades no esto restritas a valores inteiros de unidades fsicas em que so
medidas. Embora a natureza da medio e os sistemas de relatos tal que as medidas
atmosfricas so arredondadas para valores discretos, mas o conjunto de valores
observados normalmente grande o suficiente para que a maioria das variveis possam
ainda ser tratadas como quantidades contnuas.
Existem duas funes associadas a cada varivel contnua X: a funo densidade
de probabilidade, simbolizada por f(X), e a funo cumulativa de probabilidade, ou
funo de distribuio de probabilidade representada por F(X). A funo f(X) aquela
cuja integral de X = a at X = b (b a) d a probabilidade de que X assuma valores
compreendidos no intervalo (a, b), ou seja,
P a

b f X dX
a

(2)

A funo cumulativa de probabilidade F(b) tal que:


F b Pr ob X b

f X dX

(3)

A distribuio exponencial, por exemplo, tem a seguinte funo densidade de


probabilidade:
f X e X dX

(4)

com x 0. A sua funo cumulativa de probabilidade do tipo:


x

F X e X dX 1 e X
0

(5)

Qualquer funo definida no campo real s pode ser considerada como uma funo
densidade de probabilidade se forem satisfeitas as seguintes condies:
f X 0

(6)

para todo X e
F X

dX 1

Projeto PAE Bolsista: Michelle S. Reboita

(7)

11

A probabilidade de que a varivel X assuma valores no intervalo (a, b) dada por:


b

P a X b f X dX F b F a
a

(8)

e a probabilidade de que a varivel contnua X assuma um valor em particular, b, por


exemplo, :
b

P a X b f X dX F b F b 0
a

(9)

H muitas distribuies tericas contnuas. Algumas das mais usadas em cincias


atmosfricas so: distribuio normal, distribuio gamma, distribuio de valores
extremos e distribuio exponencial. Neste material vamos tratar dos modelos
probabilsticos citados, que tm importncia prtica na investigao cientfica, abordando
as formas das funes densidade de probabilidade, bem como a esperana e a varincia.
3.1

Distribuio Normal

A distribuio de probabilidade contnua mais importante e mais utilizada a


distribuio normal, geralmente citada como curva normal ou curva de Gauss. Sua
importncia em anlise matemtica resulta do fato de que muitas tcnicas estatsticas,
como anlise de varincia, de regresso e alguns testes de hiptese, assumem e exigem a
normalidade dos dados. Alm disso, a ampla aplicao dessa distribuio vem em parte
devido ao teorema do limite central. Este teorema declara que na medida em que o
tamanho da amostra aumenta, a distribuio amostral das mdias amostrais tende para
uma distribuio normal (Triola, 1998). Esta explicao parece um pouco complicada,
portanto segue uma abordagem mais detalhada sobre a mesma.
3.1.1 Teorema do Limite Central
A capacidade de usar amostras para fazer inferncias sobre parmetros
populacionais depende do conhecimento da distribuio amostral. Para obtermos uma
distribuio amostral necessrio repetir n vezes um experimento e aps calcular a
mdia das amostras. Este procedimento fornece um novo conjunto de dados que
denominado de distribuio amostral. Na verdade o que o teorema do limite central quer
dizer que se uma populao tem distribuio normal, a distribuio das mdias
amostrais extradas da populao tambm ter distribuio normal, para qualquer
Projeto PAE Bolsista: Michelle S. Reboita

12
tamanho de amostra. Alm disso, mesmo no caso de uma distribuio no-normal, a
distribuio das mdias amostrais ser aproximadamente normal, desde que a amostra
seja grande. Este um resultado notvel, na verdade, pois nos diz que no necessrio
conhecer a distribuio de uma populao para podermos fazer inferncia sobre ela a
partir de dados amostrais. A nica restrio que o tamanho da amostra seja grande.
Uma regra prtica muito usada que a amostra deve consistir de 30 ou mais
observaes.
Estes resultados so conhecidos como o Teorema do Limite Central e representam
talvez o conceito mais importante na inferncia estatstica (Stevenson, 1981).
Agora ser mostrado um exemplo ilustrativo adaptado de Triola (1998, pg. 126).
Vamos realizar quatro amostragens para identificar o ltimo algarismo do Nmero do
Seguro Social (NSS) de estudantes de uma determinada cidade. Ou seja, selecionaremos
na primeira amostragem 50 estudantes e verificamos o ltimo algarismo do NSS,
repetimos por mais trs vezes esse procedimento e como resultado obtemos a tabela 3.
Nesta tabela se combinarmos as amostras numa grande coleo de duzentos nmeros,
obtemos uma mdia x 4,5 e um desvio-padro s = 2,8 e, uma distribuio
aproximadamente uniforme como mostra o grfico da figura 3. Entretanto, se
calcularmos as mdias das amostras (linhas da tabela), obtemos as mdias amostrais e
estas possuem uma distribuio normal (figura 4). Conclui-se que embora a coleo
original de dados tenha uma distribuio aproximadamente uniforme, as mdias amostrais
tm distribuio aproximadamente normal. O conjunto original de 200 nmeros tem
distribuio uniforme (porque os algarismos 0-9 ocorrem aproximadamente com a mesma
freqncia), mas as 50 mdias amostrais tm distribuio normal. um fenmeno
verdadeiramente fascinante e intrigante na estatstica que, extraindo amostras de
qualquer distribuio, possamos criar uma distribuio normal ou, ao menos,
aproximadamente normal.
Em geral, a distribuio amostral das mdias amostrais a distribuio das mdias
amostrais quando extramos repetidas amostras de mesmo tamanho, da mesma populao.
Em outras palavras, se extrairmos amostras de mesmo tamanho da mesma populao,
calculamos suas mdias e construmos um histograma destas mdias, esse histograma
tende para a forma de um sino de uma distribuio normal. Isto verdade
independentemente da forma da distribuio da populao original.
Suponhamos que a varivel x represente notas que podem ter, ou no, distribuio
normal, e que a mdia dos valores x seja e o desvio-padro seja . Suponha que
coletemos amostras de tamanho n e calculemos as mdias amostrais. O que sabemos
sobre a coleo de todas as mdias amostrais que obtemos repetindo esse experimento?
O Teorema do Limite Central nos diz que, na medida em que o tamanho n da amostra
aumenta, a distribuio amostral das mdias amostrais tente para uma distribuio
normal com mdia e desvio-padro / n . A distribuio das mdias amostrais tende
Projeto PAE Bolsista: Michelle S. Reboita

13
para uma distribuio normal no sentido de que, quando n aumenta, a distribuio das
mdias amostrais se aproxima de uma distribuio normal. Essa concluso no obvia
intuitivamente; foi obtida aps extensa pesquisa de anlise.
Embora a demonstrao formal rigorosa exija recursos da matemtica avanada,
ultrapassando o mbito deste material, podemos encontrar uma certa justificativa com
base nos dados da tabela 3. Se selecionamos aleatoriamente amostras de algarismos de
uma populao distribuda uniformemente com mdia = 4,5, as mdias amostrais
resultantes tambm tendero a centrar-se em torno de 4,5, de modo que as mdias
amostrais tambm tm mdia 4,5; a mdia das 50 mdias amostrais da tabela 3 , de
fato, 4,5. inspecionando visualmente os 200 algarismos da tabela 3, vemos que eles
variam de 0 a 9, mas as 50 mdias amostrais acusam menor variao indo de 1,75 a 8,25.
O conjunto original de 200 algarismos tem desvio-padro de 2,8, mas as 50 mdias
amostrais tm um desvio-padro de 1,4, que menor, conforme esperado.
Tabela 3. Amostragens do Nmero do Seguro Social de estudantes de uma determinada
cidade.
Amostra I

Amostra II

Amostra III

Amostra IV

Mdia

1
5
9
5
9
4
7
9
5
7
0
9
6
8
5
6
7
5
4
1
4
3
0
1
9
7
9
8
5
9
6
8
0
2

8
3
8
1
3
2
7
1
3
8
5
8
1
1
9
2
4
7
1
2
0
1
3
5
7
3
1
6
6
3
0
2
2
0

6
3
8
2
3
6
1
5
3
4
6
2
5
3
6
3
0
5
5
0
2
2
4
1
4
1
1
5
4
9
7
9
8
9

4
6
8
5
5
2
6
4
9
1
1
2
7
0
9
4
7
6
7
6
8
5
0
0
0
1
3
9
1
5
3
6
6
7

4,75
4,25
8,25
3,25
5,00
3,50
5,25
4,75
5,00
5,00
3,00
5,25
4,75
3,00
7,25
3,75
4,50
5,75
4,25
2,25
3,50
2,75
1,75
1,75
5,00
3,00
3,50
7,00
4,00
6,50
4,00
6,25
4,00
4,50

Projeto PAE Bolsista: Michelle S. Reboita

14
5
6
4
7
2
8
2
6
2
2
5
0
2
7
8
5

8
5
8
1
9
3
7
7
3
4
4
4
5
1
3
6

9
4
7
2
5
2
1
7
3
7
3
3
8
3
7
6

0
9
6
0
0
2
6
1
9
5
7
8
6
4
0
7

Figura 3. Distribuio de 200 algarismos.

Projeto PAE Bolsista: Michelle S. Reboita

5,50
6,00
6,25
2,50
4,00
3,75
4,00
5,25
4,25
4,50
4,75
3,75
5,25
3,75
4,50
6,00

15

Figura 4. Distribuio das 50 mdias amostrais.


3.1.2 Parmetros da Distribuio Normal
A distribuio normal uma distribuio de dois parmetros (mdia) e (desviopadro) . A densidade de probabilidade desta distribuio tem a seguinte forma:

f X

X 2

para x
(10)
2
onde e so a mdia e o desvio-padro da populao, respectivamente. estimado
por x e por s, que so obtidos atravs das relaes:

22

X
i 1

X X
N

s2

(11)

i 1

(12)

N 1

Uma notao bastante empregada para designar que uma varivel tem distribuio
normal com mdia x e varincia s2 (s a representao de e x de de uma amostra)
N X , s 2 . Se uma amostra de dados tem realmente distribuio normal a seguinte relao
vlida: A = (K-3) = 0. A curtose da distribuio normal igual a 3 e a assimetria nula.
O histograma de freqncias da distribuio normal tem a forma de sino ou
parecida. Com a mdia constante e a varincia varivel, o grfico da curva normal assume
diferentes formas de sino: de alongada a achatada.
A probabilidade de que X assuma valores menores ou iguais a um dado x quando X
N( x ,s2) estimada por:
F X

1
2

X 2
2 2

dX

(13)

Mas essa equao no pode ser resolvida analiticamente sem o uso de mtodos de
integrao aproximada. Por essa razo usa-se a transformao Z
varivel Z tem N(0,1).
A varivel Z chamada varivel reduzida e a curva
Projeto PAE Bolsista: Michelle S. Reboita

X X
s

e com isso a

16

F Z

1
2

Z2
2

dZ

(14)

a curva normal reduzida.


F(Z) na forma da equao (14) tabulada. Como a curva normal reduzida
simtrica, essa propriedade geralmente utilizada na tabulao de apenas valores
positivos de Z. Mas algumas tabelas, como a tabela 4, tambm mostram valores negativos
de Z. As tabelas de F(Z) tanto podem indicar a Prob(Z z), bem como as Prob(0 Z z).
Por isso, a escolha da tabela e sua utilizao deve ser feita com muito cuidado. A tabela
utilizada aqui fornece Prob(Z z). Mas nas tabelas que fornecem apenas os valores
positivos da varivel reduzida faz-se uso da propriedade de simetria da curva normal
reduzida de modo que: P(-X Z 0) = P(0 Z X).

Projeto PAE Bolsista: Michelle S. Reboita

17

Tabela 4. Valores da distribuio normal padro.

Projeto PAE Bolsista: Michelle S. Reboita

18

Exemplo 1
Como exemplo de uso da tabela acima, considera-se uma varivel X com N(15,25).
Qual a probabilidade de que X assuma os valores (16 X 20)?
A probabilidade desejada pode ser obtida, utilizando-se a varivel transformada
(Z). Assim:
Z

X X
s

Para X = 16 Z

16 15

0,04
25
20 15 0,20
Para X = 20 Z
25
P(0,04 Z 0,20) = P(Z 0,2)-P(Z 0,04)

Com o uso da tabela, tem-se:


P(Z 0,2) = 0,5793
P(Z 0,04) = 0,5160
Portanto, a probabilidade desejada 0,5793 0,5160 = 0,0633 ou 6,33%.
Exemplo 2
Projeto PAE Bolsista: Michelle S. Reboita

19

Tabela 5. Valores totais da chuva anual em Pelotas RS (1895-1994).


Ano

Prec.

Ano

Prec.

Ano

Prec.

Ano

Prec.

1895
1896
1897
1898
1899
1900
1901
1902
1903
1904
1905
1906
1907
1908
1909
1910
1911
1912
1913
1914
1915
1916
1917
1918
1919

923
973
1258
1695
1066
1334
952
1746
1320
1510
1501
1212
1166
1305
1198
1004
1323
1539
885
2338
1455
1011
689
1510
1138

1920
1921
1922
1923
1924
1925
1926
1927
1928
1929
1930
1931
1932
1933
1934
1935
1936
1937
1938
1939
1940
1941
1942
1943
1944

1300
1054
1326
1360
931
1377
1099
1160
1144
1321
1350
1298
1780
998
1535
1496
1995
1718
1311
1297
1724
1945
1237
680
1153

1945
1946
1947
1948
1949
1950
1951
1952
1953
1954
1955
1956
1957
1958
1959
1960
1961
1962
1963
1964
1965
1966
1967
1968
1969

864
1307
919
1443
1114
1225
926
1270
1112
1373
890
1191
1220
1232
1778
1331
1372
856
1582
832
1255
1605
1271
1049
982

1970
1971
1972
1973
1974
1975
1976
1977
1978
1979
1980
1981
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994

1040
1090
1344
1110
1355
1048
1361
1654
1179
1137
1555
1352
1342
1543
1694
1178
1656
1815
890
857
1423
1330
1435
1390
1265

Consideramos os dados de chuva anual da tabela acima, cuja distribuio de


freqncia reproduzida na tabela 6, na qual se tem:

f 7 18 27 27 29 11 5 2 1 100
fX 7 x783 18x991 27 x1199 29x1407 11x1615 5x1823 2x2031 1x2239 129.676,00

fX 7x783
X

18x991 2 27 x1199 2 29x1407 2 11x1615 2 5x1823 2 2x2031 2 1x2239 2 176.764.292, 00

fX 129.676,00 1.296,8
100
f
Projeto PAE Bolsista: Michelle S. Reboita

20
s

fX

fX / f
2

f 1

176.764.592,00 129.676,00

99

/ 100

86.928,71

s = 294,83
Tabela 6. Distribuio de freqncias dos totais anuais de chuva de Pelotas RS, no
perodo de 1895 a 1994. Ajuste distribuio normal.
Classes

Ponto Mdio (X)

Zi

F(Zi)

F(Xi)

fe

679 - 887
887 1095
1095 1303
1303 1511
1511 1719
1719 -1927
1927 2135
2135 2343

783
991
1199
1407
1615
1823
2031
2239

7
18
27
29
11
5
2
1

-1,39
-0,68
0,02
0,73
1,43
2,14
2,84
3,55

0,0823
0,2483
0,5080
0,7673
0,9236
0,9838
0,9977
1,0000

0,0823
0,1660
0,2597
0,2593
0,1563
0,0602
0,0139
0,0023

8,2
16,6
26,0
26,0
15,6
6,0
1,4
0,2

Totais

100

1,0000

100,0

Calcula-se a varivel reduzida para cada classe, considerando-se o limite superior


da classe. Assim
Z1 = (887 1296,8)/294,3 = -1,39 F(Z1) = 0,0823
Z2 = (1095 1296,8)/294,3 = -0,68 F(Z2) = 0,2483
Z3 = (1303 1296,8)/294,3 = 0,02 F(Z3) = 0,5080
Z4 = (1511 1296,8)/294,3 = 0,73 F(Z4) = 0,7673
Z5 = (1719 1296,8)/294,3 = 1,43 F(Z5) = 0,9236
Z6 = (1927 1296,8)/294,3 = 2,14 F(Z6) = 0,9838
Z7 = (2135 1296,8)/294,3 = 2,84 F(Z7) = 0,9977
Z8 = (2343 1296,8)/294,3 = 3,55 F(Z8) = 1,0000

Projeto PAE Bolsista: Michelle S. Reboita

21
Como F(Zi) acumulada, a F(X), ou seja, a probabilidade de que ocorra um valor de
chuva menor ou igual ao da classe, calculada subtraindo-se do valor de F(Z) de cada
classe o valor de F(Z) da classe anterior, como indicado na tabela 6.
As freqncias esperadas (fe) em cada classe, (a ltima coluna da tabela 6) so
obtidas, multiplicando-se o valor de F(X) pela soma de todas as freqncias, ou seja:
fe1 = 0,0823 x 100 = 8,2
fe2 = 0,1660 x 100 = 16,6
fe3 = 0,2597 x 100 = 26,0
fe4 = 0,2593 x 100 = 26,0
fe5 = 0,1563 x 100 = 15,6
fe6 = 0,0602 x 100 = 6,0
fe7 = 0,0139 x 100 = 1,4
fe8 = 0,0023 x 100 = 0,2
A soma das freqncias esperadas (fe) deve ser igual a soma das freqncias
observadas (f).
A representao grfica do ajuste acima indicada na figura 5.

Projeto PAE Bolsista: Michelle S. Reboita

22
Figura 5. Totais anuais de chuva de Pelotas (RS), no perodo de 1895 a 1994, ajustada
distribuio normal (Assis et al., 1996, pg. 49).
3.2 Distribuio Gamma
Muitas variveis atmosfricas possuem assimetria positiva, ou seja, so distorcidas
direita. Freqentemente a distoro ocorre quando h um limite fsico esquerda que
relativamente prximo a variao dos dados (Wilks, 1995). Exemplos comuns desta
situao so as quantias de precipitao e a velocidade do vento que so fisicamente no
negativas. H uma variedade de distribuies contnuas que so limitas esquerda por
zero. Entretanto, a distribuio gamma comumente usada para representar dados de
precipitao.
A freqncia ou funo densidade de probabilidade da distribuio gamma :
X

1
f X
X 1 e

(15)

onde um parmetro de escala, o parmetro de forma e () a funo gamma


ordinria de . A funo gamma tem as seguintes propriedades:
X

e XdX

(16)

para todo X > 0


1 2 1

X X 1 !

para X 1, 2, 3, ...

X 1 X X

para X 0

1 / 5

1,77245

O valor de (X) pode ser obtido, com boa aproximao, atravs da seguinte
relao:
2 X ln X f X
e
X

(17)

1
1
1

2
4
12X
360X
1260X6

(18)

onde:
f X 1

A tabela 7 fornece os valores de (X), com base nestas relaes.


Projeto PAE Bolsista: Michelle S. Reboita

23
A mdia, a varincia e o coeficiente de assimetria (A) da distribuio gamma
podem ser obtidos por:
X

(19)

s2 2

(20)

(21)

A distribuio gamma tem assimetria positiva com o parmetro diminuindo e o


parmetro aumentando. Variando-se , com constante, muda-se a escala da
distribuio, enquanto variando-se , com constante, muda-se a sua forma.
Tabela 7. Funo gamma de Y.

Pode-se concluir, com base na equao (21), que, quando tende para infinito A
0, ou seja, a distribuio gamma, neste caso, tende a ser simtrica.
As estimativas dos parmetros e resultam da soluo das equaes (19) e (20).
Mas essas estimativas no so adequadas, preferindo-se as estimativas descritas em
Thom (1966):
Projeto PAE Bolsista: Michelle S. Reboita

24

1
4A
1 1

4A
3

(22)

(23)

sendo
(24)

A ln X Xg

onde
1 N
Xi
N i 1

(25)

1 N
ln Xi
N 1

(26)

X
a mdia aritmtica e
Xg

a mdia geomtrica das observaes, ou alternativamente, segundo Greenwood e


Durand (1960) dada por:

0,5000876 0,1648852Z 0,054427Z2


Z

(27)

quando 0 Z 0,5772 e por

8,898919 9,05995Z 0,9775373Z2


Z 17,79728 11,968477Z Z2

(28)

quando 0,5772 < Z < 7,0, onde

(29)

Z ln X Xg

Neste caso o parmetro continua sendo calculado como na equao (23).


A funo cumulativa de probabilidade :
1
F X

dX

Projeto PAE Bolsista: Michelle S. Reboita

(30)

25
Esta equao no tem soluo imediata, exigindo tabelas ou tcnicas de integrao
numrica como expanso em srie e a frmula de Simpson, por exemplo. A srie
normalmente utilizada a seguinte:
F t

t
t1
t2
t3
1

...

1 2 3
e t
1 1 2

(31)

Na equao (29), fazendo-se t ; X=t; dx=dt, chega-se a equao (31).


A probabilidade de ocorrer um valor de X t F(t).
Exemplo
Considere-se os 95 valores mensais de chuva do ms de janeiro em Pelotas, RS, na
tabela 8, cuja distribuio de freqncias mostrada na tabela 9. Considerando-se a
tabela 9, tem-se:

f 18 28 20 13 9 4 2 1 95
fX 18 31,1 28 73,1 20 115,1 13 157,1 9 199,1 4 241,1 2 283,1 1 325,1 10.598,5
X

10.598,5
111,56
95

fX
s

18 31,12 28 73,12 20 115,12 13 157,12 9 199,12 4 241,12 2 283,12 1 325,12 1.608

fX

fX / f
2

f 1

1.608.101,75 10.598,5 / 95 4.528,72


2

94

ln X f 18 ln 31,1 28 ln 73,1 20 ln 115,1 13 ln 157,1 9 ln 199,1 4 ln 241,1

2 ln 283,1 1 ln 325,1 429,3573

A ln 111,93

429,3573
0,19504
95

Tabela 8. Chuva mensal de janeiro em Pelotas, RS, no perodo de 1895 a 1989.


Projeto PAE Bolsista: Michelle S. Reboita

26
Ano
189...
190...
191...
192...
193...
194...
195...
196...
197...
198...

68,3
203,6
81,5
97,0
269,0
10,4
143,5
83,9
59,6

77,5
117,8
65,7
239,6
271,3
84,9
106,6
148,1
85,4

2
113,3
81,3
159,0
31,5
68,3
62,8
64,5
178,1
71,0

3
35,8
50,1
182,0
59,0
25,1
144,4
151,1
213,9
135,9

145,6
197,7
28,8
151,7
244,7
160,1
11,5
127,0
246,8

112,6
22,3
132,6
129,6
45,7
44,1
22,1
48,1
129,8
78,6

32,1
20,2
130,1
33,4
64,5
113,4
210,9
107,8
140,1
166,0

129,9
15,5
72,8
82,7
64,5
101,8
58,4
84,4
119,7
82,7

183,1
121,4
86,6
59,3
232,0
340,3
162,0
191,3
72,5
149,5

63,4
148,5
23,1
119,7
92,4
87,6
134,5
105,2
14,7
209,4

Tabela 9. Distribuio de freqncias dos totais mensais de chuva de janeiro em Pelotas


RS. Ajuste distribuio gamma.
Classes

Ponto Mdio (X)

FX

FX2

ln(X) f

10,1 52,1
52,1 94,1
94,1 136,1
136,1 178,1
178,1 220,1
220,1 262,1
262,1 - 304,1
304,1 346,1

31,1
73,1
115,1
157,1
199,1
241,1
283,1
325,1

18
28
20
13
9
4
2
1

559,8
2.046,8
2.302,0
2.042,3
1.791,9
964,4
566,2
325,1

17.409,78
149.621,08
264.960,20
320.846,33
356.767,29
232.516,84
160.291,22
105.609,01

61,8697
120,1712
94,9160
65,7395
47,6443
21,9408
11,2916
5,7841

Totais

95

10.598,5

1.608.101,75

429,3573

1 / 4 0,19504 1

1 4 0,19504 / 3 2,7206

111,56
41,0066
2,7206

2,7206 estimada pela equao (17), na qual


f Y 1 1 / 12 2,72062 1 / 360 2,72064 1 / 1.260 2,72066 0,98879
2
e2, 7206ln 2, 7206 0, 98879 1,5704
2,7206

As estimativas dos parmetros com base nas equaes (19) e (20) a fim de
comparaes, fica como exerccio.
Projeto PAE Bolsista: Michelle S. Reboita

27
Com os parmetros e estimado tem-se, ento, a funo densidade de
probabilidade, na forma da equao (15),
f x 2,61x10 X
5

1, 7206

X
41, 0066

e a funo cumulativa de probabilidade (equao 30) ser:


F X 2,61 10

1, 706

X
41, 0066

dX

A soluo dessa equao exige o emprego de tcnicas de integrao numrica ou


uso de tabelas especficas. Adotou-se aqui a expanso em srie na forma da equao (31),
cuja reproduo de todos os clculos praticamente impossvel de ser apresentada aqui.
Mas, considerando apenas a primeira classe, a ttulo de exemplo, tem-se:
t

52,1
1,2705
41,0066

,1 2705 ,1 27052
,1 27053
1

3,7206 3,7206 4,7206 3,7206 4,7206 5,7206

,1 2705
F t

,1 2705
2,7206 ,1 5704 e
2,7206

,1 2705
,1 2705

3,7206 4,7206 5,7206 6,7206 3,7206 4,7306 5,7206 6,7296 7,7206

0,12602 1 0,341484 0,091909 0,020413 0,003859 0,12602 1,4583

F X1 0,1838
Tabela 10. Distribuio de freqncias dos totais mensais de chuva de janeiro em
Pelotas RS, ajustados distribuio gamma de probabilidade.
Classes

Ponto Mdio (X)

FX

fe

10,1 52,1
52,1 94,1
94,1 136,1
136,1 178,1

31,1
73,1
115,1
157,1

18
28
20
13

0,1838
0,4734
0,7052
0,8489

17
28
22
14

Projeto PAE Bolsista: Michelle S. Reboita

28
178,1 220,1
220,1 262,1
262,1 - 304,1
304,1 346,1

199,1
241,1
283,1
325,1

9
4
2
1

0,9272
0,9663
0,9849
0,9934

7
4
2
1

Totais

95

95

O histograma de freqncias deste exemplo mostrado na figura 6.

Figura 6. Totais de chuva mensal de janeiro em Pelotas, RS, ajustados a distribuio


gamma (Assis et al., 1996, pg. 59).
3.3 Distribuio de Valores Extremos
Obras de construo civis como barragens, torres de alta tenso, entre outras, so
projetadas para suportar o limite mximo (ou mnimo) conhecido dos eventos
meteorolgicos da regio. A idia posta em prtica que se determinada estrutura
suporta o valor extremo de um evento ela est em segurana para os valores correntes.
A distribuio de probabilidade que trata dessa questo: valores mximos ou mnimos de
eventos climatolgicos que servem de subsdios para projetos de engenharia a
distribuio de valores extremos, ou distribuio tipo I de Fisher-Tippet ou, ainda,
distribuio de Gumbel. Sua funo densidade de probabilidade tem a forma:
1
f X e

F X e e

Projeto PAE Bolsista: Michelle S. Reboita

(32)
(33)

29
O duplo sinal no segundo expoente da equao (33) refere-se aos valores extremos
mximo (sinal negativo) e mnimo (sinal positivo).
As estimativas dos parmetros e podem ser obtidas por diferentes mtodos
como por exemplo: o mtodo dos momentos, o mtodo da regresso, o mtodo de Lieblein
e o mtodo da mxima verossimilhana (Assis et al., 1996). Entretanto, aqui, sero
descritos o mtodo dos momentos, o mtodo da regresso e o mtodo da mxima
verossimilhana, atravs do exemplo a seguir. O mtodo de Lieblein pode ser encontrado
em detalhes em Thom (1966) e Assis et al. (1996).
Exemplo
Considerem-se os 72 valores anuais de chuva mxima de 24 horas de Piracicaba,
SP, apresentados na tabela 11.
Tabela 11. Chuva mxima de 24 horas de Piracicaba, SP, no perodo de 1917 a 1988.
Ano

191...
192...
193...
194...
195...
196...
197...
198...

64,0
86,5
83,3
55,5
83,8
71,6
50,7

65,0
93,0
77,9
62,4
55,5
68,5
59,2

55,0
69,0
104,9
73,9
82,9
80,4
68,6

64,0
65,0
97,7
54,4
52,0
99,5
114,0

4
60,0
83,0
111,2
57,8
48,3
68,6
51,1

5
57,0
50,0
95,3
80,1
80,4
76,0
70,4

66,5
64,4
64,4
39,9
70,7
72,7
62,0

65,0
64,0
58,8
75,2
59,1
49,1
71,8
103,2

68,0
50,0
58,0
46,8
80,0
63,0
46,4
86,7

65,0
59,2
109,5
108,4
78,4
73,7
63,4

X 65,0 68,0 65,0 ... 62,3 103,2 86,7 5120,64 71,12


N

72

s2

X / N
2

N 1

72

296

= 17,22

3.3.1 Mtodo dos Momentos


As estimativas dos parmetros e com base nos dois primeiros momentos da
amostra (mdia e desvio-padro) podem ser obtidas pelas seguintes equaes:

Projeto PAE Bolsista: Michelle S. Reboita

30
6
s

(34)

equivalente a =0,7794s e,
(35)

X 0,5772

Com base nos dados da tabela 11 e nas equaes (34) e (35) tm-se:

6
17,22 13,43
3,14

71,12 0,5772 13,43 63,37

3.3.2 Mtodo da Regresso


Tomando-se os valores da varivel aleatria X, ordenados em forma crescente,
faz-se a regresso de n/(N+1) contra F(X), ou seja:
F X e

n
N1

(36)

ou

e
N 1

ln

(37)

ou, aplicando-se, novamente, o logaritmo:


n
X

ln ln

N 1

(38)

n
X

ln ln


N 1

(39)

ou, ainda,

1
n
a e
b , ela toma a
Y,
Assim, se na equao (39) tomarmos ln ln

N 1
forma Y = a + bX, que a equao da reta. Desse modo os parmetros a e b podem ser
estimados por:

Projeto PAE Bolsista: Michelle S. Reboita

31
a Y bX

(40)

X Y
XY N
b
X
X N
2

(41)

Os valores de n/(N+1), de ln[n/(N+1)] e de X, dos dados da tabela 11, organizados


em forma crescente, esto representados na tabela 12.
Tabela 12. Valores anuais de chuva mxima de 24 horas de Piracicaba, SP, ordenados
para estimativa dos parmetros da distribuio de valores etremos.

Projeto PAE Bolsista: Michelle S. Reboita

32


n
Na tabela 12, fazendo-se Y ln ln
, tem-se:
N 1

X 39,9 46,4 ... 111,2 114,0 5120,7

39,92 46,4 ... 111,22 114,02 38255,29

Y 1,4564 1,2802 ... 3,5835 4,2836 39,97


XY 39,9 1,4564 46,4 1,2802 ... 111,2 ( 3,5835) 114,0 ( 4,2836) 4295,91
Logo, segundo as equaes (40) e (41):
a = 4,3492 e b = -0,06896
Portanto,

1
1

14,5012
b
0,06896

a 14,5012 4,3492 63,0686

3.3.3 Mtodo da Mxima Verossimilhana


um mtodo iterativo no qual as estimativas de e so obtidas pela soluo das
seguintes equaes:

Xe
i

Projeto PAE Bolsista: Michelle S. Reboita

(42)

33

log

Xi

(43)

O valor inicial de para iniciar a iterao dado pela equao (34). Com os dados
da tabela 11 tem-se:
X 71,12

s 17,22

0 0,7749 17,22 / 3,1416 13,43

Aplicando-se a equao (42) encontra-se = 13,7932. Com base, ento na equao


(43), = 63,18. Deixa-se, como exerccio, para o leitor mostrar o restante dos clculos.
A tabela 13 faz uma comparao entre as estimativas dos parmetros atravs dos
trs mtodos apresentados.
Tabela 13. Estimativas dos parmetros da distribuio de valores extremos atravs dos
mtodos dos momentos, da regresso e da mxima verossimilhana, para os dados de
chuva anual mxima de 24 horas de Piracicaba, SP.
Mtodo

Momentos
Regresso
Mxima Verossimilhana

13,4300
14,5012
13,7932

63,3700
63,0686
63,1869

As estimativas dos parmetros at aqui foram feitas com os dados brutos, mas o
mtodo da regresso tambm pode ser aplicado a dados agrupados, trabalhando-se com
as freqncias acumuladas e com o ponto mdio de cada classe.
Com as estimativas pelo mtodo da mxima verossimilhana, a funo cumulativa de
probabilidade ento:
F X exp exp X 63,1869 / 13,7932

a qual permite estimar as probabilidades de que X seja menor ou igual a determinado


valor. Uma comparao entre os valores observados e estimados pela funo est
mostrada na tabela 14.
Projeto PAE Bolsista: Michelle S. Reboita

34

Tabela 14. Chuva mxima anual de 24 horas de Piracicaba, SP, ajustada distribuio
de valores extremos.
Classes

Ponto Mdio (X)

FX

fe

39,1 - 48,1
48,1 57,1
57,1 66,1
66,1 75,1
75,1 84,1
84,1 93,1
93,1 102,1
102,1 111,1
111,1 120,1

43,6
52,6
61,6
70,6
79,6
88,6
97,6
106,6
115,6

3
12
19
13
12
4
3
4
2

0,0505
0,2112
0,4450
0,6560
0,8029
0,8920
0,9422
0,9695
0,9840

4
12
17
15
11
6
4
2
1

Totais

72

72

Os quantis tambm so obtidos diretamente pela equao (33), tomando-se, duas


vezes, o logaritmo da funo. Por exemplo, se F(X) = 0,95 ou 95%, teremos, ento:
-ln[F(0,95) = exp{-exp[-(X-63,1869)/13,7932]} 0,0513 = exp[(-X - 63,1869)/13,7932]
2,9701 = (X - 63,1869)/13,7932 X 104,3mm
Isso significa que, em 95% dos casos, a chuva mxima em 24 horas, em Piracicaba,
no excede 104,3 mm.
Na figura 7 mostrado o histograma da distribuio.

Projeto PAE Bolsista: Michelle S. Reboita

35

Figura 7. Chuva anual mxima de 24 horas de Piracicaba, SP, ajustada a distribuio de


valores extremos ou de Gumbel (Assis et al., 1996, pg. 70).
3.4 Distribuio Exponencial
A distribuio exponencial geralmente aplicada a dados com forte assimetria como
aqueles cujo histograma tem a forma da figura 1B, ou seja de J invertido. Sua densidade
de probabilidade tem a forma:
f X e X

(44)

e sua funo de distribuio de probabilidade do tipo:


F X

1 e X

(45)

O nico parmetro, , estimado por

1
X

(46)

Com isso, a funo cumulativa de probabilidade assume a forma geralmente


encontrada na literatura, ou seja:
F X 1 e

X
X

(47)

A esperana e a varincia da distribuio exponencial so obtidas atravs das


expresses: X = 1/ e s2 = 1/2, respectivamente. A distribuio exponencial um caso
especial da distribuio gamma com o parmetro = 1.
Exemplo
Considere os dados dirios de chuva de Pelotas RS, no ms de janeiro, cuja
distribuio de freqncias consta na tabela 15. Neste exemplo os dados brutos no so
apresentados.
Os clculos necessrios para a estimativa da mdia e da varincia dos dados
tambm esto indicados na tabela 15, com isso, tem-se:

f 450 184 80 43 23 9 7 5 2 2 0 1 806


Projeto PAE Bolsista: Michelle S. Reboita

36

fX 450 5,5 184 15 80 25 43 35 23 45 9 55 7 65 5 75 2 85 2 95 0 105 1 115 115


fX 450 5,5 184 15 80 25 43 35 23 45 9 55 7 65 5 75 2 85 2 95 0 105
2

Tabela 15. Distribuio de freqncias dos totais dirios de chuva de janeiro de


Pelotas, RS, no perodo de 1893 a 1994. Foram considerados apenas os valores > 1,0 mm.

Classes

PM (X)

fX

fX2

F(X)

fe

1 10
10 20
20 30
30 - 40
40 50
50 - 60
60 -70
70 80
80 90
90 -100
100 110
110 -120

5,5
15
25
35
45
55
65
75
85
95
105
115

450
184
80
43
23
9
7
5
2
2
0
1

2475
2760
2000
1505
1035
495
455
375
170
190
0
115

13612,5
41400,0
50000,0
52675,0
46575,0
27225,0
29575,0
28125,0
14450,0
18050,0
0,0
13225,0

0,5016
0,7516
0,8762
0,9383
0,9692
0,9847
0,9924
0,9962
0,9981
0,9990
0,9995
0,9998

404
201
100
50
25
12
6
3
2
1
0
0

Totais

806

11575

334912,5

806

fX 11575 14,361
f 806

fX

fX / f
2

f 1

334912,5 11575 / 806 209,54


2

805

s = 14,48

1
1

0,0696
X 14,361

Os valores de F(X) e as freqncias esperadas so assim calculados:


F(X1) =
F(X2) =
F(X3) =
F(X4) =
F(X5) =
F(X6) =
F(X7) =

1-exp(-0,0696
1-exp(-0,0696
1-exp(-0,0696
1-exp(-0,0696
1-exp(-0,0696
1-exp(-0,0696
1-exp(-0,0696

x
x
x
x
x
x
x

10)
20)
30)
40)
50)
60)
70)

=0,5016
=0,7516
=0,8762
=0,9383
=0,9692
=0,9847
=0,9924

fe
fe
fe
fe
fe
fe
fe

= 404
= 201
= 100
= 50
= 25
= 12
=6

Projeto PAE Bolsista: Michelle S. Reboita

37
F(X8) =
F(X9) =
F(X10) =
F(X11) =
F(X12) =

1-exp(-0,0696
1-exp(-0,0696
1-exp(-0,0696
1-exp(-0,0696
1-exp(-0,0696

x
x
x
x
x

80)
90)
100)
110)
120)

=0,9962
=0,9981
=0,9990
=0,9995
=0,9998

fe
fe
fe
fe
fe

=3
=2
=1
=0
=0

O histograma dos dados da tabela 15 est apresentado abaixo:

Figura 8. Distribuio exponencial ajustada aos totais dirios de chuva de janeiro de


Piracicaba SP, no perodo de 1917 a 1989 (Assis et al., 1996, pg. 72).
4

Distribuies Discretas

Existe um grande nmero de distribuies de probabilidades tericas para as


variveis aleatrias discretas. De acordo com Wilks (1995), muitas encontram-se listadas
em Johnson e Kotz (1969), junto com os resultados referentes a suas propriedades.
Entretanto, somente trs distribuies de probabilidades discretas tm sido usadas em
grau aprecivel nas cincias atmosfricas: a distribuio binomial, a distribuio de
Poisson e a distribuio geomtrica.
De maneira semelhante s distribuies de variveis contnuas, existem duas
funes associadas a cada varivel aleatria discreta: a funo de probabilidade, p(X), e
a funo cumulativa (ou distribuio) de probabilidade, P(X). A probabilidade de que x
assuma um valor particular tal que:
P(X = x) = p(X)

Projeto PAE Bolsista: Michelle S. Reboita

(48)

38
A distribuio binomial com parmetros n e q, por exemplo, tem a seguinte funo
de probabilidade:
n X
q 1 q n X
p X
X

(49)

com X assumindo os valores 0, 1, 2, 3, ...


O smbolo P(X) utilizado para indicar a funo cumulativa de probabilidade, a
qual representa a probabilidade de que a varivel aleatria discreta X assuma um valor
particular x, na forma:
X

P X p X
0

(50)

com X = 0, 1, 2, 3, ... n e X n.
Diferentemente da distribuio contnua, a probabilidade de que uma varivel
discreta assuma um valor particular qualquer diferente de zero.
4.1

Distribuio Binomial

Em muitos problemas, o que nos interessa a probabilidade de um evento ocorrer X


vezes em n provas. Por exemplo, a probabilidade de se obter 45 respostas a 400
questionrios distribudos como parte de um estudo sociolgico, a probabilidade de 5 em
12 ratos sobreviverem por determinado prazo aps serem injetados com substncias
cancergenas, entre outros. Portanto, estamos interessados em obter X sucessos em n
provas, ou em outras palavras, X sucessos e n - X falhas em n provas. Para a distribuio
binominal considera-se que h um nmero fixo de provas, a probabilidade de sucesso a
mesma em todas as provas e as provas so todas independentes. Uma vez que exige que
os eventos sejam independentes esta distribuio passa a ter pouca utilidade em
climatologia, pois a independncia quer dizer observaes no correlacionadas o que
muitas vezes no se verifica nos dados meteorolgicos.
A funo de probabilidade binomial dada por:
n X
q 1 q n X
p X
X

Projeto PAE Bolsista: Michelle S. Reboita

(51)

39
onde q a probabilidade de um evento ocorrer, 1 q a probabilidade do evento no
ocorrer, X a freqncia de ocorrncia e X pode tomar os valores 0, 1, 2, ..., n. Portanto,
esta funo fornece a probabilidade de ocorrerem X sucessos em n provas.
A funo de distribuio de probabilidade dada por:
P(X)

onde t = 0, 1, 2, ..., n.

n t
q 1 q n t
t
t0

(52)

A mdia e a varincia da distribuio binomial podem ser obtidas atravs das


2
expresses: X n q e s n q 1 q , respectivamente.
Exemplo
H uma probabilidade de 0,30 de uma pessoa, ao fazer compras em um supermercado, se
beneficie de uma promoo especial de sorvete. Determine as probabilidades de que,
dentre seis pessoas que esto fazendo compras no supermercado, haja 0, 1, 2, 3, 5 ou 6
que se beneficiem da promoo. Trace um histograma dessa distribuio de
probabilidade.
Soluo
Admitindo que a escolha seja aleatria, fazemos n = 6, q = 30 e, respectivamente, X = 0,
1, 2, 3, 4, 5 e 6 na frmula da distribuio binomial:
n X
q 1 q n X
X

p X

6
p 0 0,30 0 0,70 6 0,118
0

6
p 4 0,30 4 0,70 2 0,060
4

6
p 1 0,30 1 0,70 5 0,303
1

6
p 5 0,30 5 0,70 1 0,010
5

6
p 2 0,30 2 0,70 4 0,324
2

6
p 6 0,30 6 0,70 0 0,001
6

6
p 3 0,30 3 0,70 3 0,185
3

Projeto PAE Bolsista: Michelle S. Reboita

40

Figura 9. Histograma da distribuio binomial com n = 6 e q = 030.


4.2

Distribuio de Poisson
Muitas vezes, no uso da distribuio binomial acontece que n muito grande

n e q muito pequeno q 0 . Nesse caso o clculo torna-se difcil e, portanto,


fazemos uma aproximao da distribuio binomial pela distribuio de Poisson. Podemos
usar com segurana a aproximao de Poisson da distribuio binomial quando
n 100 e nq 10 (Freund e Simon, 1995). Entretanto, autores como Morettin (1999)
sugerem a aproximao a partir de n > 30.
A distribuio de Poisson tem a seguinte distribuio de probabilidade:
p X

onde

e X X X
X!

representa a mdia da distribuio binomial que

(53)
X nq,

A funo cumulativa de probabilidade :

Projeto PAE Bolsista: Michelle S. Reboita

e X = 0, 1, 2, 3, ...

41
X

P X X t
t0

e X
t!

(53)

onde t = 0, 1, 2, ..., n.
O nico parmetro dessa distribuio a mdia que numericamente igual a
varincia. Sendo estimada por: X n q .
Exemplo
A distribuio de Poisson geralmente citada como a distribuio de eventos
raros. Os dados que sero utilizados nesse exemplo referem-se ao nmero de meses no
ano em que o nmero de dias chuvosos maior do que 10. Os dados foram observados em
Pelotas, RS, no perodo de 1895 a 1989.
Tabela 16. Nmero de meses no ano com mais de 10 dias chuvosos em Pelotas, RS, no
perodo de 1895 a 1989.
Anos

1890
1900
1910
1920
1930
1940
1950
1960
1970
1980

1
1
3
0
5
2
1
2
4

0
2
1
1
5
0
3
1
3

4
2
3
4
1
0
1
5
4

2
1
1
1
1
1
2
2
4

2
7
0
1
3
2
0
3
5

0
4
2
1
1
1
0
2
1
2

0
2
1
3
3
1
2
3
3
3

1
4
0
0
2
0
2
2
5
3

5
0
3
1
2
2
0
2
2
2

2
4
2
2
2
1
5
0
2
1

Os dados da tabela 16 fornecem a distribuio de freqncias apresentada na


tabela 17, na qual pode-se calcular:

f 15 24 27 13 8 7 0 1 95
fx 15 0 24 1 27 2 13 3 8 4 7 5 0 6 1 7 191
X

fX 191 2,0105
f 95

fx

15 02 24 12 27 22 13 32 8 42 7 52 0 62 1 7 2 601

Projeto PAE Bolsista: Michelle S. Reboita

42

fX fX / f 601 191 / 95 2,3084

f 1

94

Tabela 17. Distribuio de freqncias do nmero de meses no ano com mais de 10 dias
chuvosos em Pelotas, RS, no perodo de 1895 a 1989.
Classes X

fX

fX2

p(X)

fe

0
1
2
3
4
5
6
7

15
24
27
13
8
7
0
1

0
24
54
39
32
35
0
7

0
24
108
117
128
175
0
49

0,1339
0,2692
0,2707
0,1814
0,0912
0,0367
0,0123
0,0035

12,7
25,6
25,7
17,2
8,7
3,5
1,2
0,4

Totais

95

191

601

0,9989

95

Para efeitos prticos pode-se considerar a mdia igual a varincia. Assim, o clculo
das probabilidades se segue com base na equao (53), ou seja:
P(X
P(X
P(X
P(X
P(X
P(X
P(X
P(X

= 0)
= 1)
= 2)
= 3)
= 4)
= 5)
= 6)
= 7)

(2,01050 e-2,0105)/1
(2,01051 e-2,0105)/1
(2,01052 e-2,0105)/2
(2,01053 e-2,0105)/6
(2,01054 e-2,0105)/24
(2,01055 e-2,0105)/120
(2,01056 e-2,0105)/720
(2,01057 e-2,0105)/5040

=
=
=
=
=
=
=
=

0,1339
0,2692
0,2707
0,1814
0,0912
0,0367
0,0123
0,0035

O clculo das freqncias esperadas assim efetuado:


Para
Para
Para
Para
Para
Para
Para
Para

X
X
X
X
X
X
X
X

=0
=1
=2
=3
=4
=5
=6
=7

fe
fe
fe
fe
fe
fe
fe
fe

= 0,1339 x 95
= 0,2692 x 95
= 0,2707 x 95
= 0,1814 x 95
= 0,0912 x 95
= 0,0367 x 95
= 0,0123 x 95
= 0,0035 x 95

=
=
=
=
=
=
=
=

12,7
25,6
25,7
17,2
8,7
3,5
1,2
0,4

Projeto PAE Bolsista: Michelle S. Reboita

43

A figura abaixo representa o histograma dos dados da tabela 17.

Figura 10. Histograma de freqncias do nmero de meses do ano com mais de 10 dias
chuvosos em Pelotas, RS, no perodo de 1895 a 1989 (Assis et al., 1996, pg. 81).
4.3

Distribuio Geomtrica

A distribuio geomtrica recebe esta denominao porque seus valores sucessivos


constituem uma progresso geomtrica. Para esta distribuio h uma infinidade
enumervel de possibilidades; os eventos so independentes e com probabilidade de
sucesso p. A varivel X corresponde ao nmero de experimentos antes da ocorrncia do
primeiro sucesso.
A funo de probabilidade da distribuio geomtrica :
p X 1

(54)

X 1

com 0 1 , sendo:
1

1
X

2
A varincia da distribuio geomtrica obtida pelas expresso: s

Projeto PAE Bolsista: Michelle S. Reboita

(55)
1
.
2

44

Exemplo 1
Aplicando a frmula (54), constatamos, por exemplo, que, em jogadas repetidas de
um dado equilibrado, a probabilidade de o primeiro 6 ocorrer na quinta jogada :
5

6

5 1

1
625

0,080
6 7776

Exemplo 2
Os dados da tabela 18 mostram as seqncias de dias com chuva iniciadas nos 31
dias seguintes ao dia 21 de dezembro de 1997 a 1989, em Piracicaba, SP, a qual permite
calcular:

f 146 84 76 34 28 15 10 6 6 6 1 0 2 2 0 1 0 1 418

fX 146 1 84 2 76 3 34 4 28 5 15 6 10 7 6 8 6 9 6 10

1 11 0 12 2 13 2 14 0 15 1 16 0 17 1 18 1.239
fX
X

6341

fX 1239 63,41
f 418

fX

fX / f
2

f 1

6341,0 1239 / 418 6,399


2

417

1
0,6626
2,9641

1 1 0,6626 0,3374

Pode-se, ento, estimar-se f(X) e as freqncias esperadas (fe), assim:


Projeto PAE Bolsista: Michelle S. Reboita

45
P(X
P(X
P(X
P(X
P(X
P(X
P(X
P(X
P(X
P(X
P(X
P(X
P(X
P(X
P(X
P(X
P(X
P(X

= 1)=
= 2)=
= 3)=
= 4)=
= 5)=
= 6)=
= 7)=
= 8)=
= 9)=
= 10)=
= 11)=
= 12)=
= 13)=
= 14)=
= 15)=
= 16)=
= 17)=
= 18)=

0,3374
0,3374
0,3374
0,3374
0,3374
0,3374
0,3374
0,3374
0,3374
0,3374
0,3374
0,3374
0,3374
0,3374
0,3374
0,3374
0,3374
0,3374

x 0,66260 =
x 0,66261 =
x 0,66262 =
x 0,66263 =
x 0,66264 =
x 0,66265 =
x 0,66266 =
x 0,66267 =
x 0,66268 =
x 0,66269 =
x 0,662610 =
x 0,662611 =
x 0,662612 =
x 0,662613 =
x 0,662614 =
x 0,662615 =
x 0,662616 =
x 0,662617 =

0,33737
0,22355
0,14816
0,09816
0,06504
0,04309
0,02856
0,01892
0,01254
0,00831
0,00550
0,00365
0,00242
0,00160
0,00106
0,00070
0,00047
0,00031

fe= f(X) x 418


fe= f(X) x 418
fe= f(X) x 418
fe= f(X) x 418
fe= f(X) x 418
fe= f(X) x 418
fe= f(X) x 418
fe= f(X) x 418
fe= f(X) x 418
fe= f(X) x 418
fe= f(X) x 418
fe= f(X) x 418
fe= f(X) x 418
fe= f(X) x 418
fe= f(X) x 418
fe= f(X) x 418
fe= f(X) x 418
fe= f(X) x 418

=141
=93
=62
=41
=27
=18
=12
=8
=5
=3
=2
=2
=1
=1
=0
=0
=0
=0

A tabela 18 resume todos os resultados e na figura 11 apresenta-se o histograma


de freqncias.

Tabela 18. Seqncia de dias chuvosos iniciados nos 31 dias seguintes a 21 de dezembro
em Piracicaba, SP. Ajuste distribuio geomtrica.
Classes X

fX

fX2

p(X)

fe

1
2
3
4
5
6
7
8
9
10
11
12
13
14

146
84
76
34
28
15
10
6
6
6
1
0
2
2

146
168
228
136
140
90
70
48
54
60
11
0
26
28

146
336
684
544
700
540
490
384
486
600
121
0
338
392

0,33737
0,22355
0,14816
0,09816
0,06504
0,04309
0,02856
0,01892
0,01254
0,00831
0,00550
0,00365
0,00242
0,00160

141
93
62
41
27
18
12
8
5
3
2
2
1
1

Projeto PAE Bolsista: Michelle S. Reboita

46
15
16
17
18

0
1
0
1

0
16
0
18

0
256
0
324

0,00106
0,00070
0,00047
0,00031

0
0
0
0

Totais

418

1.239

6.341

1,0000

418

Figura 11. Histograma de freqncias das seqncias de dias chuvosos iniciados nos 31
dias seguintes a 21 de dezembro em Piracicaba, SP (Assis et al., 1996, pg. 94).
A tabela a seguir resume algumas das propriedades das distribuies tericas
contnuas e discretas descritas no texto.
Tabela 19. Principais distribuies contnuas e discretas utilizadas em climatologia.
Nome

Funo Densidade

E(X)

Var(X)

2 s2

Distribuies Contnuas

f X

Distribuio Normal

1
2

X 2
22

1
f X
X 1 e

Distribuio Gamma

Distribuio de Valores Extremos


Distribuio Exponencial

1
f X e

f X e X

Pelo Mtodo dos momentos

6
1

Distribuies Discretas

Distribuio Binomial

n X
q 1 q n X
p X
X

nq

Projeto PAE Bolsista: Michelle S. Reboita

0,5772

1
2
n q 1 q

47
Distribuio de Poisson
Distribuio Geomtrica

p X

e X X X
X!

X nq

p X 1 X 1

nq

nq

1
2

5 Referncias
ASSIS, F. N., et al, 1996. Aplicaes de Estatstica Climatologia . Ed. Universitria,
UFPEL, Pelotas, RS.
FREUND, J. E., and SIMONS, G., 1995: Statistics :a first course. Prentice-Hall.
MORETTIN, L. G., 1999: Estatstica Bsica - Probabilidade . 7. Ed., Makron Books, So
Paulo, SP.
STEVENSON, W. J., 1981: Estatstica Aplicada Administrao . Ed. Harper & Row do
Brasil, So Paulo, SP.
THOM, H. C. S., 1966: Some Methods of Climatological Analysis Technical Note n 81,
WMO n 199 TP 103.
TRIOLA, M. F., 1998. Introduo Estatstica. 7 Ed., LTC, Rio de Janeiro, RJ.
WILKS, D. S., 1995: Statistical Methods in the Atmospheric Sciences An Introduction.
Academic Press, New York.

Projeto PAE Bolsista: Michelle S. Reboita

Das könnte Ihnen auch gefallen