Beruflich Dokumente
Kultur Dokumente
Quantas Medidas s~
ao Necess
arias para o
Instituto de F
sica da Universidade de S~
ao Paulo
Laborat
orio do Acelerador Linear
Rua do Mat~
ao, Travessa R, 187
05508{900 S~
ao Paulo, SP
We discuss how to express the result of a set of measurements according to the prescriptions of the
statistics and extend the discussion to the statistical meaning of the Y sm interval, when changing
the size of the data set, N , from N = 2 up to N = 100. With the help of the Monte Carlo method,
we have surveyed the dispersion of the condence level (probability) of the interval above, showing
that such dispersion is important when the data set is small (N < 5). We conclude by stating that
we have reached \knowledge of a quantity" when the dispersion of the probability contents of its
resulting interval is not important when compared to the probability itself.
cimento de uma grandeza fsica" representara aqui a side na distribuic~ao Maxwelliana de velocidades, i.e., ha
obtenc~ao de um intervalo (dado pelo melhor valor de fato moleculas movendo-se mais lentamente e outras
desvio padr~ao) com um conteudo de probabilidade que mais rapidas).
tenha uma dispers~ao pouco importante. O primeiro e segundo conteudos representam como
utuam resultados obtidos dentro das condic~oes do
experimento. O terceiro n~ao, pois ele e baseado na
II A linguagem estatstica exist^encia de um valor limite, Y0 , para o qual con-
vergira a media de um numero de medidas muito
Nessa linguagem, os resultados obtidos em um experi- grande, com o concomitante estreitamento do intervalo
mento onde foram feitas N medidas da grandeza cha- [Y sm ; Y + sm ] ao redor dela. Este valor limite jamais
mada de Y , representam uma amostra dessa grandeza. sera conhecido a n~ao ser que a populac~ao seja nita e
Representa-se o conjunto desses resultados por fYi gN . conhecida.
O conjunto de todos os resultados possveis de serem Estes tr^es conteudos de fato coincidem no caso de
obtidos para Y e chamado de populac~ao. Denomina- um grande numero de medidas, N , mas os resultados
se Y uma variavel aleatoria e diz-se que esta e regida s~ao bem diferentes se poucas medidas s~ao efetuadas e,
por uma func~ao densidade de probabilidade, F (Y ), cuja alem disso, o primeiro e o segundo conteudos proba-
forma funcional pode ser ou n~ao conhecida previamente bilsticos deixam de fazer sentido e mesmo ter utilidade
[2]. pratica para N pequeno, o que sera demonstrado adi-
Um ponto importante e como representar a amostra ante, com simulac~oes de Monte Carlo.
fYi gN . Intuitivamente, o aluno/experimentador quer
apresentar um melhor valor juntamente com alguma ca-
racterstica que indique a reprodutibilidade desses da- III Denic~oes e metodos de si-
dos. A maneira adotada e apresentar-se o valor medio, mulac~ao
Y , e o desvio padr~ao da media, sm . Este ultimo e cal-
culado a partir do desvio padr~ao da amostra, s, am- A Fig.1 ilustra a diferenca entre os par^ametros da po-
bos denidos adiante. O que se esta informando, den- pulac~ao e aqueles da amostra.
tro de uma linguagem padronizada, s~ao os intervalos
[Y s; Y + s] e [Y sm Y + sm ]:
Costuma-se armar que os intervalos, centrados em
Y , estipulados pelo desvio padr~ao e pelo desvio padr~ao
da media contem tr^es tipos de informac~ao, ou t^em tr^es
conteudos estatsticos:
1. [Y s; Y + s] encerra uma probabilidade conhe-
cida de se obter uma particular medida Yj em seu in-
terior, no caso de se repetir uma medida em condic~oes
id^enticas;
2. [Y sm ; Y + sm ] encerra uma probabilidade co-
nhecida de se obter uma nova media Y 0 dentro dele,
no caso de se repetir todo o experimento em condic~oes
id^enticas. Isso signica que, tendo feito N medidas no
Figura 1. Denic~ao geral.
primeiro experimento, a chance de que numa repetic~ao
de N medidas nas mesmas condic~oes experimentais a
nova media Y 0 esteja dentro do intervalo apresentado e Caracteriza-se a amostra, fYi gN , de resultados de
conhecida; N medidas de uma grandeza atraves da sua media
3. [Y sm ; Y + sm ] encerra tambem uma probabili- aritmetica
1 X
N
sm = ps : (4)
N
1 (Y Y0 )2
F (Y ) = p exp ; (5)
2 2 2
N1
P (Y0 2 [Y sm ; Y + sm ]) = lim
Ntotal Ntotal
!1 (7)
onde N1 e o numero de intervalos que contem Y0 e
Ntotal numero total de intervalos do ensaio. A pro-
babilidade de se encontrar o valor verdadeiro Y0 , assim
denida n~ao e caracterstica de um intervalo particu-
lar, obtido em um experimento, mas sim de toda a po-
pulac~ao de intervalos. Por essa raz~ao ela e interpretada Figura 5. Histogramas da distribuic~ao da probabilidade
de se achar Y0 dentro do intervalo [Y sm ; Y + sm ] para
como uma constante para qualquer intervalo obtido no numeros de medidas N =2 e 10.
experimento. Neste ensaio gerou-se novamente N = 2
dados aleatorios, Y1 e Y2 , calculou-se o valor medio, Y ,
e o desvio padr~ao da media, sm . Determinou-se o inter-
valo [Y sm ; Y + sm ], e se analisou se o valor verdadeiro A largura dos histogramas diminui com o aumento
Y0 estava em seu interior. Esse procedimento foi repe- do tamanho N 0 da amostra dos intervalos (veja a
tido N 0 = 1000 vezes, gerando-se outros conjuntos fYi g2 Fig.7). No caso de pequeno numero N 0 < 5 o inter-
valo [Y s0m ; Y + s0m ] ja n~ao tem um nvel de conanca
e contando-se o numero de intervalos [Y sm ; Y + sm ],
bem denido em relac~ao Y0 .
gerados a partir deles, que continham Y0 . Repetindo
esse procedimento N 00 = 2000 vezes, preparou-se o his-
tograma da distribuic~ao de frequ^encia para a frac~ao de
sucessos, na Fig.5.
No caso N = 2 a distribuic~ao de probabilidade e VII Conclus~oes
bastante diferente dos casos anteriores. Ja nesse caso a
distribuic~ao e bem localizada e possui as caractersticas Os resultados das simulac~oes efetuadas mostram que os
de uma gaussiana. A probabilidade e maxima para uma tr^es conteudos discutidos acima coincidem, no limite de
frac~ao de cerca de 1/2. Com o aumento de N , a maxima um grande numero de medidas, N .
probabilidade da distribuic~ao se desloca para a direita 1. Situac~ao 1: o maximo de frequ^encia corresponde
e atinge o limite de 68% (N = 100). Pode-se corrigir a probabilidade 68% de encontrarmos o resultado in-
sm introduzindo-se um coeciente k dependente de N dividual Yi dentro do intervalo [Y s; Y + s];
[7], tal que (veja a Tab.1) s0m = k sm , para obter a 2. Situac~ao 2: o maximo de frequ^encia corres-
maxima probabilidade em 68%, para qualquer N . A ponde a probabilidade 68% de encontrarmos uma
Fig.6 mostra os resultados da simulac~ao com s0m . nova media de N medidas, Y 0 , dentro do intervalo
[Y sm ; Y + sm ];
Tabela 1 3. Situac~ao 3: o maximo de frequ^encia corresponde
n 2 3 4 5 10 20 1 a probabilidade 68% de encontrarmos o valor verda-
k 1,84 1,32 1,20 1,14 1,06 1,03 1 deiro, Y0 , dentro do intervalo [Y sm ; Y + sm ].
V.P. Likhachev et al. 461
pretada como uma constante para qualquer intervalo [3] W.H. Press, S.A. Teukolsky, W.A. Vetterling e B.P.
obtido no experimento e n~ao tem sentido pratico no Flannery, Numerical Recipes in FORTRAN, 2a. edica~o,
caso de um pequeno numero N de medidas, onde a lar- Cambridge, 1992.
gura e a posic~ao do intervalo variam muito.
[4] MATLAB , r High-Performance Numeric Computation
Agradecemos aos colegas, Prof. Otaviano Helene and Visualization Software, The MathWorks Inc., vers~ao
por apontar este problema e pelas valiosas discuss~oes, 4.2.
Profs. H.R. Schelin, Ivan Evseev e Sergei Paschuk, e ao
[5] P.A. Morettin e W.O. Bussab, M
etodos Quantitati-
Sr. Andre Matias Larsen pela valiosas discuss~oes.
vos para Economistas e Administradores, Atual Editora
Ltda., S~ao Paulo, 1981.
References [6] P.L.O. Costa Neto, Estatstica, Editora Edgard Blucher
[1] J. H. Vuolo, Fundamentos da Teoria de Erros, Editora Ltda, S~ao Paulo, 1987.
Edgard Blucher Ltda., S~ao Paulo, 1992.
[7] O. Helene et al., O que e uma medida?, Revista de En-
[2] O. Helene e V.R. Vanin, Tratamento Estatstico de Da- sino de Fsica, 13, 12 (1991).
dos em Fsica Experimental, Ed. Edgard Bl
ucher Ltda.,
S~ao Paulo, 1981.