Sie sind auf Seite 1von 31

Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica

1
ESTUDO E APLICAES DA TCNICA BOOTSTRAP
Ana Lucia Tucci Rizzo (analurizzo@uol.com.br), Raquel Cymrot
Orientadora: Raquel Cymrot (raquelc@mackenzie.com.br)

Resumo

A tcnica de reamostragem Bootstrap muito til por no necessitar de muitas
suposies para estimao de parmetros das distribuies de interesse. Este
artigo apresenta os diferentes mtodos de clculo de intervalos de confiana
utilizando a tcnica de reamostragem Bootstrap na forma paramtrica e no
paramtrica. Tais mtodos so o Intervalo de Confiana Bootstrap Percentil, o
Intervalo de Confiana Bootstrap Percentil das Diferenas, o Intervalo de
Confiana Bootstrap t, o Intervalo de Confiana Percentil Corrigido em Relao ao
Vis (BCPB) e o Intervalo de Confiana de Correo de Vcio Acelerado (BC
a
) ,
alm da tcnica de Bootstrap para a regresso e realizao de testes de
hipteses utilizando intervalos de confiana Bootstrap. Foram apresentadas as
situaes onde cada mtodo de obteno dos intervalos de confiana Bootstrap
mais adequado, dependendo do tipo de distribuio, vcio e assimetria da
estatstica do parmetro estudado. Para aplicao destas tcnicas foram
realizados seis estudos de caso que possibilitaram a aplicao dos mtodos de
estimao Bootstrap mais recomendados na estimao dos parmetros mdia,
varincia, proporo e desvio padro de processos. Estes casos incluram
distribuies simtricas e assimtricas. Quando a distribuio de probabilidades
da estatstica do parmetro a ser estimado era conhecida foi tambm calculado o
intervalo de confiana baseado na distribuio de probabilidades do estimador.
Palavras chave: Reamostragem ; Mtodo Bootstrap; Intervalo de confiana

Abstract

The Bootstrap resampling technique is very useful because it does not need many
assumptions to estimate parameters of the distributions of interest. This article
presents the different methods to calculate confidence intervals by using Bootstrap
Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica
2
resampling technique in parametric and nonparametric form. Such methods are
the Percentile Bootstrap Confidence Interval, the Differences Percentile Bootstrap
Confidence Interval, the Bootstrap t Confidence Interval, the Biased-Corrected
Percentile Bootstrap Confidence Interval (BCPB) and the Biased-Corrected
Accelerated Confidence Interval (BCa), besides Bootstrap technique for
regression and hypothesis tests accomplishment by using Bootstrap confidence
intervals. Situations were presented wherein each method used to obtain the
Bootstrap confidence intervals is more proper, depending on the kind of
distribution, bias and skewness of the studied parameter. Aiming at applying these
techniques, six studies of case were carried out, enabling the application of the
most recommended Bootstrap estimation methods to estimate the parameter
mean, variance, proportion and standard deviation of processes. These cases
included symmetrical and skewed distributions. When the distribution of
probabilities of the parameter to be estimated was known, the confidence interval
based on the probability distribution of the estimator was also computed.
Key terms: Resampling, Bootstrap technique, Confidence Interval
Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica
3
INTRODUO

A utilizao de tcnicas estatsticas no mundo dos negcios vem
crescendo cada vez mais, devido principalmente a sua utilidade na comparao
de servios, verificao de qualidade, anlise para desenvolvimento de produtos e
outros. A tcnica de Bootstrap uma das possveis tcnicas de reamoostragem a
serem utilizadas.
A reamostragem consiste em sortear com reposio dados pertencentes a
uma amostra retirada anteriormente, de modo a formar uma nova amostra.
Tcnicas de reamostragem so teis em especial quando o clculo de
estimadores por mtodos analticos for complicado. Reamostrar permite
diferentes alternativas para se encontrar desvios padres e intervalos de
confiana atravs da anlise de um conjunto de dados.
Existem diversas tcnicas de reamostragem que visam estimar parmetros
de uma distribuio de interesse. Uma vantagem em utilizar a tcnica de
reamostragem Bootstrap a generalidade com que pode ser aplicada, pois requer
que menos suposies sejam feitas. Outras vantagens so que geralmente
fornece respostas mais precisas, alm de favorecer o entendimento.
Muitas vezes a distribuio de probabilidade da estatstica de interesse
desconhecida. Nesse caso o Bootstrap muito til, pois uma tcnica que no
exige diferentes frmulas para cada problema e pode ser utilizada em casos
gerais, no dependendo da distribuio original da estatstica do parmetro
estudado.
Segundo Davison e Hinkley (1997), repetir um procedimento de anlise
original com muitas rplicas de dados pode ser denominado mtodo intensivo
computadorizado. Para realizar uma estimao atravs da utilizao de Bootstrap
necessria a realizao de um nmero muito grande de reamostragens e o
clculo de diversas estatsticas para cada uma destas reamostragens. Isto exige o
auxlio de programas computacionais para realizar as reamostras e os clculos de
forma mais rpida e eficaz.
Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica
4
Esse um dos motivos pelo qual essa tcnica vem se desenvolvendo mais
nos ltimos tempos, pois com o avano tecnolgico os softwares esto ficando
mais prticos, rpidos e acessveis.
A utilizao da tcnica de Bootstrap no implica que as outras devam ser
ignoradas, podendo ser usada como um complemento na argumentao das
concluses obtidas.
Devido a sua generalidade, a tcnica Bootstrap se encaixa na soluo de
problemas complexos. Atravs do uso da tcnica de Bootstrap os parmetros
como a mdia, a varincia, a proporo e at mesmo parmetros menos
utilizados como o mximo, mnimo, etc. de uma populao podem ser estimados
pontualmente e por intervalo.
A reamostragem baseada nos dados da amostra mestre utilizada pela
tcnica de Bootstrap denominada no paramtrica uma vez que a distribuio de
probabilidades da estatstica do parmetro a ser estimado desconhecida.
Atravs desta tcnica possvel obter a distribuio amostral de um parmetro a
partir da amostra original.
A forma no paramtrica a mais utilizada. Entretanto, quando a
distribuio de probabilidades das estimativas dos parmetros de interesse da
populao da qual a amostra mestre foi extrada for conhecida, outra forma de
Bootstrap pode ser aplicada. Esta forma denominada paramtrica consiste em
gerar reamostras baseadas na distribuio de probabilidades conhecida utilizando
como parmetros desta distribuio a estimativa dos mesmos obtida atravs da
amostra mestre. Neste caso o interesse ser estimar o vcio das estimativas dos
parmetros e assim efetuar as correes necessrias (NAVIDI, 2006).
Outra utilidade relatada por Hall (1988) que, ao se comparar o intervalo
de confiana obtido atravs da utilizao da tcnica Bootstrap com o intervalo de
confiana baseado na distribuio de probabilidades conhecida do estimador, se
este ltimo tiver sido calculado usando suposies inadequadas, a diferena entre
estes dois resultados ser gritante, chamando assim ateno em relao ao erro
cometido.
Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica
5
Neste artigo sero apresentadas as diversas tcnicas de Bootstrap para
estimao. Seis estudos de caso tambm sero realizados.

BOOTSTRAP

Para realizar o teste utilizando a tcnica Bootstrap preciso colher uma
amostra de tamanho n que ser denominada amostra mestre. Essa amostra deve
ser coletada de maneira planejada, uma vez que se essa amostra for mal tirada e
no representar bem a populao, a tcnica de Bootstrap no levar resultados
confiveis.
Hesterberg et al. (2003) afirmam que a amostra mestre representa a
populao da qual foi retirada. As reamostras desta amostra mestre representam
o que se deve obter quando so retiradas muitas amostras da populao original.
A distribuio Bootstrap da estatstica, baseada em muitas reamostras,
representa uma distribuio amostral desta estatstica. Esta caracterstica faz com
que uma das utilidades da tcnica Bootstrap seja checar a normalidade da
distribuio original da estatstica em foco.
Para que a aplicao da tcnica resulte em valores confiveis devem ser
feitas, a partir da amostra mestre, centenas ou at milhares de reamostras do
mesmo tamanho n. A maioria dos autores recomenda a utilizao de 1000
reamostras. Segundo Montgomery (2001) o nmero de reamostragens pode ser
estipulado verificando a variao do desvio padro para a estimativa do
parmetro em questo calculado para as reamostras medida que estas so
realizadas. No momento em que esse valor se estabilizar o tamanho da reamostra
Bootstrap estar adequado.
importante que a reamostragem seja realizada com reposio sempre
selecionando os valores de forma aleatria. Para a gerao destas reamostras as
tcnicas computacionais so de grande utilidade, pois sem estas, o tempo para
que fossem feitas todas as reamostras desejadas de forma manual seria
excessivamente grande.
Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica
6
Uma vez geradas as reamostras, deve-se calcular para cada uma delas a
estatstica solicitada no problema. Essa tcnica no altera nenhum valor da
amostra mestre, ela apenas trabalha na anlise da combinao dos valores
iniciais com a finalidade de se obter as concluses desejadas.
A variabilidade presente no Bootstrap dada pela escolha da amostra
mestre e pelas reamostras, sendo a variabilidade devido escolha da amostra
mestre a mais significativa.
O desvio padro da distribuio Bootstrap para a mdia (tambm chamado
de erro padro) uma medida de variabilidade e calculado da seguinte forma:

=
2
* *

1

1
1
i i bootstrap
B B
SE (1)
com
*

i
igual ao valor da estatstica para cada reamostra e B igual ao
nmero de reamostragens realizadas. O asterisco usado para diferenciar a
estatstica das reamostras da estatstica da amostra original, a qual
representada por

. Algumas literaturas utilizam no primeiro valor do


denominador, apenas B ao invs de (B 1), pois como o nmero de
reamostragens um valor muito alto, essa alterao acaba ficando praticamente
insignificante.
A distribuio Bootstrap geralmente tem aproximadamente a mesma forma
e amplitude que a distribuio amostral da estatstica, porm est centrada na
estatstica dos dados originais (amostra mestre), enquanto a distribuio amostral
est centrada no parmetro da populao.
Segundo Montgomery e Runger (2003), uma estatstica utilizada para
estimar um parmetro viciada quando a distribuio amostral no estiver
centrada no verdadeiro valor do parmetro. A tcnica Boostrap nos permite
verificar o vcio olhando se a distribuio Bootstrap da estatstica est centrada na
estatstica da amostra mestre.
O estimador do vcio da distribuio Bootstrap :


*
=
bootstrap
vcio (2)
Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica
7
Segundo Gonzlez Manteiga, Prada Snchez e Romo Urroz (1994) uma
das aplicaes da metodologia Bootstrap obter intervalos de confiana
confiveis. H diversas tcnicas distintas para o clculo de intervalos de confiana
Bootstrap. Entre as diferentes maneiras de calcular o Intervalo de Confiana pelo
mtodo Bootstrap destacam-se o mtodo Bootstrap t, o mtodo Percentil, que
pode ser obtido de duas formas diferentes, o Mtodo do Percentil Corrigido em
Relao ao Vis, Biased-Corrected Percentile Bootstrap (BCPB) e o Mtodo de
Correo de Vcio Acelerado, Biased-Corrected Accelerated (BC
a
). Estas tcnicas
sero apresentadas a seguir:

a) O Intervalo de Confiana Bootstrap t

Calcula-se o intervalo de confiana Bootstrap t para uma determinada
estatstica da seguinte maneira:
[ ]
bootstrap t bootstrap
SE t a estatstic IC =
(3)
, sendo n o tamanho da amostra mestre, t encontrado utilizando-se (n-1)
graus de liberdade, e
bootstrap
SE , o desvio padro bootstrap, calculado utilizando a
Equao (1) para a estatstica em estudo.
A flexibilidade e quase automaticidade do clculo de intervalo de confiana
por esse mtodo muito boa, porm existe um problema que pode afetar sua
eficcia. O intervalo de confiana Bootstrap t realmente s funciona bem quando
sabemos que a distribuio da estatstica na distribuio Bootstrap
aproximadamente normal e a estatstica pouco viciada. Respeitadas estas
condies o intervalo de confiana Bootstrap t pode ser calculado na estimao
de diversos parmetros alm da mdia populacional, como por exemplo, a
proporo e o coeficiente de correlao.

b) O Intervalo de Confiana Bootstrap Percentil

O intervalo de confiana percentil pode ser calculado de duas maneiras:
Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica
8
Segundo Efron (1986), para uma confiana (1 )100%, a primeira forma
encontrar o percentil (1 /2)100% e o percentil (/2)100% da mdia das
reamostras da estatstica do parmetro que se deseja estimar.
A segunda maneira de se obter o intervalo de confiana percentil utilizando
a tcnica em estudo atravs dos percentis das diferenas dos valores das
estatsticas das reamostras em relao ao valor mdio desta mesma estatstica
nas reamostras (MONTGOMERY e RUNGER, 2003).
Para estimar um intervalo de confiana para uma estimativa

, calcula-se o
valor destas estatsticas para cada uma das i reamostras Bootstrap (
*

i
) e a
mdia dessas estimativas
*

. Encontra-se ento, para cada reamostra i, a


diferena entre esses valores, isto :
*
*

=
i
diferena (4)

Para uma confiana de 95%, encontram-se os percentils 97,5% e 2,5%
destas diferenas e calcula-se o intervalo de confiana Bootstrap Percentil da
seguinte forma:
[ ] diferenas P diferenas P IC
percentil bootstrap % 5 , 2 % 5 , 97

;

=
(5)
Para verificar se o intervalo de confiana t calculado confivel podemos
compar-lo com o intervalo de confiana percentil. Se o vcio for pequeno e a
distribuio Bootstrap for aproximadamente normal, os dois intervalos iro
apresentar valores muito prximos. Segundo Hesterberg et al. (2003), caso os
intervalos de confiana Bootstrap calculados pela t e pelo percentil no tiverem
valores prximos nenhum destes mtodos deve ser utilizado. Entretanto Efron
(1986) afirma que se a distribuio Bootstrap no for aproximadamente normal,
mas existir uma transformao monotnica possvel que a torne normal, pode-se
calcular o intervalo de confiana Bootstrap Percentil para os dados transformados
e posteriormente desfazer a transformao para os limites do intervalo
encontrado. Isto possvel uma vez que a transformao utilizada foi uma
transformao monotnica, portanto o intervalo de confiana Bootstrap pelo
Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica
9
mtodo Percentil assim calculado coincidir com o intervalo de confiana
Bootstrap pelo mtodo Percentil para os dados no transformados.
Se o vcio e a assimetria esto presentes de forma muito forte
mais recomendvel que se utilize mtodos de Bootstrap de correo como o
Mtodo BCPB e o mtodo BC
a
.

c) O Intervalo de Confiana Bootstrap BCPB

No clculo do intervalo de confiana BCPB os extremos do intervalo so os
percentis da distribuio Bootstrap ajustados para corrigir o vcio e assimetria
desta distribuio.
Por exemplo, para encontrar um intervalo de confiana BCPB com 95% de
confiana, preciso ajustar os percentis que para um clculo de intervalo de
confiana Percentil tradicional seriam 2,5% e 97,5% para outros valores, a fim de
corrigir o vcio e assimetria. Se a estatstica for viciada para cima o BCPB move
os extremos para a esquerda e se a estatstica for viciada para baixo o BCPB
move os extremos para a direita.
Para realizar o clculo do intervalo de confiana BCPB deve-se
primeiramente ordenar as B estimativas
*

i
em forma crescente e calcular a
probabilidade denominada p
0
de uma estimativa ser inferior estimativa da
amostra mestre (

). Esse passo pode ser representado da seguinte forma:


[ ]

*
0
= i P p (6)
A partir do valor encontrado p
0
obtido o parmetro correo do vcio z
0

que representa a inversa da normal no ponto p
0
.
( )
0
1
0
p z

=
(7)
O prximo passo selecionar um nvel (1 )100% de confiana para a
estimativa do parmetro e determinar
2

z
. ento possvel obter os percentis PI e
P
S
:
Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica
10

=
2
0
2

z z P
I
(8)

+ =
2
0
2

z z P
S
(9)

O Intervalo de Confiana BCPB calculado da seguinte maneira:
[ ] )

( ; )

(
* *
i P i P BCPB
S I
P P IC = (10)

d) O Intervalo de Confiana Bootstrap BC
a


O mtodo de Correo de Vcio Acelerado permite encontrar o intervalo de
confiana quando assimetria estiver presente de maneira muito forte. Esse
mtodo no difere muito do BCPB sendo esta diferena o fato de o BC
a
possuir
uma constante de acelerao a que ajusta o intervalo de confiana em relao
assimetria. Segundo Efron (1986) nesta situao este mtodo mais indicado
que o mtodo BCPB.
O intervalo de Confiana BC
a
obtido realizando os mesmo passos do
clculo do intervalo de confiana BCPB com os limites P
I
e P
S
, porm utilizando
um ajuste por meio da constante de acelerao a. A obteno da constante a
envolve clculos no triviais, o que leva o Intervalo de Confiana BC
a
ser mais
utilizado quando h algum software estatstico disponvel. O programa S-PLUS
citado em vrios artigos como, por exemplo, em Pereira et al. (2000). possvel
encontrar tambm alguns programas livres que calculam esta constante.
O clculo do intervalo de confiana BC
a
feito atravs da mesma Equao
(10), porm com P
I
e P
S
respectivamente iguais a:

+
=
2
0
2
0
0
1

z z a
z z
z P
I
(11)

Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica
11

+
+ =
2
0
2
0
0
1

z z a
z z
z P
I
(12)

De acordo com Andrews e Buchinsky (2002) possvel determinar a
constante a de maneira mais simples quando as variveis aleatrias observadas
na amostra mestre forem independentes e identicamente distribudas. Neste caso:
( ) ( )
( )
( ) ( )
( ) ( )
2
3
1
2
.
1
3
.

6

=
=

=
n
i
i
n
i
i
a


(13)
, com
( ) i

representando o valor das estimativas do parmetro estudado


para cada amostra i que consiste na amostra mestre sem a observao i da
mesma, com 1 i n e
( ) .

o valor da mdia das estimativas


( ) i

.

e) A tcnica Bootstrap na Regresso

Existem dois procedimentos para se estimar os coeficientes do modelo de
regresso utilizando a tcnica de Bootstrap: o mtodo Bootstrap dos Resduos e o
mtodo Bootstrap dos Casos ou Pares (MONTGOMERY, 2001).
O procedimento de Bootstrap paramtrico denominado Bootstrap dos
Resduos consiste em estimar os coeficientes de regresso para os dados
originais e assim gerar os respectivos resduos para as n observaes realizadas.
Estes resduos formaro a amostra mestre. Deve-se ento gerar as reamostras a
partir destes resduos. O valor do vetor resposta para uma reamostragem (y*)
ser obtido somando-se o vetor de resduos desta reamostra ao vetor resposta
estimado nos dados originais ( y ). Para cada reamostra so ento calculadas as
estimativas dos coeficientes de regresso. As mdias das estimativas dos
coeficientes de regresso para as reamostras sero as estimativas Bootstrap
pontuais dos mesmos. Intervalos de confiana para os coeficientes da regresso
podem ser obtidos pelo mtodo percentil. A coincidncia dos intervalos
Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica
12
tradicionais e Bootstrap confirmar as suposies feitas para a realizao da
anlise de regresso.
O procedimento de Bootstrap no paramtrico denominado Bootstrap dos
Casos ou Pares deve ser usado quando existe uma transformao nos dados
originais de modo que para estes dados transformados possa ser realizada uma
regresso linear. Neste caso as estimativas dos erros padro dos coeficientes
sero aproximadas e estas aproximaes sero vlidas apenas para grandes
amostras. O mtodo Bootstrap fornecer uma estimativa dos intervalos de
confiana para os coeficientes da regresso e ser til para checar a validade da
aplicao assinttica para os resultados obtidos.
Na forma Bootstrap dos Casos ou Pares os prprios dados originais devem
compor a amostra mestre. Estes dados originais (que so vetores) devem ser
reamostrados. Para cada reamostra so estimados os coeficientes da regresso
linear para os dados da reamostra transformados. Intervalos de confiana para os
coeficientes da regresso podem ser obtidos pelo mtodo percentil.

f) Teste de Hiptese com Intervalos de Confiana Bootstrap

Dado um intervalo de confiana calculado por qualquer mtodo
Bootstrap com 100(1

)%, deve-se rejeitar com 100

% as hipteses nulas de
que o parmetro estimado seja igual a qualquer valor fora desse intervalo e deve-
se aceitar com 100

% as hiptese nulas de que este mesmo parmetro seja


igual a qualquer valor dentro do intervalo de confiana Bootstrap (NAVIDI, 2006)

g) Outras consideraes sobre os estimadores Bootstrap

O Bootstrap muito genrico e, devido a esta generalidade, h mais de um
mtodo Bootstrap como soluo para um determinado problema.
Na maioria das publicaes no tcnicas em estatstica, a forma de clculo
dos intervalos de confiana Bootstrap no costuma ser apresentada. Segundo
Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica
13
enqute realizada por Hall (1988), o mtodo Percentil utilizado em mais da
metade destas publicaes.
A maioria dos procedimentos de intervalo de confiana se torna mais
precisa quando o tamanho da amostra aumenta. Hesterberg et al. (2003) afirma
que um problema que existe nos intervalos de confiana Bootstrap t e Percentil
que esta melhora ocorre de forma mais lenta necessitando de um grande
aumento no tamanho da amostra para refletir uma melhora na preciso (na base
de 10 para 1).

METODOLOGIA

Alguns estudos de caso foram realizados para colocar em prtica tcnica
de reamostragem Bootstrap. Para cada estudo foi coletada uma amostra mestre
diferente, seguindo as tcnicas de amostragem apropriadas.
Foram realizadas 1000 reamostras e calculados os intervalos de confiana
Bootstrap segundo as diversas formas convenientes para cada situao. Quando
existia uma frmula de clculo do intervalo de confiana para a estimativa do
parmetro baseada na sua distribuio de probabilidades (denominado neste
trabalho intervalo de confiana padro), este foi calculado. Os resultados foram
ento comparados.
Para o clculo dos diversos intervalos de confiana foi utilizada uma
confiana de 95%. Apenas no estudo de caso envolvendo o desvio padro de um
controle estatstico de processos a confiana utilizada para os clculos foi de
99,73%, de acordo com as cartas de controle de Shewhart.
Para a realizao das reamostras e anlises foi utilizado o programa
MINITAB.
Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica
14
Estudo de caso 1 - Nmero de alunos reunidos diariamente em determinado
local durante um intervalo de tempo estabelecido

Neste caso foi analisada a quantidade de alunos reunidos durante 25 dias
no corredor do 2 andar do prdio da Escola de Engenharia da Universidade
Presbiteriana Mackenzie em algum horrio pertencente ao intervalo das 16:30 h
s 16:40 h.
O nmero de alunos foi observado diariamente em um horrio sorteado
aleatoriamente dentro do intervalo estipulado.
A partir desta amostra de tamanho 25, foram realizadas mil reamostragens.
Atravs da ferramenta Bootstrap foi estimado o nmero mdio de alunos
presentes naquele determinado local do corredor no horrio entre 16:30 h e 16:40
h.

Estudo de caso 2 - Transporte utilizado pelos alunos no seu deslocamento
dirio para a Universidade

Foi realizada, no segundo semestre de 2005, uma pesquisa para se
estimar a probabilidade de um aluno do curso Engenharia de Produo da Escola
de Engenharia da Universidade Presbiteriana Mackenzie utilizar transporte
pblico no seu deslocamento de ida e/ou volta para a universidade.
Foi realizada uma amostragem por conglomerado no qual foi sorteado o
sexto semestre. Foi perguntado para seus 33 alunos matriculados se eles
utilizavam, na maior parte dos dias, transporte pblico como meio de locomoo
para a universidade. Quando a resposta foi positiva a varivel foi codificada como
1 e quando negativa a varivel foi codificada como 0. Foi ento calculada a
probabilidade p de o aluno utilizar transporte pblico.
Os 33 dados coletados formaram a amostra mestre. Com base nesta
amostra, foram realizadas 1000 reamostras de mesmo tamanho e aplicada
tcnica Bootstrap a fim de calcular os intervalos de confiana Bootstrap para a
proporo de respostas afirmativas. Estes resultados foram comparados com o
Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica
15
intervalo de confiana padro. Foi tambm calculado o intervalo de confiana
Bootstrap para a varincia desta proporo.

Estudo de Caso 3 - Medio de parafusos

Foi selecionada uma amostra casual simples de cinqenta parafusos
pertencentes a uma caixa fechada contendo 200 parafusos de um mesmo lote.
Foi realizada a medio destes cinqenta parafusos no laboratrio de fsica da
Universidade Presbiteriana Mackenzie utilizando como dispositivo de medio
dimensional um paqumetro digital ajustado em milmetros, devidamente
calibrado.
Para realizar a amostragem os 200 parafusos pertencentes a uma caixa
foram numerados. Destes, foram sorteados cinqenta parafusos para compor a
amostra mestre. A caixa de parafusos representa a populao de onde foi retirada
a amostra mestre.
A partir desta amostra de cinqenta comprimentos de parafusos, foram
geradas mil reamostras de mesmo tamanho.

Estudo de caso 4 - Tempo de espera na fila do Benjamim Abraho

Neste caso o objetivo era analisar o tempo de espera desde o momento em
que um indivduo entra na fila da Padaria Benjamim Abraho situada na praa de
alimentao da Universidade Presbiteriana Mackenzie at o momento em que
este mesmo indivduo recebe seu pedido. Os dados foram coletados entre os
horrios de 19:30 h e 20:20 h de um dia letivo.
A coleta dos dados foi feita de forma sistemtica, observando-se o intervalo
de tempo de espera e atendimento da primeira pessoa de cada trs que entravam
na fila. O objetivo desse estudo de caso foi obter um intervalo de confiana para
mdia do tempo total de espera e atendimento ao cliente utilizando a tcnica de
Bootstrap.
Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica
16
Utilizou-se para medio relgios digitais ajustados no mesmo horrio e
duas pessoas, uma situada na entrada da fila e a outra na sada. A pessoa da
entrada distribua a ficha com o horrio em que o indivduo participante da
pesquisa entrava na fila e a pessoa da sada recolhia a ficha e anotava o horrio
de sada.
Foi coletada uma amostra mestre de tamanho 60. A partir desses dados,
foram realizadas 1000 reamostras.

Estudo de caso 5 Tempo de processamento de um digestor de vsceras de
aves

Segundo Ferroli et al. (2002) as fbricas de farinhas e leos de
subprodutos de origem animal esto em processo de evoluo e mudanas. Para
que estas consigam acompanhar as constantes modificaes que ocorrem no
mercado, uma de suas principais preocupaes reduzir a emisso de poluentes
ao meio ambiente.
O digestor a principal mquina em uma graxaria e est envolvido
diretamente no aproveitamento de resduos de indstrias de transformao de
produtos animais.
Foi analisado o funcionamento de um digestor existente em uma fbrica
onde funcionam seis digestores de vsceras de aves. Os dados para este caso
foram retirados do artigo Fbrica de subprodutos de origem animal: a importncia
do balanceamento das cargas dos digestores de vsceras de Ferroli et al. (2002).
A varivel medida foi o tempo de processamento de um digestor de
vsceras de aves. Para cada um dos 43 conjuntos de valores medidos contendo 6
observaes cada, foi calculada a amplitude R. Essas 43 amplitudes
representaram amostra mestre e a partir destas foram geradas 1000 reamostras.
Neste caso a estatstica ser a estimativa do desvio padro do processo igual a
2
d
R
onde d
2
um valor tabelado.
Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica
17
Este caso um exemplo de aplicao da tcnica de Bootstrap na rea de
Engenharia de Produo.

Estudo de caso 6 - Verificao da adeso dos alunos a um programa de uso
racional de gua

Considerando que a gua potvel um recurso raro no planeta, sua
economia torna-se absolutamente necessria.
A Universidade Presbiteriana Mackenzie, consciente deste problema, vem,
desde 2002, implantando um programa de Uso Racional de gua dentro do
Campus Itamb. (CYMROT et al.)
Vrias medidas foram tomadas desde ento, dentre elas, destacam-se as
seguintes medidas:
Foram registrados, em todos os prdios, todos os pontos de gua, como
torneiras, bacias, mictrios, chuveiros, etc.
A partir de 2002, foram trocadas torneiras de lavatrio por modelos mais
econmicos, com fechamento automtico de gua. Em 2004, cerca de 60% das
torneiras j haviam sido trocadas. Segundo a SABESP (Companhia de
Saneamento Bsico do Estado de So Paulo), esta tal medida resulta em uma
economia de consumo em torno de 20%.
No comeo de 2003, foi oferecido um curso na SABESP de caa
vazamentos a todos os funcionrios da manuteno, inclusive encarregados.
Este curso propiciou a localizao de inmeros vazamentos, sendo ento
trocadas s tubulaes necessrias. Estas mudanas acabaram provocando
algumas modificaes nas configuraes da rede hidrulica do Campus Itamb.
Foram colocados adesivos para conscientizao da necessidade de se
economizar gua atravs do uso adequado de torneiras e bacias na maioria dos
sanitrios existentes no Campus Itamb.
Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica
18
Este estudo foi realizado com o objetivo de verificar a adeso dos alunos
do curso de Engenharia de Produo da Universidade Presbiteriana Mackenzie
em relao ao programa.
Foi realizada uma amostragem casual simples e coletados os dados
relativos aos cinqenta alunos sorteados.
Trs perguntas foram feitas a estes alunos, a saber:
- O aluno tinha notado os adesivos com avisos alertando quanto necessidade
do uso racional de gua?
- O aluno tinha reparado na alterao dos dispositivos de funcionamento das
torneiras de modo que estas permanecessem abertas somente o tempo
necessrio?
- O aluno colabora com a campanha procurando economizar a gua quando de
sua utilizao dentro do Campus Itamb da Universidade Presbiteriana
Mackenzie?
Para cada varivel estudada foram realizadas 1000 reamostras a partir das
respostas obtidas.

RESULTADOS E DISCUSSO

Estudo de caso 1: Nmero de alunos reunidos diariamente em
determinado local durante um intervalo de tempo estabelecido

Ao realizar a anlise descritiva para a amostra mestre, verificou-se a
existncia de alguns possveis outliers que foram mantidos na amostra. O
histograma e o grfico de probabilidade normal utilizando o mtodo de Anderson
Darling para os dados da amostra mestre apresentados nos Grficos 1 e 2
confirmam a aderncia distribuio Normal (p = 0,362).
Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica
19





GRFICO 1 - Histograma da amostra mestre GRFICO 2 - Grfico de probabilidade normal
para a amostra mestre

A Tabela 1 apresenta a amostra mestre, algumas reamostras, a mdia e a
varincia para a amostra mestre e para as reamostras. Cada reamostra foi gerada
atribuindo probabilidade igual a 1/25 para cada observao da amostra mestre e
realizando a amostragem com reposio.











TABELA 1 - Amostra mestre, reamostras, mdia e varincia para a amostra mestre e reamostras.

Pode-se afirmar que a mdia da populao tem distribuio Normal.
Realizadas as 1000 reamostragens com reposio, plotado o histograma (Grfico
3) e realizado o teste de aderncia de Anderson Darling (p = 0,082) para as
C1
P
e
r
c
e
n
t
28 26 24 22 20 18 16 14 12
99
95
90
80
70
60
50
40
30
20
10
5
1
Mean
0,362
19,52
StDev 3,070
N 25
AD 0,387
P-Value
Probability Plot of C1
Normal
C1
F
r
e
q
u
e
n
c
y
27 25 23 21 19 17 15 13
7
6
5
4
3
2
1
0
Mean 19,52
StDev 3,070
N 25
Histogramof C1
Normal
observao amostra mestre reamostra 1 reamostra 2 reamostra 3 ... reamostra 1000
1 24 25 18 21 22
2 17 20 17 25 17
3 19 18 17 20 18
4 20 19 18 26 22
5 22 20 23 21 18
6 26 17 17 19 22
7 18 19 22 18 20
8 20 17 14 14 23
9 17 17 26 14 17
10 19 19 22 20 17
11 14 25 17 22 22
12 18 17 21 25 19
13 25 22 23 14 18
14 17 25 22 18 17
15 14 23 19 26 19
16 23 17 24 23 17
17 18 25 22 17 21
18 17 17 22 20 17
19 22 19 26 17 19
20 19 24 17 21 17
21 20 20 17 22 22
22 21 17 19 22 25
23 19 17 20 20 14
24 17 22 18 19 18
25 22 14 17 22 18
mdia 19,5200 19,8000 19,9200 20,2400 19,1600
varincia 9,4267 3,2146 3,1612 3,4434 2,5768
Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica
20
mdias das reamostras possvel verificar que a distribuio da estatstica mdia
das reamostras Bootstrap se aproxima da distribuio desta mesma estatstica na
populao.





GRFICO 3 - Histograma das 1000 reamostras das mdias

Os valores da mdia e varincia da amostra mestre foram respectivamente
iguais a 19,52 e 9,4267. O vcio calculado para a mdia foi igual a 0,0211,
considerado pequeno (0,11% do valor da mdia da amostra mestre).
Nestas condies foram calculados os intervalos de confiana para as
mdias utilizando a tcnica de reamostragem Boostrap pelos mtodos Percentil =
[18,3200 ; 20,6800] e pelo mtodo Bootstrap t = [18,2804 ; 20,7596] que
resultaram bem prximos.
O histograma das varincias (Grfico 4) apresenta uma forma diferente do
esperado caso a distribuio fosse Normal e o teste de Anderson Darling (Grfico
5) forneceu valor de p menor que 0,005.





GRFICO 4 - Histograma para varincia das
1000 reamostras
GRFICO 5 - Grfico de probabilidade normal
para a varincia das 1000 reamostras

reamostras
F
r
e
q
u
e
n
c
y
22,2 21,6 21,0 20,4 19,8 19,2 18,6 18,0
140
120
100
80
60
40
20
0
Mean 19,50
StDev 0,6006
N 1000
Histogramof reamostras
Normal
variancias
F
r
e
q
u
e
n
c
y
17,5 15,0 12,5 10,0 7,5 5,0 2,5
100
80
60
40
20
0
Mean 9,109
StDev 2,337
N 1000
Histogramof variancias
Normal
variancias
P
e
r
c
e
n
t
20 15 10 5 0
99,99
99
95
80
50
20
5
1
0,01
Mean
<0,005
9,109
StDev 2,337
N 1000
AD 1,196
P-Value
Probability Plot of variancias
Normal
Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica
21
Desta forma os intervalos de confiana Bootstrap pelo mtodo t e Percentil
no so muito confiveis uma vez que a suposio de normalidade no se
verificou. Neste caso aconselhvel o clculo por mtodos como BCPB e BC
a.

O clculo de intervalos de confiana para a varincia atravs dos mtodos
BCPB = [5,6034 ; 14,9469] e BC
a
= [4,1667 ; 15,3657] resultam em valores mais
precisos devido a adequao desses presena de um vis igual a 0,3173,
considerado grande (3,37 % do valor da varincia da amostra mestre). O valor da
constante de acelerao a para a varincia 0,05119.
O intervalo de confiana Bootstrap Percentil [4,7599 ; 13,7515]. Como o
vcio foi negativo, isto , a estimativa Bootstrap est subestimando o valor da
estatstica, pode-se observar que o intervalo de confiana BCPB corrige o
intervalo de confiana para a direita. O Intervalo de confiana Bootstrap BC
a

corrige o intervalo para a direita porm, neste caso, amplia seu tamanho devido
ao valor da constante a.
Os intervalos de confiana padro para a mdia [18,2526 ; 20,7874] e para
a varincia [5,7474 ; 18,2435] apresentaram valores prximos aos dos intervalos
Bootstrap.

Estudo de caso 2: Transporte utilizado pelos alunos no seu deslocamento
dirio para a Universidade

No Grfico 6 apresentado o histograma das propores obtidas nas 1000
reamostras. O teste de aderncia de Kolmogorov Smirnov confirma a aderncia
distribuio Normal das propores estimadas nas 1000 reamostras (p > 0,150).
O Grfico 7 apresenta o Box Plot para as propores nas 1000 reamostras onde
notada a simetria da distribuio. Foram encontrados quatro possveis outliers, a
saber: 0,8182; 0,7879; 0,3030; 0,2727 mantidos na amostra.
Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica
22
Proporo
F
r
e
q

n
c
ia

0,80 0,72 0,64 0,56 0,48 0,40 0,32
160
140
120
100
80
60
40
20
0
Mean 0,5451
StDev 0,08433
N 1000
Histograma da proporo de alunos usurios de transporte pblico

P
r
o
p
o
r

o
0,8
0,7
0,6
0,5
0,4
0,3
0,2
Boxplot da proporo de alunos usurios de transporte pblico

GRFICO 6 - Histograma das propores nas
1000 reamostras
GRFICO 7 - Boxplot da proporo de alunos
usurios de transporte pblico nas 1000
reamostras
Como a distribuio Normal, o intervalo de Confiana Bootstrap t pode
ser utilizado e deve coincidir com os intervalos de Confiana Bootstrap Percentil.
A amostra mestre apresentou uma proporo estimada de alunos que
utilizavam na maior parte dos dias transporte pblico como meio de locomoo
para a universidade igual a 0,5455 com varincia da proporo igual a 0,0075. As
reamostras apresentaram uma mdia das propores igual a 0,5451 com
varincia da proporo igual a 0,0073.
Os intervalos de confiana para a proporo dos alunos que utilizavam na
maior parte dos dias transporte pblico como meio de locomoo para a
universidade foram calculados atravs dos mtodos Percentil e Bootstrap t.
Os intervalos de confiana para a proporo, calculados atravs dos trs
mtodos revelaram-se muito prximos, a saber: intervalo de confiana Bootstrap
Percentil = [0,3932 ; 0,7273], intervalo de confiana Bootstrap Percentil das
Diferenas = [0,3632 ; 0,6973] e intervalo de confiana Bootstrap t = [0,3737 ;
0,7172].
Foi tambm calculado o intervalo de confiana padro para a proporo.
Para este clculo foram utilizados os dados da amostra mestre, tendo sido obtido
o intervalo [0,3756 ; 0,7153], tambm bem prximo aos demais intervalos de
confiana calculados.
O vcio encontrado foi de 0,0004 (0,07% do valor da estatstica na
amostra mestre).
Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica
23
O Grfico 8 apresenta o teste de aderncia de Kolmogorov Smirnov no
qual no foi confirmada a normalidade da distribuio das varincias das
propores estimadas nas 1000 reamostras (p < 0,010).
varincia da proporo
P
o
r
c
e
n
t
a
g
e
m
0,009 0,008 0,007 0,006 0,005 0,004
99,99
99
95
80
50
20
5
1
0,01
Mean 0,007299
StDev 0,0003851
N 1000
KS 0,165
P-Value <0,010
grfico de probabilidade normal da varincia da proporo

GRFICO 8 - Grfico de probabilidade normal para as varincias das propores de alunos
usurios de transporte pblico nas 1000 reamostras.

Devido falta de normalidade no indicado o uso do intervalo de
confiana Bootstrap t.
O intervalo de confiana para a varincia da proporo calculado atravs
do mtodo de Percentil foi igual a [0,0060 ; 0,0076]. Como a distribuio de
probabilidades da varincia assimtrica e o vcio encontrado foi de 0,0002
(2,67% do valor da estatstica na amostra mestre), sendo o estimador
tendencioso, a melhor opo o clculo dos intervalos de confiana para a
varincia atravs dos mtodos BCPB e BC
a
, os quais apresentaram
respectivamente os seguintes valores [0,0064 ; 0,0076] e [0,0060 ; 0,0076]. Para
obteno do intervalo de confiana pelo mtodo BC
a
o valor encontrado para a
constante a foi igual a 0,005297. Neste caso a correo realizada foi
desprezvel.

Estudo de Caso 3: Medio de parafusos

O Grfico 9 apresenta o histograma das 1000 mdias das reamostras
Bootstrap.
Pode-se notar a forma muito prxima Normal. O teste de aderncia
distribuio Normal realizado pelo mtodo de Anderson Darling confirma esta
hiptese (p = 0,156).
Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica
24
parafusos
F
r
e
q
u
e
n
c
y
27,18 27,12 27,06 27,00 26,94 26,88 26,82
140
120
100
80
60
40
20
0
Mean 26,99
StDev 0,06374
N 1000
Histogramof parafusos
Normal


GRFICO 9 - Histograma das mdias das mil reamostras dos comprimentos dos parafusos

A mdia da amostra mestre encontrada foi 26,9908, sua mediana 27,0050
e sua varincia apresentada por 0,2043. possvel verificar a simetria dos dados
que compe a amostra mestre pela proximidade do valor da mediana e o valor da
mdia.
Utilizando a tcnica Bootstrap, calculou-se os intervalos de confiana para
a mdia e para a varincia de forma paramtrica e no paramtrica atravs do
mtodo Percentil.
No clculo do intervalo de confiana Bootstrap Percentil no paramtrico
para as mdias, os valores obtidos foram [26,8770 ; 27,1178] e o intervalo de
confiana Bootstrap Percentil das Diferenas foi igual a [26,8657 ; 27,1066]. O
Intervalo de Confiana Bootstrap Percentil paramtrico apresentou os seguintes
valores [26,8645 ; 27,1035]. Tambm foi calculado o intervalo de confiana
Bootstrap t igual a [26,8627 ; 27,1189].
Como a distribuio das mdias dos comprimentos dos parafusos
conhecida, foi possvel realizar o clculo do intervalo de confiana padro. O
intervalo obtido foi [26,8610 ; 27,1206].
A mdia das mdias nas reamostras foi igual a 26,9928. O valor do vis na
forma no paramtrica calculado com os dados das reamostras foi igual a 0,0020,
considerado pequeno (0,0007% do valor da estatstica na amostra mestre). Neste
caso os mtodos Bootstrap t e Bootstrap Percentil de clculo de intervalo de
confiana so adequados e resultaram em valores prximos.
Os intervalos de confiana para varincia utilizando a tcnica Bootstrap
forneceram valores prximos, a saber: intervalo de confiana Bootstrap Percentil
Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica
25
no paramtrico = [0,1313; 0,2740] e Percentil das Diferenas no paramtrico =
[0,1296; 0,2723]. Atravs da aplicao da tcnica paramtrica obteve-se o
intervalo de confiana Bootstrap Percentil paramtrico = [0,1363 ; 0,2914].
Supondo a distribuio Quiquadrado para a varincia dos comprimentos
dos parafusos, foi possvel calcular o intervalo de confiana igual a [0,1425 ;
0,3172].
A mdia das varincias nas reamostras foi igual a 0,1993. O valor do vis
para a estimativa da varincia foi igual a 0,0050 considerado grande (2,45%
valor da estatstica na amostra mestre).
Neste caso aconselhvel o clculo dos intervalos de confiana para a
varincia atravs dos mtodos BCPB e BC
a
, os quais apresentaram
respectivamente os seguintes valores [0,1425 ; 0,2887] e [0,1230 ; 0,3022]. Para
obteno do intervalo de confiana pelo mtodo BC
a
o valor encontrado para a
constante a foi igual a 0,043243.

Estudo de caso 4: Tempo de espera na fila do Benjamim Abraho

Atravs da construo do Box Plot, foram encontrados os possveis outliers
235,283 ; 232,850 ; 189,0167 ; 188,017 ; 187,650, os quais foram mantidos na
amostra mestre uma vez que tais dados extremos realmente ocorreram.
Segundo Prado (1999), o tempo de espera em uma fila tem em geral
distribuio exponencial, porm, neste caso como foi computado o tempo de
espera, tempo de atendimento e tempo de pagamento, a distribuio resultante
no se comportou como exponencial. Deve-se salientar que a forma de
pagamento determinou, de maneira marcante, a diferena nos tempos totais
computados. Se o comprador utilizava dinheiro a operao era bem rpida,
porm, se ele usava algum carto eletrnico poderia ser consumido um tempo
muito maior.
O histograma (Grfico 10) indicou a forma da distribuio do tempo total
prxima da Normal. O teste de aderncia pelo mtodo de Anderson Darling
confirmou a aderncia distribuio Normal (p = 0,809).
Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica
26
Os dados da amostra mestre apresentaram uma mdia igual a 209,0333.
As mil reamostragens foram feitas com reposio e calculadas as estatsticas
necessrias para a aplicao da tcnica Bootstrap.
Os intervalos de confiana para a mdia foram obtidos pelo mtodo
Percentil das Diferenas = [193,9140 ; 223,8027], mtodo Percentil = [194,1488 ;
224,0375] e, sendo a distribuio aproximadamente normal, o clculo foi realizado
pelo mtodo Bootstrap t = [193,9850 ; 224,0817]. Os trs intervalos de confiana
apresentaram valores prximos.
Tempo de atendimento
F
r
e
q

n
c
ia

232 224 216 208 200 192
120
100
80
60
40
20
0
Mean 208,9
StDev 7,520
N 1000
Histograma do tempo de atendimento


GRFICO 10 - Histograma das 1000 mdias das reamostras do tempo de espera e atendimento
na fila

Foi calculado o intervalo de confiana para a mdia do modo padro para
que os resultados fossem comparados, a saber: [193,3806 ; 224,6861]. O vcio
presente para o tempo mdio de atendimento foi igual a 0,1152 (0,055% do
valor da estatstica na amostra mestre), considerado pequeno.

Estudo de caso 5: Tempo de processamento de um digestor de vsceras de
aves

As amplitudes foram reamostradas e calculado o desvio padro do
processo para essas 1000 reamostras bootstrap. A partir dessas reamostras, foi
plotado o histograma que permite verificar a proximidade da distribuio dos
desvios padres do processo com a distribuio Normal. O teste de probabilidade
de aderncia pelo mtodo de Anderson Darling confirmou esta hiptese (p =
0,537).
Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica
27
Atravs da tcnica Bootstrap, foram obtidos intervalos de confiana para o
desvio padro do processo pelos mtodos Percentil e t. Para o clculo do
intervalo de confiana Bootstrap t foi estimado o desvio padro do processo da
amostra mestre, a saber: 22,6226. Os resultados obtidos pelos intervalos foram
respectivamente iguais a [18,3447 ; 26,9005] e [19,0134 ; 26,6287 ] para os
mtodos Bootstrap t e Percentil.
A proximidade dos intervalos ocorre devido distribuio ser
aproximadamente Normal alm do vcio calculado pela diferena entre a mdia do
desvio padro das reamostras do processo e o desvio padro do processo da
amostra mestre ser relativamente pequeno, igual a 0,0154 (0,07% do valor da
estatstica na amostra mestre).

Estudo de caso 6: Verificao da adeso dos alunos a um programa de uso
racional de gua

As respostas para as perguntas foram codificadas como zero quando
negativas e um quando positivas. Atravs da tcnica Bootstrap, foram calculados
os intervalos de confiana para a proporo de respostas afirmativas e seus
resultados comparados com o intervalo de confiana padro.
Para cada resposta obtida para as trs perguntas, foram geradas 1000
reamostras e obtidos os seguintes resultados:
Em relao percepo de adesivos que estavam sendo colados, foi
realizado um teste de aderncia distribuio Normal pelo mtodo de
Kolmogorov Smirnov (p > 0,150), o que possibilita o clculo dos intervalos de
confiana Bootstrap pelo mtodo Percentil = [0,5200 ; 0,8000] e pelo mtodo
Bootstrap t= [0,5243 ; 0,7957]. Como a distribuio da proporo nas reamostras
aproximadamente Normal, foi possvel calcular o intervalo de confiana padro
para proporo e o resultado obtido foi [0,5287 ; 0,6954]. Todos os intervalos
resultaram muito prximos.
Para as 1000 reamostras dos dados que representam o resultado da
pesquisa sobre o aluno que havia notado a alterao dos dispositivos de
Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica
28
funcionamento das torneiras, foram calculadas as propores cuja distribuio foi
considerada Normal atravs do teste de aderncia pelo mtodo de Kolmogorov
Smirnov (p > 0,150).
Os intervalos de confiana Bootstrap Percentil e t foram calculados e seus
resultados comparados com o clculo do intervalo de confiana padro para
proporo. Os resultados obtidos foram: intervalo de confiana Bootstrap t =
[0,2623 ; 0,5377], intervalo de confiana Bootstrap Percentil = [0,2800 ; 0,5400] e
intervalo de confiana padro = [0,2642 ; 0,4183], todos muito prximos.
O teste de aderncia realizado pelo mtodo de Kolmogorov Smirnov para a
distribuio das propores nas 1000 reamostras das respostas dos alunos
quanto colaborao na diminuio do consumo de gua confirma a aderncia
distribuio Normal (p >0,150).
Os valores encontrados nos clculos dos intervalos de confiana Bootstrap
Percentil, t e padro foram muito prximos, a saber: intervalo de confiana
Bootstrap t = [0,4228 ; 0,6972], intervalo de confiana Bootstrap Percentil =
[0,4200 ; 0,7000] e intervalo de confiana padro = [0,4224 ; 0,5897].

CONCLUSO

Atravs da realizao dos estudos de caso, foi possvel verificar a
adequao da tcnica Bootstrap em situaes presentes no cotidiano.
Os intervalos de confiana e as estimativas encontradas em todos os
estudos de caso foram coerentes e confirmaram a confiabilidade do mtodo para
estimao de parmetros em situaes onde as distribuies das estimativas dos
parmetros eram conhecidas.
O mtodo tambm tornou possvel a estimao de intervalos de confiana
em situaes onde as distribuies dos parmetros so desconhecidas ou
complexas.
Verificou-se, pelos casos estudados, a generalidade de aplicao da
tcnica de estimao atravs da reamostragem e que o mtodo Bootstrap permite
que o clculo do intervalo de confiana seja realizado de modo mais simples e
Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica
29
abrangente para diversas estatsticas, mesmo quando as distribuies de
probabilidades das mesmas so desconhecidas.
Foi possvel estabelecer o intervalo de confiana adequado para cada
situao diferente.
Quando a estatstica do parmetro estudado tinha distribuio Normal, os
intervalos de confiana Bootstrap pelos mtodos t e Percentil coincidiram e foram
adequados.
Quando a distribuio da estatstica do parmetro estudado no era
Normal, porm existia uma transformao monotnica para a estatstica do
parmetro que tornasse sua distribuio Normal, o intervalo Bootstrap Percentil foi
adequado.
Nos casos em que a distribuio no era Normal com a estimativa pontual
Bootstrap muito viciada ou a assimetria presente de modo muito forte, foram
utilizados os mtodos BCPB e BC
a
. Quando era conhecida a distribuio da
estatstica do parmetro, os intervalos BCPB e BC
a
resultaram mais prximos do
intervalo padro que o intervalo Bootstrap Percentil, confirmando a melhora na
estimao com o uso dos intervalos corrigidos.
O valor pequeno do vis uma indicao de que os valores estimados
devem estar prximos dos verdadeiros valores.
Para cada situao deve ser escolhida a tcnica de clculo de intervalo
Bootstrap mais adequada. Quando houve mais de uma tcnica possvel de ser
utilizada, verificou-se que os intervalos de confianas resultaram muito prximos.
Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica
30
REFERNCIAS

[1] ANDREWS, D. W. K.; BUCHINSKY, M. On the number of bootstrap repetitions
for BC
a
confidence intervals. Econometric Theory, v. 18, n. 4, p. 962-984, Aug.
2002.
[2] CYMROT, R.; ROCHA, A. J. F.; MARTINS, A. J.; MOUETTE, D.; DURO, M. A.
S.; MONEZI JUNIOR, O.; ANTUNES, V. R. G. L.; ZIVIERI, J. N. Estudo do uso
racional da gua implantado em um campus da Universidade Presbiteriana
Mackenzie. In: WORLD CONGRESS ON COMPUTER SCIENCE, ENGINEERING
AND TECHNOLOGY EDUCATION, 2006, Itanham. Anais So Vicente:
COPEC, 2006. 1 CD-ROM.
[3] DAVISON, A. C.; HINKLEY, D. V. Bootstrap methods and their application.
Cambridge: Cambridge University Press, 1997.
[4] EFRON, B.; TIBSHIRANI, R. Bootstrap methods for standard errors,
confidence intervals, and other measures of statistical accuracy. Statistical
Science , v. 1, n. 1, p. 5577, Feb. 1986.
[5] FERROLI, P. C. M.; FIOD NETO, M.; CASAROTTO, N.; CASTRO, J. E.
Fbrica de subprodutos de origem animal: a importncia do balanceamento das
cargas dos digestores de vsceras. Revista Produo, v. 10, n. 2, p. 5-9, 2002.
[6] HALL, P. Theoretical comparison of bootstrap confidence intervals. Annals of
Statistics, v. 16, n. 3, p. 927953, Sep. 1988.
[7] HESTERBERG, T.; MOORE, D. S.; MONAGHAN, S.; CLIPSON, A.; EPSTEIN,
R. Bootstrap methods and permutation tests. In: The practice of business
statistics: using data for decisions. New York: W.H. Freeman, 2003. cap. 18.
[8] GONZLEZ MANTEIGA, W.; PRADA SNCHEZ, J. M.; ROMO URROZ, J. J.
The Bootstrap: a review. Computational Statistics, v. 9, n. 1, p. 165-205, 1994.
[9] MONTGOMERY, D. C.; PECK, E. A.; VINING, G. G. Introduction to linear
regression analysis. 3rd ed. New York: Wiley, 2001.
[10] MONTGOMERY, D. C.; RUNGER, G. C. Estatstica aplicada e probabilidade
para engenheiros. 2. ed. Rio de Janeiro: LTC, 2003.
Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica
31
[11] NAVIDI, W. C. Statistics for engineers and scientists. Boston: McGraw-Hill,
c2006.
[12] PEREIRA, J. E.; SILVA, J. F. V.; DIAS, W. P.; SOUZA, G. S. Intervalo de
confiana Bootstrap como ferramenta para classificar raas do nematide de
cisto de soja. Pesquisa Agropecuria Brasileira, Braslia, v. 35, n. 2, fev. 2000.
Disponvel em: http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0100-
204X2000000200005 Acesso em: 9 jun. 2006.
[13] PRADO, D. S. Teoria das filas e da simulao. Belo Horizonte:
Desenvolvimento Gerencial, 1999. (Pesquisa operacional, v. 2).

Das könnte Ihnen auch gefallen