Sie sind auf Seite 1von 31

Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica

ESTUDO E APLICAES DA TCNICA BOOTSTRAP


Ana Lucia Tucci Rizzo (analurizzo@uol.com.br), Raquel Cymrot Orientadora: Raquel Cymrot (raquelc@mackenzie.com.br)

Resumo

A tcnica de reamostragem Bootstrap muito til por no necessitar de muitas suposies para estimao de parmetros das distribuies de interesse. Este artigo apresenta os diferentes mtodos de clculo de intervalos de confiana utilizando a tcnica de reamostragem Bootstrap na forma paramtrica e no paramtrica. Tais mtodos so o Intervalo de Confiana Bootstrap Percentil, o Intervalo de Confiana Bootstrap Percentil das Diferenas, o Intervalo de Confiana Bootstrap t, o Intervalo de Confiana Percentil Corrigido em Relao ao Vis (BCPB) e o Intervalo de Confiana de Correo de Vcio Acelerado (BCa) , alm da tcnica de Bootstrap para a regresso e realizao de testes de hipteses utilizando intervalos de confiana Bootstrap. Foram apresentadas as situaes onde cada mtodo de obteno dos intervalos de confiana Bootstrap mais adequado, dependendo do tipo de distribuio, vcio e assimetria da estatstica do parmetro estudado. Para aplicao destas tcnicas foram realizados seis estudos de caso que possibilitaram a aplicao dos mtodos de estimao Bootstrap mais recomendados na estimao dos parmetros mdia, varincia, proporo e desvio padro de processos. Estes casos incluram distribuies simtricas e assimtricas. Quando a distribuio de probabilidades da estatstica do parmetro a ser estimado era conhecida foi tambm calculado o intervalo de confiana baseado na distribuio de probabilidades do estimador. Palavras chave: Reamostragem ; Mtodo Bootstrap; Intervalo de confiana

Abstract

The Bootstrap resampling technique is very useful because it does not need many assumptions to estimate parameters of the distributions of interest. This article presents the different methods to calculate confidence intervals by using Bootstrap

Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica

resampling technique in parametric and nonparametric form. Such methods are the Percentile Bootstrap Confidence Interval, the Differences Percentile Bootstrap Confidence Interval, the Bootstrap t Confidence Interval, the Biased-Corrected Percentile Bootstrap Confidence Interval (BCPB) and the Biased-Corrected Accelerated Confidence Interval (BCa), besides Bootstrap technique for regression and hypothesis tests accomplishment by using Bootstrap confidence intervals. Situations were presented wherein each method used to obtain the Bootstrap confidence intervals is more proper, depending on the kind of distribution, bias and skewness of the studied parameter. Aiming at applying these techniques, six studies of case were carried out, enabling the application of the most recommended Bootstrap estimation methods to estimate the parameter mean, variance, proportion and standard deviation of processes. These cases included symmetrical and skewed distributions. When the distribution of probabilities of the parameter to be estimated was known, the confidence interval based on the probability distribution of the estimator was also computed. Key terms: Resampling, Bootstrap technique, Confidence Interval

Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica

INTRODUO

A utilizao de tcnicas estatsticas no mundo dos negcios vem crescendo cada vez mais, devido principalmente a sua utilidade na comparao de servios, verificao de qualidade, anlise para desenvolvimento de produtos e outros. A tcnica de Bootstrap uma das possveis tcnicas de reamoostragem a serem utilizadas. A reamostragem consiste em sortear com reposio dados pertencentes a uma amostra retirada anteriormente, de modo a formar uma nova amostra. Tcnicas de reamostragem so teis em especial quando o clculo de estimadores por mtodos analticos for complicado. Reamostrar permite diferentes alternativas para se encontrar desvios padres e intervalos de confiana atravs da anlise de um conjunto de dados. Existem diversas tcnicas de reamostragem que visam estimar parmetros de uma distribuio de interesse. Uma vantagem em utilizar a tcnica de reamostragem Bootstrap a generalidade com que pode ser aplicada, pois requer que menos suposies sejam feitas. Outras vantagens so que geralmente fornece respostas mais precisas, alm de favorecer o entendimento. Muitas vezes a distribuio de probabilidade da estatstica de interesse desconhecida. Nesse caso o Bootstrap muito til, pois uma tcnica que no exige diferentes frmulas para cada problema e pode ser utilizada em casos gerais, no dependendo da distribuio original da estatstica do parmetro estudado. Segundo Davison e Hinkley (1997), repetir um procedimento de anlise original com muitas rplicas de dados pode ser denominado mtodo intensivo computadorizado. Para realizar uma estimao atravs da utilizao de Bootstrap necessria a realizao de um nmero muito grande de reamostragens e o clculo de diversas estatsticas para cada uma destas reamostragens. Isto exige o auxlio de programas computacionais para realizar as reamostras e os clculos de forma mais rpida e eficaz.

Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica

Esse um dos motivos pelo qual essa tcnica vem se desenvolvendo mais nos ltimos tempos, pois com o avano tecnolgico os softwares esto ficando mais prticos, rpidos e acessveis. A utilizao da tcnica de Bootstrap no implica que as outras devam ser ignoradas, podendo ser usada como um complemento na argumentao das concluses obtidas. Devido a sua generalidade, a tcnica Bootstrap se encaixa na soluo de problemas complexos. Atravs do uso da tcnica de Bootstrap os parmetros como a mdia, a varincia, a proporo e at mesmo parmetros menos utilizados como o mximo, mnimo, etc. de uma populao podem ser estimados pontualmente e por intervalo. A reamostragem baseada nos dados da amostra mestre utilizada pela tcnica de Bootstrap denominada no paramtrica uma vez que a distribuio de probabilidades da estatstica do parmetro a ser estimado desconhecida. Atravs desta tcnica possvel obter a distribuio amostral de um parmetro a partir da amostra original. A forma no paramtrica a mais utilizada. Entretanto, quando a distribuio de probabilidades das estimativas dos parmetros de interesse da populao da qual a amostra mestre foi extrada for conhecida, outra forma de Bootstrap pode ser aplicada. Esta forma denominada paramtrica consiste em gerar reamostras baseadas na distribuio de probabilidades conhecida utilizando como parmetros desta distribuio a estimativa dos mesmos obtida atravs da amostra mestre. Neste caso o interesse ser estimar o vcio das estimativas dos parmetros e assim efetuar as correes necessrias (NAVIDI, 2006). Outra utilidade relatada por Hall (1988) que, ao se comparar o intervalo de confiana obtido atravs da utilizao da tcnica Bootstrap com o intervalo de confiana baseado na distribuio de probabilidades conhecida do estimador, se este ltimo tiver sido calculado usando suposies inadequadas, a diferena entre estes dois resultados ser gritante, chamando assim ateno em relao ao erro cometido.

Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica

Neste artigo sero apresentadas as diversas tcnicas de Bootstrap para estimao. Seis estudos de caso tambm sero realizados.

BOOTSTRAP

Para realizar o teste utilizando a tcnica Bootstrap preciso colher uma amostra de tamanho n que ser denominada amostra mestre. Essa amostra deve ser coletada de maneira planejada, uma vez que se essa amostra for mal tirada e no representar bem a populao, a tcnica de Bootstrap no levar resultados confiveis. Hesterberg et al. (2003) afirmam que a amostra mestre representa a populao da qual foi retirada. As reamostras desta amostra mestre representam o que se deve obter quando so retiradas muitas amostras da populao original. A distribuio Bootstrap da estatstica, baseada em muitas reamostras, representa uma distribuio amostral desta estatstica. Esta caracterstica faz com que uma das utilidades da tcnica Bootstrap seja checar a normalidade da distribuio original da estatstica em foco. Para que a aplicao da tcnica resulte em valores confiveis devem ser feitas, a partir da amostra mestre, centenas ou at milhares de reamostras do mesmo tamanho n. A maioria dos autores recomenda a utilizao de 1000 reamostras. Segundo Montgomery (2001) o nmero de reamostragens pode ser estipulado verificando a variao do desvio padro para a estimativa do parmetro em questo calculado para as reamostras medida que estas so realizadas. No momento em que esse valor se estabilizar o tamanho da reamostra Bootstrap estar adequado. importante que a reamostragem seja realizada com reposio sempre selecionando os valores de forma aleatria. Para a gerao destas reamostras as tcnicas computacionais so de grande utilidade, pois sem estas, o tempo para que fossem feitas todas as reamostras desejadas de forma manual seria excessivamente grande.

Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica

Uma vez geradas as reamostras, deve-se calcular para cada uma delas a estatstica solicitada no problema. Essa tcnica no altera nenhum valor da amostra mestre, ela apenas trabalha na anlise da combinao dos valores iniciais com a finalidade de se obter as concluses desejadas. A variabilidade presente no Bootstrap dada pela escolha da amostra mestre e pelas reamostras, sendo a variabilidade devido escolha da amostra mestre a mais significativa. O desvio padro da distribuio Bootstrap para a mdia (tambm chamado de erro padro) uma medida de variabilidade e calculado da seguinte forma:
1 1 SEbootstrap = i* Bi* B1
2

(1)

* com i igual ao valor da estatstica para cada reamostra e B igual ao


nmero de reamostragens realizadas. O asterisco usado para diferenciar a estatstica das reamostras da estatstica da amostra original, a qual representada por . Algumas literaturas utilizam no primeiro valor do denominador, apenas B ao invs de (B 1), pois como o nmero de reamostragens um valor muito alto, essa alterao acaba ficando praticamente insignificante. A distribuio Bootstrap geralmente tem aproximadamente a mesma forma e amplitude que a distribuio amostral da estatstica, porm est centrada na estatstica dos dados originais (amostra mestre), enquanto a distribuio amostral est centrada no parmetro da populao. Segundo Montgomery e Runger (2003), uma estatstica utilizada para estimar um parmetro viciada quando a distribuio amostral no estiver centrada no verdadeiro valor do parmetro. A tcnica Boostrap nos permite verificar o vcio olhando se a distribuio Bootstrap da estatstica est centrada na estatstica da amostra mestre. O estimador do vcio da distribuio Bootstrap :
vciobootstrap =
*

(2)

Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica

Segundo Gonzlez Manteiga, Prada Snchez e Romo Urroz (1994) uma das aplicaes da metodologia Bootstrap obter intervalos de confiana confiveis. H diversas tcnicas distintas para o clculo de intervalos de confiana Bootstrap. Entre as diferentes maneiras de calcular o Intervalo de Confiana pelo mtodo Bootstrap destacam-se o mtodo Bootstrap t, o mtodo Percentil, que pode ser obtido de duas formas diferentes, o Mtodo do Percentil Corrigido em Relao ao Vis, Biased-Corrected Percentile Bootstrap (BCPB) e o Mtodo de Correo de Vcio Acelerado, Biased-Corrected Accelerated (BCa). Estas tcnicas sero apresentadas a seguir:

a) O Intervalo de Confiana Bootstrap t

Calcula-se o intervalo de confiana Bootstrap t para uma determinada estatstica da seguinte maneira:

ICbootstrap t = estatstica t SEbootstrap


(3)

, sendo n o tamanho da amostra mestre, t encontrado utilizando-se (n-1) graus de liberdade, e SEbootstrap , o desvio padro bootstrap, calculado utilizando a Equao (1) para a estatstica em estudo. A flexibilidade e quase automaticidade do clculo de intervalo de confiana por esse mtodo muito boa, porm existe um problema que pode afetar sua eficcia. O intervalo de confiana Bootstrap t realmente s funciona bem quando sabemos que a distribuio da estatstica na distribuio Bootstrap aproximadamente normal e a estatstica pouco viciada. Respeitadas estas condies o intervalo de confiana Bootstrap t pode ser calculado na estimao de diversos parmetros alm da mdia populacional, como por exemplo, a proporo e o coeficiente de correlao.

b) O Intervalo de Confiana Bootstrap Percentil

O intervalo de confiana percentil pode ser calculado de duas maneiras:


7

Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica

Segundo Efron (1986), para uma confiana (1 )100%, a primeira forma encontrar o percentil (1 /2)100% e o percentil (/2)100% da mdia das reamostras da estatstica do parmetro que se deseja estimar. A segunda maneira de se obter o intervalo de confiana percentil utilizando a tcnica em estudo atravs dos percentis das diferenas dos valores das estatsticas das reamostras em relao ao valor mdio desta mesma estatstica nas reamostras (MONTGOMERY e RUNGER, 2003).

Para estimar um intervalo de confiana para uma estimativa , calcula-se o


* valor destas estatsticas para cada uma das i reamostras Bootstrap ( i ) e a
mdia dessas estimativas . Encontra-se ento, para cada reamostra i, a diferena entre esses valores, isto :
* diferena = i
*
*

(4)

Para uma confiana de 95%, encontram-se os percentils 97,5% e 2,5% destas diferenas e calcula-se o intervalo de confiana Bootstrap Percentil da seguinte forma:

ICbootstrap

percentil

= P97,5% diferenas ; P2,5% diferenas


(5)

Para verificar se o intervalo de confiana t calculado confivel podemos compar-lo com o intervalo de confiana percentil. Se o vcio for pequeno e a distribuio Bootstrap for aproximadamente normal, os dois intervalos iro apresentar valores muito prximos. Segundo Hesterberg et al. (2003), caso os intervalos de confiana Bootstrap calculados pela t e pelo percentil no tiverem valores prximos nenhum destes mtodos deve ser utilizado. Entretanto Efron (1986) afirma que se a distribuio Bootstrap no for aproximadamente normal, mas existir uma transformao monotnica possvel que a torne normal, pode-se calcular o intervalo de confiana Bootstrap Percentil para os dados transformados e posteriormente desfazer a transformao para os limites do intervalo encontrado. Isto possvel uma vez que a transformao utilizada foi uma transformao monotnica, portanto o intervalo de confiana Bootstrap pelo

Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica

mtodo Percentil assim calculado coincidir com o intervalo de confiana Bootstrap pelo mtodo Percentil para os dados no transformados. Se o vcio e a assimetria esto presentes de forma muito forte mais recomendvel que se utilize mtodos de Bootstrap de correo como o Mtodo BCPB e o mtodo BCa.

c) O Intervalo de Confiana Bootstrap BCPB

No clculo do intervalo de confiana BCPB os extremos do intervalo so os percentis da distribuio Bootstrap ajustados para corrigir o vcio e assimetria desta distribuio. Por exemplo, para encontrar um intervalo de confiana BCPB com 95% de confiana, preciso ajustar os percentis que para um clculo de intervalo de confiana Percentil tradicional seriam 2,5% e 97,5% para outros valores, a fim de corrigir o vcio e assimetria. Se a estatstica for viciada para cima o BCPB move os extremos para a esquerda e se a estatstica for viciada para baixo o BCPB move os extremos para a direita. Para realizar o clculo do intervalo de confiana BCPB deve-se

primeiramente ordenar as B estimativas i* em forma crescente e calcular a


probabilidade denominada p0 de uma estimativa ser inferior estimativa da

amostra mestre ( ). Esse passo pode ser representado da seguinte forma: p0 = P * i

(6)

A partir do valor encontrado p0 obtido o parmetro correo do vcio z0 que representa a inversa da normal no ponto p0.
z 0 = 1 ( p 0 )

(7)

O prximo passo selecionar um nvel (1 )100% de confiana para a


z

estimativa do parmetro e determinar PS:

. ento possvel obter os percentis PI e

Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica

PI = 2 z 0 z 2

(8)

PS = 2 z 0 + z 2

(9)

O Intervalo de Confiana BCPB calculado da seguinte maneira: * * IC BCPB = PPI ( i ) ; PPS ( i )

(10)

d) O Intervalo de Confiana Bootstrap BCa

O mtodo de Correo de Vcio Acelerado permite encontrar o intervalo de confiana quando assimetria estiver presente de maneira muito forte. Esse mtodo no difere muito do BCPB sendo esta diferena o fato de o BCa possuir uma constante de acelerao a que ajusta o intervalo de confiana em relao assimetria. Segundo Efron (1986) nesta situao este mtodo mais indicado que o mtodo BCPB. O intervalo de Confiana BCa obtido realizando os mesmo passos do clculo do intervalo de confiana BCPB com os limites PI e PS , porm utilizando um ajuste por meio da constante de acelerao a. A obteno da constante a envolve clculos no triviais, o que leva o Intervalo de Confiana BCa ser mais utilizado quando h algum software estatstico disponvel. O programa S-PLUS citado em vrios artigos como, por exemplo, em Pereira et al. (2000). possvel encontrar tambm alguns programas livres que calculam esta constante. O clculo do intervalo de confiana BCa feito atravs da mesma Equao (10), porm com PI e PS respectivamente iguais a:
z0 + z 2 PI = z0 z0 + z 1a 2

(11)

10

Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica

z0 + z 2 PI = z0 + 1 a z0 + z 2

(12)

De acordo com Andrews e Buchinsky (2002) possvel determinar a constante a de maneira mais simples quando as variveis aleatrias observadas na amostra mestre forem independentes e identicamente distribudas. Neste caso:

(( ) ( ) ) a= 6 ( ( ( ) ( ) ) )

n 3 i =1 n . i i =1 . i

3 2 2

(13)

, com (i ) representando o valor das estimativas do parmetro estudado para cada amostra i que consiste na amostra mestre sem a observao i da mesma, com 1 i n e (.) o valor da mdia das estimativas (i ) .

e) A tcnica Bootstrap na Regresso

Existem dois procedimentos para se estimar os coeficientes do modelo de regresso utilizando a tcnica de Bootstrap: o mtodo Bootstrap dos Resduos e o mtodo Bootstrap dos Casos ou Pares (MONTGOMERY, 2001). O procedimento de Bootstrap paramtrico denominado Bootstrap dos Resduos consiste em estimar os coeficientes de regresso para os dados originais e assim gerar os respectivos resduos para as n observaes realizadas. Estes resduos formaro a amostra mestre. Deve-se ento gerar as reamostras a partir destes resduos. O valor do vetor resposta para uma reamostragem (y*) ser obtido somando-se o vetor de resduos desta reamostra ao vetor resposta
estimado nos dados originais ( y ). Para cada reamostra so ento calculadas as

estimativas dos coeficientes de regresso. As mdias das estimativas dos coeficientes de regresso para as reamostras sero as estimativas Bootstrap pontuais dos mesmos. Intervalos de confiana para os coeficientes da regresso podem ser obtidos pelo mtodo percentil. A coincidncia dos intervalos

11

Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica

tradicionais e Bootstrap confirmar as suposies feitas para a realizao da anlise de regresso. O procedimento de Bootstrap no paramtrico denominado Bootstrap dos Casos ou Pares deve ser usado quando existe uma transformao nos dados originais de modo que para estes dados transformados possa ser realizada uma regresso linear. Neste caso as estimativas dos erros padro dos coeficientes sero aproximadas e estas aproximaes sero vlidas apenas para grandes amostras. O mtodo Bootstrap fornecer uma estimativa dos intervalos de confiana para os coeficientes da regresso e ser til para checar a validade da aplicao assinttica para os resultados obtidos. Na forma Bootstrap dos Casos ou Pares os prprios dados originais devem compor a amostra mestre. Estes dados originais (que so vetores) devem ser reamostrados. Para cada reamostra so estimados os coeficientes da regresso linear para os dados da reamostra transformados. Intervalos de confiana para os coeficientes da regresso podem ser obtidos pelo mtodo percentil.

f) Teste de Hiptese com Intervalos de Confiana Bootstrap

Dado um intervalo de confiana calculado por qualquer mtodo Bootstrap com 100(1 )%, deve-se rejeitar com 100 % as hipteses nulas de que o parmetro estimado seja igual a qualquer valor fora desse intervalo e devese aceitar com 100 % as hiptese nulas de que este mesmo parmetro seja igual a qualquer valor dentro do intervalo de confiana Bootstrap (NAVIDI, 2006)

g) Outras consideraes sobre os estimadores Bootstrap

O Bootstrap muito genrico e, devido a esta generalidade, h mais de um mtodo Bootstrap como soluo para um determinado problema. Na maioria das publicaes no tcnicas em estatstica, a forma de clculo dos intervalos de confiana Bootstrap no costuma ser apresentada. Segundo

12

Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica

enqute realizada por Hall (1988), o mtodo Percentil utilizado em mais da metade destas publicaes. A maioria dos procedimentos de intervalo de confiana se torna mais precisa quando o tamanho da amostra aumenta. Hesterberg et al. (2003) afirma que um problema que existe nos intervalos de confiana Bootstrap t e Percentil que esta melhora ocorre de forma mais lenta necessitando de um grande aumento no tamanho da amostra para refletir uma melhora na preciso (na base de 10 para 1).

METODOLOGIA

Alguns estudos de caso foram realizados para colocar em prtica tcnica de reamostragem Bootstrap. Para cada estudo foi coletada uma amostra mestre diferente, seguindo as tcnicas de amostragem apropriadas. Foram realizadas 1000 reamostras e calculados os intervalos de confiana Bootstrap segundo as diversas formas convenientes para cada situao. Quando existia uma frmula de clculo do intervalo de confiana para a estimativa do parmetro baseada na sua distribuio de probabilidades (denominado neste trabalho intervalo de confiana padro), este foi calculado. Os resultados foram ento comparados. Para o clculo dos diversos intervalos de confiana foi utilizada uma confiana de 95%. Apenas no estudo de caso envolvendo o desvio padro de um controle estatstico de processos a confiana utilizada para os clculos foi de 99,73%, de acordo com as cartas de controle de Shewhart. Para a realizao das reamostras e anlises foi utilizado o programa MINITAB.

13

Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica

Estudo de caso 1 - Nmero de alunos reunidos diariamente em determinado local durante um intervalo de tempo estabelecido

Neste caso foi analisada a quantidade de alunos reunidos durante 25 dias no corredor do 2 andar do prdio da Escola de Engenharia da Universidade Presbiteriana Mackenzie em algum horrio pertencente ao intervalo das 16:30 h s 16:40 h. O nmero de alunos foi observado diariamente em um horrio sorteado aleatoriamente dentro do intervalo estipulado. A partir desta amostra de tamanho 25, foram realizadas mil reamostragens. Atravs da ferramenta Bootstrap foi estimado o nmero mdio de alunos presentes naquele determinado local do corredor no horrio entre 16:30 h e 16:40 h.

Estudo de caso 2 - Transporte utilizado pelos alunos no seu deslocamento dirio para a Universidade

Foi realizada, no segundo semestre de 2005, uma pesquisa para se estimar a probabilidade de um aluno do curso Engenharia de Produo da Escola de Engenharia da Universidade Presbiteriana Mackenzie utilizar transporte pblico no seu deslocamento de ida e/ou volta para a universidade. Foi realizada uma amostragem por conglomerado no qual foi sorteado o sexto semestre. Foi perguntado para seus 33 alunos matriculados se eles utilizavam, na maior parte dos dias, transporte pblico como meio de locomoo para a universidade. Quando a resposta foi positiva a varivel foi codificada como 1 e quando negativa a varivel foi codificada como 0. Foi ento calculada a probabilidade p de o aluno utilizar transporte pblico. Os 33 dados coletados formaram a amostra mestre. Com base nesta amostra, foram realizadas 1000 reamostras de mesmo tamanho e aplicada tcnica Bootstrap a fim de calcular os intervalos de confiana Bootstrap para a proporo de respostas afirmativas. Estes resultados foram comparados com o

14

Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica

intervalo de confiana padro. Foi tambm calculado o intervalo de confiana Bootstrap para a varincia desta proporo.

Estudo de Caso 3 - Medio de parafusos

Foi selecionada uma amostra casual simples de cinqenta parafusos pertencentes a uma caixa fechada contendo 200 parafusos de um mesmo lote. Foi realizada a medio destes cinqenta parafusos no laboratrio de fsica da Universidade Presbiteriana Mackenzie utilizando como dispositivo de medio dimensional um paqumetro digital ajustado em milmetros, devidamente calibrado. Para realizar a amostragem os 200 parafusos pertencentes a uma caixa foram numerados. Destes, foram sorteados cinqenta parafusos para compor a amostra mestre. A caixa de parafusos representa a populao de onde foi retirada a amostra mestre. A partir desta amostra de cinqenta comprimentos de parafusos, foram geradas mil reamostras de mesmo tamanho.

Estudo de caso 4 - Tempo de espera na fila do Benjamim Abraho

Neste caso o objetivo era analisar o tempo de espera desde o momento em que um indivduo entra na fila da Padaria Benjamim Abraho situada na praa de alimentao da Universidade Presbiteriana Mackenzie at o momento em que este mesmo indivduo recebe seu pedido. Os dados foram coletados entre os horrios de 19:30 h e 20:20 h de um dia letivo. A coleta dos dados foi feita de forma sistemtica, observando-se o intervalo de tempo de espera e atendimento da primeira pessoa de cada trs que entravam na fila. O objetivo desse estudo de caso foi obter um intervalo de confiana para mdia do tempo total de espera e atendimento ao cliente utilizando a tcnica de Bootstrap.

15

Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica

Utilizou-se para medio relgios digitais ajustados no mesmo horrio e duas pessoas, uma situada na entrada da fila e a outra na sada. A pessoa da entrada distribua a ficha com o horrio em que o indivduo participante da pesquisa entrava na fila e a pessoa da sada recolhia a ficha e anotava o horrio de sada. Foi coletada uma amostra mestre de tamanho 60. A partir desses dados, foram realizadas 1000 reamostras.

Estudo de caso 5 Tempo de processamento de um digestor de vsceras de aves

Segundo Ferroli et al. (2002) as fbricas de farinhas e leos de subprodutos de origem animal esto em processo de evoluo e mudanas. Para que estas consigam acompanhar as constantes modificaes que ocorrem no mercado, uma de suas principais preocupaes reduzir a emisso de poluentes ao meio ambiente. O digestor a principal mquina em uma graxaria e est envolvido diretamente no aproveitamento de resduos de indstrias de transformao de produtos animais. Foi analisado o funcionamento de um digestor existente em uma fbrica onde funcionam seis digestores de vsceras de aves. Os dados para este caso foram retirados do artigo Fbrica de subprodutos de origem animal: a importncia do balanceamento das cargas dos digestores de vsceras de Ferroli et al. (2002). A varivel medida foi o tempo de processamento de um digestor de vsceras de aves. Para cada um dos 43 conjuntos de valores medidos contendo 6 observaes cada, foi calculada a amplitude R. Essas 43 amplitudes representaram amostra mestre e a partir destas foram geradas 1000 reamostras. Neste caso a estatstica ser a estimativa do desvio padro do processo igual a

R onde d2 um valor tabelado. d2

16

Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica

Este caso um exemplo de aplicao da tcnica de Bootstrap na rea de Engenharia de Produo.

Estudo de caso 6 - Verificao da adeso dos alunos a um programa de uso racional de gua

Considerando que a gua potvel um recurso raro no planeta, sua economia torna-se absolutamente necessria. A Universidade Presbiteriana Mackenzie, consciente deste problema, vem, desde 2002, implantando um programa de Uso Racional de gua dentro do Campus Itamb. (CYMROT et al.) Vrias medidas foram tomadas desde ento, dentre elas, destacam-se as seguintes medidas: Foram registrados, em todos os prdios, todos os pontos de gua, como

torneiras, bacias, mictrios, chuveiros, etc. A partir de 2002, foram trocadas torneiras de lavatrio por modelos mais

econmicos, com fechamento automtico de gua. Em 2004, cerca de 60% das torneiras j haviam sido trocadas. Segundo a SABESP (Companhia de Saneamento Bsico do Estado de So Paulo), esta tal medida resulta em uma economia de consumo em torno de 20%. No comeo de 2003, foi oferecido um curso na SABESP de caa

vazamentos a todos os funcionrios da manuteno, inclusive encarregados. Este curso propiciou a localizao de inmeros vazamentos, sendo ento trocadas s tubulaes necessrias. Estas mudanas acabaram provocando algumas modificaes nas configuraes da rede hidrulica do Campus Itamb. Foram colocados adesivos para conscientizao da necessidade de se

economizar gua atravs do uso adequado de torneiras e bacias na maioria dos sanitrios existentes no Campus Itamb.

17

Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica

Este estudo foi realizado com o objetivo de verificar a adeso dos alunos do curso de Engenharia de Produo da Universidade Presbiteriana Mackenzie em relao ao programa. Foi realizada uma amostragem casual simples e coletados os dados relativos aos cinqenta alunos sorteados. Trs perguntas foram feitas a estes alunos, a saber: - O aluno tinha notado os adesivos com avisos alertando quanto necessidade do uso racional de gua? - O aluno tinha reparado na alterao dos dispositivos de funcionamento das torneiras de modo que estas permanecessem abertas somente o tempo necessrio? - O aluno colabora com a campanha procurando economizar a gua quando de sua utilizao dentro do Campus Itamb da Universidade Presbiteriana Mackenzie? Para cada varivel estudada foram realizadas 1000 reamostras a partir das respostas obtidas.

RESULTADOS E DISCUSSO

Estudo de caso 1: Nmero de alunos reunidos diariamente em determinado local durante um intervalo de tempo estabelecido

Ao realizar a anlise descritiva para a amostra mestre, verificou-se a existncia de alguns possveis outliers que foram mantidos na amostra. O histograma e o grfico de probabilidade normal utilizando o mtodo de Anderson Darling para os dados da amostra mestre apresentados nos Grficos 1 e 2 confirmam a aderncia distribuio Normal (p = 0,362).

18

Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica

Histogram of C1
Normal 7 6 5 Frequency 4 3 2
10 Mean 19,52 StDev 3,070 N 25 99

Probability Plot of C1
Normal
Mean StDev N AD P-Value 19,52 3,070 25 0,387 0,362

95 90 80

Percent 13 15 17 19 21 C1 23 25 27

70 60 50 40 30 20

1 0

12

14

16

18

20 C1

22

24

26

28

GRFICO 1 - Histograma da amostra mestre

GRFICO 2 - Grfico de probabilidade normal para a amostra mestre

A Tabela 1 apresenta a amostra mestre, algumas reamostras, a mdia e a varincia para a amostra mestre e para as reamostras. Cada reamostra foi gerada atribuindo probabilidade igual a 1/25 para cada observao da amostra mestre e realizando a amostragem com reposio.
observao amostra mestre 1 24 2 17 3 19 4 20 5 22 6 26 7 18 8 20 9 17 10 19 11 14 12 18 13 25 14 17 15 14 16 23 17 18 18 17 19 22 20 19 21 20 22 21 23 19 24 17 25 22 mdia 19,5200 varincia 9,4267 reamostra 1 reamostra 2 reamostra 3 ... reamostra 1000 25 18 21 22 20 17 25 17 18 17 20 18 19 18 26 22 20 23 21 18 17 17 19 22 19 22 18 20 17 14 14 23 17 26 14 17 19 22 20 17 25 17 22 22 17 21 25 19 22 23 14 18 25 22 18 17 23 19 26 19 17 24 23 17 25 22 17 21 17 22 20 17 19 26 17 19 24 17 21 17 20 17 22 22 17 19 22 25 17 20 20 14 22 18 19 18 14 17 22 18 19,8000 19,9200 20,2400 19,1600 3,2146 3,1612 3,4434 2,5768

TABELA 1 - Amostra mestre, reamostras, mdia e varincia para a amostra mestre e reamostras.

Pode-se afirmar que a mdia da populao tem distribuio Normal. Realizadas as 1000 reamostragens com reposio, plotado o histograma (Grfico 3) e realizado o teste de aderncia de Anderson Darling (p = 0,082) para as

19

Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica

mdias das reamostras possvel verificar que a distribuio da estatstica mdia das reamostras Bootstrap se aproxima da distribuio desta mesma estatstica na populao.

Histogram of reamostras
Normal 140 120 100 Frequency 80 60 40 20 0 18,0 18,6 19,2 19,8 20,4 reamostras 21,0 21,6 22,2
Mean StDev N 19,50 0,6006 1000

GRFICO 3 - Histograma das 1000 reamostras das mdias

Os valores da mdia e varincia da amostra mestre foram respectivamente iguais a 19,52 e 9,4267. O vcio calculado para a mdia foi igual a 0,0211, considerado pequeno (0,11% do valor da mdia da amostra mestre). Nestas condies foram calculados os intervalos de confiana para as mdias utilizando a tcnica de reamostragem Boostrap pelos mtodos Percentil = [18,3200 ; 20,6800] e pelo mtodo Bootstrap t = [18,2804 ; 20,7596] que resultaram bem prximos. O histograma das varincias (Grfico 4) apresenta uma forma diferente do esperado caso a distribuio fosse Normal e o teste de Anderson Darling (Grfico 5) forneceu valor de p menor que 0,005.

Histogram of variancias
Normal 100
Mean StDev N 9,109 2,337 1000

Probability Plot of variancias


Normal 99,99
Mean StDev N AD P-Value 9,109 2,337 1000 1,196 <0,005

80 Frequency

99 95 Percent

60

80 50 20 5

40

20

0 2,5

5,0

7,5

10,0 12,5 variancias

15,0

17,5

0,01 0 5 10 variancias 15 20

GRFICO 4 - Histograma para varincia das 1000 reamostras

GRFICO 5 - Grfico de probabilidade normal para a varincia das 1000 reamostras

20

Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica

Desta forma os intervalos de confiana Bootstrap pelo mtodo t e Percentil no so muito confiveis uma vez que a suposio de normalidade no se verificou. Neste caso aconselhvel o clculo por mtodos como BCPB e BCa. O clculo de intervalos de confiana para a varincia atravs dos mtodos BCPB = [5,6034 ; 14,9469] e BCa = [4,1667 ; 15,3657] resultam em valores mais precisos devido a adequao desses presena de um vis igual a 0,3173, considerado grande (3,37 % do valor da varincia da amostra mestre). O valor da constante de acelerao a para a varincia 0,05119. O intervalo de confiana Bootstrap Percentil [4,7599 ; 13,7515]. Como o vcio foi negativo, isto , a estimativa Bootstrap est subestimando o valor da estatstica, pode-se observar que o intervalo de confiana BCPB corrige o intervalo de confiana para a direita. O Intervalo de confiana Bootstrap BCa corrige o intervalo para a direita porm, neste caso, amplia seu tamanho devido ao valor da constante a. Os intervalos de confiana padro para a mdia [18,2526 ; 20,7874] e para a varincia [5,7474 ; 18,2435] apresentaram valores prximos aos dos intervalos Bootstrap.

Estudo de caso 2: Transporte utilizado pelos alunos no seu deslocamento dirio para a Universidade

No Grfico 6 apresentado o histograma das propores obtidas nas 1000 reamostras. O teste de aderncia de Kolmogorov Smirnov confirma a aderncia distribuio Normal das propores estimadas nas 1000 reamostras (p > 0,150). O Grfico 7 apresenta o Box Plot para as propores nas 1000 reamostras onde notada a simetria da distribuio. Foram encontrados quatro possveis outliers, a saber: 0,8182; 0,7879; 0,3030; 0,2727 mantidos na amostra.

21

Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica

Histograma da proporo de alunos usurios de transporte pblico


160 140 120 Freqncia 100 80 60 40 20 Proporo 0,32 0,40 0,48 0,56 Proporo 0,64 0,72 0,80
Mean StDev N 0,5451 0,08433 1000

Boxplot da proporo de alunos usurios de transporte pblico


0,8

0,7

0,6

0,5

0,4

0,3 0 0,2

GRFICO 6 - Histograma das propores nas 1000 reamostras

GRFICO 7 - Boxplot da proporo de alunos usurios de transporte pblico nas 1000 reamostras

Como a distribuio Normal, o intervalo de Confiana Bootstrap t pode ser utilizado e deve coincidir com os intervalos de Confiana Bootstrap Percentil. A amostra mestre apresentou uma proporo estimada de alunos que utilizavam na maior parte dos dias transporte pblico como meio de locomoo para a universidade igual a 0,5455 com varincia da proporo igual a 0,0075. As reamostras apresentaram uma mdia das propores igual a 0,5451 com varincia da proporo igual a 0,0073. Os intervalos de confiana para a proporo dos alunos que utilizavam na maior parte dos dias transporte pblico como meio de locomoo para a universidade foram calculados atravs dos mtodos Percentil e Bootstrap t. Os intervalos de confiana para a proporo, calculados atravs dos trs mtodos revelaram-se muito prximos, a saber: intervalo de confiana Bootstrap Percentil = [0,3932 ; 0,7273], intervalo de confiana Bootstrap Percentil das Diferenas = [0,3632 ; 0,6973] e intervalo de confiana Bootstrap t = [0,3737 ; 0,7172]. Foi tambm calculado o intervalo de confiana padro para a proporo. Para este clculo foram utilizados os dados da amostra mestre, tendo sido obtido o intervalo [0,3756 ; 0,7153], tambm bem prximo aos demais intervalos de confiana calculados. O vcio encontrado foi de 0,0004 (0,07% do valor da estatstica na amostra mestre).

22

Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica

O Grfico 8 apresenta o teste de aderncia de Kolmogorov Smirnov no qual no foi confirmada a normalidade da distribuio das varincias das propores estimadas nas 1000 reamostras (p < 0,010).
grfico de probabilidade normal da varincia da proporo
99,99
Mean StDev N KS P-Value 0,007299 0,0003851 1000 0,165 <0,010

99 95 Porcentagem 80 50 20 5 1

0,01 0,004

0,005

0,006 0,007 varincia da proporo

0,008

0,009

GRFICO 8 - Grfico de probabilidade normal para as varincias das propores de alunos usurios de transporte pblico nas 1000 reamostras.

Devido falta de normalidade no indicado o uso do intervalo de confiana Bootstrap t. O intervalo de confiana para a varincia da proporo calculado atravs do mtodo de Percentil foi igual a [0,0060 ; 0,0076]. Como a distribuio de probabilidades da varincia assimtrica e o vcio encontrado foi de 0,0002 (2,67% do valor da estatstica na amostra mestre), sendo o estimador tendencioso, a melhor opo o clculo dos intervalos de confiana para a varincia atravs dos mtodos BCPB e BCa, os quais apresentaram

respectivamente os seguintes valores [0,0064 ; 0,0076] e [0,0060 ; 0,0076]. Para obteno do intervalo de confiana pelo mtodo BCa o valor encontrado para a constante a foi igual a 0,005297. Neste caso a correo realizada foi desprezvel.

Estudo de Caso 3: Medio de parafusos

O Grfico 9 apresenta o histograma das 1000 mdias das reamostras Bootstrap. Pode-se notar a forma muito prxima Normal. O teste de aderncia distribuio Normal realizado pelo mtodo de Anderson Darling confirma esta hiptese (p = 0,156).
23

Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica

Histogram of parafusos
Normal 140 120 100 Frequency 80 60 40 20 0 26,82 26,88 26,94 27,00 parafusos 27,06 27,12 27,18
Mean StDev N 26,99 0,06374 1000

GRFICO 9 - Histograma das mdias das mil reamostras dos comprimentos dos parafusos

A mdia da amostra mestre encontrada foi 26,9908, sua mediana 27,0050 e sua varincia apresentada por 0,2043. possvel verificar a simetria dos dados que compe a amostra mestre pela proximidade do valor da mediana e o valor da mdia. Utilizando a tcnica Bootstrap, calculou-se os intervalos de confiana para a mdia e para a varincia de forma paramtrica e no paramtrica atravs do mtodo Percentil. No clculo do intervalo de confiana Bootstrap Percentil no paramtrico para as mdias, os valores obtidos foram [26,8770 ; 27,1178] e o intervalo de confiana Bootstrap Percentil das Diferenas foi igual a [26,8657 ; 27,1066]. O Intervalo de Confiana Bootstrap Percentil paramtrico apresentou os seguintes valores [26,8645 ; 27,1035]. Tambm foi calculado o intervalo de confiana Bootstrap t igual a [26,8627 ; 27,1189]. Como a distribuio das mdias dos comprimentos dos parafusos conhecida, foi possvel realizar o clculo do intervalo de confiana padro. O intervalo obtido foi [26,8610 ; 27,1206]. A mdia das mdias nas reamostras foi igual a 26,9928. O valor do vis na forma no paramtrica calculado com os dados das reamostras foi igual a 0,0020, considerado pequeno (0,0007% do valor da estatstica na amostra mestre). Neste caso os mtodos Bootstrap t e Bootstrap Percentil de clculo de intervalo de confiana so adequados e resultaram em valores prximos. Os intervalos de confiana para varincia utilizando a tcnica Bootstrap forneceram valores prximos, a saber: intervalo de confiana Bootstrap Percentil

24

Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica

no paramtrico = [0,1313; 0,2740] e Percentil das Diferenas no paramtrico = [0,1296; 0,2723]. Atravs da aplicao da tcnica paramtrica obteve-se o intervalo de confiana Bootstrap Percentil paramtrico = [0,1363 ; 0,2914]. Supondo a distribuio Quiquadrado para a varincia dos comprimentos dos parafusos, foi possvel calcular o intervalo de confiana igual a [0,1425 ; 0,3172]. A mdia das varincias nas reamostras foi igual a 0,1993. O valor do vis para a estimativa da varincia foi igual a 0,0050 considerado grande (2,45% valor da estatstica na amostra mestre). Neste caso aconselhvel o clculo dos intervalos de confiana para a varincia atravs dos mtodos BCPB e BCa, os quais apresentaram

respectivamente os seguintes valores [0,1425 ; 0,2887] e [0,1230 ; 0,3022]. Para obteno do intervalo de confiana pelo mtodo BCa o valor encontrado para a constante a foi igual a 0,043243.

Estudo de caso 4: Tempo de espera na fila do Benjamim Abraho

Atravs da construo do Box Plot, foram encontrados os possveis outliers 235,283 ; 232,850 ; 189,0167 ; 188,017 ; 187,650, os quais foram mantidos na amostra mestre uma vez que tais dados extremos realmente ocorreram. Segundo Prado (1999), o tempo de espera em uma fila tem em geral distribuio exponencial, porm, neste caso como foi computado o tempo de espera, tempo de atendimento e tempo de pagamento, a distribuio resultante no se comportou como exponencial. Deve-se salientar que a forma de pagamento determinou, de maneira marcante, a diferena nos tempos totais computados. Se o comprador utilizava dinheiro a operao era bem rpida, porm, se ele usava algum carto eletrnico poderia ser consumido um tempo muito maior. O histograma (Grfico 10) indicou a forma da distribuio do tempo total prxima da Normal. O teste de aderncia pelo mtodo de Anderson Darling confirmou a aderncia distribuio Normal (p = 0,809).

25

Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica

Os dados da amostra mestre apresentaram uma mdia igual a 209,0333. As mil reamostragens foram feitas com reposio e calculadas as estatsticas necessrias para a aplicao da tcnica Bootstrap. Os intervalos de confiana para a mdia foram obtidos pelo mtodo Percentil das Diferenas = [193,9140 ; 223,8027], mtodo Percentil = [194,1488 ; 224,0375] e, sendo a distribuio aproximadamente normal, o clculo foi realizado pelo mtodo Bootstrap t = [193,9850 ; 224,0817]. Os trs intervalos de confiana apresentaram valores prximos.
Histograma do tempo de atendimento
120
Mean StDev N 208,9 7,520 1000

100

80 Freqncia

60

40

20

0 192 200 208 216 224 Tempo de atendimento 232

GRFICO 10 - Histograma das 1000 mdias das reamostras do tempo de espera e atendimento na fila

Foi calculado o intervalo de confiana para a mdia do modo padro para que os resultados fossem comparados, a saber: [193,3806 ; 224,6861]. O vcio presente para o tempo mdio de atendimento foi igual a 0,1152 (0,055% do valor da estatstica na amostra mestre), considerado pequeno.

Estudo de caso 5: Tempo de processamento de um digestor de vsceras de aves

As amplitudes foram reamostradas e calculado o desvio padro do processo para essas 1000 reamostras bootstrap. A partir dessas reamostras, foi plotado o histograma que permite verificar a proximidade da distribuio dos desvios padres do processo com a distribuio Normal. O teste de probabilidade de aderncia pelo mtodo de Anderson Darling confirmou esta hiptese (p = 0,537).

26

Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica

Atravs da tcnica Bootstrap, foram obtidos intervalos de confiana para o desvio padro do processo pelos mtodos Percentil e t. Para o clculo do intervalo de confiana Bootstrap t foi estimado o desvio padro do processo da amostra mestre, a saber: 22,6226. Os resultados obtidos pelos intervalos foram respectivamente iguais a [18,3447 ; 26,9005] e [19,0134 ; 26,6287 ] para os mtodos Bootstrap t e Percentil. A proximidade dos intervalos ocorre devido distribuio ser

aproximadamente Normal alm do vcio calculado pela diferena entre a mdia do desvio padro das reamostras do processo e o desvio padro do processo da amostra mestre ser relativamente pequeno, igual a 0,0154 (0,07% do valor da estatstica na amostra mestre).

Estudo de caso 6: Verificao da adeso dos alunos a um programa de uso racional de gua

As respostas para as perguntas foram codificadas como zero quando negativas e um quando positivas. Atravs da tcnica Bootstrap, foram calculados os intervalos de confiana para a proporo de respostas afirmativas e seus resultados comparados com o intervalo de confiana padro. Para cada resposta obtida para as trs perguntas, foram geradas 1000 reamostras e obtidos os seguintes resultados: Em relao percepo de adesivos que estavam sendo colados, foi realizado um teste de aderncia distribuio Normal pelo mtodo de Kolmogorov Smirnov (p > 0,150), o que possibilita o clculo dos intervalos de confiana Bootstrap pelo mtodo Percentil = [0,5200 ; 0,8000] e pelo mtodo Bootstrap t= [0,5243 ; 0,7957]. Como a distribuio da proporo nas reamostras aproximadamente Normal, foi possvel calcular o intervalo de confiana padro para proporo e o resultado obtido foi [0,5287 ; 0,6954]. Todos os intervalos resultaram muito prximos. Para as 1000 reamostras dos dados que representam o resultado da pesquisa sobre o aluno que havia notado a alterao dos dispositivos de

27

Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica

funcionamento das torneiras, foram calculadas as propores cuja distribuio foi considerada Normal atravs do teste de aderncia pelo mtodo de Kolmogorov Smirnov (p > 0,150). Os intervalos de confiana Bootstrap Percentil e t foram calculados e seus resultados comparados com o clculo do intervalo de confiana padro para proporo. Os resultados obtidos foram: intervalo de confiana Bootstrap t = [0,2623 ; 0,5377], intervalo de confiana Bootstrap Percentil = [0,2800 ; 0,5400] e intervalo de confiana padro = [0,2642 ; 0,4183], todos muito prximos. O teste de aderncia realizado pelo mtodo de Kolmogorov Smirnov para a distribuio das propores nas 1000 reamostras das respostas dos alunos quanto colaborao na diminuio do consumo de gua confirma a aderncia distribuio Normal (p >0,150). Os valores encontrados nos clculos dos intervalos de confiana Bootstrap Percentil, t e padro foram muito prximos, a saber: intervalo de confiana Bootstrap t = [0,4228 ; 0,6972], intervalo de confiana Bootstrap Percentil = [0,4200 ; 0,7000] e intervalo de confiana padro = [0,4224 ; 0,5897].

CONCLUSO

Atravs da realizao dos estudos de caso, foi possvel verificar a adequao da tcnica Bootstrap em situaes presentes no cotidiano. Os intervalos de confiana e as estimativas encontradas em todos os estudos de caso foram coerentes e confirmaram a confiabilidade do mtodo para estimao de parmetros em situaes onde as distribuies das estimativas dos parmetros eram conhecidas. O mtodo tambm tornou possvel a estimao de intervalos de confiana em situaes onde as distribuies dos parmetros so desconhecidas ou complexas. Verificou-se, pelos casos estudados, a generalidade de aplicao da tcnica de estimao atravs da reamostragem e que o mtodo Bootstrap permite que o clculo do intervalo de confiana seja realizado de modo mais simples e
28

Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica

abrangente para diversas estatsticas, mesmo quando as distribuies de probabilidades das mesmas so desconhecidas. Foi possvel estabelecer o intervalo de confiana adequado para cada situao diferente. Quando a estatstica do parmetro estudado tinha distribuio Normal, os intervalos de confiana Bootstrap pelos mtodos t e Percentil coincidiram e foram adequados. Quando a distribuio da estatstica do parmetro estudado no era Normal, porm existia uma transformao monotnica para a estatstica do parmetro que tornasse sua distribuio Normal, o intervalo Bootstrap Percentil foi adequado. Nos casos em que a distribuio no era Normal com a estimativa pontual Bootstrap muito viciada ou a assimetria presente de modo muito forte, foram utilizados os mtodos BCPB e BCa. Quando era conhecida a distribuio da estatstica do parmetro, os intervalos BCPB e BCa resultaram mais prximos do intervalo padro que o intervalo Bootstrap Percentil, confirmando a melhora na estimao com o uso dos intervalos corrigidos. O valor pequeno do vis uma indicao de que os valores estimados devem estar prximos dos verdadeiros valores. Para cada situao deve ser escolhida a tcnica de clculo de intervalo Bootstrap mais adequada. Quando houve mais de uma tcnica possvel de ser utilizada, verificou-se que os intervalos de confianas resultaram muito prximos.

29

Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica

REFERNCIAS

[1] ANDREWS, D. W. K.; BUCHINSKY, M. On the number of bootstrap repetitions for BCa confidence intervals. Econometric Theory, v. 18, n. 4, p. 962-984, Aug. 2002. [2] CYMROT, R.; ROCHA, A. J. F.; MARTINS, A. J.; MOUETTE, D.; DURO, M. A. S.; MONEZI JUNIOR, O.; ANTUNES, V. R. G. L.; ZIVIERI, J. N. Estudo do uso racional da gua implantado em um campus da Universidade Presbiteriana Mackenzie. In: WORLD CONGRESS ON COMPUTER SCIENCE, ENGINEERING AND TECHNOLOGY EDUCATION, 2006, Itanham. Anais So Vicente: COPEC, 2006. 1 CD-ROM. [3] DAVISON, A. C.; HINKLEY, D. V. Bootstrap methods and their application. Cambridge: Cambridge University Press, 1997. [4] EFRON, B.; TIBSHIRANI, R. Bootstrap methods for standard errors, confidence intervals, and other measures of statistical accuracy. Statistical Science , v. 1, n. 1, p. 5577, Feb. 1986. [5] FERROLI, P. C. M.; FIOD NETO, M.; CASAROTTO, N.; CASTRO, J. E. Fbrica de subprodutos de origem animal: a importncia do balanceamento das cargas dos digestores de vsceras. Revista Produo, v. 10, n. 2, p. 5-9, 2002. [6] HALL, P. Theoretical comparison of bootstrap confidence intervals. Annals of Statistics, v. 16, n. 3, p. 927953, Sep. 1988. [7] HESTERBERG, T.; MOORE, D. S.; MONAGHAN, S.; CLIPSON, A.; EPSTEIN, R. Bootstrap methods and permutation tests. In: The practice of business statistics: using data for decisions. New York: W.H. Freeman, 2003. cap. 18. [8] GONZLEZ MANTEIGA, W.; PRADA SNCHEZ, J. M.; ROMO URROZ, J. J. The Bootstrap: a review. Computational Statistics, v. 9, n. 1, p. 165-205, 1994. [9] MONTGOMERY, D. C.; PECK, E. A.; VINING, G. G. Introduction to linear regression analysis. 3rd ed. New York: Wiley, 2001. [10] MONTGOMERY, D. C.; RUNGER, G. C. Estatstica aplicada e probabilidade para engenheiros. 2. ed. Rio de Janeiro: LTC, 2003.

30

Universidade Presbiteriana Mackenzie - II Jornada de Iniciao Cientfica

[11] NAVIDI, W. C. Statistics for engineers and scientists. Boston: McGraw-Hill, c2006. [12] PEREIRA, J. E.; SILVA, J. F. V.; DIAS, W. P.; SOUZA, G. S. Intervalo de confiana Bootstrap como ferramenta para classificar raas do nematide de cisto de soja. Pesquisa Agropecuria Brasileira, Braslia, v. 35, n. 2, fev. 2000. Disponvel em: http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0100-

204X2000000200005 Acesso em: 9 jun. 2006. [13] PRADO, D. S. Teoria das filas e da simulao. Belo Horizonte: Desenvolvimento Gerencial, 1999. (Pesquisa operacional, v. 2).

31

Das könnte Ihnen auch gefallen