Beruflich Dokumente
Kultur Dokumente
Abstract This paper introduces statistical methods for calculating the appropriate sample size for comparing two independent groups of subjects (parallel group design), or for comparing paired observations (paired or crossover group design). These methods includes categorical or qualitative data (attributes) and numerical or quantitative data (variables). The main idea behind the sample size calculations is to improve the reliability and credibility of the findings from health field research, giving some guarantee that the statistical aspects have been handled well or even validly. Keywords Sample size; statistics.
Introduo
A determinao do tamanho da amostra em trabalho de pesquisa experimental na rea de sade, ou seja, a seleo do nmero de pacientes a serem utilizados nesta tarefa, de significativa importncia, considerando-se que a correo desta determinao d validade estatstica ao experimento e condio bsica primordial para a aceitao de trabalhos na comunidade cientfica. Em razo da experincia vivida pelo autor, as perguntas iniciais mais freqentes, feitas, s vezes, at aps a concluso da coleta de dados, nesta rea, esto, geralmente, entre as seguintes: a) O tamanho da amostra escolhido no meu trabalho est correto? b) Quando eu iniciar o meu trabalho, qual o tamanho da amostra que deverei utilizar?
c) Em razo do tamanho da amostra que utilizei, os resultados obtidos tm significncia estatstica? d) Com o tamanho da amostra utilizado, como devem ser correlacionados os dados disponveis? d) Com o tamanho da amostra que utilizei, o meu trabalho pode ser aceito? O que tenho a corrigir para a aceitao? No resta dvida, portanto, de que o problema da determinao do tamanho da amostra considerado de fundamental relevncia, basicamente, porque a rea de sade apresenta particularidades de tal especificidade que o tratamento a ser dispensado coleta e anlise de dados requer um procedimento especial. Isto se justifica porque a complexidade do ser humano incomparavelmente maior que as dificuldades que se apresentam, por exemplo, na rea de cincias exatas, com mquinas e/ou computadores. Para caracterizar esta complexidade, veja-se que o ser humano constitudo, aproximadamente, por 30.000 genes e que, no crtex cerebral, existem cerca de 9,2 x 109 clulas nervosas interconectadas2. Estes nmeros, extremamente elevados, levam a concluir sobre a marcante complexidade do organismo humano. Por outro lado, verifica-se que, nos seres humanos, a tolerncia bioestatstica , numericamente, muito ampla. Duas pessoas que tm, cada uma delas, por exemplo, ndices glicmicos de 85 e de 110 mg/dL (diferena de 25 mg/dL), so indivduos considerados normais, o mesmo acontecendo com dois pacientes que, individualmente, apresentem presses sistlicas de 100 mmHg e 120 mmHg (diferena de 20 mmHg). Estes valores representam uma ampla tolerncia, aceita na rea de sade, que no admitida, a ttulo de ilustrao, na rea de engenharia, cincia na qual, por exemplo, uma pea somente poderia ser aceita se a diferena entre sua medida e a medida de um padro (valor nominal) no excedesse a 1 micrmetro (10 -6 m). Esta ampla tolerncia em cincias da sade concorre, substancialmente, como se ver adiante, para que as amostras nesta rea sejam muito pequenas em relao a outras reas, como a de engenharia. Por esta razo, enquanto a ordem de grandeza para uma amostra na rea de sade poderia ser, por exemplo, de 30 pacientes (N = 30), na rea de engenharia poderia ser aceita uma amostra de 1.000 peas (N = 1.000).
* Livre-Docente pela Escola Politcnica da USP e Professor Titular do Curso de Cincias Farmacuticas da F aculdade de Medicina do ABC.
v. 29
no 2 Jul/Dez 2004
87
um tratamento. So caracterizados por se referirem a uma mesma amostra, testada antes e depois de um certo procedimento. Os dados no-pareados so simultneos e correspondem a dois grupos de pesquisa: o grupo de controle e o grupo experimental. Neste caso, o tamanho da amostra, calculada matematicamente como ser mostrado, deve ser multiplicado por 2, admitindo-se que o nmero de participantes dos dois grupos seja o mesmo, o que, em geral, pode ocorrer.
t= X - X s N Como o nmero de desvios-padro, t, na distribuio de Student, depende dos graus de liberdade, que pressupem conhecido o tamanho da amostra, t substitudo pelo nmero de desvios-padro Z da distribuio normal. Uma transformao algbrica simples d o tamanho da amostra N.
2 2 N=Z S d2
Xmx = p + Zp (1 - p)/N , o que d Xmx p = Zp (1 - p)/N (X mx p)2 = Z 2p (1 - p)/N, o que resulta para N o valor:
2 2 N=Z p (1 - p) ou N=Z p (1 - p) (Xmx - p) 2 d2
Veja-se que N inversamente proporcional a d2 (d = diferena) e, no caso das amostras da rea de sade, como a diferena d muito grande (e d2, com mais forte razo), conforme se fez meno, resulta em valor pequeno para N, ao contrrio das pesquisas em engenharia, em que a tolerncia, caracterizada tambm por d, muitssimo menor, o que conduz a amostras de tamanho N muito elevadas. Exemplo ilustrativo: Verificou-se que a populao de um bairro de uma cidade litornea apresentou um elevado valor da presso arterial sistlica, na faixa mdia de 160 mmHg. Deseja-se aplicar um medicamento experimental, com o fim de abaixar o valor mdio da presso arterial sistlica at a faixa de 120 mmHg. Como estimar o tamanho da amostra para ensaio dos efeitos do medicamento antes e depois de corretamente aplicado, com um intervalo de confiana de 95% (usual na rea de sade), para o teste ser significativo? Soluo: A tabela da cur va normal fornece, para intervalo de confiana de 95%, o nmero de desviospadro, indicando o valor Z = 1,96. A diferena ser d = 160 - 120 = 40 mmHg. Como no h como calcular o desvio-padro s, deve-se arbitrar uma condio logicamente mais desfavorvel, escolhendo-se, por exemplo, um desvio-padro s = 80 mmHg, valor que dificilmente ocorrer na populao estudada. Neste caso, ter-se-: N = 1,962. 802/40 2 16 indivduos Como se trata de dados pareados (sucessivos), o tamanho da amostra de, no mnimo, 16 indivduos. Se o teste fosse conduzido com uso de um grupo de controle e um grupo experimental, cada um destes grupos deveria ter 16 pessoas, ou seja, um total de 32 indivduos, no mnimo.
Verifica-se que deve ser maximizado o valor de p (1 - p) e minimizado o valor da diferena d = Xmx - p, para maximizar o valor do tamanho da amostra N (situao mais desfavorvel). Para dados no pareados (simultneos), o valor de N deve ser multiplicado por 2. Exemplo ilustrativo: Uma vacina est sendo testada em certa populao, admitindo-se que um valor considerado satisfatrio ser a obteno de uma frao de sucesso em torno de 70%. Valores da literatura indicam que, em condies razoveis, pode-se obter uma frao de sucesso da ordem de 90%. Qual dever ser o tamanho da amostra, para um intervalo de confiana de 95%? Soluo: Tm-se os seguintes valores: Z = 1,96 (da curva normal) p = 0,705 d = Xmx - p = 0,90 - 0,70 = 0,20. Substituindo estes valores, obtm-se: N = 1,962 . 0,70 (1 - 0,70)/0,202 21 indivduos, no mnimo. Se forem usados dados no-pareados (simultneos), o grupo experimental e o grupo de controle devero ter, cada um deles, 21 pessoas, com um total de, no mnimo, 42 indivduos.
pesquisa na rea de sade, recomendvel apresentar sempre os detalhes que indiquem como foi calculado o tamanho da amostra. 5) Quando o tamanho N de pacientes, muito grande, deve ser escolhida uma soluo entre as seguintes: a) aumentar a taxa ou o tempo de recrutamento; b) reduzir o nvel de rigor cientfico; c) abandonar a pesquisa. Esta ltima hiptese deve ser afastada a todo custo.
Alguns programas de microcomputador so de extrema importncia no clculo do tamanho da amostra e na determinao de outros parmetros de interesse da bioestatstica. Entre estes programas, esto o Microsoft Excel, o EPIINFO, o SPSS (Statistical Package of Social Science), o Statsoft Statistica 5.0 e o Matlab 6.
Bibliografia
Altman, Douglas G. Practical statistics for medical research. London: Chapman & Hall: 1999. Dawson B, Trapp KG. Bioestatstica bsica e clnica. Rio de Janeiro: Mc Graw Hill: 2001. Cox DR. Planning of experiments. New Y ork: Wiley: 1992. Herrick CJ. Brains of rats and man. New York: Hafner Publishing Co: 1993. Jekel JF. Epidemiologia, bioestatstica e medicina preventiva. Porto Alegre: Artmed: 1999. Petrie A, Sabin C. Compndio de estatstica mdica. Lisboa: Instituto Piaget: 2000. Soares JF, Siqueira AL. Introduo estatstica mdica. Belo Horizonte: Cooperativa Editora e de Cultura Mdica: 2002. Zar JH. Bioestatistical analysis. London: Prentice Hall: 1999.
Endereo para correspondncia Coordenao do Curso de Cincias Farmacuticas da FMABC Av. Prncipe de Gales, 821 Vila Prncipe de Gales Santo Andr, SP CEP 09060-650 Tel.: (11) 4993-5411
90
v. 29
no 2 Jul/Dez 2004