Beruflich Dokumente
Kultur Dokumente
APOSTILA DE BIOESTATSTICA
Bioestatstica
Sumrio
1. Captulo 1 Noes Bsicas ........................................................................................... 5 1.1. Variveis ...................................................................................................................... 5 1.2. 1.3. 1.4. 1.4.1. 1.4.2. 1.4.3. 1.4.4. 1.5. 2. Apurao de Dados ..................................................................................................... 5 Populao e Amostra .................................................................................................. 6 Tcnicas de Amostragem ............................................................................................ 6 Amostra Casual Simples ......................................................................................... 6 Amostra Sistemtica ................................................................................................ 7 Amostra Estratificada .............................................................................................. 7 Amostra de Convenincia........................................................................................ 8 Exerccios Captulo 1 ................................................................................................ 8
Captulo 2 - Apresentao de Dados em Tabelas ....................................................... 10 2.1. Componentes das Tabelas ........................................................................................ 10 2.2. 2.3. Tabelas de Contingncia ........................................................................................... 11 Exerccios Captulo 2 .............................................................................................. 12
3.
Capitulo 3 - Tabelas de Distribuio de Frequncias................................................... 13 3.1. Tabela primitiva ou dados brutos: .............................................................................. 13 3.1.1. 3.2. 3.3. 3.4. ROL ....................................................................................................................... 13 Distribuio de frequncia sem intervalos de classe .................................................. 13 Distribuio de frequncia com intervalos de classe .................................................. 13 Exerccios Captulo 3 .............................................................................................. 17
4.
Elementos de uma distribuio de frequncia (com intervalos de classe) ................ 20 4.1. Classe ....................................................................................................................... 20 4.2. 4.3. 4.4. 4.5. 4.6. 4.7. Limite superior e limite inferior da classe ................................................................... 20 Amplitude de classe................................................................................................... 20 Amplitude total da distribuio ................................................................................... 20 Amplitude total da amostra (ROL) .............................................................................. 21 Ponto Mdio de classe............................................................................................... 21 Exerccios Captulo 4 .............................................................................................. 21
5.
GRFICOS ESTATSTICOS ............................................................................................ 24 5.1. Grfico de Barras....................................................................................................... 24 5.2. 5.3. 5.4. 5.5. Grfico de Colunas .................................................................................................... 25 Grfico de Setores ..................................................................................................... 25 Grfico de Linhas....................................................................................................... 26 Exerccios Captulo 5 .............................................................................................. 27
6.
REPRESENTAO GRFICA DE UMA DISTRIBUIO ............................................... 28 6.1. Histograma ................................................................................................................ 28 6.2. 6.3. Polgono de Frequncias ........................................................................................... 28 Exerccios Captulo 6 .............................................................................................. 29
2
Bioestatstica
7.
MEDIDAS DE POSIO .................................................................................................. 30 7.1. Introduo.................................................................................................................. 30 7.2. 7.2.1. 7.2.2. 7.2.3. 7.2.4. 7.3. 7.3.1. 7.4. 7.5. 7.5.1. 7.5.2. 7.5.3. 7.5.4. 7.6. 7.7. 7.7.1. 7.7.2. 7.7.3. 7.8. 7.8.1. 7.9. 7.10. Mdia Aritmtica: ................................................................................................... 30
Dados no agrupados ........................................................................................... 30 Desvio em relao mdia: .................................................................................. 30 Propriedades da mdia aritmtica ......................................................................... 31 Dados agrupados sem intervalo de classe ............................................................ 31 Exerccios Captulo 7 .............................................................................................. 32 Dados agrupados com intervalo de classe ............................................................ 33 Exerccios: ................................................................................................................. 34 MODA - Mo .............................................................................................................. 35 Dados no agrupados ........................................................................................... 35 Dados agrupados sem intervalo de classe ............................................................ 35 Dados agrupados com intervalo de classe ............................................................ 36 Clculo da Moda: Mtodo mais elaborado pela frmula de CZUBER: ................... 36 Exerccios: ................................................................................................................. 37 MEDIANA ............................................................................................................ 38
Dados no agrupados ........................................................................................... 38 Dados agrupados .................................................................................................. 39 Dados Agrupados sem intervalo de classe ............................................................ 39 Exerccios: ................................................................................................................. 39 Dados Agrupados com intervalos de classe .......................................................... 41 Resolva: .................................................................................................................... 42 Exerccios Captulo 7 .............................................................................................. 43
8.
Medidas de Disperso ou de Variabilidade ................................................................... 47 8.1. Disperso ou variabilidade ......................................................................................... 47 8.2. 8.2.1. 8.2.2. 8.2.3. 8.3. 8.3.1. 8.4. 8.4.1. 8.5. 8.5.1. 8.6. 8.7. 8.8. Amplitude Total .......................................................................................................... 48 Dados no agrupados ........................................................................................... 48 Dados agrupados sem intervalo de classe ............................................................ 48 Dados agrupados com intervalo de classe ............................................................ 49 Varincia / Desvio padro ...................................................................................... 49 Dados no agrupados ........................................................................................... 51 Resolva: .................................................................................................................... 51 Dados Agrupados sem intervalo de classe ............................................................ 52 Exerccios: ................................................................................................................. 53 Dados Agrupados com intervalo de classe ............................................................ 54 Exerccios: ................................................................................................................. 54 Coeficiente de Variao ............................................................................................. 55 Exerccios Captulo 8 .............................................................................................. 56
3
Bioestatstica
9.
Bibliografia ...................................................................................................................... 58
Bioestatstica
1.
Nas reas mdicas, biolgicas e engenharias, coletam-se dados de pessoas, de animais experimentais e de fenmenos fsicos e qumicos. Interessam aos pesquisadores dessas reas, dados sobre mortalidade infantil, eficincia de medicamentos, incidncia de doenas, causa de morte, etc. Os dados referem-se a variveis que so classificadas em Estatstica, como qualitativas, ordinais e quantitativas.
1.1.
Variveis
Em estatstica, uma varivel um atributo mensurvel que tipicamente varia entre indivduos. As variveis so divididas em qualitativas e quantitativas. Varivel Quantitativa - So aquelas que so numericamente mensurveis, por exemplo, a idade, a altura, o peso. Estas ainda se subdividem em:
Varivel Quantitativa Contnua: So aquelas que assumem valores dentro de um conjunto contnuo, tipicamente os nmeros reais. So exemplos, o peso ou a altura de uma pessoa. Varivel Quantitativa Discreta: So aquelas que assumem valores dentro de um tempo finito ou enumervel, tipicamente nmeros inteiros. Um exemplo o nmero de filhos de uma pessoa.
Varivel Qualitativa - So aquelas que se baseiam em qualidades e no podem ser mensurveis numericamente. Estas ainda se subdividem em:
Varivel Qualitativa Ordinal: So aquelas que podem ser colocadas em ordem, por exemplo, a classe social (A,B,C,D, ou E) e a varivel "Peso" medida em 3 nveis (pouco pesados, pesados, muito pesados). So variveis qualitativas ordinais tambm, grau de instruo, status social, estgio da doena. Varivel Qualitativa Nominal: So aquelas que no podem ser hierarquizadas ou ordenadas, como a cor dos olhos, o local de nascimento, peso, altura.
1.2.
Apurao de Dados
Os dados so registrados em fichas, com vrias outras informaes. Para obter apenas os dados preciso fazer uma apurao. Se a varivel qualitativa ou ordinal, a apurao resume-se a simples contagem. Por exemplo, para obter o nmero de nascidos vivos de cada sexo, preciso tomar os pronturios e escrever numa folha de papel: Feminino Masculino Depois, preciso examinar os pronturios e fazer um trao, na linha correspondente a um dos sexos, toda vez que o pronturio registrar que o nascido vivo desse sexo. No exemplo, cada trao representa um nascido vivo e cada quadrado, cortado pela diagonal, representa cinco nascidos vivos. O total dado pelo nmero de traos de cada linha. Feminino Masculino = 52 = 48
5
Bioestatstica
Se a varivel quantitativa, a apurao consiste em anotar cada valor observado. Por exemplo, para apurar dados de peso ao nascer, basta escrever os pesos, uma folha de papel. O nmero do pronturio, escrito ao lado do peso ao nascer, facilita a posterior verificao da apurao. Veja o exemplo:
Nmero do Pronturio 10.525 10.526 ..... ..... ..... 10.624 Peso ao nascer 3,25 2,00 ..... ..... ..... 3,20
1.3.
Populao e Amostra
Entende-se por populao, o conjunto de elementos que tm em comum, determinada caracterstica. Todo subconjunto no vazio e com menor numero de elementos do que a populao constitui uma amostra dessa populao. As populaes podem ser finitas, como o conjunto de alunos de uma escola em determinado ano ou, infinitas, como o nmero de vezes que se pode jogar um dado. Para certas finalidades, as populaes finitas muito grandes so consideradas infinitas. Como exemplo, considere as pessoas do sexo masculino com mais de 35 anos de idade, residentes na cidade de So Paulo. O nmero dessas pessoas matematicamente finito, mas to grande que um registrador ao analisar uma amostra de 500 pessoas, pode considerar a populao como infinita. Os pesquisadores trabalham com amostras, por vrios motivos. Primeiro, fato que as populaes finitas s podem ser estudadas atravs de amostras. Por exemplo, por maior que seja o nmero de vezes que uma pessoa possa pesar um corpo slido, o resultado ser sempre uma amostra por que, teoricamente, todo corpo pode ser pesado um nmero infinito de vezes. Depois, as populaes finitas muito grandes s podem ser estudadas atravs de amostras. Por exemplo, o nmero de cobaias existentes no mundo em determinado perodo , matematicamente, finito, mas as pesquisas que usam cobaias s podem ser feitas com amostras, por que nenhum pesquisador dispe de todas as cobaias do mundo para o seu trabalho. Finalmente, o estudo cuidadoso de uma amostra tem mais valor cientfico do que o estudo sumrio de toda a populao. Por exemplo, para estudar o efeito do flor sobre a preveno de cries em crianas, melhor submeter uma amostra de crianas a exames peridicos minuciosos, do que examinar rapidamente todas as crianas antes, e determinado tempo aps o uso do flor.
1.4.
Tcnicas de Amostragem
Definida a populao, preciso estabelecer a tcnica de amostragem, isto , o procedimento que ser adotado para escolher os elementos que iro compor a amostra. Conforme a tcnica utilizada, tem-se um tipo de amostra.
Bioestatstica
Imagine que um professor quer obter uma mostra casual simples dos alunos de sua escola. Para isso, pode organizar um sorteio com fichas numeradas, de zero a nove. Para fazer o sorteio, o professor retira uma ficha de uma urna e anota o nmero. Esse nmero ser o primeiro dgito do nmero do aluno que ser sorteado para a amostra. Feito isso, o professor recoloca a ficha na urna, mistura, retira outra ficha e anota o nmero, que ser o segundo dgito do nmero do aluno que ser sorteado para a amostra. Esse procedimento deve ser repetido at que sejam retirados todos os dgitos do nmero do aluno sorteado. Se a escola tem, por exemplo, 832 alunos, os nmeros dos alunos tm trs dgitos. Para sortear um aluno, preciso retirar trs fichas da urna, uma de cada vez, sempre lembrando que a ficha retirada deve ser recolocada na urna antes de nova retirada. O nmero de um dos alunos sorteados poderia ser, por exemplo, 377 assim obtido: Primeira ficha: 3 Segunda ficha: 7 Terceira ficha: 7 claro que devem ser desprezados nmeros maiores do que 832 (se a escola tem 832 alunos, nenhum aluno recebeu nmero maior do que 832), nmeros que j foram sorteados e o nmero 000. O professor sorteia tantos nmeros quantos so os alunos que ele quer na amostra.
Nome
Nome
Nome
1 . . *10 . . *20
21 . . *30 . . *40
41 . . *50 . . *60
Quando a populao est organizada, mais fcil obter uma amostra sistemtica do que uma amostra casual simples. Por exemplo, para obter uma amostra de 2% dos pronturios dos pacientes de uma clnica, mais fcil pegar o ltimo de cada 50 pronturios do que fazer um sorteio at conseguir 2% do total de pronturios. As amostras sistemticas so muito usadas, mas exigem especial preocupao com o sistema de seleo. Por exemplo, se os elementos da populao esto em fila, no se devem selecionar os primeiros, ou os ltimos, nem mesmo os do meio, preciso percorrer toda a fila e escolher, por exemplo, o dcimo de cada grupo de dez.
Bioestatstica
diferenas, cada srie um estrato. O professor deve ento, obter uma amostra de cada srie (estrato) e depois reunir todas as amostras, em uma s. Essa amostra final estratificada. Devem ser obtidas amostras estratificadas sempre que a populao for constituda por diferentes estratos. Por exemplo, se as pessoas que residem nos vrios bairros de uma cidade so diferentes, cada bairro um estrato. Para obter uma amostra de pessoas dessa cidade, seria razovel obter uma amostra de cada bairro e depois reunir todas as informaes numa amostra estratificada.
1.5.
Exerccios Captulo 1
1. Os pronturios dos pacientes de um hospital esto organizados em um arquivo, por ordem alfabtica. Qual a maneira mais rpida de amostrar 1/3 do total dos pronturios? 2. Um pesquisador trem dez gaiolas que contm cada uma, seis ratos. Como o pesquisador pode solucionar dez ratos para a mostra? 3. Para levantar dados sobre o nmero de filhos por casal, em uma comunidade, um pesquisador organizou um questionrio que enviou, pelo correio, a todas as residncias. A resposta ao questionrio era facultativa, pois o pesquisador no tinha condies de exigir a resposta. Nesse questionrio perguntava-se o nmero de filhos por casal morador na residncia. Voc acha que os dados assim obtidos tm algum tipo de tendenciosidade? 4. Um pesquisador pretende levantar dados sobre o nmero de moradores por domiclio usando a tcnica de amostragem sistemtica. Para isso, o pesquisador visitar cada domiclio selecionado. Se nenhuma pessoa estiver presente na ocasio da visita, o pesquisador excluir o domiclio da amostra. Esta ltima determinao introduz tendenciosidade? Por qu? 5. Muitas pessoas acreditam que as famlias se tornaram menores. Suponha que, para estudar essa questo, foi selecionada uma amostra de 2.000 casais e perguntou-se quantos filhos eles tinham, quantos filhos tinham seus pais e quantos filhos tinham seus avs. O procedimento introduz tendenciosidade nos dados? Por qu?
8
Bioestatstica
6. Dada uma populao de 4 indivduos, X, W, Y, Z, quantas amostras casuais simples de tamanho 2 podem ser obtidas? Quais so essas amostras? 7. Dada uma populao de 8 elementos, A, B, C, D, E, F, G, e H, descreva trs formas diferentes de obter uma amostra sistemtica de 4 elementos. 8. Dada uma populao de 40 alunos, descreva uma forma de obter uma amostra casual simples de 6 alunos. 9. Organize uma lista com 10 nomes de pessoas em ordem alfabtica. Depois escreva uma forma de obter uma amostra sistemtica de 5 indivduos. 10. Em uma pesquisa de mercado para servios odontolgicos tomou-se a lista telefnica, onde os nomes dos assinantes esto organizados em ordem alfabtica do ltimo sobrenome, e se amostrou o dcimo de cada 10 assinantes. Critique esse procedimento. 11. Classifique as variveis em qualitativa (nominal ou ordinal) e quantitativa (discreta ou contnua) e d exemplo de um valor (numrico ou no numrico) para cada item. a) b) c) d) e) f) g) h) i) Estado civil de uma pessoa: Marcas de carros em um estacionamento: Salrio de um funcionrio de uma empresa: Nmero de acidentes de trabalho em uma empresa: Cor dos cabelos das modelos de uma agencia de modelos: Cor dos olhos: Grau de instruo: Nmero de filhos de um casal: Peso e altura dos alunos de uma escola:
Bioestatstica
2.
Os dados devem ser apresentados em tabelas construdas de acordo com as normas tcnicas ditadas pela Fundao Instituto Brasileiro de Geografia e Estatstica IBGE.
2.1.
As tabelas tm ttulo, corpo, cabealho e coluna indicadora. O ttulo explica o que a tabela contm. O corpo formado pelas linhas e colunas de dados. O cabealho especifica contedo das colunas, e a coluna indicadora especifica o contedo das linhas. Como exemplo, veja a tabela a seguir:
Populao brasileira residente, com 15 anos e mais, segundo a alfabetizao, de acordo com o senso demogrfico de 1980
O cabealho constitudo pelas palavras: Alfabetizao A coluna indicadora constituda pelas especificaes: Sabem ler e escrever No sabem ler e escrever Sem declarao O corpo da tabela formado pelos nmeros: 54.793.268 18.716.847 31.828 Frequncia
As tabelas podem apresentar, alm das frequncias, as frequncias relativas e o total. Para obter a frequncia relativa de uma dada categoria, divide-se a frequncia dessa categoria pela soma das frequncias. O resultado, multiplicado por 100, uma porcentagem. O total da coluna escrito entre dois traos horizontais.
10
Bioestatstica
Populao brasileira residente, com 15 anos e mais, segundo a alfabetizao, de acordo com o senso demogrfico de 1980 Alfabetizao Sabem ler e escrever No sabem ler e escrever Sem declarao Total.......................................................
Fonte: IBGE (1988)
As tabelas podem conter fonte ou notas. A fonte d indicao da entidade, ou do pesquisador, ou dos pesquisadores que publicaram ou forneceram os dados. Como exemplo na tabela citada como exemplo, a fonte o IBGE, pois foi essa fundao que publicou os dados. As notas devem esclarecer aspectos relevantes do levantamento dos dados ou da apurao. Observe a tabela abaixo. A nota informa que s foram apurados nascimentos ocorridos no ano de registro. Nascidos vivos registrados segundo o ano do registro Ano do Registro 1984 1985 1986
Fonte: IBGE (1988) Nota: Nascimentos ocorridos no ano de registro
2.2.
Tabelas de Contingncia
Muitas vezes os elementos da amostra ou da populao so classificados de acordo com dois fatores. Os dados devem ento ser apresentados em tabelas de contingncia, isto , em tabelas de dupla entrada, cada entrada relativa a um dos fatores. Como exemplo, veja a tabela abaixo que representa o nmero de nascidos vivos registrados. Note que eles esto classificados segundo dois fatores: o ano de registro e o sexo.
Nascidos vivos registrados segundo o ano de registro e o sexo Ano de Registro 1984 1985 1986 Sexo Masculino 1.307.758 1.339.059 1.418.050 Feminino 1.251.280 1.280.545 1.361.203 Total 2.559.038 2.619.604 2.779.253
As tabelas de contingncia podem apresentar frequncias relativas, alm de frequncias simples. As frequncias relativas do estimativas de riscos, isto , do estimativas de probabilidades de dano. Veja o exemplo abaixo:
11
Bioestatstica
At o 3 ms Depois do 3 ms
Fonte: HILL et all. (1958)
Normal 36 51
Defeituoso 14 3
50 54
28,0% 5,6%
As frequncias relativas apresentadas na tabela acima estimam o risco de um recm-nascido ser defeituoso em funo da poca em que a gestante foi atacada de rubola. Note que a frequncia relativa de defeituosos (risco) maior quando a gestante foi atacada de rubola no primeiro trimestre da gestao. Diz-se ento que a poca do ataque de rubola um fator de risco na ocorrncia de recmnascidos defeituosos.
2.3.
Exerccios Captulo 2
1. Faa uma pesquisa sobre os dados dos seus colegas de sala e monte tabelas com as seguintes variveis: a. b. c. d. e. f. g. Idade Sexo Cidade de Residncia Idade Nmero de Filhos Estado Civil Nmero de Irmos
12
Bioestatstica
3.
um tipo de tabela que condensa uma coleo de dados conforme as frequncias (repeties de seus valores).
3.1.
uma tabela ou relao de elementos que no foram numericamente organizados. difcil formarmos uma ideia exata do comportamento do grupo como um todo, a partir de dados no ordenados. Ex : 45, 41, 42, 41, 42 43, 44, 41 ,50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51
3.1.1. ROL
a tabela obtida aps a ordenao dos dados (crescente ou decrescente). Ex : 41, 41, 41, 42, 42 43, 44, 45 ,46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60
3.2.
a simples condensao dos dados conforme as repeties de seu valores. Para um ROL de tamanho razovel esta distribuio de frequncia inconveniente, j que exige muito espao. Veja exemplo abaixo:
Dados 41 42 43 44 45 46 50 51 52 54 57 58 60 Total Frequncia 3 2 1 1 1 2 2 1 1 1 1 2 2 20
3.3.
Quando o tamanho da amostra elevado, mais racional efetuar o agrupamento dos valores em vrios intervalos de classe.
13
As tabelas com grande nmero de dados so cansativas e no do ao leitor viso rpida e global do fenmeno. Para isso, preciso que os dados estejam organizados em uma tabela de distribuio de frequncias. A partir de agora, explicaremos passo a passo, a construo desse tipo de tabela usando, como exemplo os dados na tabela Peso ao nascer de nascidos vivos em quilogramas. Imagine que, para dar uma ideia sobre o peso ao nascer de nascidos vivos, o pesquisador ir apresentar no os pesos observados, mas o nmero de nascidos vivos por faixas de peso. Deve, ento, construir uma tabela de distribuio de frequncias. Peso ao nascer de nascidos vivos, em quilogramas
2.522 2.720 3.125 2.250 3.220 3.000 3.725 2.890 3.110 3.520 3.100 3.200 2.780 3.155 2.150 3.300 3.250 3.200 3.720 2.800 2.900 2.950 2.480 3.800 2.500 3.550 3.000 4.100 3.200 3.450 3.100 3.150 2.800 2.900 1.900 3.600 3.200 3.300 2.900 2.500 3.600 2.500 2.300 2.950 3.000 3.750 3.150 3.200 2.500 2.900 3.200 4.100 2.400 2.700 2.450 3.400 2.400 3.120 3.400 3.200 2.700 3.150 2.800 2.700 3.300 3.200 3.200 2.800 4.600 1.720 2.750 4.200 2.100 4.450 2.900 2.920 2.720 2.900 2.000 2.720 2.480 3.900 2.500 2.480 2.450 3.400 3.400 1.570 3.800 2.700 2.900 3.700 2.120 3.150 2.400 3.450 3.120 2.120 2.450 2.700 ....... .......
Primeiro, preciso definir as faixas de peso que recebem tecnicamente o nome de classes. Observe os dados apresentados na tabela acima. O menor valor de 1.570 Kg e o maior de 4.600 Kg. Podem ento ser definidas classes de 1,5 a 2,0 Kg, de 2,0 a 2,5 Kg, e assim por diante, como mostra o esquema dado a seguir:
1,5 2,0
14
Bioestatstica
2,0
2,5
2,5
3,0
3,0
3,5
3,5
4,0
4,0
4,5
4,5
5,0
Na classe de 1,5 a menos de 2,0 Kg so colocados desde nascidos com 1,5 Kg at os que nasceram com 1.999 Kg; na classe de 2,0 a menos de 2,5 Kg, so colocados desde nascidos com 2,0 Kg at os que nasceram com 2,499 Kg, e assim por diante. Logo, cada classe cobre um intervalo de 0,5 Kg, ou seja, cada intervalo de classe de 0,5 Kg. mais fcil trabalhar com intervalos de classe iguais. As distribuies das frequncias, obtidas a partir da tabela do Peso ao nascer de nascidos vivos, em quilogramas, dada a seguir: Classe 1,5 2,0 = 16 2,0 2,5 3,0 2,5 = 31 3,0 = 34 3,5 = 11 3,5 4,0 = 4 4,0 4,5 4,5 = 1 5,0 Frequncia = 3
Denominam-se extremos de classe os limites dos intervalos de classe. Deve ficar muito claro se os valores iguais aos extremos devem ou no ser includos na classe. Recomenda-se adotar a notao 1,5 2,0, 2,0 2,5 etc. Isto significa que o intervalo e fechado esquerda, isto , pertencem classe os valores iguais ao extremo inferior (por exemplo, 1,5 na primeira classe). Tambm significa que o intervalo fechado direita, isto , no pertencem classe os valores iguais ao extremo superior (por exemplo, 2,0 na primeira classe).
15
Bioestatstica
Numa tabela de distribuio de frequncias tambm podem ser apresentados os pontos mdios da classe. O ponto mdio dado pela soma dos extremos da classe, dividia por 2. Para a classe 1,5 2,0, o ponto mdio :
Uma tabela tpica de distribuio de frequncias tem ento, trs colunas: a da esquerda, onde esto escritas as classes; a do meio, onde esto escritos os pontos mdios; e a da direita, onde esto escritas as frequncias, isto , o numero de elementos de cada classe. Veja a tabela a seguir: Nascidos vivos segundo o peso ao nascer, em quilogramas Classe 1,5 2,0 2,25 2,0 2,5 2,75 2,5 3,0 3,25 3,0 3,5 3,75 3,5 4,0 4,25 4,0 4,5 4,75 4,5 5,0 1 4 11 34 31 16 Ponto Mdio 1,75 Frequncia 3
Nem sempre estaro definidos o extremo inferior da primeira classe ou o extremo superior da ltima classe. Observa a tabela abaixo. O extremo superior da ltima classe no esta definido. Esta tabela tambm exemplifica o uso de intervalos de classe diferentes. Mulheres com 30 anos de Idade Segundo a Presso Sangunea Sistlica, em Milmetros de Mercrio Classe 90 100 100 105 105 110 110 115 115 120 120 125 125 130 130 135 135 140 Ponto Mdio 95 102,5 107,5 112,5 117,5 122,5 127,5 132,5 137,5 Frequncia 6 11 12 17 18 11 9 6 4
16
Bioestatstica
4 1 1
As tabelas de distribuio de frequncias mostram a distribuio da varivel, mas perdem em exatido. Isso porque todos os dados passam a ser representados pelo ponto mdio da classe a que pertencem. Por exemplo, a tabela acima mostra que seis mulheres apresentaram presso sangunea sistlica com o ponto mdio igual a 95, mas no da informao exata sobre a presso de cada uma delas. O numero de classes deve ser escolhido pelo pesquisador, em funo do que ele quer mostrar. Em geral, convm estabelecer de 5 a 20 classes. Se o numero de classes for demasiado pequeno (por exemplo, 3) perde-se muita informao. Se o numero de classes for grande (por exemplo, 30) tem-se pormenores desnecessrios. Mas no existe um numero ideal de classes, embora existam at formulas para estabelecer quantas classes devem ser construdas. Uma dessas frmulas e a seguinte:
Onde n o nmero de dados. O nmero de classes um inteiro prximo de k. Para entender como se aplica esta frmula, veja a tabela peso ao nascer dos nascidos vivos, como n=100, tem-se que:
ou seja, deveriam ter sido construdas 7 ou 8 classes. importante deixar claro, aqui, que o resultado obtido por esta formula pode ser usado como referencia, mas cabe ao pesquisador determinar o numero de classes que pretende organizar. Finalmente, quando se constri uma tabela de distribuio de frequncias, melhor usar, como extremos de classes, nmeros fceis de trabalhar. No caso do peso ao nascer dos nascidos vivos, foram definidas 7 classes e foram estabelecidos extremos com valores fceis, como 1,5 e 2,0.
3.4.
Exerccios Captulo 3
1. De acordo com o IBGE (1988), a distribuio dos suicdios ocorridos no Brasil em 1986, segundo a causa atribuda foi a seguinte: 263 por alcoolismo, 198 por dificuldade financeira, 700 por doena mental, 189 por outro tipo de doena, 416 por desiluso amorosa e 217 por outras causas. Apresente essa distribuio em uma tabela. 2. Construa uma tabela de distribuio de frequncias para apresentar os dados da tabela abaixo, apresente tambm as frequncias relativas: Presso arterial, em milmetros de mercrio, de ces adultos anestesiados e aps laparotomia 130,0 107,5 135,0 100,0 134,5 105,0 125,0 130,0 145,0 158,5 120,0 100,0 135,0 125,0 110,0 111,5 107,5 127,5 104,5 102,5 99,0 120,0 90,5 101,5 90,5 116,0 143,0 104,5 102,5 107,5 82,5 115,0 136,5 101,5 124,0
17
Bioestatstica
121,5 107,5
135,0 140,0
102,0 121,5
119,5 107,5
115,5 113,0
125,5 93,0
117,5 103,5
3. De acordo com o IBGE (1988), em 1986 ocorreram, em acidentes de Trnsito, 27.306 casos de vitimas fatais, assim distribudos: 11.712 pedestres, 7.116 passageiros e 8.478 condutores. Faa uma tabela para apresentar esses dados. Apresente tambm as frequncias relativas e o total. 4. De posse da tabela abaixo, calcule as frequncias relativas de no sobreviventes.
Pacientes com cncer de mama segundo a faixa de idade por ocasio Do diagnostico e sobrevivncia por trs anos Sobrevivncia Faixa de idade Menor de 50 anos De 50 a 70 anos Mais de 70 anos Fonte: MORRISON (1973) Sim 11 18 15 No 6 8 9
5. De posse da tabela abaixo, calcule as frequncias relativas em cada linha, isto e, calcule a proporo de estabelecimentos de sade, pblicos e particulares, de cada espcie. Estabelecimentos de sade, pblicos e particulares Por espcie. Brasil, 1985. Estabelecimentos Pblicos Particulares 1.002 5.132 150 156 1.531 6.136 14.393 472
6. Construa uma tabela de distribuio de frequncias para apresentar os dados da tabela abaixo usando intervalos de classes iguais. Depois faa outra tabela, com os seguintes intervalos: 1 dia, 2 ou 3 dias, de 4 a 7 dias, de 8 a 14 dias, mais de 14 dias. Tempo de internao, em dias, de pacientes acidentados no trabalho, em um dado hospital 7 12 4 10 2 1 8 12 15 8 7 6 1 3 2 9 14 4 7 17 14 8 12 7 13 4 3 5 10 7 6 2 5 3 8 11
7. Ao nascer, os bebs so pesados e medidos, para saber se esto dentro das tabelas de peso e altura esperados. Estas duas variveis so: a) qualitativas b) ambas discretas
18
Bioestatstica
c) ambas contnuas d) contnuas e discretas e) discreta e contnua 8. A parcela da populao convenientemente escolhida para representa-la chamada de: a) varivel b) rol c) amostra d) dados brutos e) nada podemos afirmar, porque a informao incompleta
9. Um conjunto de 100 notas de matemtica, de alunos do sexo masculino, tiradas dos arquivos da secretaria da escola, constitui: a) um rol b) uma tabela c) uma relao de dados brutos d) uma distribuio de frequncia 10. Por definio, rol qualquer srie ordenada de valores referentes a uma mesma varivel. Ento, dadas as sries da mesma varivel x: I. 2, 4, 5, 6, 7 II. 1, 3, 3, 6, 7 III. 8, 7, 5, 2, 1 IV. 5, 4, 4, -1 Podemos afirmar que: a) todas elas constituem ris b) s a srie I constitui um rol c) a srie II no um rol, mas as outras sim d) apenas as sries I e IV no so ris e) somente a srie III um rol, as demais no
19
Bioestatstica
4.
Frequncia 3
2,25 2,0 2,5 2,75 2,5 3,0 3,25 3,0 3,5 3,75 3,5 4,0 4,25 4,0 4,5 4,75 4,5 5,0
16
31
34
11
4.1.
Classe
So os intervalos de variao da varivel e simbolizada por i e o nmero total de classes simbolizada por k. Exemplo, na tabela acima, K=7 e 2,5 3,0 a terceira classe, onde i=3.
4.2.
So os extremos de cada classe. O menor nmero o limite inferior de classe ( li ) e o maior nmero o limite superior ( Li ) da classe. Exemplo, em 2,5 3,0 l3=2,5 e L3=3,0. O smbolo representa um intervalo fechado esquerda e aberto direita. O dado 3,0 do ROL no pertence classe 3 e sim a classe 4 representada por 3,0 3,5.
4.3.
Amplitude de classe
obtida atravs da diferena entre o limite superior e inferior da classe e simbolizada por . Exemplo, na tabela acima, na classe k=1, hi = 2,0 - 1,5 = 0,5.
4.4.
a diferena entre o limite superior da ltima classe e o limite inferior da primeira classe. AT = L(max) - l(min). Ex: na tabela anterior AT = 5,01,5 = 3,5.
20
Bioestatstica
4.5.
a diferena entre o valor mximo e o valor mnimo da amostra (ROL). Onde AA = Xmax - Xmin. Em nosso exemplo AA = 4.6001.570 = 3.030. (AT sempre ser maior que AA).
4.6.
o ponto que divide o intervalo de classe em duas partes iguais. Exemplo, em 2,0 ponto mdio x3= (2,0+2,5)/2= 2,25.
4.7.
Exerccios Captulo 4
1. A tabela abaixo apresenta a distribuio de frequncia dos salrios mensais em reais, de 65 empregados da companhia P & R.
1 2 3 4 5 6 7
5.000 6.000 6.000 7.000 7.000 8.000 8.000 9.000 9.000 10.000 10.000 11.000 11.000 12.000 Total ............................................
8 10 16 14 10 5 2 65
Determinar: a) b) c) d) e) f) g) h) A amplitude Total; O limite superior da quinta classe O limite inferior da sexta classe; A amplitude do quinto intervalo de classe; A classe do 40 empregado; A percentagem de empregados cuja renda ultrapassa R$10.000,00 por ms; A percentagem de empregados que ganham menos de R$8.000,00 por ms; A percentagem de empregados que ganham menos de R$10.000,00 e pelo menos R$6.000,00 por ms;
2. A tabela abaixo apresenta uma distribuio de frequncia das reas de 400 lotes:
reas 2 (m ) o N de Lotes
300
14
400
46
500
58
600
76
700
68
800
62
900
48
1000
22
1100
1200
Bioestatstica
b) c) d) e) f) g) h) i) j) k) l) m) n) o)
O limite superior da quinta classe. O limite inferior da oitava classe. O ponto mdio da stima classe. A amplitude do intervalo da segunda classe. A frequncia da quarta classe. A frequncia relativa da sexta classe. A frequncia acumulada da quinta classe. O nmero de lotes cuja rea no atinge 700m2. O nmero de lotes cuja rea atinge e ultrapassa 800m2. A percentagem dos lotes cuja rea no atinge 600m2. A percentagem dos lotes cuja rea seja maior ou igual a 900m2. A percentagem dos lotes cuja rea de 500m2, no mnimo, mas inferior a 1000m2. A classe do 72 lote. At que classe esto includos 60% os lotes.
3. A distribuio abaixo indica o nmero de acidentes ocorridos com 70 motoristas de uma empresa de nibus.
No de Acidentes No de Motoristas 0 20 1 10 2 16 3 9 4 6 5 5 6 3 7 1
Determine: a) b) c) d) e) O nmero de e a percentagem de motoristas que no sofreram nenhum acidente. O nmero e a percentagem de motoristas que sofreram pelo menos 4 acidentes. O nmero e a percentagem de motoristas que sofreram menos de 3 acidentes O nmero e a percentagem de motoristas que sofreram no mnimo 3 e no mximo 5 acidentes. A percentagem dos motoristas que sofreram no mximo 2 acidentes.
i 1 2 3 4 5
Classes 0 8 8 16 16 24 24 32 32 40
fi 4 10 14 9 3
fr
f%
= 40 = 1,00
i 1 2 3
xi 0 1 2
fi 1 4
Fi 4
22
Bioestatstica
4 5 6 7 8
3 4 5 6 7
3 2
0,25 0,15
13 18 19
i 1 2 3 4 5 6 7 8
Classes 0 2 2 4 4 6 8 10 10 12
xi 1 5 7
fi 4 8
Fi
30 27 15 10 72 83 93
13 14 16
100
7. Considerando as notas de um teste de inteligncia aplicado a 100 alunos:
64 73 78 86 76 82 68 71 95 94
78 95 86 84 80 90 96 73 94 75
66 82 78 86 92 83 86 63 88 67
74 73 85 76 73 85 72 74 91 108
103 92 98 83 87 72 74 98 83 98
78 85 75 103 70 81 84 78 98 71
86 80 73 86 85 96 99 78 93 92
103 81 90 84 79 81 81 83 83 72
87 90 86 85 93 85 89 96 76 73
23
Bioestatstica
5.
GRFICOS ESTATSTICOS
So representaes visuais dos dados estatsticos que devem corresponder, mas nunca substituir as tabelas estatsticas. Os grficos so de extrema importncia na visualizao e interpretao de informaes e dados acerca de temas de aspectos naturais, sociais e econmicos. Os grficos so representaes bastante difundidas em diferentes tipos de informativos, dentre eles, os principais esto em livros, revistas, jornais impressos, alm da televiso e a internet, que fazem o uso continuamente para apresentar informaes populao em geral ou grupos especficos de pesquisas. Diante dessas afirmaes os grficos consistem em uma representao constituda por formas geomtricas elaboradas de maneira precisa, oriundas de dados numricos resultados de pesquisas e organizadas em uma tabela. Os grficos so classificados segundo sua forma e podem ser de colunas, de linhas e circulares. Existem normas adicionais para a construo de grficos, ditadas pela fundao IBGE. Assim, todo grfico deve apresentar ttulo e escala. O ttulo pode ser colocado tanto acima como abaixo do grfico. As escalas devem crescer da esquerda para a direita, e de baixo para cima. As legendas explicativas devem ser colocadas de preferncia, direita do grfico. Observe os tipos de grficos a partir do exemplo da tabela com os dados da populao brasileira residente, com 15 anos e mais segundo o estado conjugal. Populao Brasileira residente, com 15 anos e mais, segundo o estado conjugal, de acordo com o censo demogrfico de 1980 Estado conjugal Solteiros (1) Casados (2) Separados Vivos Sem declarao Frequncia 25.146.484 41.974.865 1.816.046 3.616.046 1.005.234 Percentual 34,18 57,06 2,47 4,92 1,37
Fonte: IBGE Nota: Esto computados, como separados, os separados, os desquitados e os divorciados (1) Exclusive as pessoas solteiras, vivendo em unio consensual estvel (2) Inclusive 4.939.528 pessoas vivendo em unio consensual estvel
5.1.
Grfico de Barras
O grfico de barras usado para apresentar variveis qualitativas ou ordinais. Para fazer um grfico de barras, primeiro se traa o sistema de eixos cartesianos. Depois se colocam, no eixo das abscissas, as categorias da varivel em estudo. Em seguida constroem-se barras retangulares, com base no eixo das abscissas e altura igual frequncia, ou frequncia relativa, da respectiva categoria. As barras devem ser desenhadas separadas para ficar claro que a varivel qualitativa ou ordinal.
24
Bioestatstica
Figura 1: Populao brasileira residente, com 15 anos e mais, segundo o estado conjugal, de acordo com o senso demogrfico de 1980.
5.2.
Grfico de Colunas
Figura 2: Populao brasileira residente, com 15 anos e mais, segundo o estado conjugal, de acordo com o senso demogrfico de 1980.
5.3.
Grfico de Setores
O grfico de setores tambm usado para apresentar variveis qualitativas ou ordinais. Para fazer um grfico de setores, primeiro se traa uma circunferncia que, como se sabe, tem 360. Essa circunferncia representa o total, ou seja, 100%. Dentro dessa circunferncia devem ser representadas as categorias da varivel em estudo. Para isso, toma-se a frequncia relativa de cada categoria e calcula-se o ngulo central, da seguinte maneira: se 100% correspondem a 360, uma categoria com frequncia relativa de f% ter um ngulo central x, tal que:
25
Bioestatstica
Os ngulos centrais das demais categorias so obtidos da mesma maneira. Para fazer o grfico de setores marcam-se, na circunferncia, os ngulos calculados, separando-os com o traado dos raios. Observe o grfico de setores apresentado abaixo:
5.4.
Grfico de Linhas
Grfico de Linhas: um grfico que apresenta os dados por meio de linhas, sempre que as categorias utilizadas representarem um intervalo de tempo.
26
Bioestatstica
5.5.
Exerccios Captulo 5
1. Faa um grfico de barras e um grfico de setores para apresentar os dados da tabela a seguir: Suicidas segundo o sexo. Brasil, 1986 Sexo Masculino ............. Feminino ..............
Fonte: IBGE: 1988
27
Bioestatstica
6.
Os dados apresentados em tabelas de distribuio de frequncias so apresentados graficamente em histogramas. Para construir um histograma, primeiro se traa o sistema de eixos cartesianos. Depois, se os intervalos de classe so iguais, traam-se barras retangulares com bases iguais, correspondendo aos intervalos de classe, e com alturas determinadas pelas respectivas frequncias. Quando os intervalos de classe so diferentes, para construir um histograma preciso calcular as densidades de frequncia relativa. Entende-se por densidade de frequncia relativa o quociente entre a frequncia relativa e o intervalo de classe, isto :
6.2.
Polgono de Frequncias
Os dados apresentados na tabela de distribuio de frequncias tambm podem ser apresentados em grficos denominados polgonos de frequncias. Para fazer esse tipo de grfico, primeiro se traa o sistema de eixos cartesianos. Depois, se os intervalos de classe so iguais, marcam-se pontos com abscissas iguais aos pontos mdios de classes e ordenadas iguais s respectivas frequncias. Se os intervalos de classe so diferentes, marcam-se pontos com abscissas iguais aos pontos mdios de classes e ordenadas iguais s respectivas densidades de frequncia relativas. Para fechar o polgono, unem-se os extremos da figura com o eixo horizontal, nos pontos de abscissas iguais aos pontos mdios de uma classe imediatamente inferior primeira, e de uma classe imediatamente superior ltima.
28
Bioestatstica
6.3.
Exerccios Captulo 6
Preo mdio da gasolina comum para reas selecionadas dos Estados Unidos, maro de 1975, em centavos de dlar.
rea Atlanta Baltimore Boston Buffalo Chicago Cincinnati Cleveland Dallas Detroit Houston Kansas City Preo por galo 53.4 55.1 53.9 53.4 54.8 53.3 53.9 49.1 53.7 47.9 49.6 rea Los Angeles Milwaukee Minneapolis New York Philadelphia Pittsburgh St. Louis San Diego San Francisco Seattle Washington Preo por galo 53.5 50.1 50.3 55.2 52.9 53.4 52.3 55.3 56.8 52.7 55.2
Vamos supor que quisssemos organizar aqueles preos em uma distribuio de frequncias com cerca de 5 classes. Determinar a amplitude conveniente de cada intervalo, de tal forma que todos os intervalos de classe tenham iguais amplitudes, e construir a tabela de frequncias fixando o limite inferior da primeira classe em 47.0. Construir o histograma e o polgono de frequncia da distribuio. 2. A tabela seguinte representa as alturas (em cm) de 40 alunos de uma classe. 162 164 170 160 166 163 165 157 158 169 148 159 176 163 152 166 175 157 165 170 169 155 157 164 172 154 163 165 178 165 170 171 158 150 162 166 172 158 168 164
a) Calcular a amplitude total. b) Admitindo-se 6 classes, qual a amplitude do intervalo de classe? c) Construir uma tabela de frequncias simples absoluta e relativa das alturas dos alunos admitindo que o limite inferior da 1a classe seja 148 cm. d) Determinar os pontos mdios das classes. 3. Os dados seguintes representam 20 observaes relativas ao ndice pluviomtrico em determinados municpios do Estado: 144 141 152 150 159 142 160 146 160 142 151 141 157 141 146 150 154 143 145 158
Construir a tabela de frequncias simples e acumuladas (abaixo de e acima de) tanto absolutas quanto relativas.
29
Bioestatstica
7.
MEDIDAS DE POSIO
7.1.
Introduo
So as estatsticas que representam uma srie de dados orientando-nos quanto posio da distribuio em relao ao eixo horizontal do grfico da curva de frequncia. As medidas de posies mais importantes so as medidas de tendncia central ou promdias (verifica-se uma tendncia dos dados observados a se agruparem em torno dos valores centrais). As medidas de tendncia central mais utilizadas so: mdia aritmtica, moda e mediana. Outros promdios menos usados so as mdias: geomtrica, harmnica, quadrtica, cbica e biquadrtica. As outras medidas de posio so as separatrizes,que englobam: a prpria mediana, os decis, os quartis e os percentis. .
7.2.
Mdia Aritmtica:
igual ao quociente entre a soma dos valores do conjunto e o nmero total dos valores.
30
Bioestatstica
, temos:
2 propriedade: Somando-se (ou subtraindo-se) uma constante (c) a todos os valores de uma varivel, a mdia do conjunto fica aumentada (ou diminuda) dessa constante.
Se no exemplo original somarmos a constante 2 a cada um dos valores da varivel temos: Y = 12+16+15+17+18+20+14 / 7 = 16 quilos ou Y = .+ 2 = 14 +2 = 16 quilos
3 propriedade: Multiplicando-se (ou dividindo-se) todos os valores de uma varivel por uma constante (c), a mdia do conjunto fica multiplicada (ou dividida) por essa constante.
Se no exemplo original multiplicarmos a constante 3 a cada um dos valores da varivel temos: Y = 30+42+39+45+48+54+36 / 7 = 42 quilos ou
31
Bioestatstica
Consideremos a distribuio relativa a 34 famlias de quatro filhos, tomando para varivel o nmero de filhos do sexo masculino. Calcularemos a quantidade mdia de meninos por famlia: N de meninos 0 1 2 3 4 frequncia = fi 2 6 10 12 4 34 Como as frequncias so nmeros indicadores da intensidade de cada valor da varivel, elas funcionam como fatores de ponderao, o que nos leva a calcular a mdia aritmtica ponderada, dada pela frmula:
..xi. 0 1 2 3 4
..fi. 2 6 10 12 4 34
..xi.fi . 0 6 20 36 16 78
Onde temos:
7.3.
Exerccios Captulo 7
1 2 3 4
2 3 6 8
32
Bioestatstica
5 6
3 1
Onde,
Consideremos a distribuio: I 1 2 3 4 5 6 Estaturas (cm) 150 |----- 154 154 |----- 158 158 |----- 162 162 |----- 166 166 |----- 170 170 |----- 174 fi 4 9 11 8 5 3 40 Pela mesma razo do caso anterior, vamos, inicialmente, abrir uma coluna para os pontos mdios e outras para os produtos xi.fi. i 1 2 3 4 5 6 Estaturas (cm) 150 |----- 154 154 |----- 158 158 |----- 162 162 |----- 166 166 |----- 170 170 |----- 174 fi 4 9 11 8 5 3 xi 152 156 160 164 168 172 xi.fi 608 1404 1760 1312 840 516
33
Bioestatstica
40
6440
7.4.
Exerccios:
Custo (R$)
Temos :
1 2 3 4 5 6 7
500
8 10 11 16 13 5
4.000
1.100
Logo,
34
Bioestatstica
7.5.
MODA - Mo
o valor que ocorre com maior frequncia em uma srie de valores. Desse modo, o salrio modal dos empregados de uma fbrica o salrio mais comum, isto , o salrio recebido pelo maior nmero de empregados dessa fbrica.
H sries nas quais no exista valor modal, isto , nas quais nenhum valor aparea mais vezes que outros. Exemplo: { 3 , 5 , 8 , 10 , 12 } no apresenta moda. A srie amodal.
.Em outros casos, pode haver dois ou mais valores de concentrao. Dizemos, ento, que a srie tem dois ou mais valores modais. Exemplo: { 2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7 , 7 , 8 , 9 } apresenta duas modas: 4 e 7. A srie bimodal.
Bioestatstica
Onde: l* = limite inferior da classe modal e L* = limite superior da classe modal Assim, para a distribuio: I 1 2 3 4 5 6 Estaturas (cm) 150 |----- 154 154 |----- 158 158 |----- 162 162 |----- 166 166 |----- 170 170 |----- 174 fi 4 9 11 8 5 3 40
Vem:
36
Bioestatstica
na qual: = limite inferior da classe modal..... = amplitude da classe modal = ; = ; sendo: a frequncia simples da classe modal; a frequncia simples da classe anterior classe modal a freqncia simples da classe posterior classe modal Assim, para a distribuio da tabela das estaturas, temos:
Onde,
7.6.
Exerccios:
1. Complete o esquema para o clculo da moda da distribuio de frequncia: Custo (R$) fi 450 8 550 10 650 11 750 16 850 13 950 5 1050 1 1150
Temos, pois:
37
Bioestatstica
7.7.
MEDIANA
A mediana outra medida de posio definida como o nmero que se encontra no centro de uma srie de nmeros, estando estes dispostos segundo uma ordem. Em outras palavras, a medida de um conjunto de valores, ordenados segundo uma ordem de grandeza, o valor situado de tal forma no conjunto que o separa em dois subconjuntos de mesmo nmero de elementos.
Md = 10
Se, porm, a srie dada tiver um nmero par de termos, a mediana ser, por definio, qualquer dos nmeros compreendidos entre os dois valores centrais da srie. Convencionou-se utilizar o ponto mdio. Assim, a srie de valores: 1, 6, 7, 10, 12, 13, 18, 21 tem para a mediana a mdia aritmtica entre 10 e 12. Logo:
Md=11
38
Bioestatstica
A menor frequncia acumulada que supera esse valor 18, que corresponde ao valor 2 da varivel, sendo este o valor mediano. Logo:
Md = 2 meninos
7.8.
Exerccios:
a)
2 3 4 7 6 12 8 8 10 4
39
Bioestatstica
2 4 6 8 10
10 30
Como:
Temos que:
Md = ___________
b)
0 2 1 5 2 9 3 7 4 6 5 3
0 1 2 3 4 5
2 9
Como:
Temos que:
Md = ___________
40
Bioestatstica
Feito isto, um problema de interpolao resolve a questo, admitindo-se, agora, que os valores se distribuam uniformemente em todo o intervalo de classe. Assim, considerando a distribuio da tabela a seguir: i 1 2 3 4 5 6 Estaturas (cm) 150 |----- 154 154 |----- 158 158 |----- 162 162 |----- 166 166 |----- 170 170 |----- 174 fi 4 9 11 8 5 3 40 A 3 Classe a classe mediana. Temos: Fi 4 13 24 32 37 40
Como h 24 valores includos nas trs primeiras classes da distribuio e como pretendemos determinar o valor que ocupa o 20 lugar, a partir do incio da srie, vemos que este deve estar localizado na terceira classe (i = 3), supondo que as frequncias dessas classes estejam uniformemente distribudas. Como h 11 elementos nessa classe e o intervalo de classe igual a 4, devemos tomar a partir do limite inferior a distancia:
Logo:
Bioestatstica
1) Determinamos as frequncias acumuladas. 2) Calculamos 3) Marcamos a classe correspondente frequncia acumulada imediatamente superior - e em seguida, empregamos a frmula:
na qual: o limite inferior da classe mediana a frequncia acumulada da classe anterior classe mediana a frequncia simples da classe mediana a amplitude do intervalo da classe mediana Tomando como exemplo, a distribuio anterior, temos:
isto :
Md = 160,5 cm
7.9.
Resolva:
1) Calcule a mediana da distribuio de frequncia: Custo (R$) fi Temos: 450 8 550 10 650 11 750 16 850 13 950 5 1050 1 1150
42
Bioestatstica
1 450 2 550 3 650 4 750 5 850 6 950 7 1050 1150 1050 950 850 750 650 550
8 10 11 16 13 5 1
8 18
Logo,
7.10.
Exerccios Captulo 7
1. Considerando os conjuntos de dados: a) 3, 5, 2, 6, 5, 9, 5, 2, 8, 6. b) 20, 9, 7, 2, 12, 7, 20, 15, 7. c) 51,6; 48,7; 50,3; 49,5; 48,9; d) 15, 18, 20, 13, 10, 16, 14. Calcule: I. a mdia; II. a mediana;
43
Bioestatstica
III. a moda; 2. Os salrios-hora de cinco funcionrios de uma companhia so: R$ 75, R$ 90, R$ 83, R$ 142 e R$ 88. Determine: a) a mdia dos salrios-hora; b) o salrio-hora mediano; 3. As notas de um candidato, em seis provas de um concurso, foram: 8,4; 9,1; 7,2; 6,8; 8,7 e 7,2. Determine: a) a nota mdia; b) a nota mediana; c) a nota modal 4. Considerando a distribuio abaixo: 3 4 Determine: a) a mdia; b) a mediana; c) a moda; 5. Em uma classe de 50 alunos, as notas obtidas formaram a seguinte distribuio: 2 1 Calcule: a) a nota mdia; b) a nota mediana; c) a nota modal. 6. Determine a mdia aritmtica de: a) 50 8 60 5 80 4 90 3 3 3 4 6 5 10 6 13 7 8 8 5 9 3 10 1 4 8 5 11 6 10 7 8 8 3
b) 50 20 58 50 66 30
44
Bioestatstica
7. Determine os desvios em relao mdia dos seguintes dados: 6, 8, 5, 12, 11, 7, 4, 15. Qual a soma dos desvios?
5 8 14 10 7
44 b)
5 12 18 27 8
70 c)
18
45
Bioestatstica
31 15 3 1 1 1
70 d)
10 9 8 6 3 3 1
40
46
Bioestatstica
8.
Vimos anteriormente que um conjuntos de valores pode ser convenientemente sintetizado por meio de procedimentos matemticos, em poucos valores representativos mdia aritmtica, mediana e moda. Tais valores podem servir de comparao para dar a posio de qualquer elemento do conjunto. No entanto, quando se trata de interpretar dados estatsticos, mesmo aqueles j convenientemente simplificados, necessrio ter-se uma ideia retrospectiva de como se apresentavam esses dados nas tabelas. Assim, no o bastante dar uma das medidas de posio para caracterizar perfeitamente um conjunto de valores, pois, mesmo sabendo, por exemplo, que a temperatura mdia de duas cidades a mesma, e igual a 24 oC, ainda assim somos levados a pensar a respeito do clima dessas cidades. Em uma delas poder a temperatura variar entre limites de muito calor e de muito frio e haver, ainda, uma temperatura mdia de 24 oC, A outra poder ter uma variao pequena de temperatura e possuir, portanto, no que se refere temperatura, um clima mais favorvel. Vemos ento, que a mdia ainda que considerada como um nmero que tem a faculdade de representar uma srie de valores no pode por si mesma, destacar o grau de homogeneidade ou heterogeneidade que existe entre os valores que compe o conjunto. Consideremos os seguintes conjuntos de valores das variveis x, y e z: X: 70, 70, 70, 70, 70 Y: 68, 69, 70, 71, 72 Z: 5, 15, 50, 120, 160 Calculando a mdia aritmtica de cada um desses conjuntos, obtemos:
Vemos ento, que os trs conjuntos apresentam a mesma mdia aritmtica: 70. Entretanto fcil notar que o conjunto X mais homogneo que os conjuntos Y e Z, j que todos os valores so iguais mdia. O conjunto Y, por sua vez, mais homogneo que o conjunto Z, pois h menor diversificao entre cada um de seus valores e a mdia representativa. Chamado de disperso ou variabilidade a maior ou menor diversificao dos valores de uma varivel em torno de um valor de tendncia central tomado como ponto de comparao, podemos dizer
47
Bioestatstica
que o conjunto X apresenta disperso ou variabilidade nula e que o conjunto Y apresenta uma disperso ou variabilidade menor que o conjunto Z. Portanto, para qualificar os valores de uma dada varivel, ressaltando a maior ou menor disperso ou variabilidade entre esses valores e a sua medida de posio, a Estatstica recorre s medidas de disperso ou de variabilidade. Dessas medidas, estudaremos a amplitude total, a varincia, o desvio padro e o coeficiente de variao.
8.2.
Amplitude Total
Quando dizemos que a amplitude total dos valore 30, estamos afirmando alguma coisa do grau de sua concentrao. evidente que, quanto maior a amplitude total, maior a disperso ou variabilidade dos valores da varivel. Relativamente aos trs conjuntos de valores mencionados no incio desse captulo, temos: ATx = 70 70 = 0 (disperso nula) ATy = 72 68 = 4 ATz = 160 5 = 155
48
Bioestatstica
12
Temos:
Exemplo: Considerando a distribuio abaixo: i 1 2 3 4 5 6 Estaturas (cm) 150 |----- 154 154 |----- 158 158 |----- 162 162 |----- 166 166 |----- 170 170 |----- 174 fi 4 9 11 8 5 3 40 Temos:
A amplitude total tem o inconveniente de s levar em conta os dois valores extremos da srie, descuidando do conjunto de valores intermedirios, o que quase sempre invalida a idoneidade do resultado. Ela apenas uma indicao aproximada da disperso ou variabilidade. Faz-se uso da amplitude total quando se quer determinar a amplitude da temperatura de um dia ou no ano, no controle de qualidade ou como uma medida de clculo rpido, e quando a compreenso popular mais importante que a exatido e a estabilidade.
8.3.
Como vimos, a amplitude total instvel por se deixar influenciar pelos valores extremos, que so, na sua maioria, devidos ao acaso.
49
Bioestatstica
A varincia e o desvio padro so medidas que fogem a essa falha, pois levam em considerao a totalidade dos valores da varivel em estudo, o que faz delas ndices de variabilidade bastante estveis e, por isso mesmo, os mais geralmente empregados. A varincia baseia-se nos desvios em torno da mdia aritmtica, porm determinando a mdia aritmtica dos quadrados dos desvios. Assim, representando a varincia por , temos:
Sendo a varincia calculada a partir dos quadrados dos desvios, ela um nmero em unidade quadrada em relao varivel em questo, o que, sob o ponto de vista prtico um inconveniente. Por isso mesmo, imaginou-se uma nova medida que tm utilidade e interpretao prticas, denominada desvio padro, definida como a raiz quadrada da varincia e representada por s:
Assim,
Se bem que a frmula dada para o clculo do desvio seja a que torna mais fcil a sua compreenso, ela no uma boa frmula para fins de computao, pois em geral, a mdia aritmtica , um nmero fracionrio, o que torna pouco prtico o clculo das quantidades Podemos simplificar escrevendo a frmula do seguinte modo: .
50
Bioestatstica
No apenas este mtodo usualmente mais prtico, como tambm mais preciso. Quando a mdia no exata e tem de ser arredondada, cada desvio fica afetado ligeiramente do erro, devido a esse arredondamento. Para o clculo do desvio padro, consideremos os seguintes casos:
40 45 48 52 54 62 70 371
Como n = 7, temos:
Logo,
8.4.
Resolva:
1. Complete o esquema para o clculo do desvio padro, dados os valores da varivel: 8, 10, 11, 15, 16, 18 Temos:
51
Bioestatstica
64
n=
Logo,
Isto ,
52
Bioestatstica
O modo mais prtico para se obter o desvio padro abrir, na tabela dada, uma coluna para os produtos seu respectivo e outra para , assim: , lembrando que para obter basta multiplicar cada pelo
0 1 2 3 4
2 6 12 7 3
0 6 24 21 12
0 6 48 63 48
Logo:
8.5.
Exerccios:
1 2 Temos:
2 5
3 8
4 6
5 3
6 1
1 2 3 4 5 6
53
Bioestatstica
Logo:
1 2 3 4 5 6
150 |----- 154 154 |----- 158 158 |----- 162 162 |----- 166 166 |----- 170 170 |----- 174
4 9 11 8 5 3 40
Logo:
8.6.
Exerccios:
Bioestatstica
Custo (R$)
130 30 2 50 8 70 12 90 10 110 5
Temos:
1 2 3 4 5
40
8.7.
Coeficiente de Variao
O desvio padro por si s no nos diz muita coisa. Assim, um desvio padro de duas unidades pode ser considerado pequeno para uma srie de valores cujo valor mdio 200; no entanto, se a mdia for igual a 20, o mesmo no pode ser dito. Alm disso, o fato de o desvio padro ser expresso na mesma unidade dos dados limita o seu emprego quando desejamos comparar duas ou mais sries de valores, relativamente sua disperso ou variabilidade, quando expressas em unidades diferentes. Para contornar essas dificuldades e limitaes, podemos caracterizar a disperso ou variabilidade dos dados em termos relativos a seu valor mdio, medida essa denominada Coeficiente de Variao (CV):
55
Bioestatstica
Exemplo: Tomemos os resultados das medidas das estaturas e dos presos de um grupo de indivduos:
175 cm 68 Kg
5,0 cm 2,0 Kg
Logo, nesse grupo de indivduos, os pesos apresentam maior grau de disperso que as estaturas.
8.8.
a) 1, 3, 5, 9
Exerccios Captulo 8
b) 20, 14, 15, 19, 21, 22, 20 c) 17,9; 22,5; 13,3; 16,8; 15,4; 14,2; d) -10, -6, 2, 3, 7, 9, 10
Xi fi
2 1
3 3
4 5
5 8
6 5
7 4
8 2
2,2
3. Calcule os desvios padres dos conjuntos de dados do exerccio 1. 4. Calcule os desvios padres dos conjuntos de dados do exerccio 2.
56
Bioestatstica
0 4
11 14
12 34
13 29
14 16
5 3
Calcule o desvio padro: 6. Sabendo que um conjunto de dados apresenta para mdia aritmtica e para desvio padro respectivamente, 18,3 e 1,47, calcule o coeficiente de variao: 7. Em um exame final de matemtica, o grau mdio de um grupo de 150 alunos foi de 7,8 e o desvio padro, 0,80. Em estatstica, entretanto, o grau mdio foi de 7,3 e o desvio padro, 0,76. Em que disciplina foi maior a disperso?
. O peso
mdio desses indivduos 52 Kg, com um desvio padro de 2,3 Kg. Esses indivduos apresentam maior variabilidade em estatura ou em peso? 9. Um grupo de 85 moas tem estatura mdia de 160,6 cm, com um desvio padro igual a 5,97 cm. Outro grupo de 125 moas tem uma estatura mdia de 161,9 cm. Qual o coeficiente de variao de cada um dos grupos? Qual o grupo mais homogneo? 10. Um grupo de cem estudantes tem uma estatura mdia de 163,8 cm, com um coeficiente de variao de 3,3%. Qual o desvio padro desse grupo? 11. Uma distribuio apresenta as seguintes estatsticas: s=1,5 e VC=2,9%. Determine a mdia da distribuio
57
Bioestatstica
9.
BIBLIOGRAFIA
1. CRESPO, Antnio A., Estatstica Fcil, 19 ed. atual. So Paulo, Ed. Saraiva, 2009. 2. DORIA FILHO, Ulysses, Introduo Bioestatstica: para simples mortais, 14 reimpresso So Paulo, Ed. Elsevier, 1999.
3. GUEDES, Marilda Laurenti da silva, Jos da Silva, Bioestatstica, Rio de Janeiro, CNPQ, 1988. 4. JAQUES, Sidia M. Callegari, Bioestatstica Princpios e Aplicaes, So Paulo, Ed. Artmed 2003 reimpresso: 2008. 5. VIEIRA, Sonia, Introduo Bioestatstica, Rio de Janeiro, Ed. Campus, 1997 5 reimpresso.
58