Beruflich Dokumente
Kultur Dokumente
CURSO DE INTRODUÇÃO À
ESTATÍSTICA ECONÔMICA E
APLICADA
Julho de 2000
Estudo de Caso 1
Estatísticas Descritivas
Suicídio
Tópicos Abordados:
Solução
Agora,
Em outras palavras, a relação das taxas de suicídio para homens e mulheres pode
ser calculada como (21786/28295)/(6509/28295)= 77 %/23 % = 3,3, como acima.
Usualmente P(A dado B) e P(B dado A) conduzem a duas questões bem
diferentes.
ESTUDO DE CASO 3:
Tópicos Referidos
1.Cálculo e interpretação de probabilidades
2.Medicina
O teste ELISA foi aprovado pelo governo dos EUA em meados da década de 1980
para a verificação da presença do vírus da AIDS no sangue doado. O teste opera
através da detecção de anticorpos, substâncias que o corpo produz quando o
virus está presente, mas ele comete alguns erros. O teste ELISA foi projetado de
forma que quando uma dada amostra de sangue está de fato contaminada com
AIDS, o teste dá um resultado positivo (ou seja, o teste ELISA registra que na sua
opinião esta amostra de sangue tem AIDS) 99 % das vezes, ao passo que quando
a amostra que está sendo testada não está contaminada com o vírus o teste
ELISA anunciará um resultado negativo 94 % das vezes. A prevalência de AIDS
na população de pessoas que doam sangue é cerca de 1 %. Suponha que alguém
doe sangue e que o teste ELISA forneça um resultado positivo. Mostre que a
probabilidade da pessoa efetivamente ter AIDS dado este resultado positivo é de
somente cerca de 14 %! Isto significa que os projetistas do teste ELISA são
estúpidos, ou erros como este são inevitáveis? Explique brevemente. A seguinte
sugestão pode ser útil.
Preencha a tabela 2 X 2 abaixo para um conjunto imaginário de 10.000
amostras de sangue, usando os três fatos numéricos do parágrafo anterior.
Comece com o dado de 1 % e continue a preencher a tabela explicando as
passagens.
A pessoa tem AIDS A pessoa não tem AIDS
O teste ELISA é positivo
O teste ELISA é negativo
Resposta:
Primeiramente, se 1 % das amostras de sangue são realmente de pessoas
com AIDS, então você pode colocar 1 % de 10.000 = 100 o total marginal na
primeira coluna e teremos 10.000 - 100 = 9.900 amostras de sangue que não tem
AIDS como o total marginal na segunda coluna. Em segundo lugar, se 99 % das
pessoas com AIDS serão corretamente classificadas pelo teste ELISA, 99 das 100
amostras na primeira coluna cairão na primeira linha naquela coluna, deixando
100 - 99 = 1 na segunda linha naquela coluna. Em seguida, se 94 % das 9900
pessoas que não tem AIDS serão corretamente informadas de que não estão
infectadas pelo ELISA, estimo que seriam 0,94 * 9900 = 9306 amostras de sangue
na segunda linha da segunda coluna, deixando 9900 - 9307 = 693 para a primeira
linha daquela coluna. Finalmente, portanto, os totais marginais nas linhas são 99 +
594 = 693 e 1 + 9306 = 9307
Finamente, estando a tabela completa, podemos calcular a probabilidade
condicional que queremos: P(uma pessoa tem AIDS dado que o ELISA é positivo)
= 99/693 = 14 %. Em outras palavras, somente cerca de 14 % dos resultados
positivos do ELISA efetivamente estão infectados. Isto parece ser um dado
desapontadoramente baixo considerando os números de performance (99 % e 94
%) bons do ELISA. Portanto, é importante dedicar um momento para ver porque.
A pessoa tem AIDS A pessoa não tem AIDS
O teste ELISA é positivo 99 591 693
O teste ELISA é negativo 1 9306 9307
100 9900 10000
Há uma variedade de pontos que podem ser observados em uma
explanação:
Algebricamente, uma fração é pequena quando seu numerador é pequeno
e/ou seu denominador é grande, e ambas as coisas acontecem aqui. O numerador
(99) é pequeno devido a incidência de AIDS ser baixa - desde que somente 1 %
das amostras de sangue estarão de fato contaminadas, o numerador poderia ser
no máximo 100. E o denominador (693) é grande porque o valor 591 é também
bastante grande, o que por sua vez ocorre devido a taxa de sucesso de 94 % do
ELISA entre as pessoas que não têm AIDS.
As células na diagonal da tabela 2 x 2 acima são valores de sucesso para o
ELISA; a outra diagonal mostra os erros do teste. Verifique o forte desequilíbrio
nas células da diagonal secundária: 1 contra 591. O teste ELISA foi evidentemente
projetado para ter horror a cometer um dos dois possíveis erros que ele pode
cometer, ou seja comunicar a pessoas que tem AIDS que elas não têm (falsos
negativos, como eles são chamados), o que faz sentido já que o ponto é retirar
sangue contaminado do sistema de doação de sangue. Mas é inevitável que ao
tentar arduamente não cometer este tipo de erro o ELISA tem que cometer um
grande número do outro tipo de erro, ou seja, comunicar às pessoas que não têm
AIDS que elas têm. Na prática pessoas cujo resultado é positivo com ELISA são
submetidas a um segundo teste (chamado Western blot) que é mais caro mas é
mais preciso, e aquelas pessoas são somente declaradas como tendo AIDS se
ambos os testes resultam positivos. Portanto, a resposta é não: os projetistas do
ELISA não são estúpidos; se falsos negativos são realmente resultados ruins e a
sua prevalência é baixa, os falsos positivos são inevitáveis.
ESTUDO DE CASO 4
Fumantes mulheres tem duas vezes risco de câncer pulmonar se elas fumam o
mesmo número de cigarros que homens, um novo estudo descobriu. O estudo
registrado na Revista Americana de Epidemiologia, é um dos primeiros a revelar
que o fumo afeta homens e mulheres diferentemente. Encontrou que mulheres
mais jovens eram sete vezes mais prováveis de adquirir câncer que mulheres não
fumantes mas tem cinco vezes mais risco que homens não fumantes.
Os investigadores converteram os dados em "maços-anos" , com cada ano
equivalente a 7305 cigarros, ou um média de um maço por dia. Mulheres que
fumaram mais que 30 maços-anos tiveram 27 vezes mais risco de adquirir câncer
pulmonar que mulheres não fumantes. Mas os homens que fumaram o mesmo
número de anos eram 11 vezes mais prováveis de desenvolver câncer que os
homens não fumantes. Para 60 maços-anos e mais, as mulheres correram um
risco de câncer que foi 82 vezes mais alto do que se elas não fumassem, e os
homens correram um risco 23 vezes mais alto.
Os investigadores da Universidade de Yale , da Universidade de Toronto-Canadá
e da Fundação de Tratamento do Cancer de Ontario, entrevistaram 442 mulheres
e 403 homens com câncer pulmonar para o estudo. Os fumantes foram escolhidos
a partir dos dados de 410 mulheres saudáveis e 362 homens saudáveis de cerca
da mesma idade. Os membros familiares e cônjuges dos fumantes também eram
cuidadosamente entrevistados para estabelecer detalhes da história de cada
pessoa fumante e do número de cigarros que elas fumavam.
Estudo conduzido pelo Dr. Harvey Risch, professor associado de epidemiologia e
saúde pública na Escola de Medicina de Yale afirmou que a maioria dos fumantes
fumam em média um maço por dia e fumam cerca de 40 anos. Mas apesar do
resultados, Dr. Risch escreveu no New York Times que ele não pôde estabelecer
quaisquer razões de que as mulheres eram mais suscetíveis a câncer pulmonar
que os homens.
O Conselho Anti-câncer Vitoriano de Epidemiologia encabeçado pelo Dr. Graham
Giles disse ontem que os resultados da pesquisa tornam vital que as mulheres -
especialmente
mulheres jovens - deixem de fumar. Ele disse que muito pouca pesquisa tinha sido
feita sobre a diferença no hábito de fumar de acordo com os sexos porque a
maioria das mulheres não fumaram por tanto tempo como os homens.
DISCUSSÃO:
Dois tipos de questões podem ser levantadas a partir desse artigo. Em primeiro
lugar há a questão geral referente a coleta dos dados, relatando-a e explicando-a.
É um caso interessante de um estudo retrospectivo porque começa com pessoas
que têm câncer pulmonar (provavelmente de idade de 55 ou mais desde que a
maioria têm fumado aproximadamente 40 anos). A segunda questão é a
representação de probabilidades. Não está claro totalmente como estas poderiam
ser calculadas da informação sobre as pessoas no estudo. Usando uma
abordagem de freqüência para probabilidade, pode-se concluir que desde que os
pesquisadores partiram de pessoas com câncer pulmonar (442 mulheres e 403
homens), as probabilidades que podem ser obtidas são:
Pr (fumar | saudável).
A mistura com " pessoas saudáveis " de cerca da mesma idade é de interesse
porque não diz se elas eram os fumantes ou não. De sentenças anteriores no
artigo, poderia se supor que elas eram não-fumantes. Isto poderia ser importante
para a interpretação dos resultados. A mistura de aspectos é importante para um
estudo como iste mas claro que não responde por outros fatores (genéticos ou
sociais) por que as pessoas poderiam escolher fumar ou desenvolver uma
propensão para câncer pulmonar. Uma pergunta adicional surge sobre a base
para as conclusões para mulheres "mais jovens" dadas no começo do artigo,
ESTUDO DE CASO 5
Subterrâneo de Londres
Tópicos Abordados:
Solução
Suponha que eles somente quisessem que ela não funcionasse uma vez a
cada 10000 viagens inteiramente carregadas. Isto seria equivalente a perguntar o
número de libras x tal que P(S > x) = 0,0001. A posição na curva normal
padronizada com 0,0001 como área a direita é cerca de de 3,72, e trabalhando em
sentido inverso de (x - 28800)/388 = 3,72, obtemos cerca de 30240 lb. Isto é muito
interessante: para abaixar a taxa de falha de 1 em 100 para 1 em 10000 eles
somente tem que aumentar a tolerância de carga de cerca de 540 lb, de 29700
para 30240. A razão é que 2,32 já é bastante distanciada na cauda direita da
curva normal e a curva aproxima-se de zero muito rapidamente a partir daquele
ponto - você não tem que ir muito longe para fazer com que a área a direita do
ponto caia bastante.
ESTUDO DE CASO 6
Tópicos Abordados:
Supunha-se que um guinel em 1799 pesava 128 gramas (há 360 gramas em uma
onça), de forma que 100 guinels no "Pix"pesariam cerca de 12800 gramas. O
"remédio" por esses dias era 1/400 da quantidade esperada, ou 32 gramas. Se o
peso efetivo das moedas no "Pyx" diferisse de seu valor esperado por mais que o
"remédio" tanto para mais como para menos, o Mestre do "Pix" ficava exposto a
sérias penalidades. O governo britânico tinha um interesse em que as moedas não
pesassem muito, mas o Mestre do "Pix" tinha um incentivo para faze-las pesar
menos que o padrão, porque isto lhe permitiram obter a diferença (contanto que
ele não fosse pego pelo "Trial of the Pyx").
Se ao invés ele faz com que as guinés pesem somente 127,7 grãos em média
(com o mesmo desvio padrão de 1 grama), qual é agora a probabilidade de que
ele sobreviverá ao "Trial"? Se ele sobrevive, quanto ouro pode esperar ele
embolsar em um ano comum no qual ele produz 100000 guinels? Ele perde ou
ganha quanto? Mostre todo o seu desenvolvimento (mas você não precisa
reconstruir o modelo explicitamente).
DISCUSSÃO
Então, se o Mestre do "Pix" é honrado ele está virtualmente certo de que irá
sobreviver ao "Trial"
Estudo de Caso 7:
Dados de temperatura
Tópicos Abordados:
1.Inferência
2.Meteorologia
Solução:
É muito difícil inventar ou imaginar uma população da qual estes números podem
plausivelmente ser considerados como uma IID ou amostra aleatória simples.
ESTUDO DE CASO 8)
Tópicos Referidos
1.Amostragem
2.Demografia
A revista Times publicou no final da década de 1950 que “em média um ex-
estudante da Universidade de Yale, turma de 1924, tinha uma renda de $ 25.111
por ano,” o que seria equivalente hoje a cerca de $ 150.000 ( o sexismo na
sentença não estava na afirmação da Times mas nas políticas de admissão da
Universidade de Yale na década de 1920: somente homens eram admitidos
naqueles dias). A estimativa da Times baseou-se em respostas recebidas de uma
pesquisa amostral feita por questionários e endereçada àqueles membros da
turma de 1924 da Universidade de Yale cujos endereços eram conhecidos no final
da década de 1950 pela administração da universidade.
Explique brevemente.
Resposta:
Você pode considerar qualquer uma das três espécies de viés - viés de
seleção, devido ao fato de que a lista de endereços era composta de pessoas que
permaneceram em contato com a Yale todos aqueles anos, e tais pessoas eram
muito provavelmente diferentes em renda daquelas que não tiveram que manter
contato como a universidade (Porque a universidade mantinha seus nomes?
Talvez porque eles eram fiéis doadores para algum fundo); viés de não resposta,
porque as pessoas que responderam e aquelas que não responderam o
questionário muito provavelmente diferem em renda, se as questões são sobre
renda (você enviaria o questionário de volta se não estivesse orgulhoso de como
está indo?), e viés de resposta, devido a que qualquer que seja a pessoa que
encaminhou a pesquisa poderia ter tido um interesse pessoal em fazer com que
aquelas pessoas parecessem prósperas e poderia ter formulado a questão de
uma forma que encorajassem-nas a exagerar a sua renda (esta terceira fonte de
viés parece menos plausível do que as outras duas, mas ainda é possível). No
mínimo as duas primeiras fontes de viés podem ter influído proeminentemente na
estimativa de $ 25.111. Dadas as direções dos vieses, parece muito provável que
a estimativa da Times foi substancialmente muito elevada.
ESTUDO DE CASO 9
Nielsen
TÓPICOS REFERIDOS:
1.Pesquisas Amostrais
2.Negócios
As companhias nos EUA gastam centenas de milhões de dólares por ano com
propagandas de seus produtos na televisão, rádio e nos jornais e há naturalmente
muito interesse em saber se a mensagem está atingindo o público certo. Duas
pesquisas foram conduzidas alguns anos atrás para medir o efeito de uma
campanha publicitária para o detergente Tide. Em uma pesquisa, entrevistadores
perguntaram às donas de casa se elas usavam Tide. Posteriormente, os
entrevistadores pediram para efetivamente ir na lavanderia e ver que detergente
estava sendo usado. Você esperaria que as duas pesquisas chegariam as
mesmas conclusões? A que espécies de vieses pode cada pesquisa estar
suscetível ? Explique brevemente.
Solução:
Tópicos Referidos
Os dados:
Tribo N Média SD
1 25 59,4 polegadas 1,8 polegadas
2 27 61,3 polegadas 2,4 polegadas
Monte um modelo para estes dados sob a suposição (para o momento) que
estas são amostras aleatórias simples das populações de interesse, e use o
modelo para achar um intervalo de 95% de confiança para a diferença em altura
comum entre fêmeas nas duas populações tribais e um teste de significância para
a hipótese que esta diferença é zero.
O que conclui você? Você pensa que é razoável assumir que os esqueletos
que ela adquiriu com seu método de amostragem pode ser considerada uma
amostragem aleatória simples (AAS) das populações de todas as fêmeas nas
duas tribos?
Se não, quais seriam os efeitos em termos de quaisquer vieses nas
inferências que ela estabeleceu com seu método amostral.
Explique brevemente.
Solução:
Observações:
1.O teste assume amostras aleatórias simples que não são o caso aqui.
2.A amostra é grande o bastante. Assim, devido ao Teorema do Limite
Central, o histograma de probabilidade para cada média de amostra e por
conseguinte da diferença delas segue a curva normal.
Porém, desde que foram juntadas ambas as amostras do mesmo modo que
os vieses embutidos em cada uma delas se cancelam em grande parte fora e
assim a inferência feita relativa a diferença entre elas é provavelmente altamente
precisa, enquanto cada uma individualmente não o é.
ESTUDO DE CASO 12
Tópicos Abordados:
1.Estimação de Proporções
2.Educação
617 dos 950 estudantes conheciam a resposta certa, 5/6 (a resposta errada mais
freqüente foi 2/5).
Solução:
Seja p a porcentagem dos estudantes de 17 anos nos EUA que sabem a resposta
certa. Uma estimativa de p é dada por 617/950 = 0,65 ou 65 %, a partir da amostra
aleatória simples (AAS).
Explique brevemente.
Discussão
A teoria do psicólogo sugere que nós não devêssemos esperar nenhuma
diferença em média entre vendas descontadas e vendas padrão.Esta é a hipótese
nula que nós queremos testar.
Observações:
1.The teste assume amostras aleatórias simples que é o caso aqui.
2. A amostra é grande o bastante de forma que devido ao Teorema de Limite
Central o histograma de probabilidade para cada média amostral e
consequentemente da diferença delas segue a curva normal.
O emparelhando das lojas de acordo com volume de vendas, localização etc nos
permite comparar coisas semelhantes e elimina do procedimento de teste fatores
que podem potencialmente confundi-lo.
ESTUDO DE CASO 13
Tópicos Referidos
1. Teste de Hipóteses de proporções
2. Justiça
Em 1969, o famoso pediatra Dr. Benjamim Spock foi julgado perante um juiz
chamado Ford no tribunal Federal de Boston. Ele foi acusado de conspiração para
violar a Lei de Serviço Militar (além do seu trabalho sobre desenvolvimento de
crianças ele era ativo em protestos anti-guerra nos anos sessenta). Um advogado
que escreveu sobre o caso naquele mesmo ano na Revista Jurídica de Chicago
Lei Revisão disse sobre o caso, "De todos os acusado a tais tentativas, Dr. Spock
que tinha dado sábios e bem-vindos conselho sobre gravidez para milhões de
mães, gostaria de ter mulheres no seu juri "
A população de interesse são todos os jurados elegíveis, com 53% deles sendo
mulheres. A hipótese nula é que o Juiz Ford é do gênero neutro, enquanto a
alternativa é que ele é parcial contra mulheres. Da população de interesse (onde o
número de pessoas é grande) uma amostra aleatória simples (AAS) (sob a
hipótese nula) de n=350 pessoas é selecionada pelos funcionários do tribunal que
passa a ser a nova população de interesse. A proporção calculada de mulheres na
amostra é 102/350 = 0,291 ou aproximadamente 29%. A proporção esperada de
mulheres na amostra é p=53%, com um erro padrão dado por
p(1 p) 0,53 0,47
SE ( p estimado) s p 2,7% O histograma de longo prazo
n 350
da proporção estimada se a hipótese nula é verdadeira é normal, centrado em
53% com variância igual a 0,0272. Calculamos o valor de z e obtemos um valor de
(29-53)/2,7=-8,9%, com um P-value associado de aproximadamente 0%. Então, é
altamente improvável que seriam selecionadas 102 ou menos mulheres por
casualidade em uma população de 350 pessoas.
ESTUDO DE CASO 14
Tópicos Abordados:
1. Regressão Múltipla
2. Recursos Hídricos
Estudo de Caso 7:
D it
C .P it t
t
C it
C (1 i0
e r)
it
t
P t
P (1
0
p)
onde:
Cit = f(Rt)
onde:
C R
C log R +
C= + /R+
log C = + R+
log C = + /R+
Nota: para o arroz, feijão e trigo, entre 1970 e o ano indicado pelos
asteriscos, o consumo foi estimado fazendo-se: produção + importação -
exportação; para os anos seguintes e para os demais produtos, a estimativa foi
obtida fazendo-se: estoque no início do período + produção no período +
importação - exportação - estoque no final do período.
Estudo de Caso 15:
Deseja-se obter previsões de curto prazo para a série dos preços do café
utilizando modelos simples de médias móveis e de alisamento exponencial.
Verifique qual dos dois métodos gera os menores erros, de acordo com o critério
do erro médio quadrático mínimo. (Dados em anexo - Planilha CAFEEXP.XLS)
rq
ni 0i
E b
i 1
k
rq
i 1
0i 0i
onde 0 ir er ni
referem-se a homens-hora por unidade de produto na base e no
período n, respectivamente.
No caso de produtos agrícolas poderíamos calcular um índice de
produtividade tendo como base o fator de produção terra. O município de Araguari
produz três produtos: soja, milho e café. Construa um índice de produtividade
conjunta para este município.
milho soja café
ano quantidade area quantidade area quantidade area
1988 14400 7200 20400 10200 18480 17500
1989 17000 8500 19200 8000 10587 17645
1990 15300 8500 11880 9000 19800 22000
1991 14000 7000 15840 7200 19800 22000
1992 7500 16500 17280 7200 21516 16300
1993 27300 7800 19440 8100 41520 17300
1994 28000 8000 8500 20400 43250 17300
1995 28000 8000 24000 10000 40500 15000
1996 24500 7000 27000 15000 36000 12000
ESTUDO DE CASO 17
y x2 x3 x4 x5
50 25 8 10 59
45 25 5 9 59
75 30 9 14 65
50 30 5 11 63
40 27 4 12 55
95 35 7 18 65
40 26 6 11 52
65 31 12 12 60
120 35 14 16 58
35 24 4 9 67
35 26 5 8 55
25 20 5 8 42
75 29 7 18 48
80 33 13 15 71
65 30 9 13 61
75 32 16 10 64
65 30 10 16 68
45 28 7 15 55
55 26 5 18 53
50 27 4 18 50
ESTUDO DE CASO 18
y Ae Bx
onde y é um valor individual da variável dependente Y ( y
é o valor estimado a
partir do modelo para a variável Y), x é a variável explicativa, que é
freqüentemente o tempo, e é a base dos logaritmos naturais (neperiano). Com a
transformação logarítmica (ou seja, tomando logaritmos de ambos os lados da
equação) transformamos a equação original em equação linear:
ln y = ln A + Bx
Ajustou-se um modelo de regressão exponencial ao dados de população dos
EUA, de 1850 a 1900, com X em unidades de décadas e estimou-se a seguinte
equação:
ln y ln a + bx = 3,236 + 0,0223x
o que é equivalente a:
y e3,236 0,0223 x
e3,236 e0,0223x 25,43e0,0223x
Este modelo tem muita aplicação prática quando, por exemplo, queremos
projetar a produção agrícola de uma determinada área. Considerando como
variável independente o tempo estime um modelo de crescimento linear para a
produção dos produtos soja, arroz e milho. Estime também modelos de
crescimento simples, conforme especificação feita anteriormente, assim como
outros modelos não lineares tais como função polinomial de segundo grau, função
potência e função recíproca. Avalie e escolha o melhor modelo ajustado. Verifique
também se existe autocorrelação nos resíduos procedendo ao teste Durbin-
Watson. Com base nos melhores modelos obtenha projeções da produção para os
próximos três anos. É possível também especificar modelos com defasagens
tendo como variável explicativa, além do tempo que representa o movimento de
tendência da série, os preços. A hipótese subjacente é a de que os preços no
período anterior atuam como causa das decisões de produção dos agricultores
nos anos seguintes. Estime estes modelos com defasagens e verifique se eleva-
se o poder explicativo em relação aos modelos anteriores. Discuta os resultados.
Os dados de produção e de preços estão disponíveis em arquivos anexos
(arquivos PRODUCAO.XLS e PRECO2.XLS). Os preços a serem utilizados nos
modelos devem ser “precos reais” ou seja, preços deflacionados utilizando-se um
índice de inflação. Para a deflação sugerimos a utilização do IGP-Di da FGV que
está disponível no arquivo IGP.XLS e obtenha preços médios anuais reais para os
períodos de safra dos produtos.
ESTUDO DE CASO 19
ESTUDO DE CASO 20
DADOS:
Dados:
Referência: Estes dados são distribuídos com um software, Data Desk.
Data Description, Inc. (1993). Data Desk¨.Ithaca, NY: Data Description, Inc.
Número de casos: 12
Nomes das Variáveis:
ESTUDO DE CASO 22
RESUMO DESCRITIVO:
Porcentagem de gordura de corpo, idade, peso, altura, e dez medidas de
circunferência do corpo (por exemplo, abdômen) são registradas para 252
homens. A gordura de corpo, uma medida de saúde, é estimada por uma técnica
de pesagem. Ajustando a gordura de corpo para as outras medidas usando
regressão múltipla fornece um modo conveniente de calcular a gordura de corpo
para homens usando só uma balança e uma fita métrica.
FONTE:
Os dados foram fornecidos generosamente pelo Dr. Garth Fisher, Centro
de Pesquisa de Desempenho Humano, Brigham Young University, Provo, Utah,
84602, que deu para permissão distribuir os dados livremente e os usar para
propósitos não-comerciais. Referência para os dados é feita em Penrose, et al.
(1985).
DESCRIÇÕES VARIÁVEIS:
Colunas
3 - 5 Número de caso
10 - 13 porcentagem de gordura de corpo calculada a partir da equação de
Brozek,
457/Densidade - 414.2
18 - 21 gordura de corpo em percentual que usa a equação de Siri,
495/Density - 450
24 - 29 densidade (gm/cm^3)
36 - 37 idade (anos)
40 - 45 peso (lbs)
49 - 53 altura (polegadas)
58 - 61 índice de adiposidade = Weight/Height^2 (kg/m^2)
65 - 69 gordura Peso Livre
= (1 - fração de gordura de corpo) * Peso,
usando a fórmula de Brozek (lbs)
74 - 77 circunferência de pescoço (cm)
81 - 85 circunferência de tórax (cm)
89 - 93 circunferência de abdômen (cm) " ao umbigo
e nivela com a crista " de iliac
97 - 101 circunferência de quadril (cm)
106 - 109 circunferência de coxa (cm)
114 - 117 circunferência de joelho (cm)
122 - 125 circunferência de tornozelo (cm)
130 - 133 circunferência de bíceps estendida (cm)
138 - 141 circunferência de antebraço (cm)
146 - 149 circunferência de pulso (cm) " distal para o
styloid processa "
NOTAS ESPECIAIS:
Os dados são como recebidos do Dr. Fisher. Porém, note que há alguns
erros. As densidades de corpo para casos 48, 76, e 96, por exemplo, parecem
ter um dígito errado como pode ser visto do dois valores de porcentagem gordura
do corpo. Também note a presença de um homem (caso 42) com mais de 200
libras em peso que é menos de 3 pés alto (a altura deve ser presumivelmente
69.5 polegadas, não 29.5 polegadas)! As porcentagens de gordura estimadas são
truncadas para zero quando negativas (caso 182).
NOTAS PEDAGÓGICAS:
Estes dados podem ser usados para mostrar a utilidade da regressão
múltipla e praticar construção de modelo.
Pode ser achada informação adicional sobre estes dados no artigo " Data
sets and Stories" "Ajustando Porcentagem de Gordura de Corpo para Medidas
de Corpo Simples" no Journal of Statístics Education_ (Johnson 1996).
ESTUDO DE CASO 25