Beruflich Dokumente
Kultur Dokumente
Sumrio
1
Introduo
1.1 Fases do Trabalho Estatstico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2 Ramificaes da Estatstica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Estatstica Descritiva
2.1 Classificao de variveis . . . . . . . . . . . . . . . . .
2.1.1 Exerccios . . . . . . . . . . . . . . . . . . . . .
2.2 Tipos de sries estatsticas . . . . . . . . . . . . . . . .
2.2.1 Exerccios . . . . . . . . . . . . . . . . . . . . .
2.3 Anlise de Variveis Qualitativas . . . . . . . . . . . . .
2.3.1 Distribuio de Frequncias . . . . . . . . . . .
2.3.2 Representao Grfica . . . . . . . . . . . . . .
2.3.3 Exerccios . . . . . . . . . . . . . . . . . . . . .
2.4 Anlise de Variveis Quantitativas . . . . . . . . . . . .
2.4.1 Distribuio de Frequncias - Varivel Discreta. .
2.4.2 Representao Grfica - Varivel Discreta . . . .
2.4.3 Distribuio de Frequncias - Varivel Contnua.
2.4.4 Representao Grfica - Varivel Contnua . . .
2.4.5 Exerccios . . . . . . . . . . . . . . . . . . . . .
Somatrio
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
3
3
4
4
4
5
6
7
8
8
9
12
13
14
15
16
18
20
21
.
.
.
.
.
.
.
.
22
22
24
25
26
28
29
30
30
Separatrizes
5.1 Quartis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.2 Decis e Percentis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.3 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
30
31
32
33
Medidas de Disperso
6.1 Amplitude Total . . . .
6.2 Amplitude Interquartlica
6.3 Varincia . . . . . . . .
6.4 Coeficiente de Variao .
6.5 Exerccios . . . . . . . .
.
.
.
.
.
33
34
34
34
36
37
39
39
40
42
43
45
46
47
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
49
49
50
52
53
54
54
Introduo
A Estatstica uma cincia cujo campo de aplicao estende-se a muitas reas do conhecimento humano. Entretanto, um equvoco comum que deparamos nos dias atuais que, em funo da facilidade que o advento dos computadores
nos proporciona, permitindo desenvolver clculos avanados e aplicaes de processos sofisticados com razovel eficincia e rapidez, muitos pesquisadores consideram-se aptos a fazerem anlises e inferncias estatsticas sem um conhecimento
mais aprofundado dos conceitos e teorias. Tal prtica, em geral, culmina em interpretaes equivocadas e muitas vezes
errneas.
No desenvolvimento cientfico e em nosso prprio dia-a-dia, estamos sempre fazendo observaes de fenmenos,
gerando dados. Quando as pessoas ouvem a palavra estatstica, imaginam logo taxas de acidente, ndices de mortalidade, litros por quilmetro etc. Os agrnomos esto frequentemente analisando o efeito de agrotxicos na agricultura,
os engenheiros analisam dados de propriedades de materiais e todos ns, ao lermos jornais e revistas, estamos vendo
resultados estatsticos provenientes do censo demogrfico, de pesquisas eleitorais etc.
Entende-se a Estatstica como um conjunto de tcnicas que permite, de forma sistemtica, organizar, descrever, analisar e interpretar dados oriundos de estudos ou experimentos, realizados em qualquer rea do conhecimento.
Denomina-se por dados um (ou mais) conjunto de valores, numricos ou no.
As variveis so o foco principal da pesquisa em cincias. Uma varivel simplesmente algo que pode variar,
isto , pode assumir valores ou categorias diferentes. Alguns exemplos de variveis so gnero (sexo), velocidade de
digitao, nmero de sintomas registrados de uma doena, nvel de ansiedade, nmero de gols em uma partida de futebol,
cores favoritas etc. Estes so exemplos de itens que se pode medir e registrar e que variam de uma situao ou pessoa para
outra.
As anlises estatsticas dependem da forma como os dados so coletados e o planejamento estatstico da pesquisa
indica o esquema sob o qual os dados sero obtidos. Portanto, o planejamento da pesquisa e a anlise estatstica dos
dados esto intimamente ligados. Dessa forma, o pesquisador deve possuir um razovel conhecimento de estatstica para
desenvolver suas pesquisas ou, ento, consultar um estatstico para auxili-lo. Esta consulta deve ser feita antes do incio
da pesquisa, ainda durante a fase de elaborao do projeto. 1
1.1
1 ANDRANDE,
Dalton; OGLIARI, Paulo. Estatstica para Cincias Agrrias e Biolgicas, Editora UFSC. 2007.
1.2
Ramificaes da Estatstica
1. Estatstica Descritiva
Compreende a organizao, o resumo e, em geral, a simplificao de informaes que podem ser muito complexas.
A finalidade tornar as coisas mais fceis de entender, de relatar e de discutir. A mdia industrial Dow-Jones, a
taxa de desemprego, o custo de vida, o ndice pluviomtrico, tudo isto se enquadra nessa categoria. A estatstica
descritiva vai resumir as informaes atravs do uso de certas medidas-sntese, que tornem possvel a interpretao
de resultados. No sentido mais amplo, suas funes so:
coleta de dados;
organizao e classificao destes dados;
apresentao atravs de grficos e tabelas;
clculo de coeficientes (estatsticos), que permitem descrever resumidamente os fenmenos.
2. Probabilidade
til para analisar situaes que envolvem o acaso. Exemplo de situaes que enquadram-se na categoria do acaso:
Jogos de dados e de cartas ou Lanamento de uma moeda para o ar. A maioria dos jogos esportivos influenciada
pelo acaso at certo ponto.
3. Inferncia
Diz respeito a anlise e interpretao de dados amostrais. Ou seja, com base numa amostra faz-se inferncia para
toda populao. Um exemplo do uso da inferncia no nosso dia-a-dia que no precisamos beber toda a sopa para
saber se est ou no salgada. A idia bsica da amostragem efetuar determinada mensurao sobre uma parcela
pequena, mas tpica, de determinada populao e utilizar essa informao para fazer inferncia sobre a populao
toda.
Firmas comerciais e entidades governamentais recorrem a amostragem por vrias razes. O custo usualmente um
fator relevante. Coligir dados e analisar resultados custa dinheiro e, em geral, quanto maior o nmero de dados
coligidos, maior o custo. A amostragem reduz a quantidade de dados a coligir e analisar, diminuindo assim os
custos. 2
Em estatstica utilizaremos extensivamente os termos populao e amostra. Assim, definiremos esses termos no
contexto da estatstica:
Populao: conjunto da totalidade dos elementos (valores, pessoas, medidas) a serem estudados. Congrega todas
as observaes que sejam relevantes para o estudo de uma ou mais caractersticas dos indivduos. Podem ser tanto
seres animados ou inanimados;
Amostra: um subconjunto de elementos extrados de uma populao;
Censo: uma coleo de dados relativos a todos os elementos de uma populao;
Estatstica: a medida numrica que descreve uma caracterstica da amostra;
Parmetro: a medida numrica que descreve uma caracterstica da populao;
Estatstica Descritiva
Os mtodos estatsticos envolvem a anlise e a interpretao de nmeros, tais como renda anual, vendas mensais, escores de testes, no de peas defeituosas etc. Tais nmeros so designados por dados. Para interpretar os dados
corretamente, em geral preciso primeiro organizar e sumarizar os nmeros. 3
2.1
Classificao de variveis
Os dados estatsticos se obtm mediante um processo que envolve a observao ou outra mensurao de itens tais
como renda anual numa comunidade, escores de testes, quantidade de caf por xcara servida por uma mquina automtica
etc. Tais itens chamam-se variveis, porque originam valores que tendem a exibir certo grau de variabilidade quando se
fazem mensuraes sucessivas.
2 TRIOLA,
3 BUSSAB,
Antes da escolha da anlise descritiva apropriada necessria a classificao da varivel de interesse, pois a
adequao da tcnica est diretamente relacionada ao tipo de varivel em questo.
De acordo com a estrutura numrica as variveis podem ser classificadas em:
Qualitativas - se os resultados das observaes sero expressos atravs de categorias, que se distinguem por alguma
caracterstica no-numrica. Ex: Sexo, Nvel de escolaridade, Cor da pele, Estado civil, Tipo sanguneo.
Quantitativas - se os resultados das observaes sero expressos sempre atravs de nmeros, que representam
contagens ou medidas. Ex: Idade, Altura, Peso, Nmero de nascidos vivos, Populao.
As variveis qualitativas podem ser classificadas, por sua vez, em:
1. Nominal - caracteriza-se por dados que consistem apenas em nomes, rtulos ou categorias. Os dados no podem
ser dispostos segundo um esquema ordenado. Ex: Estado civil (casado, solteiro, vivo etc.).
2. Ordinal - envolve dados que podem ser dispostos em alguma ordem, mas as diferenas entre os valores dos dados
no podem ser determinadas ou no tem sentido. Ex: Nvel de escolaridade (fundamental, mdio, superior etc.).
Em relao s variveis quantitativas, estas podem ser classificadas em:
1. Discreta - s pode assumir valores pertencentes a um conjunto finito ou enumervel. Ex: Nmero de alunos
presentes s aulas de determinado professor; nmero de mortos em um surto de determinada doena. Geralmente,
seus valores so resultados de um processo de contagem, razo pela qual seus valores so expressos atravs de
nmeros inteiros no-negativos.
2. Contnua - pode assumir qualquer valor pertencente a um determinado intervalo do conjunto dos Reais. Ex: Estatura
e peso dos alunos do curso de estatstica; temperatura mxima diria de Cuiab. Pode-se dizer que a varivel
contnua resulta normalmente de mensuraes.
2.1.1
Exerccios
2.2
Srie estatstica uma sucesso de dados estatsticos que medem a intensidade do fenmeno, segundo suas caractersticas qualitativas ou quantitativas. As sries estatsticas sero classificadas de acordo com a variao de trs elementos:
tempo, local e o fenmeno. 4 So elas:
Srie Histrica - aquela em que o elemento que serve como base de classificao a frao do tempo, como o
dia, o ms, o ano, o sculo, etc. Ex: Valores do PIB no Brasil no perodo de 1982 a 1986. cidade de Salvador-Ba.
Elemento varivel: poca
Elementos Fixos: Local e Fenmeno
Tabela 1: Valores do PIB no Brasil no perodo de 1982 a 1986.
Anos
PIB
1982 779,94
1983 760,20
1984 803,53
1985 869,90
1986 941,26
Fonte: Morettin; Bussab-Estatstica Bsica.
Srie Geogrfica - aquela que apresenta como elemento varivel somente o local (fator geogrfico). Ex: Casos de
dengue nos municpios de Sinop, Rondonpolis e Cuiab no ano de 2002.
Elemento varivel: Local
Elementos Fixos: poca e Fenmeno
Tabela 2: Casos de dengue nos municpios de Sinop, Rondonpolis e Cuiab no ano de 2002.
Municpios
No de casos
Cuiab
32
Rondonpolis
15
Sinop
9
Fonte: Dados fictcios.
Srie Especfica - aquela srie que apresenta como elemento ou carter varivel o fenmeno (ou espcie), permanecendo fixos a poca e o local. Ex: Os alunos de uma Faculdade, em determinado ano, classificados segundo o
tipo sanguneo.
Elemento varivel: Fenmeno
Elementos Fixos: Local e poca
Tabela 3: Classificao de alunos de uma Faculdade, em determinado ano, segundo o tipo sanguneo.
Tipo Sanguneo Nmero de alunos
A
96
B
149
AB
132
O
92
Fonte: Dados fictcios.
Srie Mista - refere-se s sries que so combinaes de outros tipos de sries j estudadas.
Alguns exemplos de sries mistas sero apresentadas a seguir:
1. Srie Geogrfica - Temporal:
4 CRESPO,
Tabela 4: Taxa de atividade feminina urbana (em percentual) em trs regies do Brasil. 1981/90.
Regio
Ano
1981 1984 1986 1990
Norte
28,9 30,3 34,0 37,1
Nordeste 30,2 32,6 34,3 37,8
Sudeste
34,9 37,2 40,1 40,7
Fonte: Anurio Estatstico do Brasil - 1990
2.2.1
Exerccios
2. Abaixo encontramos algumas tabelas. Calcule a porcentagem, faa um breve comentrio sobre os resultados e diga
que tipo de srie estatstica cada tabela pertence:
Tabela 6: Matriculas no ensino superior segundo reas de ensino - Brasil - 1975.
reas de ensino
Matriculas %
Cincias Biolgicas
32.109
Cincias Exatas e Tecnologicas
65.949
Cincias Agrrias
2.419
Cincias Humanas
148.842
Letras
9.883
Artes
7.464
Duas ou mais reas
16.323
Total
Fonte: Servio de estatstica da educao e da cultura.
2.3
Quando se estuda uma varivel, o maior interesse do pesquisador conhecer o comportamento dessa varivel,
analisando a ocorrncia de suas possveis realizaes. Nesta seo veremos uma maneira de dispor um conjunto de
realizaes, para se ter uma idia global sobre elas, ou seja, de sua distribuio. Para dados qualitativos a enumerao e
tabulao a forma mais simples de represent-los.
2.3.1
Distribuio de Frequncias
Uma distribuio de frequncia a forma de representao tabular de dados que mostra a frequncia (ou o nmero)
de observaes em cada uma das diversas classes no sobrepostas.
Alguns aspectos importantes devem ser levados em considerao na construo de uma tabela: 5
1. Toda tabela deve ter um ttulo completo, contendo trs questes: o que est sendo estudado?, onde foi feito o
estudo? em que perodo (poca) este estudo foi realizado? O ttulo deve ser colocado na parte superior da tabela.
2. Se a fonte de dados no do prprio autor, ela deve ser indicada abaixo da tabela.
3. As notas e chamadas so utilizadas para fazer esclarecimentos de ordem geral e especfica, respectivamente. Ambas
so numeradas (ou smbolos como o asterisco) e colocadas abaixo da tabela.
4. De preferncia, usar o mesmo nmero de casas decimais para os algarismos.
5. As tabelas no devem ser fechadas lateralmente, mas linhas horizontais devem ser colocadas no incio e no final.
A seguir ser discutido um exemplo, no qual se destaca a forma de representao dos dados qualitativos mais
comuns.
Exemplo: Em uma determinada pesquisa, tem-se interesse em verificar a opinio de estudantes respeito das salas
de cinema da cidade. Uma amostra de 50 estudantes apresentou os seguintes resultados:
Tabela 9: Dados de uma amostra de 50 estudantes.
Regular a boa
Muito Boa
Regular a boa Regular a boa
Regular a boa
Muito Boa
Regular a boa
Muito boa
..
..
.
.
Muito Boa
Muito Boa
Muito Boa
Regular a boa
Regular a boa
Regular a boa
Para desenvolver a distribuio de frequncia para estes dados, contamos o nmero de vezes que cada resposta
aparece no conjunto de dados. A resposta Regular a boa aparece 32 vezes e a Muito boa aparece 18 vezes.
Uma distribuio de frequncias mostra o nmero (frequncia) de observaes em cada uma das classes no sobrepostas. No entanto, comum termos interesse na proporo (f ri ), ou porcentagem (f ri (%)), das observaes em cada
5 ANDRANDE,
Dalton; OGLIARI, Paulo. Estatstica para Cincias Agrrias e Biolgicas, Editora UFSC. 2007.
Tabela 10: Distribuio de frequncias da Opinio dos alunos a respeito das salas de cinema na cidade.
Opinio
Regular a boa Muito boa
frequncia(fi )
32
18
0,64
0,36
frequncia relativa (f ri )
frequncia percentual(f ri (%))
64
36
Fonte: Tabela 9 - Notas de Aula.
classe que serve para fazermos comparaes entre diferentes categorias independente do tamanho amostrado em cada
uma delas. Para a Tabela 10 temos:
fi : frequncia absoluta ou simples da categoria i;
f ri : frequncia relativa de uma classe: a proporo das observaes que pertencem classe,
f ri = fi /n, onde n o tamanho da amostra;
f ri (%) : frequncia percentual de uma classe a frequncia relativa multiplicada por 100.
Segundo Barbetta et al. (2004), as freqncias relativas em percentual so teis ao se comparar tabelas ou pesquisas
diferentes. Por exemplo, quando amostras (ou populaes) tm nmeros de elementos diferentes, a comparao atravs
das freqncias absolutas pode resultar em afirmaes errneas enquanto que pelas freqncias relativas em percentual
no, pois os percentuais totais so os mesmos.
2.3.2
Representao Grfica
Nesta seo sero apresentados os grficos mais utilizados para a representao das variveis qualitativas.
Um grfico de barras um dispositivo grfico para retratar os dados qualitativos que foram sintetizados em uma
distribuio de frequncia, em uma distribuio de frequncia relativa ou em uma distribuio de frequncia percentual.
Um grfico de barras tm por finalidade comparar grandezas, por meio de retngulos de igual largura, dispostos horizontalmente e com alturas proporcionais s grandezas. Devemos deixar uma distncia entre os retngulos. Para as variveis
qualitativas ordinais, devemos respeitar a ordem das categorias, como mostrado na figura a seguir.
Para efetuar uma anlise comparativa de vrias distribuies, podemos construir um grfico de barras mltiplo. A
figura a seguir um exemplo de grfico de barras mltiplo.
Figura 2: Distribuio das porcentagens da resistncia a ferrugem de hbridos de milho para as regies preferenciais.
Fonte: Andrade, D; Ogliari, P. Estatstica para Cincias Agrrias e Biolgicas.
Quando os retngulos so colocados na posio vertical, temos os grficos de colunas. A finalidade desse tipo de
grfico a mesma dos grficos de barras, isto servem para comparar grandezas.
10
Figura 4: Distribuio das porcentagens da resistncia a ferrugem de hbridos de milho para as regies preferenciais.
Fonte: Andrade, D; Ogliari, P. Estatstica para Cincias Agrrias e Biolgicas.
O grfico de pizza (ou setores) um dispositivo grfico comumente usado para apresentar as distribuies de
frequncia relativa e de frequncia percentual para dados qualitativos.
Para desenhar um grfico de pizza primeiro desenha-se um crculo e ento usa-se as frequncias relativas para
subdividir o crculo em setores ou partes, que correspondem frequncia relativa para cada classe. Por exemplo, como o
crculo tem 360 graus e a categoria Regular a boa tem uma frequncia relativa de 0,64, o setor do grfico rotulado de
Regular a boa consiste em 0, 64 360 = 230.4 graus.
Grfico de linhas : Sua aplicao mais indicada para representaes de sries temporais sendo por tal razo,
conhecidos tambm como grficos de sries cronolgicas. Sua construo feita colocando-se no eixo vertical (y) a
mensurao da varivel em estudo e na abscissa (x), as unidades da varivel numa ordem crescente. Este tipo de grfico
permite representar sries longas, o que auxilia detectar suas flutuaes tanto quanto analisar tendncias. Tambm podem
ser representadas vrias sries em um mesmo grfico.
11
Figura 6: Nmero de matriculas no curso de engenharia civil da UEM no perodo de 1999 a 2005.
Fonte: Guedes, T.A; Acorsi, C.R.L; Martins, A.B; Janeiro, V. Projeto de Ensino - UEM.
2.3.3
Exerccios
Figura 7: Composio do rebanho bovino da fazenda capim branco, Araguari - MG - Brasil, 2005.
Fonte: Daniel Furtado - Estatstica Bsica.
2. A equipe de nadadores de Cuiab apresentou-se no Campeonato Brasileiro de Natao de 1987 com 20 nadadores
do estilo borboleta, 30 de costa, 60 estilo craw e 50 estilo peito. Descreva esses dados em uma tabela. Que tipos de
grficos podem melhor representar esses dados. Trace 2 grficos entre todos possveis.
3. A seguir esto tipos de rochas:
12
SIENITO
GABRO
Q-DIORITO
SIENITO
DIORITO
GABRO
SIENITO
GABRO
DIORITO
NORITO
MONZONITO
NORITO
GABRO
Q-DIORITO
SIENITO
DIORITO
DIORITO
MONZONITO
NORITO
Q-DIORITO
DIORITO
MONZONITO
DIORITO
MONZONITO
SIENITO
MONZONITO
Q-DIORITO
DIORITO
DIORITO
MONZONITO
Q-DIORITO
SIENITO
NORITO
DIORITO
GABRO
DIORITO
NORITO
DIORITO
GABRO
SIENITO
2.4
Assim como nas variveis qualitativas, a anlise das variveis quantitativas dar-se- por meio de tabelas e grficos,
porm, como se trata de variveis numricas tambm possvel estudar o comportamento destas variveis atravs de
algumas medidas de resumo (mdia, mediana etc) que sero apresentadas neste curso na prxima seo.
A anlise tabular tambm feita com o uso das distribuies de frequncias que constituem-se num caso particular
das sries estatsticas, nas quais todos os elementos so fixos. Na distribuio de frequncias os dados referentes ao
fenmeno so apresentados atravs de gradaes, onde feita a correspondncia entre categorias ou valores possveis e
as frequncias respectivas. Alguns conceitos importantes sero apresentados atravs de um exemplo:
Um novo medicamento para cicatrizao est sendo testado e um experimento feito para estudar o tempo (em dias
completos) de completo fechamento em cortes provenientes de uma cirurgia. Uma amostra em trinta cobaias forneceu os
valores:
1. Dados Brutos - o conjunto dos dados numricos obtidos aps a coleta dos dados.
No exemplo:
13
17
17
16
15
18
14
17
17
15
16
15
17
16
15
14
17
14
18
16
16
16
14
14
18
17
15
16
15
18
18
Fonte: Lima, A.C.P; Magalhes, M.N. Noes de Probabilidade e Estatstica. Editora Edusp. 2004.
Varivel de estudo: Tempo (em dias completos) de completo fechamento em cortes provenientes de uma
cirurgia;
Classificao: A varivel Tempo sozinha classificada como contnua, pois pode assumir qualquer valor
em um intervalo. Como no exemplo s interessa ao pesquisador coletar dias completos, a varivel deixa de
ser contnua e passa a ser discreta.
Dados Brutos:
17 - 16 - 18 - 17 - 15 - 15 - 16 - 14 - 14 - 16 - 16 - 14 - 17 - 16 - 18 - 17 - 15 - 14 - 17 - 16 - 17 - 15 - 17 - 18 16 - 14 - 18 - 15 - 15 - 18
Como pode ser observado, os valores esto dispostos de forma desordenada. Em razo disso, pouca informao se consegue obter inspecionando-se os dados anotados. Mesmo uma informao to simples como a
de saber os valores mnimos e mximo requer um certo exame dos dados coletados.
2. Rol - o arranjo dos dados brutos em uma determinada ordem crescente ou decrescente.
Ex: Utilizando os mesmos dados anteriores:
14 - 14 - 14 - 14 - 14 - 15 - 15 - 15 - 15 - 15 - 15 - 16 - 16 - 16 - 16 - 16 - 16 - 16 - 17 - 17 - 17 - 17 - 17 - 17 - 17 18 - 18 - 18 - 18 - 18
Apresenta vantagens concretas em relao aos dados brutos. Ele torna possvel visualizar, de forma bem ampla, as
variaes dos dados, uma vez que os valores extremos so percebidos de imediato. Mas, a anlise com este tipo de
disposio comea a se complicar quando o nmero de observaes tende a crescer.
3. Amplitude total (H) - a diferena entre o maior e o menor valor observado da varivel em estudo.
Ex: Utilizando os mesmos dados anteriores:
H = 18 - 14 = 4.
Interpretao: No exemplo, H = 4, representa a diferena entre o tempo de cicatrizao mais lento e o mais rpido,
ou seja, 4 dias. OBS: A amplitude total tambm usada como uma medida de variabilidade dos dados, quanto
maior a amplitude maior a variabilidade do conjunto.
4. Frequncia absoluta simples (fi ) - J apresentada anteriormente, conta o nmero de vezes que o elemento aparece
na amostra ou o nmero de elementos pertencentes a uma classe (ou categoria).
5. Frequncia Acumulada (Fi ) - ndica o nmero de itens de dados observados at aquele dado valor (ou classe). A
frequncia acumulada auxiliar no clculo da mediana e de separatrizes, medidas de posio (ou tendncia central)
que sero apresentadas na prxima seo.
Para condensarmos melhor os dados, aconselhvel a elaborao de distribuies de frequncia. Uma tabela com
distribuio de frequncia uma tabela onde se procura fazer um arranjo dos valores e suas respectivas frequncias, onde a
frequncia de determinado valor ser dado pelo nmero de observaes ou repeties de um valor ou de uma modalidade.
As tabelas de frequncias podem representar tanto valores individuais como valores agrupados em classes.
2.4.1
uma tabela onde os valores da varivel aparecem individualmente. Esse tipo de distribuio utilizada geralmente para representar uma varivel discreta, com pouca variedade de valores.
Exemplo: Utilizando os mesmos dados anteriores, a tabela a seguir representa a distribuio de frequncias referente aos tempos de cicatrizao (em dias completos) de 30 cobaias.
Tabela 12: Distribuio de frequncias referente aos tempos de cicatrizao (em dias completos) de 30 cobaias.
Tempos(Xi ) 14 15 16 17 18 Total(n)
fi
5
6
7
7
5
30
Fonte: Lima, A.C.P; Magalhes, M.N. Noes de Probabilidade e Estatstica. Editora Edusp. 2004.
14
A soma das frequncias absolutas simples (fi ) sempre igual ao nmero total de valores observados, ou seja, n =
i=1 fi , onde k o nmero de valores distintos observados. No exemplo acima temos 5 valores diferentes observados,
consequentemente 5 fi0 s.
OBS: Este tipo de tabela no aconselhvel quando se trabalha com variveis que apresentam uma grande quantidade de valores distintos (mesmo sendo dados discretos), uma vez que a tabela poder ficar muito extensa, dificultando,
alm de sua elaborao, as anlises e concluses dos dados pesquisados.
Pk
2.4.2
Figura 8: Grfico de colunas referente aos tempos de cicatrizao (em dias completos) de 30 cobaias.
Fonte: Dados da Tabela 12.
Outras formas:
Figura 9: Grfico de barras referente aos tempos de cicatrizao (em dias completos) de 30 cobaias.
Fonte: Dados da Tabela 12.
15
Figura 10: Grfico de setores referente aos tempos de cicatrizao (em dias completos) de 30 cobaias.
Fonte: Dados da Tabela 12.
2.4.3
Quando a varivel contnua, como por exemplo: peso, altura, salrio, renda etc. natural que em uma amostra
retirada aparea uma grande diversidade de valores. Devido a esta possibilidade, no recomendado utilizarmos uma
tabela de distribuio de frequncias simples onde aparea diversos valores com frequncias muito pequenas e que no
est de fato desempenhando a sua verdadeira funo que resumir as informaes. Em vez de resumir, uma tabela de
distribuio de frequncias simples para uma varivel contnua com resultados bem diversos ser uma tabela extensa e
difcil de interpretar.
Com o objetivo de resumir os dados originais em uma distribuio de frequncias, utiliza-se os dados agrupados
ou em classes e no mais individual. As classes podem ser definidas como sendo os subintervalos da Amplitude Total de
uma varivel (grupo de valores). Quando a varivel objeto de estudo for contnua geralmente ser conveniente agrupar os
valores observados em classes.
Se, por outro lado, a varivel for discreta e o nmero de valores representativos dessa varivel for muito grande,
recomenda-se o agrupamento dos dados em classes. Da mesma forma, se a varivel for contnua mas os resultados
observados se repetem muito, no apresentando uma grande diversidade, tambm possvel utilizarmos a tabela de
distribuio de frequncias simples no agrupados em classes.
A seguir sero apresentadas as diversas situaes citadas anteriormente.
(A) Varivel Contnua com grande diversidade de valores:
Exemplo: Foram feitas medidas em operrios da construo civil a respeito da taxa de hemoglobina no sangue (em
gramas/ cm3 ):
16,3
13,5
15,2
12,7
12,3
12,3
13,7
13,5
14,1
15,4
11,1
11,3
12,2
11,7
11,7
12,6
12,5
13,4
13,9
15,2
12,3
13,2
14,4
13,0
13,6
16,9
12,7
15,8
12,6
14,7
Fonte: Lima, A.C.P; Magalhes, M.N. Noes de Probabilidade e Estatstica. Editora Edusp. 2004.
6
5
8
4
7
7
5
6
5
7
6
5
4
7
4
8
6
6
6
4
4
8
7
5
6
5
8
8
16
24 - 23 - 22 - 28 - 35 - 21 - 23 - 33 - 34 - 24 - 21 - 25 - 36 - 26 - 22 30 - 32 - 25 -26 - 33 - 34 - 21 - 31 - 25 - 31 - 26 - 25 - 35 - 33 - 31
Fonte: Dados fictcios.
No exemplo: k = 30
= 5, 48 = 5 classes;
2. Amplitude do Intervalo de Classe (h) - A amplitude de um intervalo de classe corresponde ao comprimento
desta classe. Numericamente, sua amplitude pode ser definida como a diferena existente entre os limites
superior (ou inferior) de duas classes consecutivas (h = ls li ).
h=
Ex: Utilizando os mesmos dados anteriores: h =
H
k
16,911,1
5
= 5, 8/5 = 1, 16
3. Limites de Classe - Os limites de classe so seus valores extremos. O smbolo ` indica a incluso do
limite inferior do intervalo naquela classe e smbolo a indica a incluso do limite superior do intervalo naquela
classe. Neste curso adotaremos o smbolo ` na construo das classes, pois ele o mais usual. Para a construo das classes temos:
li1 : Limite inferior da 1a classe; Usualmente o menor valor da amostra. No exemplo: 11,1.
ls1 : Limite superior da 1a classe; ls1 = li1 + h. No exemplo: 11,1 + 1,16 = 12,26.
li2 : Limite inferior da 2a classe; li2 = ls1 . No exemplo: 12,26.
ls2 : Limite superior da 2a classe; ls2 = li2 + h. No exemplo: 12,26 + 1,16 = 13,42.
Para a n-sima classe:
lin : Limite inferior da na classe; lin = ls(n1) . Ou seja, ser igual ao limite superior da classe imediatamente
anterior.
lsn : Limite superior da na classe; lsn = lin + h.
4. Pontos Mdios ou Centrais da Classe (P mi ) - a mdia aritmtica simples entre o limite superior e o inferior
de uma mesma classe.
Ex: Utilizando os mesmos dados anteriores: P m1 = (11,1 + 12,26)/2 = 11,68.
Para obter os pontos mdios das demais classes, basta acrescentar ao ponto mdio da classe precedente a
amplitude do intervalo de classe. No exemplo anterior: P m2 = h + P m1 = 1, 16 + 11, 68 = 12, 84, e assim
sucessivamente.
17
Tabela 13: Distribuio de frequncias referente as Taxas de hemoglobina no sangue (em gramas/ cm3 ) de 30 operrios
da construo civil.
Tx Hemoglobina P mi fi
f ri
f ri (%) Fi
11,10 ` 12,26
11,68 5 0,1667
16,67
5
12,84 11 0,3667
36,67
16
12,26 ` 13,42
13,42 ` 14,58
14,00 7 0,2333
23,33
23
14,58 ` 15,74
15,16 4 0,1333
13,33
27
16,32 3 0,1000
10,00
30
15,74 ` 16,90
Total
30
1
100
Fonte: Lima, A.C.P; Magalhes, M.N. Noes de Probabilidade e Estatstica. Editora Edusp. 2004.
A representao grfica das distribuies de frequncias para dados em classes feita atravs do histograma e/ou
polgono de frequncias.
1. Histograma - um grfico formado por um conjunto de retngulos justapostos, de forma que a rea de cada
retngulo seja proporcional frequncia da classe que ele representa.
2. Polgonos de Frequncia - Unindo por linhas retas os pontos mdios das bases superiores dos retngulos do
histograma, obtm-se outra representao dos dados, denominada polgono de frequncia
Figura 11: Histograma e Polgono de frequncias referente as taxas de hemoglobina no sangue de 30 operrios da construo civil.
Fonte: Dados da Tabela 13.
18
3. Apresentao Ramo-e-Folha - Apresenta a forma e ordem dos dados. Pode ser utilizado na organizao dos
dados antes de dispor na tabela.
Exemplo: Um dos principais indicadores da poluio do ar nas grandes cidades a concentrao de oznio na
atmosfera. O nvel de concentrao de oznio na atmosfera foi medido em So Paulo durante o inverno de 1998, e
os resultados so apresentados a seguir:
Tabela 14: Concentrao de ozonio na atmosfera em So Paulo, inverno de 1998.
6,6 4,4 5,7 4,5 3,7 3,5 1,4 6,6 6,0 4,2 4,4 5,3 5,6
9,4 7,6 6,2 3,3 5,9 6,8 2,5 5,4 4,4 5,4 4,7 3,5 4,0
3,8 4,7 3,1 6,8 9,4 2,4 3,0 5,6 4,7 6,5 3,0 4,1 3,4
3,4 5,8 7,6 1,4 3,7 6,8 1,7 5,3 4,7 7,4 6,0 6,7 10,9
2,0 3,7 5,7 5,8 3,1 5,5 1,1 5,1 5,6 5,5 1,4 3,9 6,6
5,8 1,6 2,5 8,1 6,6 6,2 7,5 6,2 6,0 5,8 2,8 6,1 4,1
A apresentao ramo-e-folha apresentada a seguir:
1
2
3
4
5
6
7
8
9
10
1
0
0
0
1
0
4
1
4
9
4
4
0
1
3
0
5
4
5
1
1
3
0
6
4
5
1
2
4
1
6
6
8
3
4
4
2
7
4
4
5
2
4
4
5
2
5
5
6
5
5
7
6
6
7
7
6
6
7
7
7
6
7
7
7
6
8
7
8
8
8
8
8
8
Exerccio: A partir do ramo e folha acima, disponha os dados em uma tabela de frequncias.
(B) Agora iremos analisar a situao (B) descrita anteriormente onde a varivel de estudo era Notas dos alunos da 6a
srie na disciplina de portugus. Apesar dos valores apresentados serem inteiros, a varivel Nota pode assumir
qualquer valor em um intervalo, por exemplo: 6,5. Como no exerccio no foi especificado que o professor adotaria
apenas nmeros inteiros, esta varivel classificada como contnua.
PASSO 1 - Calcular a amplitude total (H): H = 8 - 4 = 4; (amplitude pequena)
PASSO 2 - Dispor os dados em uma tabela de distribuio de frequncias simples;
Tabela 15: Distribuio de frequncias referente as notas dos alunos da 6a srie na disciplina de portugus.
Notas(Xi )
4
5
6
7
8
Total(n)
fi
5
6
7
7
5
30
f ri (%)
16,67 20,00 23,33 23,33 16,67
100
Fonte: Dados fictcios.
Figura 12: Grfico de setores referente as notas dos alunos da 6a srie na disciplina de portugus.
Fonte: Dados da Tabela 15.
Tabela 16: Idade dos alunos do curso de estatstica da UFMT, no ano de 2010.
Idade(Xi ) 21 22 23 24 25 26 28 30 31 32 33 34 35 36 TOTAL(n)
fi
3
2
2
1
4
3
1
1
3
1
3
3
2
1
30
Fonte: Dados hipotticos.
Observando a Tabela 16, podemos perceber a grande diversidade de valores e a extenso da tabela. Por conta desta
tabela no resumir tanto as informaes iremos colocar estes dados em classes.
Tabela 17: Idade dos alunos do curso de estatstica da UFMT, no ano de 2010.
Idade
P mi fi
f ri f ri (%) Fi
21 ` 24 22,5
7 0,23
23
7
24 ` 27 25,5
8 0,27
27
15
27 ` 30 28,5
1 0,03
3
16
30 ` 33 31,5
5 0,17
17
21
33 ` 36 34,5
9 0,30
30
30
TOTAL
30
1
100
Fonte: Dados hipotticos.
Na Tabela 17 temos que na 1a classe sero contados na amostra elementos a partir do 21 at o 23,99, na 2a classe
sero contados os elementos a partir do 24 at o 26,99 e assim por diante.
Representao Grfica:
2.4.5
Exerccios
1. Em um estudo sobre o potencial de germinao de sementes de algodo dividiu-se uma rea em 48 parcelas com a
mesma rea, tipo de solo, iluminao, etc. Em cada uma destas parcelas foram plantadas 4 sementes e verificou-se
o nmero de sementes que germinaram. Os dados obtidos so apresentados a seguir:
2
2
0
0
1
0
0
1
2
4
1
0
3
1
0
0
1
1
0
1
1
1
0
2
0
0
0
0
0
2
1
3
0
1
0
0
0
0
0
0
0
0
0
0
0
1
0
0
Figura 13: Histograma e Polgono de frequncias referente as idades dos alunos do curso de estatstica da UFMT 2010.
Fonte: Dados da Tabela 17.
144
141
152
150
154
143
145
158
a) Construir a tabela de freqncias constituda pelas freqncias absolutas simples, as freqncias relativas, as
freqncias acumuladas e os Pontos mdios de classes;
b) Construir um histograma e um polgono de freqncias;
Somatrio
Nas prximas sees sero vistos alguns coeficientes estatsticos que fazem uso do somatrio. Um somatrio um
operador matemtico que nos permite representar facilmente somas muito grandes ou at infinitas. representado com a
letra grega sigma , e definido por:
n
X
xi
i=1
n
X
k = k + k + k + ... + k = nk
i=1
i=1
n
X
i=1
(xi + yi ) =
i=1
n
X
i=1
xi +
n
X
yi
i=1
(a + bxi ) =
n
X
a+
i=1
n
X
i=1
21
bxi = na + b
n
X
i=1
xi
xi
Observaes:
n
X
xi yi
n
X
6=
i=1
xi
i=1
n
X
x2i
n
X
6=
i=1
n
X
yi
i=1
!2
xi
i=1
Exemplos:
Seja X = {4, 7, 9, 12, 3}, obter:
5
4
5
X
X
X
xi = 35,
2xi = 64,
3xi = 93
i=1
i=1
Sabendo que
3
X
i=2
xi = 6,
i=1
a)
b)
3
X
(xi + 1) =
i=1
3
X
i=1
3
X
xi +
i=1
3
X
(xi 1) =
i=1
3
X
i=1
3
X
1=6+3=9
i=1
x2i
2xi + 1 =
3
X
i=1
x2i
3
X
xi +
i=1
3
X
1 = 14 12 + 3 = 5.
i=1
Foi visto at agora a sintetizao dos dados sob a forma de tabelas, grficos e distribuies de frequncias. Agora,
vamos aprender o clculo de medidas que possibilitem representar um conjunto de dados relativos observao de determinado fenmeno de forma resumida.
As medidas de tendncia central ou posio so assim denominadas por indicarem um ponto em torno do qual se
concentram os dados. Este ponto tende a ser o centro da distribuio dos dados. Vale a pena chamar a ateno que, para
o clculo dessas medidas, necessrio que a varivel seja quantitativa. 6
As principais medidas de tendncia central so: Mdia, Mediana e Moda.
4.1
Mdia
a medida de tendncia central mais comumente utilizada para descrever resumidamente uma distribuio de
frequncia (centro de massa de um conjunto dados).
Notao:
chamada mdia amostral e
X
a mdia populacional.
Observaes:
A mdia afetada por valores extremos;
A mdia bastante utilizada em distribuies simtricas;
No utilizvel em variveis categricas;
A mdia pode ser utlizada para variveis discretas, inclusive com decimais.
(a) Mdia Aritmtica Simples: dada pelo quociente entre a soma dos valores observados e a frequncia total (
o nmero total de observaes). Genericamente, podemos escrever:
=
X
n
X
xi
i=1
W.O.; MORETTIN, P.A. Estatstica Bsica. 4a ed., Atual Editora, S.P., 2010.
22
Pk
i=1
Pk
i=1
xi fi
P5
i=1
xi fi
= x1 f1 + x2 f2 + x3 f3 + x4 f4 + x5 f5
X
f1 + f2 + f3 + f4 + f5
= 26 3 + 28 10 + 30 12 + 32 5 + 37 19
X
49
X = 32, 26
Interpretao: A idade mdia dos pacientes renais observados foi de aproximadamente 32,26 anos.
(c) Mdia para dados agrupados em classes:
=
X
Pk
i=1
P mi f i
n
Exemplo:
Tabela 20: Pesos dos alunos do curso de estatstica da UFMT, no ano de 2010.
Pesos(kg) Frequncia (fi ) P mi
59 ` 63
3
61
63 ` 67
5
65
67 ` 71
9
69
71 ` 75
12
73
75 ` 79
11
77
TOTAL
40
Fonte: Dados fictcios.
23
P mi fi
n
= 61 3 + 65 5 + 69 9 + 73 12 + 77 11
X
3 + 5 + 9 + 12 + 11
X
= 71, 3
=
X
i=1
Interpretao: O peso mdio dos alunos do curso de estatstica 2010 da UFMT, foi de 71,3 Kg.
OBS: Perde-se um pouco de preciso na mdia quando estamos trabalhando com dados agrupados em classes.
(d) Mdia aritmtica ponderada:
s vezes, associam-se os nmeros X1 , X2 , , Xk a certos fatores de ponderao ou pesos w1 , w2 , , wk , que dependem do significado ou importncia atribuda aos nmeros. 7 Nesse caso,
P
i wi Xi
= w1 X1 + w2 X2 + + wk Xk = P
X
w1 + w2 + + wk
i wi
tem a denominao de mdia aritmtica ponderada.
Exemplo: Se o exame final, em um curso, tem peso 3 e as provas correntes peso 1, e um estudante tem grau 85 naquele
exame e 70 e 90 nas provas, seu grau mdio :
= (1)(70) + (1)(90) + (3)(85) = 415 = 83.
X
1+1+3
5
4.1.1
Propriedades da mdia
Dentre as principais propriedades da mdia podemos destacar as seguintes:
a) multiplicando-se todos os valores de uma varivel por uma constante, a mdia do conjunto fica multiplicada por
essa constante;
a mdia da amostra.
Seja X = {x1 , x2 , x3 , , xn } uma amostra aleatria de tamanho n, c uma constante e X
MDIA fica
Se multiplicarmos ou dividirmos todos os valores de uma varivel X pela constante c, o valor de X
multiplicada ou dividida pela constante.
n
X
n
n
X
= c
=
cxi
i=1
xi
i=1
cX
b) somando-se ou subtraindo-se uma constante a todos os valores de uma varivel, a mdia do conjunto fica acrescida
ou diminuda dessa constante.
a mdia da amostra.
Seja X = {x1 , x2 , x3 , , xn } uma amostra aleatria de tamanho n, c uma constante e X
MDIA fica
Se somarmos ou subtrairmos todos os valores de uma varivel X pela constante c, o valor de X
7 SPIEGEL,
24
(xi + c)
i=1
n
n
X
i=1
=
=
4.1.2
n
X
i=1
n
n
X
xi +
i=1
n
X
xi
+
i=1
+ nc
X
n
+c
X
Exerccios:
1. Sejam dados referentes a um levantamento onde observou-se o nmero de peas defeituosas em 25 mquinas de
uma empresa.
Tabela 21: Nmero de peas defeituosas em 25 mquinas de uma empresa
3 5 7 1 3
6 5 5 5 3
8 5 2 6 2
4 4 4 3 5
6 2 2 4 5
Fonte: Dados fictcios.
25
4.2
Mediana (Md)
definido como o valor que divide uma srie ordenada de tal forma que pelo menos a metade dos itens sejam
iguais ou maiores do que ela, e que a outra metade dos itens sejam menores do que ela. Colocados em ordem crescente, a
mediana o elemento que ocupa a posio central.
Como a mediana divide os dados ordenados ao meio, ela no sensvel a valores discrepantes. A depender de
como estejam os dados, deve-se diferenciar a forma como encontra-se a mediana.
Observaes:
No utilizvel em variveis categricas;
Pouco afetada por valores discrepantes;
Bastante utilizada para distribuies assimtricas.
1. Determinao da Mediana para Dados Brutos:
Seja x(1) , x(2) , , x(n) o rol das observaes em ordem crescente. A mediana dessas observaes ser dada por:
8
(b) n par: M d =
X( n ) +X( n +1)
2
Exemplos:
(a) n mpar:X = {1, 3, 6, 7, 9}. M d = X( 5+1 ) = X(3) , logo a mediana ser dada pelo 3o elemento, M d = 6.
2
Interpretao da Mediana: Metade das observaes vo at 6 e a outra metade maior (ou igual) que 6.
X( 6 ) +X( 6 +1)
(b) n par:X = {1, 3, 6, 7, 9, 12}. M d = 2 2 2 , logo a mediana ser dada pela mdia entre o 3o elemento
X +X
e o 4o elemento, M d = (3) 2 (4) = 6+7
2 = 6, 5. Interpretao da Mediana: Metade das observaes vo
at 6,5 e a outra metade maior (ou igual) que 6,5.
2. Determinao da Mediana para Dados em Distribuio de Frequncias Simples:
Da mesma forma como foi calculado anteriormente, encontra-se mediana usando as expresses (a) ou (b), para n
mpar ou par. Em seguida, acrescenta-se tabela de frequncia uma coluna com as frequncias acumuladas (Fi ).
Com o uso destas frequncias (Fi ) encontra-se a posio da mediana e em seguida o elemento mediano.
Exemplo:
Tabela 23: Idade dos alunos do curso de estatstica da UFMT, no ano de 2010.
Idade(xi ) 21 22 23 24 25 26 28 30 31 32 33 34 35 36
fi
3
2
2
1
4
3
1
1
3
1
3
3
2
1
Fi
3
5
7
8 12 15 16 17 20 21 24 27 29 30
Total
30
-
Soluo:
Como n = 30 (par), o elemento mediano ser dada por: Xmd =
X( 30 ) +X( 30 +1)
2
Assim, a mediana ser dada pela mdia aritmtica entre o 15o e o 16o elemento, M d =
X(15) +X(16)
;
2
Se olharmos as frequncias acumuladas (Fi ) na Tabela 23 veremos que o 15o elemento se encontra na 6a
coluna e o 16o elemento na 7a coluna e as idades correspondentes a cada coluna so:
M d = (26 + 28)/2 = 27;
Interpretao: 50% dos alunos do curso de estatstica de 2010 tem idade igual ou superior a 27 anos;
8 BUSSAB,
W.O.; MORETTIN, P.A. Estatstica Bsica. 4a ed., Atual Editora, S.P., 2010.
26
Exemplo 2:
Encontre a mediana utilizando os dados da tabela a seguir:
Pesos(kg)
59 ` 63
63 ` 67
67 ` 71
71 ` 75
75 ` 79
TOTAL
Frequncia
3
5
9
12
11
40
Soluo 1: Somando-se as trs primeiras frequncias tm-se 3 + 5 + 9 = 17. Logo, para obtermos o 20o peso (n/2)
desejado, so necessrios mais 3 dos 12 casos existentes na 4a classe. Como o 4o intervalo de classe dado por 71 ` 75,
a mediana situa-se a 3/12 da distncia entre 71 e 75 e :
3
M d = 71 + (75 71) = 72.
12
Soluo 2: Utilizando o histograma tambm podemos encontrar a mediana:
Em cada coluna do histograma temos as frequncias das respectivas classes, mais uma vez, somando-se as trs
primeiras frequncias tm-se 3 + 5 + 9 = 17. Logo, para obtermos o 20o peso (n/2) desejado, so necessrios mais 3 dos
12 casos existentes na 4a classe. Assim a mediana ser dada por:
75 71
M d 71
=
3
12
3(75 71)
M d 71 =
12
M d = 1 + 71 = 72.
27
4.3
Moda (Mo)
A moda outra medida de tendncia central, sendo, no entanto a menos usada. Sua vantagem que pode ser usada
para variveis qualitativas. Genericamente, pode-se definir a moda como o valor mais frequente da distribuio.
Observaes:
Um conjunto de dados pode apresentar mais de uma moda;
A moda pode ser calculada para variveis qualitativas e quantitativas;
Um conjunto de dados sem moda chamado Amodal.
1. Determinao da Moda de Valores No-Tabulados.
Considerando um conjunto ordenado de valores, a moda ser o valor predominante, o valor mais frequente desse
conjunto. Embora seu significado seja o mais simples possvel, nem sempre a moda existe (distribuio amodal) e
nem sempre nica. Se apresentar apenas uma moda diremos que unimodal; se possuir duas modas diremos que
bimodal; se tiver vrias modas (mais que duas) diremos que multimodal. Exemplos:
X = {1, 2, 4, 7, 9}: conjunto Amodal;
X = {1, 2, 2, 4, 7, 9}: conjunto Unimodal, moda = 2;
X = {1, 2, 2, 4, 4, 7, 9}: conjunto Bimodal; moda = 2 e 4;
2. Determinao da Moda para Valores Tabulados.
No caso de dados tabelados no agrupados em classe, a determinao da moda imediata, bastando para isso,
consultar a tabela, localizando o valor que apresenta a maior frequncia. Analisando a Tabela 23, observa-se que a
idade que possui o maior fi a idade 25, com fi = 4. Ou seja, a idade mais frequente entre os estudantes do curso
de estatstica de 2010 25 anos ou a idade mais observada entre os estudantes foi 25 anos.
Para variveis qualitativas, a moda ser a categoria que mais apareceu.
Tabela 25: Distribuio de frequncias da Opinio dos alunos a respeito das salas de cinema na cidade.
Opinio
Regular a boa Muito boa
frequncia(fi )
32
18
Fonte: Estatstica Bsica - Daniel Furtado.
Observando os resultados da Tabela 25, conclui-se que a categoria que foi observada com maior frequncia foi a Regular
a boa, logo essa ser a moda. Interpretao: A maioria dos estudantes considera que as salas de cinema da cidade est
classificada como Regular a boa.
Para dados agrupados a moda se localiza na classe de maior freqncia (classe modal) e obtida por meio da
expresso (Moda de Czuber): 9
1
h
Mo = l +
1 + 2
l o limite inferior da classe modal;
9 SPIEGEL,
28
95
M o = 33 + 3
(9 5) + (9 0)
M o = 33 + 0, 92
= 34.
Interpretao: A idade mais frequente entre os alunos do curso de estatstica 2010 34 anos.
4.4
29
4.5
Simetria
A determinao das medidas de posio permite discutir sobre a simetria da distribuio dos dados.
Distribuio simtrica - X = Md = Mo
Distribuio assimtrica - ocorrem diferenas entre os valores da mdia, mediana e moda. A assimetria pode ser:
direita - X > Md > Mo
esquerda - X < Md < Mo
4.6
Exerccios
0
1
0
0
1
2
4
1
0
3
1
0
0
1
1
0
1
1
1
0
2
0
0
0
0
0
2
1
3
0
1
0
0
0
0
0
0
0
0
0
0
0
1
0
0
152
150
159
142
160
146
160
142
151
141
157
141
146
150
154
143
145
158
Separatrizes
So as medidas que separam o rol ou a distribuio de frequncias em partes iguais. Vimos que a mediana divide
a distribuio em duas partes iguais quanto ao nmero de elementos de cada parte. Agora vamos estudar outras medidas
que dividem a distribuio em partes iguais, so as chamadas separatrizes. So elas: 10
Quartis - Dividem a amostra em 4 partes iguais;
Decis - Dividem a amostra em 10 partes iguais;
Percentis - Dividem a amostra em 100 partes iguais;
30
5.1
Quartis
in
,
4
i = 1, 2, 3;
17
4
in
4
= 1, 75o
= 2o elemento,
Q1 = 12. Interpretao: 25% das observaes so menores que 12 ou 75% das observaes so superiores ou
iguais a 12.
Exemplo 2: para n par - X = {11, 12, 12, 14, 14, 17, 19, 19}, vamos calcular o quartil 3 desse conjunto:
1. Fazer o Rol das observaes em ordem crescente;
2. Encontrar a posio do elemento:
EQi =
EQ3 =
38
4
in
4
= 6o . Entre o 6o e 7o elemento,
Q3 = 17+19
= 18. Interpretao: 75% das observaes so menores que 18 ou 25% das observaes so superiores
2
ou iguais a 18.
, Exemplo 3: Quando os dados tiverem em uma distribuio de frequncias:
1. Encontrar a posio do elemento:
EQi =
10 BUSSAB,
in
;
4
W.O.; MORETTIN, P.A. Estatstica Bsica. 4a ed., Atual Editora, S.P., 2010.
31
Para dados agrupados em classes, encontraremos os quartis de maneira semelhante usada para o clculo da
mediana:
EQi Fant
Qi = l + h
fqi
onde,
l = limite inferior da classe que contem o quartil desejado;
h = amplitude do intervalo de classe;
EQi = elemento quartlico;
Fant = frequncia acumulada da classe anterior classe quartlica;
fqi = frequncia absoluta simples da classe quartlica.
= 7, 5o , como os dados esto em classes, olha-se o Fi mais prximo de
No exemplo das idades EQ1 = 130
4
EQi , analisando a Tabela acima, temos que a 2a classe ser a classe quartlica pois na 1a classe observamos at 7
elementos e o que passar disso cai na classe seguinte, logo:
7, 5 7
Q1 = 24 + 3
= 24, 2.
8
Interpretao: 25% dos estudantes tem at 24,2 anos. O Q1 encontrado aqui diferente do quartil calculado para os
dados originais no tabulados, essa diferena se justifica pois nos dados em classes perdemos um pouco na preciso.
5.2
Decis e Percentis
Genericamente, para determinar a ordem ou posio do Decil a ser calculado, usaremos a seguinte expresso:
EDi =
in
,
10
i = 1, 2, 3, , 9;
32
Do mesmo modo, para determinar a ordem ou posio do Percentil a ser calculado, usaremos a seguinte expresso:
EDi =
in
,
100
i = 1, 2, 3, , 99;
EPi Fant
fpi
o
No exemplo das idades EP90 = 9030
100 = 27 , como os dados esto em classes, olha-se o Fi mais prximo de EPi ,
analisando a Tabela 8, temos que a ltima classe ser a classe do 90o percentil, logo:
27 21
= 35.
P90 = 33 + 3
9
Interpretao: 90% dos estudantes tem at 35 anos. O P90 encontrado aqui ser diferente do Percentil achado
usando os dados brutos, essa diferena se justifica pois nos dados em classes perdemos um pouco na preciso.
5.3
Exerccios
1. Para os exerccios (1) e (2) da seo 2.1.2, pginas 6 e 7, calcule Q1 , Q3 e P95 . Interprete os resultados.
2. Para os dados da Tabela 8 calcule Q3 e D8 . Interprete os resultados.
3. Considere os seguintes dados sobre a distribuio de valores de metabolismo basal (cal/dia) em 36 adolescentes:
910
1190
960
1280
1090
1300
1220
1010
1240
1120
1380
1130
1040
1270
1070
1070
1280
1080
980
1210
1000
1310
1110
1360
1240
1040
1260
1140
1460
1180
1110
1420
1200
1020
1270
1100
Medidas de Disperso
Uma breve reflexo sobre as medidas de tendncia central permite-nos concluir que elas no so suficientes para
caracterizar totalmente uma sequncia numrica. Se observarmos as sequncias:
X : 10, 1, 18, 20, 35, 3, 7, 15, 11, 10.
Y : 12, 13, 13, 14, 12, 14, 12, 14, 13, 13.
Z : 13, 13, 13, 13, 13, 13, 13, 13, 13, 13.
concluiremos que todas possuem a mesma mdia 13. No entanto so sequncias completamente distintas do ponto de
vista de variabilidade dos dados. Na sequncia Z no h variabilidade dos dados. Na sequncia Y , a mdia 13 representa
bem a srie, mas existem elementos da srie levemente diferenciados da mdia 13. Na sequncia X os elementos esto
bem diferenciados da mdia 13. As medidas de disperso sero usadas para avaliar a representatividade da mdia. 11
11 BUSSAB,
W.O.; MORETTIN, P.A. Estatstica Bsica. 4a ed., Atual Editora, S.P., 2010.
33
6.1
Amplitude Total
A amplitude total de um conjunto de dados a diferena entre o maior e o menor valor observado. A medida de
disperso no leva em considerao os valores intermedirios perdendo a informao de como os dados esto distribudos
e/ou concentrados.
H = Xmax Xmin
Exemplo: Utilizando os dados da Tabela 8, a amplitude total da idade dos alunos do curso de Estatstica 2010 :
H = 36 21 = 15 anos,
isto , as idades dos alunos diferem em torno de 15 anos.
6.2
Amplitude Interquartlica
A amplitude interquartlica a diferena entre o terceiro e o primeiro quartil. Esta medida mais estvel que a
amplitude total por no considerar os valores mais extremos. Esta medida abrange 50% dos dados e til para detectar
valores discrepantes.
dq = Q3 Q1
Exemplo: Utilizando os dados da Tabela 8, a amplitude interquartlica da idade dos alunos do curso de Estatstica da
UFMT :
dq = 33, 5 24, 2 = 9, 3 anos
A amplitude entre o terceiro e primeiro quartil, que envolve 50% (centrais) dos alunos, de 9,3 anos.
6.3
Varincia
a medida de disperso mais usada e mais importante. Mede a concentrao dos dados em torno da mdia. dado
pela soma dos quadrados dos desvios dividido pelo nmero total de observaes. A notao S 2 usada para representar
a varincia amostral.
1. Varincia amostral (S 2 ) para dados no tabulados
n
X
Xi X
S =
n1
i=1
2
2
,
(1)
( n
X
)
Xi2
nX
(2)
i=1
22,71.
Exemplo: Calcular a varincia do conjunto A = {10, 12, 13, 20, 25, 34, 45}, X=
Xi
10
12
13
20
25
34
45
Total
2
di = (Xi X)
d2i = (Xi X)
-12,71
161,54
-10,71
114,70
-9,71
94,28
-2,71
7,34
2,29
5,24
11,29
127,46
22,29
496,84
0,03
1007,4
Fonte: Dados hipotticos.
Na Tabela 29 di chamadado de desvio, a soma do desvio nula. A soma dos desvios ao quadrado dividido por
n 1 resulta na varincia e a raz quadrada da varincia o desvio-padro.
p
13 e S 2 = 167, 9.
Logo, S = 1007, 4/6 =
34
2. Desvio-Padro (S): a raz quadrada da varincia. Deixa a medida de variabilidade na mesma unidade de medida
dos dados, diferente da varincia. Exemplo: Se calculamos a varincia das alturas de um conjunto de 10 crianas,
essa varincia ter como unidade de medida cm2 e o desvio padro cm, mesma unidade de medida das observaes
coletadas.
3. Varincia de dados tabulados em distribuio de frequncias: Quando os valores vierem dispostos em uma tabela
de frequncias, o clculo da varincia se far atravs da seguinte frmula:
k
2 fi
X
Xi X
S =
n1
i=1
2
(3)
X
P mi X
n1
i=1
2
fi
P mi fi nX .
S =
n 1 i=1
(4)
(5)
(6)
Exemplo: Os dados a seguir referem-se as vendas de determinada empresa e produtividade de seus vendedores.
Tabela 30: Distribuio de frequncias referente s vendas de determinada empresa e produtividade de seus vendedores.
Vendas(x 1000 - R$)(xi ) No de vendedores(fi )
xi fi
x2i fi
70
1
70
702 1
120
12
1440 1202 12
170
27
4590 1702 27
220
31
6820 2202 31
270
10
2700 2702 10
Total
81
15620
3187400
Fonte: Dados hipotticos.
1
3187400 81(192, 84)2
= 2.190, 39
81 1
p
2.190, 39
= 46, 8
=
X=
= 28, 6.
n
30
A idade mdia dos alunos de 28,6 anos.
35
Tabela 31: Idade dos alunos do curso de estatstica da UFMT, no ano de 2010.
Idade
P mi fi P mi fi
P m2i fi
21 ` 24 22,5
7
157,5 22, 52 7
24 ` 27 25,5
8
204
25, 52 8
1
28,5
28, 52 1
27 ` 30 28,5
30 ` 33 31,5
5
157,5 31, 52 5
9
310,5 34, 52 9
33 ` 36 34,5
TOTAL
30
858
25231,5
Fonte: Dados hipotticos.
1
25231, 5 30(28, 6)2
= 23, 1
30 1
23, 1
= 4, 8
6.4
Coeficiente de Variao
Trata-se de uma medida relativa de disperso, til para comparao em termos relativos do grau de concentrao
em torno da mdia de sries distintas.
dada por:
S
CV = 100
X
(7)
Como o CV uma medida que exprime a variabilidade relativa mdia, usualmente expresso em porcentagem.
Exemplo: Tomemos os resultados das medidas das estaturas e dos pesos de um mesmo grupo de indivduos:
Estaturas
Pesos
X
175 cm
68 kg
s
5,0 cm
2,0 kg
Temos:
5
100 = 2, 85%
175
2
CVP =
100 = 2, 94%
68
Logo, nesse grupo de indivduos, os pesos apresentam maior grau de disperso que as estaturas.
O Coeficiente de variao pode ser usado em um conjunto de dados para determinar a homogeneidade dos mesmos.
O grau de homogeneidade geralmente determinado pelo prprio pesquisador e depende de que tipo de estudo est sendo
feito. Nesse curso usaremos um grau de at 20% para os dados serem considerados homogneos.
CVE =
36
Tabela 32: Informaes sobre sexo, idade (anos), altura (metro e centmetro), peso (kg), estado civil, nmero de irmos,
transporte, procedncia, relao do trabalho com o curso de Estatstica e meio de informao dos alunos da disciplina
Inferncia Estatstica do curso de Estatstica da UEM - 21/03/2005.
No Sexo Id Altura Peso Est.Civil No ir. Transp. Procedncia Trabalho Inform
1
F
20
1,60
58
Solteiro
1
Prprio
Maring
No Rel.
TV
F
26
1,65
59
Solteiro
2
Coletivo
Fora do Pr
No trab. Revista
2
3
F
18
1,64
55
Solteiro
2
Prprio
Maring
No trab.
TV
4
F
25
1,73
60
Solteiro
2
Coletivo Outro no Pr No Rel.
TV
5
M
35
1,76
83
Casado
6
Coletivo Outro no Pr No Rel.
TV
F
20
1,62
58
Solteiro
2
Coletivo Outro no Pr No Rel.
Rdio
6
7
F
29
1,72
70
Solteiro
3
Coletivo
Maring
No trab.
TV
8
M
23
1,71
62
Separado
2
Prprio Outro no Pr No Rel. Internet
9
F
20
1,63
63
Solteiro
2
Prprio
Maring
No trab.
TV
10
M
20
1,79
75
Solteiro
2
Prprio
Fora do Pr
No trab. Internet
M
20
1,82
66
Solteiro
1
Prprio
Fora do Pr
No trab.
TV
11
12
F
30
1,68
46
Solteiro
3
Prprio Outro no Pr Parc.Rel.
TV
F
18
1,69
64
Solteiro
1
Prprio
Maring
Parc.Rel.
TV
13
14
M
37
1,82
80
Casado
2
Prprio
Maring
No Rel.
TV
M
25
1,83
62
Solteiro
1
Prprio Outro no Pr No Rel.
TV
15
16
F
20
1,63
68
Solteiro
2
Coletivo
Maring
No trab.
TV
17
M
21
1,71
80
Solteiro
2
Coletivo
Maring
No Rel. Internet
18
M
25
1,80
82
Casado
1
Prprio Outro no Pr No Rel. Internet
19
F
24
1,62
55
Solteiro
2
Prprio
Maring
No trab.
Jornal
20
M
19
1,74
58
Solteiro
2
Prprio
Maring
Com.Rel.
TV
F
21
1,55
65
Solteiro
1
Prprio
Maring
No trab.
TV
21
22
M
22
1,73
62
Solteiro
0
Prprio
Maring
No trab.
Jornal
6.5
Exerccios
37
Tabela 34: Nmero de atendimentos em servio mdico por funcionrios de uma empresa.
No de Atendimentos 0
1 2 3 4 Total
fi
24 21 3 51 1 100
Estaturas
No de alunos
145`150
2
175`180
8
180`185
7
c) Calcule o primeiro quartil, o quadragsimo centil e o nono decil para o conjunto de dados referente Altura
dos 140 alunos. (Interprete os resultados)
3. Os dados para este exemplo provm de uma jazida de carvo, localizada em Sapopema-PR, na qual foram obtidos
valores para as variveis espessura da camada de carvo, teor de cinzas, teor de enxofre e rendimento para a
obteno de um produto lavrado com 20% de cinzas. Como descrito por Cava (1985) e Landim et al. (1988), esse
depsito situa-se a cerca de 20km a noroeste da Figueira, no nordeste do Estado do Paran, em sedimentos da parte
superior do Membro Triunfo da Formao Rio Bonito.
Espessura
0,8
0,72
0,69
0,8
0,73
1,19
0,94
0,96
1,05
1,32
1,02
1,2 2
1,1
1,18
1,3
1,55
1,57
1,3
1,18
1,4
1,3
1,5
1,4
1,85
1,2
1,23
1,3
1,62
2,09
1,6
1,4
1,41
1,38
1,04
1,31
1,28
0,55
Cinzas
38,6
22,6
39
37,1
40,8
34,1
25
29,3
33
29,7
33,7
6,13
25,41
22,8
19,1
35,1
16,9
20,5
39,1
38,6
27,5
25,4
24,3
57,4
22
27
32,1
36,8
19,5
47,8
43,1
36,6
39,6
31,1
64,8
43,24
27,2
Enxofre
15,2
6,1
7,9
10,1
4,9
7,21
5,79
7,92
7,03
7,32
8,1
7,4
8,6
6
8,1
7,93
6,31
6,27
5,74
8,68
7,75
6,87
6,9
5,6
7,46
5,99
8,07
5,24
5,34
5,93
5,6
8,17
5,12
6,39
5,71
5,4
9,01
Rendimento a 20%
0,81
0,83
0,67
0,99
0,81
1,32
1,32
1,12
1,19
1,37
0,91
1,64
1,49
1,4
2,13
1,75
1,9
1,89
1,32
1,43
1,55
2,03
1,59
1,15
1,77
1,57
1,46
1,77
1,21
1,44
1,18
1,48
1,3
1,28
1,09
1,33
0,82
38
7.1
Momentos
Se X1 , X2 , , Xn so n valores assumidos pela varivel X, define-se a quantidade 12
Pn
xr
X r + X2r + + Xnr
Mr = 1
= i=1 i ,
n
n
i=1 (xi
mr =
Mra =
(11)
a)r fi
n
Pn
(9)
(10)
(8)
(12)
r fi
X)
,
n
i=1 (xi
(13)
i=1
m4 =
x4i
Pn
4
x
i=1
x3i
+ 6
x2
Pn
i=1
x2i
3
x4 ,
i=1
x4i fi
Pn
4
x
i=1
x3i fi
+ 6
x2
Pn
i=1
x2i fi
3
x4 ,
(15)
(16)
(17)
Vantagens: timos estimadores para parmetros populacionais, ex: mdia e varincia; Pode ser utilizado tambm
no clculo dos coeficientes de assimetria e curtose.
Desvantagens: pode ser um pouco trabalhoso ou complicado de calcular; s vezes podemos ter mais de um estimador de momentos;
12 SPIEGEL,
13 NETO,
39
7.2
Assimetria
As medidas de assimetria procuram caracterizar como e quanto a distribuio de frequncias se afastam da condio
de simetria. A medida de assimetria um indicador da forma da distribuio dos dados. Ao construir uma distribuio
de freqncias e/ou um histograma, est-se buscando, tambm, identificar visualmente, a forma da distribuio dos dados
que ou no confirmada pelo coeficiente de assimetria de Pearson (A) definido como: 14
A=
x
mo
.
sx
(18)
Quando |A| < 0, 15, podemos considerar a distribuio como praticamente simtrica. Por outro lado, costuma-se considerar a assimetria como moderada se 0, 15 < |A| < 1, e forte se |A| > 1.
O momento de terceira ordem tambm pode ser usado como medida de assimetria de uma distribuio. Entretanto
mais conveniente a utilizao de uma medida adimencional o que leva a definio do coeficiente de assimetria:
a3 =
m3
.
s3
(19)
Onde: a3 = 0 indica que a distribuio praticamente simtrica, a3 > 0 indica que a distribuio assimtrica positiva e a3 < 0 indica que a distribuio assimtrica negativa. Esse coeficiente indica o sentido da assimetria e, sendo
adimencional, pode ser usado para comparar diversos casos.
Uma distribuio classificada como:
Simtrica: se mdia = mediana = moda.
14 NETO,
40
41
7.3
Curtose
Q3 Q1
.
2(P90 P10 )
(20)
A curtose ou achatamento mais uma medida com a finalidade de complementar a caracterizao da disperso em uma
distribuio. Esta medida quantifica a concentrao ou disperso dos valores de um conjunto de dados em relao s
medidas de tendncia central em uma distribuio de freqncias.
Uma distribuio classificada quanto ao grau de achatamento como:
m4
m4
= 2.
s4
m2
(21)
Este coeficiente adimencional, sendo menor que trs para as distribuies platicrticas, igual a trs para uma distribuio
mesocrtica e maior que trs para as distribuies leptocrticas.
15 SPIEGEL,
42
Resumo: Por curtose entende-se o aplainamento (afilamento ou achatamento) da curva caracterstica do conjunto
ou distribuio. O que a justifica a possibilidade de haver conjuntos e distribuies com idnticas medidas de posio,
de disperso e assimetria.
A curtose mede a divergncia entre a curva considerada e a convencionada como normalmente achatada (tambm se
diz que ela mede a concentrao dos dados em torno do seu centro). curva normalmente achatada d-se o nome de
mesocrtica; mais achatada que ela, platicrtica; menos achatada (ou mais afilada), leptocrtica.
Resumo do Box-Plot: D uma idia da posio, disperso, assimetria, caudas e dados discrepantes. A posio
central dada pela mediana e a disperso pelo desvio interquartlico (dq ). As posies relativas de Q1 , Q2 , Q3 do uma
noo da assimetria da distribuio. Quando tiver em dvidas em classificar um conjunto de dados como simtrico ou no,
pode tentar comparar o formato do box plot com os resultados dos coeficientes de assimetria e tambm com o formato do
polgono de frequncias (ou com histograma).
Exemplo: A construo do grfico Box Plot pode ser exemplificada utilizando os dados a seguir:
1) Ordenar os dados em seqncia crescente:
18
22
18
23
19
24
20
25
20
25
20
25
20
26
20
29
20
30
21
35
21
37
X n +X n +1
2
2. Primeiro Quartil:
Q1 = X 1(n) = X 22
= X5,5 =
4
4
20+20
2
3. Terceiro Quartil:
Q3 = X 3(n) = X 322 = X16,5 =
4
X11 +X12
2
21+22
2
= 21, 5;
= 20;
25+25
2
= 25;
4. Desvio interquartlico:
dq = Q3 Q1 = 25 20 = 5;
5. Limite inferior:
Li = Q1 1, 5dq
Li = 20 1, 5 5 = 12, 5;
6. Limite superior:
Ls = Q3 + 1, 5dq
Ls = 25 + 1, 5x5 = 32, 5;
Construir uma escala com valores (mesma amplitude) que incluam os valores mximo e mnimo dos dados. Construir
uma caixa (retangular) estendendo-se de Q1 a Q3 , e trace uma linha na caixa no valor da mediana.
As figuras a seguir mostraro passo a passo como fazer o box-plot:
43
44
No conjunto de dados no existe aluno com idade inferior a 12,5, ou seja, no h aluno com idade considerada
discrepante inferiormente, logo o limite inferior do grfico ser o menor valor da amostra (Xmin ). Entretanto, existem
dois indivduos cujas idades so superiores a 32,5, pontos estes considerados discrepantes neste conjunto de dados: as
idades 35 e 37. Estes pontos so identificados no diagrama de caixas por meio de um pontinho e o limite superio do
grfico ser o Ls calculado.
Note-se que no intervalo interquartlico (dentro do retngulo) existem 50% dos dados, dos quais, 25% esto entre a
linha da mediana e a linha do primeiro quartil e os outros 25% esto entre a linha da mediana e a linha do terceiro quartil.
Cada linha da cauda mais os valores discrepantes contm os 25% restantes da distribuio. A Figura 18 mostra que a
distribuio das idades dos alunos apresenta assimetria positiva, ou seja, dispersam-se para os valores maiores.
muito frequente o interesse em verificar se duas variveis qualitativas apresentam-se associadas, isto , se o
conhecimento de uma varivel ajuda a entender uma outra varivel. Por exemplo, sabendo-se que determinado tipo de
doena est associado com o hbito de fumar, o governo pode promover campanha para alertar a populao. 17
Exemplo:
A Tabela 36 mostra trs distribuies de frequncias, uma para cada regio preferencial (regio indicada para o
cultivo de milho). Dizemos que esta tabela bidimencional, pois apresenta a distribuio de duas variveis: resistncia
ferrugem e regio preferencial.
Tabela 36: Distribuio de frequncias da resistncia ferrugem de hbridos de milho, segundo as regies preferenciais.
Resistencia
Regio Preferencial
ferrugem Chapec Campos Novos Iara Total
r
10
3
12
25
mr
6
12
2
20
ms
9
3
3
15
s
7
1
2
10
Total
32
19
19
70
Fonte: ANDRANDE, Dalton; OGLIARI, Paulo. Estatstica para Cincias Agrrias e Biolgicas, Editora UFSC. 2007.
Dalton; OGLIARI, Paulo. Estatstica para Cincias Agrrias e Biolgicas, Editora UFSC. 2007.
45
Figura 19: Distribuio das porcentagens da resistncia a ferrugem de hbridos de milho para as regies
Fonte: Tabela 37.
Exerccio Resolvido
Um estudo sobre o tempo de vida de duas amostras de Biomphalaria straminea (Amostra A: 45 indivduos agrupados numa bacia e Amostra I: 49 indivduos isolados em copos de vidro), produziu os resultados da Tabela 38 :
Tabela 38: Nmero de indivduos classificados segundo o tempo de vida, em dias, para duas condies de agrupamento.
Tempo de vida Condies de Agrupamento Total
(em dias)
Agrupados
Isolados
58 a 179
3
6
9
180 a 300
6
19
25
301 a 422
36
24
60
Total
45
49
94
Fonte: ANDRANDE, Dalton; OGLIARI, Paulo. Estatstica para Cincias Agrrias e Biolgicas, Editora UFSC. 2007.
a) Dos indivduos submetidos condio de Agrupados, qual a porcentagem de indivduos com tempo de vida entre
301 e 422?
b) Dos indivduos submetidos condio de Isolados, qual a porcentagem de indivduos com tempo de vida de no
mximo 300 dias?
c) Voc concluiria que o tempo de vida est relacionado com a condio de agrupamento? Justifique.
Respostas:
a) De um total de 45 indivduos submetidos condio de Agrupados, a porcentagem dos que apresentaram tempo de
vida entre 301 e 422 : 36/45 = 0,80 ou 0,80 100 = 80%.
b) Do total de 49 indivduos submetidos condio de Isolados, 25 (= 6 + 19) indivduos sobreviveram no mximo
300 dias. Este valor corresponde a (25/49)100 = 51,02%.
c) Sim, pois pode-se verificar que enquanto 80% dos indivduos submetidos condio de Agrupados sobreviveram
entre 301 e 422 dias, somente 48,98% (= 24/49)100 sobreviveram entre 301 e 422 dias na condio de Isolados.
9.1
Medidas de Associao
At agora, vimos como as tabelas bidimencionais (ou tabelas de contigncia) podem ser utilizadas para verificar
uma possvel associao entre duas variveis. Agora iremos aprender como medir a grandeza dessa associao atravs de
medidas estatsticas que indiquem se existe ou no relao entre duas variveis qualitativas e qual a sua magnitude, isto ,
a grandeza da associao. No caso de estarmos trabalhando com variveis quantitativas, elas podem ser categorizadas e
transformadas em variveis qualitativas. Por exemplo, na varivel Rendimento Mdio de hbridos de milho para a regio
46
de Chapec, podemos dividir a amostra em trs categorias: menor do que 1500kg/ha (rendimento baixo), maior ou igual
a 1500 e menor ou igual a 3000 (rendimento normal) e maior do que 3000 (rendimento alto). 18
Coeficiente de Contigncia de Pearson
Existem vrias medidas de associao e seu uso depende do tipo e finalidade do estudo. Neste curso usaremos
uma medida de associao comumente utilizada, que o Coeficiente de contigncia de Pearson. Podemos atravs desse
coeficiente, por exemplo, verificar a grandeza da associao entre condies de agrupamento (isolados ou agrupados) e
tempo de vida dos caramujos.
Karl Pearson props o chamado coeficiente de contigncia, representado pela letra C, definido por:
s
2
,
(22)
C=
2
+n
onde n o nmero total de observaes e 2 uma estatstica dada por:
2 =
s X
r
X
(f oij f eij )2
,
f eij
i=1 j=1
(23)
onde f oij e f eij so as frequncias observadas e esperadas da i-sima linha e j-sima coluna, respectivamente; s e r
so o nmero de linhas e o nmero de colunas da tabela. No exemplo a seguir ser mostrado como obter as frequncias
esperadas f eij .
Este coeficiente nem sempre est entre zero e um, um fator de correo foi proposto para facilitar a interpretao:
C = p
C
t(t 1)
(24)
de que os pssaros alimentam-se nestes trs locais da floresta nas mesmas propores na primavera e no outono. Em outras
palavras, o pesquisador formulou a hiptese de que no existe associao entre as duas variveis.
a) Voc concordaria com a hiptese formulada pelo pesquisador? Justifique utilizando porcentagens e o Coeficiente
de Contigncia de Pearson.
b) Faa um grfico de barras mltiplo para representar os dados da Tabela 39.
Obs: Este exerccio ser feito em sala de aula.
9.2
Exerccios
1. Na Tabela 40 esto apresentados resultados de um experimento no qual um pesquisador est procurando verificar se
existe associao entre hbito de crescimento (3 = indeterminado trepador e 4 = indeterminado prostado) e porte (Tr =
trepador, EB = ereto na base e Pr = prostado) na cultura de feijo de vagem.
a) Construa a tabela da distribuio de frequncia conjunta para as variveis hbito de crescimento e porte;
b) Faa um grfico de coluna mltipla para a distribuio de frequncia conjunta do item (a);
c) Para os dados da Tabela 40 podemos considerar que o hbito est associado com o porte? Se houver associao,
qual a grandeza da mesma?
47
Tabela 40: Hbito de crescimento (H) e porte (P) para 50 materiais de feijo de vagem.
H
P H
P H
P H
P H
P
4
Tr
4
Tr
4 Tr
4 Pr
4 Tr
4
Tr
4 Tr
4 Tr
3 Pr
4 EB
3
Pr
3
Pr
3 Tr
4 Pr
3 Pr
3
Pr
4 Tr
3 Pr
3 Pr
4
Tr
4
Tr
3
Pr
4 Tr
4 Tr
4 Tr
4
Tr
3 EB
4 Tr
3 Pr
4 Tr
4 EB
4 Tr
4 Pr
4 Tr
3
Pr
3 EB
4 EB
4 Tr
3 Pr
4 Tr
4
Tr
3 Pr
4 Tr
3 Pr
4
Tr
4
Tr
4
Tr
4 Tr
4 Tr
4 Tr
Fonte: ANDRANDE, Dalton; OGLIARI, Paulo. Estatstica para Cincias Agrrias e Biolgicas, Editora UFSC. 2007.
Tabela 41: Distribuio de frequncias conjunta de plantas segregando para dois caracteres numa prognie da espcie
X.
Ciclo
Virescncia
Total
Normal Virescente
Tardio
3470
910
4380
Precoce
1030
290
1320
Total
4500
1200
5700
Fonte: ANDRANDE, Dalton; OGLIARI, Paulo. Estatstica para Cincias Agrrias e Biolgicas, Editora UFSC. 2007.
2. Os dados da Tabela 41 tm por objetivo verificar se os caracteres ciclo (Tardio e Precoce) e Virescncia (Normal e
Virescente), de uma prognie da espcie X, segregam de forma independentemente.
a) Construa a tabela da distribuio de frequncia relativa percentual conjunta para as variveis Ciclo e Virescncia e
verifique se os dois pares de genes so herdados independentemente ou existe associao;
b) Faa um grfico de coluna mltipla para a distribuio de frequncia conjunta do item (a);
3. Um economista agrcola est estudando fatores que afetam a adoo de uma nova variedade de arroz altamente produtiva. Os resultados esto na Tabela 42.
Tabela 42: Distribuio de frequncias conjunta referente a fatores que podem afetar a adoo de uma nova variedade de
arroz.
Posse
Adoo
Total
Adota No Adota
Proprietrio
102
26
128
Vrios arrendatrios
42
10
52
nico arrendatrio
5
2
7
Total
149
38
187
Fonte: ANDRANDE, Dalton; OGLIARI, Paulo. Estatstica para Cincias Agrrias e Biolgicas, Editora UFSC. 2007.
Dalton; OGLIARI, Paulo. Estatstica para Cincias Agrrias e Biolgicas, Editora UFSC. 2007.
48
Tabela 43: Distribuio de frequncias conjunta da Germinao de sementes de duas cultivares de cebola.
Cultivares
Germinao
Total
Germinaram No germinaram
Bola Precoce
392
8
400
Norte 14
381
19
400
Total
773
27
800
Fonte: ANDRANDE, Dalton; OGLIARI, Paulo. Estatstica para Cincias Agrrias e Biolgicas, Editora UFSC. 2007.
b) Verifique se existe associao entre entre as cultivares e a germinao de sementes. Justifique utilizando porcentagens e o Coeficiente de Contigncia de Pearson.
5. Determinado posto de qualidade de um laticnio retira uma amostra dos pesos dos litros de leite produzidos em um dia,
classificando-os de acordo com seu tipo (B, C, UHT), e condies de peso (dentro ou fora das especificaes). A Tabela
46 mostra a distribuio de frequncias conjunta de 6.850 unidades de leite, disposta numa tabela de contingncia.
Tabela 44: Distribuio de frequncias conjunta do tipo de leite e condio do peso.
Condies do Peso
Tipo do Leite
Total
B
C
UHT
Dentro das especificaes 500 4.500 1.500 6.500
Fora das especificaes
30
270
50
350
Total
530 4.770 1.550 6.850
Fonte: Dados extrados da dissertao de mestrado de Luciana S.C.V da Silva - Programa de Ps-graduao em engenharia de produao/ UFSC, 2001.
a) Faa um grfico mostrando o comportamento dos Tipos de leite com relao s Condies de Peso. Interprete os
resultados.
b) Verifique se existe associao entre os Tipos de leite e as Condies de Peso. Justifique utilizando porcentagens e o
Coeficiente de Contigncia de Pearson.
6. Uma metalrgica produz grandes quantidades de parafusos, trabalhando em trs turnos. O setor da qualidade deseja
verificar se o desempenho dos turnos semelhante, o que poderia ser avaliado atravs das propores de peas aprovadas,
direcionadas a retrabalho ou rejeitadas. Como parte do Controle Estatstico de Processos, amostras aleatrias de parafusos
so coletadas de cada turno. Uma dessas amostras, com a classificao das peas est mostrada na tabela a seguir:
Tabela 45: Distribuio de frequncias conjunta da situao das peas e turno.
Situaes das Peas
Turno
Total
Matutino Vespertino Noturno
Aprovadas
432
456
424
1.312
Retrabalho
185
190
180
555
Rejeitadas
45
48
39
132
Total
530
4.770
1.550
6.850
Fonte: BARBETTA, Pedro A.; REIS, Marcelo M. e BORNIA, Antonio C. Estatstica para cursos de Engenharia e informtica. So Paulo: Editora Atlas S.A., 2004.
a) Faa um grfico mostrando a Situao das peas com relao ao Turno. Interprete os resultados.
b) Verifique se existe associao entre a Situao das peas e o Turno. Justifique utilizando porcentagens e o Coeficiente de Contigncia de Pearson.
10
10.1
comum na prtica, o interesse em se analisar o comportamento conjunto de duas ou mais variveis quantitativas.
Nesta seo trataremos do estudo de correlao entre duas variveis quantitativas. Suponha que seja de interesse obter
uma medida estatstica que indique se existe ou no relao entre duas variveis e se existe relao qual a sua magnitude
e sinal. Veja alguns exemplos:
49
Diagrama de Disperso
O primeiro passo para verificar a possvel correlao entre duas variveis quantitativas, em termos de um conjunto
de elementos em que se observem essas duas variveis, atravs do diagrama (ou grfico) de disperso, em que os valores
destas variveis so representados por pontos, num sistema cartesiano. Esta representao feita sob forma de pares
ordenados (X, Y), onde X um valor observado de uma varivel e Y o correspondente valor da outra varivel.
Exemplo 1 - Nmeros de anos de servio e nmero de clientes de 10 agentes de uma companhia de seguros:
Tabela 46: Nmeros de anos de servio e No de clientes de 10 agentes de uma companhia de seguros.
Agente Anos de servio (X) No de clientes (Y )
A
2
48
B
4
56
C
5
64
D
6
60
E
8
72
F
2
45
G
3
57
H
7
80
I
6
75
J
3
47
Na Figura 20 esto representados os pares (X, Y ) observados na Tabela 46. Atravs da observao da disposio
dos pontos, conclu-se que h uma dependncia entre as variveis, porque no conjunto medida que aumenta o tempo de
servio, aumenta o nmero de clientes. Temos ento uma correlao positiva.
50
Exemplo 2 - Numa pesquisa com 10 famlias com renda bruta mensal entre 10 e 60 salrios mnimos, mediu-se:
Y: a % da renda bruta anual gasta com assistncia mdica. X: renda bruta mensal (expressa em no de salrios-mnimos).
Tabela 47: Dados referentes a renda bruta anual gasta com assistncia mdica e No de salrios mnimos por famlia.
Famlia X
Y
A 12 7,2
B 16 7,4
C 18 7,0
D 20 6,5
E 28 6,6
F 30 6,7
G 40 6,0
H 48 5,6
I 50 6,0
J 54 5,5
Figura 21: Grfico de disperso da Renda bruta anual e gasto com assistncia mdica.
Observando a Figura 21, nota-se que existe uma dependncia inversa, ou seja, uma correlao negativa, aumentando a renda bruta, diminui a porcentagem da mesma, gasta em assistncia mdica.
51
Exemplo 3 - Oito indivduos foram submetidos a um teste sobre conhecimento de lngua estrangeira e, em seguida,
mediu-se o tempo gasto por cada um para aprender operar uma determinada mquina. Assim,
X: resultado obtido no teste (mximo 100 pontos)
Y: tempo em minutos necessrio para aprender operar satisfatoriamente a mquina.
Tabela 48: Dados referentes ao resultado de um teste sobre conhecimento em lngua estrangeira e tempo gasto para
aprender a operar uma determinada mquina.
Indivduos X
Y
A 45 343
B 52 368
C 61 355
D 70 334
E 74 337
F 76 381
G 80 345
H 90 375
Figura 22: Grfico de disperso do resultado obtido no teste e tempo em minutos necessrio para aprender operar satisfatoriamente a mquina.
Do diagrama de disperso, Figura 22, conclui-se que parece no haver nenhum tipo de dependncia entre as duas
variveis, pois conhecer o resultado do teste no ajuda prever o tempo gasto para aprender a operar a mquina.
10.1.2
O coeficiente de correlao linear de Pearson, representado pela letra r, utilizado para quantificar a correlao
entre duas variveis quantitativas. Assume valores no intervalo [-1,+1] e calculado por:
P
P P
n( xy) ( x y)
p P
r = Corr(X, Y ) = p P
(25)
P
P
n( x2 ) ( x)2 n( y 2 ) ( y)2
onde r = 1 indica uma relao linear negativa perfeita, r = 1 indica uma relao linear positiva perfeita e r = 0 indica
que no h relao linear entre as variveis. Pode haver outro tipo de relao entre X e Y .
Para obter os somatrios da equao de r procede-se da seguinte maneira:
P
xy:
Fazem-se os produtos X Y , referente a cada par de observaes e depois efetua-se a soma;
P
x:
Somam-se
os valores da varivel X;
P
y: Somam-se os valores da varivel Y ;
52
P 2
P x2 : Elevam-se ao quadrado cada valor de X e, depois, efetua-se a soma.
y : Elevam-se ao quadrado cada valor de Y e depois efetua-se a soma.
Exemplo: Considere as seguintes variveis:
Y - consumo de cerveja em um dia (em 100 litros); e
X - temperatura mxima (em o C).
Estas variveis foram observadas em nove localidades com as mesmas caractersticas demogrficas e scio-econmicas.
A seguir, veja a tabela com os dados amostrais.
Tabela 49: Dados referentes a consumo de cerveja em um dia (em 100 litros) e temperatura mxima (em o C).
Temperatura Consumo
16
290
31
374
38
393
39
425
37
406
36
370
36
365
22
320
10
269
Verifique atravs do coeficiente de correlao se existe associao entre as variveis e plote os dados num grfico
de disperso.
10.2
A anlise estatstica de um conjunto de dados pode ser realizada atravs de uma variedade de mtodos existentes.
A escolha do mtodo a ser utilizado deve estar de acordo com o tipo de informao disponvel e os objetivos que se deseja
alcanar. Considere as seguintes situaes:
Um estado implementa novas punies severas para motoristas bbados; Qual o efeito disso sobre sobre os
acidentes fatais nas estradas?
Uma diretoria regional de ensino reduz o tamanho de suas turmas do ensino fundamental; qual o efeito disso sobre
as pontuaes dos alunos nos exames nacionais?
Voc conclui com sucesso mais um ano de estudos da universidade; qual o efeito disso sobre seu salrio futuro?
O modelo de regresso linear relaciona uma varivel X, a outra Y . Como Y afetado por X, Y chamada de varivel
dependente e X de varivel independente. Exemplos de Y e X:
Y : consumo X: Renda;
Y : Salrio X: Anos de estudo;
Y : Vendas X: Gastos com propaganda.
O modelo usado com maior freqncia o linear, na forma:
Yi = + Xi + ei ,
i = 1, , n.
(26)
onde:
i) Yi : varivel resposta (dependente) de interesse relativa ao indivduo i;
ii) Xi : varivel explicativa (independente);
iii) ei : erro aleatrio no observvel, aquilo que no possvel "prever"atravs do modelo;
iv) e coeficientes de inclinao e angular da reta, respectivamente. Esses parmetros so desconhecidos e precisam
ser estimados.
Dentre os mtodos de estimao o mais utilizado na anlise de regresso o mtodo dos mnimos quadrados. Isto se deve
em grande parte a simplicidade computacional e matemtica do mesmo, e o que ainda mais importante, est presente
em praticamente todos os pacotes de programas estatsticos disponveis no mercado. Alm disso, o aspecto inferencial
amplamente desenvolvido e divulgado.
53
= y x
(27)
P
yi xi n
yx
= P 2
2
x
xi n
(28)
Coeficiente de Determinao - R2
O coeficiente de determinao R2 , tambm chamado de lucro relativo, representa o poder explicativo da regresso
e tem por objetivo avaliar a qualidade do ajuste. Seu valor fornece a proporo da variao total da varivel Y explicada
pela varivel X atravs da funo ajustada. Pode-se expressar R2 por:
P
(xi x
)2
2
2
R = P
(29)
(yi y)2
10.3
Exerccios
1. Considere os seguintes dados amostrais obtidos de um estudo da relao entre o nmero de anos que os candidatos
a certo emprego no exterior estudaram alemo no curso secundrio ou na faculdade, e as notas obtidas em um teste de
proficincia naquela lngua:
Indivduo
No de Anos (X)
Nota do teste (Y )
1
3
57
2
4
78
3
4
72
4
2
58
5
5
89
6
3
63
7
4
73
8
5
84
9
3
75
10
2
48
X
Y
0
2,2
2
1,2
4
1,5
6
1,4
8
1,1
10
1,1
12
0,9
1
18
520
2
159
190
3
118
208
4
115
213
5
22
310
6
127
194
7
111
160
0,2
9,4
0,5
11,4
0,6
12,3
0,7
10,2
1,0
11,9
1,5
13,6
2,0
14,2
2,5
16,2
3,0
16,2
3,5
17,7
4,0
18,8
4,5
19,9
5,0
22,5
5,5
24,7
6,0
23,1
18
9
10
125
14
57
11
90
16
22
13
79
a) Ajuste uma reta de mnimos quadrados com a qual possamos predizer a procura do produto em termos do seu preo;
b) Interprete os coeficientes do modelo;
c) Calcule o coeficiente de correlao entre as duas variveis e interprete;
6. Os dados a seguir mostram as despesas com propaganda (expressas em percentagem das despesas totais) e o lucro
lquido operacional (expresso em percentagem do total de vendas) em uma amostra de 6 drogarias:
a) Ajuste uma reta de mnimos quadrados que permita predizer o lucro operacional lquido em termos das despesas
com propaganda;
b) Interprete os coeficientes do modelo;
c) Calcule o coeficiente de correlao entre as duas variveis e interprete;
d) Calcule o coeficiente de determinao do modelo e interprete;
55
7. Uma indstria submete seus operrios a um teste de aptido, e trs meses depois mede a produtividade desses operrios.
Os resultados obtidos de uma amostra de 6 operrios, esto na tabela abaixo.
aptido (X)
produtividade (Y )
22
48
26
52
15
25
19
40
20
43
18
30
a) Determine a reta de regresso que se ajuste aos dados. Interprete os coeficientes obtidos;
b) Se um operrio tira 24 no teste de aptido, qual a sua produtividade esperada, depois de trs meses?
8. A tabela abaixo apresenta dados referentes a idade X e a presso sistlica Y para um grupo de 12 mulheres.
X
Y
56
147
42
125
72
160
36
118
63
149
47
128
56
55
150
49
145
38
115
42
140
68
152
60
155
Referncias
[1] ANDRANDE, Dalton; OGLIARI, Paulo. Estatstica para Cincias Agrrias e Biolgicas, Editora UFSC. 2007.
[2] BUSSAB, W.O.; MORETTIN, P.A. Estatstica Bsica. 4a ed., Atual Editora, S.P., 2010.
[3] BARBETTA, Pedro A.; REIS, Marcelo M. e BORNIA, Antonio C. Estatstica para cursos de Engenharia e informtica. So Paulo: Editora Atlas S.A., 2004.
[4] CRESPO, A.A.; Estatstica Fcil. Editora: Saraiva.
[5] FONSECA, J.S.; MARTINS, G. de A. Curso de estatstica, 4a ed., Editora Atlas, SP., 2010.
[6] JAY L. DEVORE, Probabilidade e Estatstica para Engenharia e Cincias, Editora THOMSON, SP, 2006.
[7] JOHN E. FREUND, Estatstica Aplicada Economia, Administrao e Contabilidade, 11a ed., Editora Artmed Bookman, SP., 2006.
[8] LIMA, A.C.Pedroso; MAGALHES, M.Nascimento. Noes de Probabilidade e Estatstica. Editora Edusp. 2004.
[9] MILONE, Giuseppe. Estatstica Geral e Aplicada. So Paulo: Pioneira Thomson Learning, 2004.
[10] MORETTIN, Luiz Gonzaga. Estatstica Bsica. 7a ed. Editora Makron Books. Vols. 1 e 2. 1999.
[11] NETO, P.L.O.Costa. Estatstica, 2a Edio, Editora Edgard Blcher Ltda. 2002.
[12] SPIEGEL, Murray R. Estatstica, 3a Edio. Editora Pearson. 1993.
[13] STEVENSON, W.J. Estatstica aplicada administrao. Traduo de Alfredo Alves de Farias. Harbra, S.P., 1981.
57