Beruflich Dokumente
Kultur Dokumente
Todos os direitos reservados. Nenhuma parte desta obra pode ser reproduzida ou transmitida por qualquer forma e/ou
quaisquer meios (eletrnico, incluindo fotocpia e gravao) ou arquivada em qualquer sistema ou banco de dados sem
permisso escrita da Universidade Paulista.
Comisso editorial:
Dra. Anglica L. Carlini (UNIP)
Dra. Divane Alves da Silva (UNIP)
Dr. Ivan Dias da Motta (CESUMAR)
Dra. Ktia Mosorov Alonso (UFMT)
Dra. Valria de Carvalho (UNIP)
Apoio:
Profa. Cludia Regina Baptista EaD
Profa. Betisa Malaman Comisso de Qualificao e Avaliao de Cursos
Projeto grfico:
Prof. Alexandre Ponzetto
Reviso:
Juliana Maria Mendes
Amanda Casale
Sumrio
Estatstica
APRESENTAO.......................................................................................................................................................7
INTRODUO............................................................................................................................................................7
Unidade I
1 CONCEITOS FUNDAMENTAIS..........................................................................................................................9
1.1 Conceitos iniciais......................................................................................................................................9
1.2 Dados.......................................................................................................................................................... 10
1.3 Populao x amostra.............................................................................................................................11
1.4 Amostragem ............................................................................................................................................11
2 DISTRIBUIO DE FREQUNCIAS.............................................................................................................. 14
2.1 Conceitos bsicos.................................................................................................................................. 14
2.2 Elementos de uma distribuio de frequncia.......................................................................... 18
2.2.1 Classe (i)....................................................................................................................................................... 18
2.2.2 Limites de classe (li e Li)........................................................................................................................ 18
2.2.3 Amplitude de classe (hi)........................................................................................................................ 18
2.2.4 Amplitude amostral (AA)...................................................................................................................... 18
2.2.5 Ponto mdio de classe (xi).................................................................................................................... 19
4 MEDIDAS DE DISPERSO.............................................................................................................................. 34
4.1 Introduo................................................................................................................................................ 34
4.2 Varincia (s2)............................................................................................................................................ 35
4.2.1 Dados no agrupados............................................................................................................................ 35
4.2.2 Distribuio de frequncias sem intervalo.................................................................................... 36
4.2.3 Distribuio de frequncias com intervalo................................................................................... 37
7 CORRELAO LINEAR..................................................................................................................................... 66
7.1 Conceitos e diagrama de disperso............................................................................................... 66
8 COEFICIENTE DE PEARSON........................................................................................................................... 68
APRESENTAO
Este livro-texto contempla os temas fundamentais para um curso de Introduo Estatstica, que na
maioria das instituies de ensino superior ou tcnico tem durao semestral.
A grande quantidade de exerccios de fixao e a preocupao em explicar os mtodos de clculo,
passo a passo, sem excesso de texto, so os pontos marcantes deste material, que tem como objetivo
ensinar os conceitos bsicos de Estatstica para um pblico que no lida diariamente e/ou tem pouca
desenvoltura com a Matemtica.
O pr-requisito para acompanhar esta obra somente a Matemtica do primeiro grau, atualmente
chamado de Ensino Fundamental, o que atende principalmente aos cursos que no so de Exatas, pois
nestes a Matemtica exercitada a todo o momento, nas mais diversas disciplinas, tais como Fsica,
Clculo, Programao de Computadores etc.
Espero que esta obra ajude o leitor a compreender os conceitos bsicos de Estatstica de maneira
mais leve, porm bastante consistente.
INTRODUO
Este livro-texto aborda os assuntos fundamentais da Estatstica, desde o estudo de uma varivel at
a introduo ao estudo do comportamento mtuo de duas variveis.
A Unidade I cobre os conceitos introdutrios, porm importantssimos para o entendimento do
restante do material, a organizao de dados em tabelas de frequncia, a obteno de medidas de
tendncia e posio e a determinao de medidas de disperso e variabilidade. Esses tpicos fazem parte
da Estatstica Descritiva (responsvel por organizar e descrever os dados coletados).
A Unidade II cobre os conceitos de probabilidade simples (que tambm so abordados na disciplina
Matemtica), distribuio normal de probabilidades e a determinao da correlao entre duas variveis,
por meio do diagrama de disperso e do coeficiente de Pearson.
Cada unidade pode ser ministrada em um bimestre, se o curso introdutrio de Estatstica for de duas
horas-aula semanais. Vale lembrar que o material tem como leitor-alvo o aluno de graduao dos cursos
da rea de Humanas e Cincias Sociais Aplicadas.
Espero que este livro auxilie o aluno com pouca desenvoltura em Matemtica a entender e aplicar
os conceitos bsicos de Estatstica, alm de servir como guia para qualquer aluno relembrar Estatstica
rapidamente.
ESTATSTICA
Unidade I
1 CONCEITOS FUNDAMENTAIS
1.1 Conceitos iniciais
A palavra estatstica tem origem do vocbulo latino status, que significa estado, e foi utilizada para
o levantamento de dados por parte do Estado, visando tomada de decises.
Atualmente a Estatstica parte da Matemtica Aplicada que se dedica ao estudo e interpretao
de fenmenos coletivos e deles extrai concluses.
A Estatstica fornece mtodos para:
coleta de dados, feita normalmente por meio de um questionrio ou da observao direta do
fenmeno estudado;
organizao e descrio dos dados;
anlise e interpretao dos dados visando tomada de decises.
A Estatstica pode ser aplicada s mais diversas reas do conhecimento, tais como Economia, Fsica,
Medicina, Psicologia, Engenharia, Pedagogia e Servio Social, para tabular e interpretar os resultados de
um experimento, e, mais recentemente, para a gerao e a interpretao de indicadores.
Esses indicadores so largamente utilizados na gesto dos mais diversos segmentos do conhecimento.
Para um aluno de qualquer curso superior, a Estatstica muito importante para:
organizar e analisar os dados de um experimento cientfico/observao de um fenmeno em
qualquer rea do conhecimento;
servir de embasamento para entender, analisar e at criar indicadores relevantes em seu trabalho
(entendendo que, muitas vezes, o egresso de um curso superior pode assumir um cargo de gerncia
no seu segmento de formao).
Podemos citar como exemplos de indicadores: o ndice de desenvolvimento humano (IDH) de
uma determinada localidade, a taxa de evaso de clientes de uma empresa de telefonia e os vrios
indicadores de aprendizado utilizados na educao.
Unidade I
A Estatstica pode ser classificada em:
descritiva: responsvel pela coleta, organizao e descrio dos dados;
indutiva: responsvel pela anlise e interpretao dos dados.
1.2 Dados
Qualitativos
Quantitativos
Discretos
Contnuos
Figura 1 Classificao dos dados em Estatstica
10
ESTATSTICA
Observao
A classificao da varivel depende do contexto. Por exemplo: para fins
cadastrais, a varivel idade poderia ser quantitativa discreta; na Pediatria,
porm, contnua, pois a parte fracionria tambm considerada.
1.3 Populao x amostra
Populao o conjunto de entes portadores de, no mnimo, uma caracterstica comum; tambm
chamada de universo estatstico. Um exemplo so os estudantes de uma instituio de ensino, pois
a caracterstica comum o fato de estudarem na mesma instituio. Os eleitores de um estado da
federao tambm so um exemplo.
Na maioria das vezes, podemos concluir que invivel ter acesso a toda a populao para a coleta
de dados (por limitaes monetrias, de tempo etc.). Logo, normalmente feita a coleta em uma parte,
que deve ser muito representativa dessa populao. Tal parcela denominada amostra.
Amostra corresponde ao subconjunto finito e representativo de uma populao. Para obtermos
uma boa amostra, utilizamos a tcnica da amostragem.
1.4 Amostragem
Sorteio
Amostra
Populao
Figura 2 Amostragem simples
7 4 1
Amostra
11
Unidade I
Observao: perodo de trs (elementos coletados, iniciando do primeiro e em seguida coletando de
trs em trs).
Na amostragem estratificada, a populao encontra-se dividida em vrios estratos, e as amostras
so coletadas aleatoriamente de cada estrato.
Amostra
Populao
Figura 4 Amostragem estratificada
Saiba mais
Aps a leitura e a compreenso deste material, voc pode aprofundar
os estudos em amostragem (para compreender assuntos como tamanho e
nvel de confiana de amostra), lendo o livro a seguir:
BRUNI, A. L. Estatstica aplicada gesto empresarial. So Paulo: Atlas,
2007.
Exemplos de Aplicao
1. Cite pelo menos dez aplicaes da Estatstica (pesquise em jornais e sites da internet).
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
________________________________________________________________________________
2. Defina os termos amostra e populao.
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
________________________________________________________________________________
12
ESTATSTICA
3. O que so dados qualitativos?
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
________________________________________________________________________________
4. O que so dados quantitativos discretos e quantitativos contnuos?
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
________________________________________________________________________________
5. D pelo menos oito exemplos para cada tipo de dado:
a) Qualitativo
__________________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
b) Quantitativo discreto
__________________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
c) Quantitativo contnuo
__________________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
6. Pesquise um exemplo prtico para cada tipo de amostragem.
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
________________________________________________________________________________
13
Unidade I
2 DISTRIBUIO DE FREQUNCIAS
2.1 Conceitos bsicos
Para compreender todos os conceitos, ser utilizada uma amostra como exemplo. A amostra de
quarenta alunos de uma escola qualquer, e a varivel a ser estudada a estatura deles em centmetros.
Segue a tabela dos valores de estaturas (em cm) coletados:
Tabela 1 Tabela primitiva das estaturas dos alunos
166
161
162
165
164
162
168
156
160
164
155
163
155
169
170
154
156
153
156
158
160
150
160
167
160
161
163
173
155
168
152
160
155
151
164
161
172
157
158
161
Essa tabela com os dados coletados (dados brutos), sem nenhuma organizao, chamada de tabela
primitiva.
Analisando os dados na tabela primitiva, para determinar a maior e a menor estatura, ser necessrio
examinar item a item, o que tende a ser ineficiente, principalmente se o tamanho da amostra for grande.
Logo, se os dados da tabela forem organizados em ordem crescente ou decrescente, ser obtida uma
nova tabela chamada de rol.
Tabela 2 Rol das estaturas dos alunos
150
155
160
162
166
151
156
160
162
167
152
156
160
163
168
153
156
160
163
168
154
157
161
164
169
155
158
161
164
170
155
158
161
164
172
155
160
161
165
173
Examinando o rol, fica fcil determinar a maior e a menor estatura (173 e 150 cm, respectivamente),
o que permite concluir que a faixa de estaturas de 150 a 173 cm. Outros questionamentos, como: Qual
a estatura com o maior nmero de alunos? (160 cm) e Qual(is) (so) a(s) estatura(s) inexistente(s) no
14
ESTATSTICA
intervalo de 150 a 173 cm? (159 e 171 cm), podem ser respondidos, porm com uma observao mais
cuidadosa do rol.
Para responder ao questionamento anterior com mais agilidade, o rol ser alocado em uma
tabela, em que cada estatura ter um nmero correspondente de ocorrncias (vindo da contagem
do rol).
Tabela 3 Tabela de ocorrncias das estaturas dos alunos
Estatura (cm)
Nmero de ocorrncias
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
Esta tabela de ocorrncias para todos os valores das estaturas chamada de distribuio
de frequncias. Nesse caso, como foram exibidos todos os valores de estatura, esta distribuio
classificada como sem intervalo.
15
Unidade I
Tabela 4 Distribuio de frequncias sem intervalo para as estaturas dos alunos
Estatura (cm)
Fi
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
fi
40
Onde:
fi = frequncia (nmero de ocorrncias para cada valor de estatura)
fi = n
fi = soma das frequncias
n = nmero de elementos da amostra (n = 40)
A amostra das estaturas tem a faixa de estaturas de 23 cm (basta subtrair a maior da menor estatura),
que resulta numa tabela com muitas linhas. Se a faixa de estaturas fosse maior, a tabela teria ainda mais
linhas, o que prejudicaria a anlise rpida dos dados.
Para gerar uma tabela mais enxuta e de fcil anlise, possvel agrupar as estaturas em intervalos. No
exemplo, as estaturas sero agrupadas de quatro em quatro, gerando intervalos de 4 cm (no momento,
16
ESTATSTICA
no h a necessidade de preocupar-se com a razo de o agrupamento ser de quatro em quatro, pois
adiante ser explicado o critrio de clculo utilizado). Essa tabela chamada de distribuio de
frequncias com intervalo.
Tabela 5 Distribuio de frequncias com intervalo para as estaturas dos alunos
Estaturas (cm)
fi
150 154
154 158
158 162
11
162 166
166 170
170 174
fi
40
Onde:
o operador de intervalo.
Inclui o valor
Exemplo:
O quinto intervalo da tabela anterior que mostra 166 170 para as estaturas de 166 a 169 cm
(note que o valor 170 cm considerado no sexto). Os valores do rol que atendem a esse intervalo so:
166, 167, 168, 168 e 169. Estes cinco valores resultam na frequncia igual a 5 para o quinto intervalo.
A etapa da contagem dos valores do rol para a tabela de frequncias deve ser feita com o mximo de
cuidado, pois um erro na contagem ocasiona anlises equivocadas e valores errados de todas as medidas
estatsticas feitas a partir dessa tabela.
Saiba mais
O modelo de distribuio estudado o mais utilizado pelos autores,
porm existem outros modelos, com outros tipos de intervalo alm do .
Matematicamente um intervalo pode ser representado de diversas maneiras,
como (,, e ).
Para mais informaes sobre esse assunto, leia:
Unidade I
2.2 Elementos de uma distribuio de frequncia
Todos os conceitos a seguir sero explicados com base na distribuio de frequncias j explicada
anteriormente (Tabela 5).
2.2.1 Classe (i)
cada intervalo, ou cada linha para uma tabela de frequncias. O total de classes de uma tabela de
frequncias denominado k.
Exemplo: i = 3 (terceira classe: 158 162)
k=6
ESTATSTICA
Exemplo: Amplitude amostral para as estaturas dos alunos
AA = 173 - 150 = 23cm
2.2.5 Ponto mdio de classe (xi)
o ponto que divide a classe em duas partes iguais. Ser muito utilizado a partir deste ponto.
xi =
li + Li
2
154 + 158
= 156 cm
2
i
i
Lembrete
fi = n (a soma das frequncias igual ao nmero de elementos do rol).
e
fri = 1 (a soma das frequncias relativas deve ser sempre igual a 1,
que indica 100%).
19
Unidade I
Exemplo:
r2 =
2
9
=
= 0, 225
i 40
Isso significa que 22,5% das estaturas esto na segunda classe, pois 0,225 x 100 = 22,5%.
2.3.3 Frequncia acumulada (Fi)
a soma das frequncias at a classe indicada.
Exemplo:
F2 = frequncia acumulada da segunda classe = soma das frequncias simples at a segunda classe.
F2 = 4 + 9 = 13
Finalmente temos a distribuio com as frequncias e os pontos mdios calculados.
Tabela 6 Distribuio de frequncias com intervalo para as estaturas dos alunos, com as
frequncias calculadas
I
Estaturas (cm)
fi
xi
fri
Fi
150 154
152
0,100
154 158
156
0,225
13
158 162
11
160
0,275
24
162 166
164
0,200
32
166 170
168
0,125
37
170 174
172
0,075
40
40
1,000
ESTATSTICA
2.4 Construo de distribuies de frequncias
Anlise: este rol apresenta poucas possibilidades de valores para a varivel, mais precisamente de 0
a 4 carros, e isso permite concluir que a distribuio sem intervalos a mais indicada.
Logo, para construir a distribuio de frequncias sem intervalos, no existe nenhum clculo. A
partir do rol, basta colocar em cada classe um dos valores da varivel e contar o nmero de ocorrncias
para cada classe.
Tabela 8 Distribuio de frequncias sem intervalo para o rol do nmero de carros por residncia
N de carros
Fi
20
155
160
162
166
151
156
160
162
167
152
156
160
163
168
153
156
160
163
168
154
157
161
164
169
155
158
161
164
170
155
158
161
164
172
155
160
161
165
173
21
Unidade I
Anlise: este rol apresenta muitas possibilidades de valores para a varivel, mais precisamente de
150 a 173 cm (o que resultaria em uma distribuio sem intervalo com muitas linhas), e isso permite
concluir que a distribuio com intervalos a mais indicada.
Logo, para construir a distribuio de frequncias com intervalos, necessrio determinar:
o nmero de classes da distribuio (k)
k= n
Onde o valor de K deve ser sempre arredondado para inteiro.
Para o rol anterior:
K = 40 = 6, 32 , arredondando temos 6;
logo k = 6 (a distribuio dever ter 6 classes).
a amplitude de classe (h)
h=
AA
k
De posse das duas informaes necessrias para montar uma tabela com intervalo (k = 6 e h = 4),
realizamos o seguinte procedimento:
Passo 1: colocar o menor valor do rol no limite inferior da primeira classe.
Passo 2: somar o valor de h calculado e colocar no limite superior da primeira classe. Colocar o sinal
de intervalo entre os limites.
Tabela 10 Incio da construo de uma distribuio sem intervalo
22
Estaturas (cm)
150 154
ESTATSTICA
Passo 3: repetir o limite superior da classe em foco na classe abaixo.
Tabela 11 Andamento da construo de uma distribuio sem intervalo
I
Estaturas (cm)
150 154
154
Passo 4: somar o valor de h (h = 4) calculado e colocar no limite superior desta classe. Colocar o
sinal de intervalo entre os limites.
Tabela 12 Andamento da construo de uma distribuio sem intervalo
I
Estaturas (cm)
150 154
154 158
k=6
Estaturas (cm)
fi
150 154
154 158
158 162
11
162 166
166 170
170 174
40
h=4
Observao
Esse um dos critrios existentes para se construir uma distribuio de
frequncias com intervalo de classe. Existe tambm o critrio de Sturges,
que tambm bem conhecido. A principal diferena est no clculo de k,
pois nesse caso k dado por:
K =1+3,3 log n
23
Unidade I
2.5 Representaes grficas
Para a distribuio com intervalo, podemos representar os dados utilizando dois tipos de grfico: o
histograma e o polgono de frequncias.
2.5.1 Histograma (grfico de colunas)
Composio:
no eixo x (horizontal): os limites das classes da varivel em estudo;
no eixo y (vertical): as frequncias para cada uma das classes;
a altura da barra ser proporcional frequncia de cada uma das classes.
f
12
9
6
3
0
150
154
158
162
166
170
174
estaturas (cm)
ESTATSTICA
f
12
9
6
3
0
150
154
158
162
166
170
174
Estaturas (cm)
Figura 7 Polgono de frequncias para uma distribuio com intervalo (Tabela 13)
Para analisar um conjunto de dados, muitas vezes necessrio obter um nico valor que represente
toda a amostra em estudo. Esse valor usualmente obtido pelas medidas de tendncia central.
As medidas de tendncia central abordadas sero:
a mdia (x);
a moda (Mo);
a mediana (Md).
O clculo de cada uma das medidas de tendncia central ser explicado em trs abordagens:
dados no agrupados (no alocados em tabelas de frequncia);
distribuio de frequncia sem intervalo;
distribuio de frequncia com intervalo.
3.1 Mdia (x)
A mdia de um conjunto de dados a soma dos dados dividida pelo nmero de elementos do
conjunto.
3.1.1 Dados no agrupados
x=
xi
n
Unidade I
Exemplo: as notas de um aluno em uma determinada disciplina durante o ano foram: 3,5; 5,0; 6,5
e 9,0. A nota mdia do aluno na disciplina pode ser calculada por:
x=
3, 5 + 5, 0 + 6, 5 + 9, 0 24
=
= 6, 0
4
4
xi.fi
n
Onde: xi.fi a multiplicao dos valores das classes com as respectivas frequncias, classe por classe.
n o nmero de elementos do conjunto de dados que, nesse caso, determinado pela soma
das frequncias.
Exemplo: dada a distribuio sem intervalo da Tabela 8, determine o nmero mdio de veculos por
residncia em um determinado bairro.
Para armazenar os valores de xi.fi, uma coluna criada. Em seguida, os valores da coluna so somados,
gerando xi.fi.
Tabela 14 Clculo da mdia para uma distribuio sem intervalo
x=
N de carros
fi
xi.fi
0x2=0
1x9=9
2 x 5 = 10
3x2=6
4x2=8
20
xi.fi = 33
33
= 165
,
20
Logo, no bairro citado h em mdia 1,65 carros por residncia (para efeito de interpretao,
aproximadamente 2 carros por residncia).
3.1.3 Distribuio de frequncias com intervalo
x=
26
xi.fi
n
Onde: xi.fi a multiplicao dos pontos mdios das classes com as respectivas frequncias, classe
por classe.
ESTATSTICA
Lembrando que:
xi =
li + Li
2
n o nmero de elementos do conjunto de dados que, nesse caso, determinado pela soma
das frequncias.
Exemplo: dada a distribuio com intervalo da Tabela 13, determine a estatura mdia dos alunos
que compem a amostra.
O procedimento similar ao da distribuio sem intervalo, apenas com o detalhe de xi, que para uma
distribuio com intervalo o ponto mdio da classe.
Tabela 15 Clculo da mdia para uma distribuio com intervalo
x=
Estaturas (cm)
fi
xi
xi.fi
150 154
152 x 4 = 608
154 158
156 x 9 = 1404
158 162
11
160 x 11 =1760
162 166
164 x 8 = 1312
166 170
168 x 5 = 840
170 174
40
172 x 3 = 516
xi.fi = 6440
6440
= 161 cm
40
Compare as vendas mensais com uma mdia histrica, para indicar o desempenho de cada vendedor.
27
Unidade I
Observao
Alm da mdia que estudamos, muito utilizada como indicador de
tendncia, existem outros tipos, como: a mdia ponderada, que tambm
indica tendncia, mas considera os valores da varivel com pesos diferentes,
e a mdia mvel em um determinado nmero de valores (tipicamente de 3
a 12), largamente utilizada no clculo de previso.
3.2 Moda (Mo)
A moda o valor que ocorre com maior frequncia em um conjunto de dados. Serve para indicar as
regies das mximas frequncias.
3.2.1 Dados no agrupados
Dados os conjuntos a seguir, a moda ser determinada analisando-se as maiores frequncias.
Exemplo 1: conjunto 1
20 30
40
80
10
20 30 20
10
110
124
145
101
200
500
Nenhum valor se repete mais vezes que os outros valores do conjunto; logo, no existe valor modal
(conjunto amodal).
28
ESTATSTICA
3.2.2 Distribuio de frequncias sem intervalo
Para determinar a moda em uma distribuio sem intervalo, basta identificar a classe com maior
frequncia simples (classe modal). A moda ser o valor da varivel da classe modal.
Exemplo: dada a distribuio sem intervalo da Tabela 8, determine o valor modal dos veculos por
residncia em um determinado bairro.
Tabela 16 Obteno da moda para uma distribuio sem intervalo
N de carros
fi
20
d1
h*
d1 + d2
d1 = f* - fant
d2 = f* - fpost
f* a frequncia simples da classe modal
fant a frequncia simples anterior (acima) classe modal.
fpost a frequncia simples posterior (acima) classe modal.
Existem vrios modelos para clculo da moda. O modelo aqui apresentado o mais utilizado e
chama-se Moda de Czuber.
29
Unidade I
Exemplo: dada a distribuio com intervalo da Tabela 13, determine a estatura modal dos alunos
que compem a amostra.
Tabela 17 Obteno da moda para uma distribuio com intervalo
I
Estaturas (cm)
fi
150 154
154 158
158 162
11
162 166
166 170
170 174
40
Observao
Assim como nos dados no agrupados, uma distribuio pode ser
bimodal, desde que existam duas maiores frequncias. Nesse caso basta
calcular as modas para as duas classes modais. Isso vale para mais de duas
modas em uma distribuio, ainda que essa ocorrncia no seja to comum.
3.3 Mediana (Md)
A mediana o valor que caracteriza o centro de uma distribuio de frequncias. Divide um conjunto
ordenado de dados em duas partes iguais de 50% (da o fato de a mediana ser considerada tambm uma
medida de posio).
30
ESTATSTICA
3.3.1 Dados no agrupados
Dados os conjuntos a seguir, antes de determinar a mediana, necessrio ordenar os dados da amostra.
Exemplo 1: conjunto ordenado 1
20
30
50
80
190
210
300
30
50
80
190
210
300
Logo, Md = 80.
Exemplo 2: conjunto ordenado 2
100 230
300
500
600
800
300 500
600
Md = (300+500) / 2
Md = 800 / 2
Md = 400
800
Unidade I
Passo 4: a mediana o valor da varivel da classe encontrada (classe mediana).
Exemplo: dada a distribuio sem intervalo da Tabela 18, determine o valor da mediana.
i 20
=
= 10 (referncia)
2
2
Tabela 18 Obteno da mediana para uma distribuio sem intervalo
N de carros
fi
Fi
11
16
18
20
20
Fant
Md = l * +
h *
*
Onde: l* o limite inferior da classe mediana
fi/2 a referncia, j calculada anteriormente para a escolha da classe mediana.
Fant a frequncia acumulada anterior (acima) classe mediana.
f* a frequncia simples da classe mediana.
h* a amplitude da classe mediana.
Exemplo: dada a distribuio com intervalo da Tabela 13, determine a estatura mediana dos alunos
que compem a amostra.
i 40
=
= 20 (referncia)
2
2
32
ESTATSTICA
Tabela 19 Obteno da mediana para uma distribuio com intervalo
I
Estaturas (cm)
fi
Fi
150 154
154 158
13
158 162
11
24
162 166
32
166 170
37
170 174
40
40
[20 17] 4
11
3
4
11
12
Md = 158 +
11
Md = 158 + 1, 09
Md = 159, 09 cm
Md = 158 +
Concluindo: a estatura que divide os 50% mais altos dos 50% mais baixos de 159,09 cm.
Observao
Alm da mediana, uma medida tanto de tendncia quanto de
posio, existem outras tambm importantes, como o quartil, o decil e
o percentil. O mtodo de obteno muito parecido com o da mediana,
que tem o dois como referncia nos clculos. O quartil, o decil e o
percentil, por sua vez, dividem uma srie em quatro, dez ou cem partes
iguais.
33
Unidade I
4 MEDIDAS DE DISPERSO
4.1 Introduo
20
20
20
20
20
20
20
19
20
20
21
22
22
10
13
20
25
35
50
Grupo 2:
18
18
Grupo 3:
2
Desejamos tirar algumas concluses sobre os trs grupos analisando a principal medida de tendncia,
a mdia.
34
ESTATSTICA
20 + 20 + 20 + 20 + 20 + 20 + 20 + 20 160
=
= 20
8
8
18 + 18 + 19 + 20 + 20 + 21 + 22 + 22 160
=
= 20
x do grupo 2 =
8
8
2 + 5 + 10 + 13 + 20 + 25 + 35 + 50 160
x do grupo 3 =
=
= 20
8
8
x do grupo 1 =
Os valores das mdias para os trs grupos foram iguais, mas percebemos que os grupos so totalmente
distintos quanto s idades.
No grupo 1, todos os valores coincidem com a mdia, pois no existem diferenas em relao a
esta, logo no existe disperso. um grupo formado somente por pessoas de 20 anos de idade.
No grupo 2, os valores no coincidem exatamente com a mdia, mas tambm no se afastam
muito desta, logo existe uma pequena disperso. um grupo formado por pessoas com idades
prximas de 20 anos.
No grupo 3, a maioria dos valores est bem afastada de mdia, logo existe uma considervel
disperso. um grupo formado pelas mais diversas idades.
Concluso: apenas utilizando a mdia, os trs grupos apresentavam um perfil de idades igual. No
entanto, considerando tambm a disperso das idades (afastamento dos valores em relao mdia),
podemos indicar as diferenas existentes entre os trs grupos.
4.2 Varincia (s2)
a mdia dos quadrados das diferenas dos valores em relao a sua mdia.
4.2.1 Dados no agrupados
( xi x )2
s =
n
2
3, 5 + 5, 0 + 6, 5 + 9, 0 24
=
= 6, 0
4
4
35
Unidade I
Obteno da varincia utilizando uma tabela para organizar os clculos.
Tabela 20 Tabela para auxiliar na obteno da varincia de dados no agrupados
xi
xi - x
(xi - x)2
3,5
3,5 - 6 = -2,5
(-2,5)2 = 6,25
5,0
5 - 6 = -1
(-1)2 = 1
6,5
6,5 6 = 0,5
(0,5)2 = 0,25
9,0
9-6=3
(3)2 = 9
24
s2 =
16, 5
= 4,13
4
Lembrete
O nmero elevado ao quadrado o produto do nmero por ele mesmo.
Para os clculos deste livro, uma calculadora com operaes bsicas (+, -, x
e /) e raiz quadrada mais que suficiente.
( xi x )2 i
n
36
33
= 165
, carros
20
ESTATSTICA
Tabela 21 Clculo da varincia para uma distribuio sem intervalo
N de carros (xi)
fi
xi.fi
xi - x
(xi - x)2
(xi - x)2.fi
0x2=0
0 - 1,65 = -1,65
(-1,65)2 = 2,72
2,72 x 2 = 5,44
1x9=9
1 - 1,65 =- 0,65
(-0,65)2 = 0,42
0,42 x 9 = 3,78
2 x 5 = 10
2 - 1,65 = 0,35
(0,35) = 0,12
0,12 x 5 = 0,60
3x2=6
3 - 1,65 = 1.35
(1,35) = 1,82
1,82 x 2 = 3,64
4x2=8
4 - 1,65 = 2,35
(2,35) = 5,52
5,52 x 2 = 11,04
20
xi.fi = 33
2
2
2
Logo:
s2 =
24, 5
= 1, 23 carros2
20
Observao
Um dos problemas do uso direto da varincia que a unidade e o valor
estaro elevados ao quadrado.
( xi x )2 i
n
Onde:
xi o ponto mdio para cada classe
Lembrando que:
xi =
li + Li
2
Unidade I
O procedimento similar ao da distribuio sem intervalo, apenas com o detalhe de xi, que para uma
distribuio com intervalo o ponto mdio da classe.
Tabela 22a-b Clculo da varincia para uma distribuio com intervalo
a)
x=
Estaturas (cm)
fi
Xi
xi.fi
150 154
152 x 4 = 608
154 158
156 x 9 = 1404
158 162
11
160 x 11 =1760
162 166
164 x 8 = 1312
166 170
168 x 5 = 840
170 174
172 x 3 = 516
40
xi.fi = 6440
6440
= 161 cm
40
b)
xi - x
(xi - x)2
(xi - x)2.fi
152 - 161 = -9
(-9)2 = 81
81 x 4 = 324
156 - 161 = -5
(-5) = 25
25 x 9 = 225
160 -161 = -1
(-1)2 = 1
1 x 11 = 11
164 -161 = 3
(3)2 = 9
9 x 8 = 72
168 -161 = 7
(7)2 = 49
49 x 5 = 245
172 - 161 = 11
(11)2 = 121
121 x 3 = 363
Logo:
s2 =
1240
= 31 cm2
40
a raiz quadrada da varincia. a medida de disperso mais utilizada, por ter a mesma unidade que
a mdia, possibilitando uma melhor avaliao da disperso da amostra.
38
ESTATSTICA
4.3.1 Dados no agrupados
Considere:
( xi x )2
n
s=
16, 5
= 4,13
4
Logo:
s = 4,13 = 2, 03
4.3.2 Distribuio de frequncias sem intervalo
Considere:
( xi x )2 i
n
s2 =
24, 5
= 1, 23 carros2
20
Logo:
s = 123
, = 111
, carros
39
Unidade I
4.3.3 Distribuio de frequncias com intervalo
Considere:
( xi x )2 i
n
s=
li + Li
2
1240
= 31 cm2
40
Logo:
s = 31 = 5, 57 cm
4.4 Coeficiente de variao (CV)
ESTATSTICA
Exemplo: calcular o coeficiente de variao do exemplo abordado no item 4.3.3 (estaturas dos
alunos).
Como:
x = 161 cm
s = 5,57 cm
Logo:
CV =
5, 57
557
100 =
= 3, 46%
161
161
Unidade I
Ressaltamos que erros, tanto na montagem da tabela quanto na contagem dos
valores do rol, resultam em anlise e medidas/indicadores errados.
Na sequncia, apresentamos os principais tipos de frequncias
existentes (simples, relativa e acumulada) e as suas respectivas finalidades.
Mostramos tambm a montagem de grficos (histograma e polgono de
frequncias) para distribuies de frequncias com intervalo (por serem as
mais utilizadas na prtica).
Alm disso, estudamos as trs principais medidas de tendncia
central: a mdia, a moda e a mediana. As medidas foram analisadas
sob trs abordagens distintas (dados no agrupados, distribuio de
frequncia sem intervalo e distribuio de frequncia com intervalo),
pois os mtodos de obteno das medidas apresentam significativas
diferenas para cada abordagem.
Vimos que a mdia de dados no agrupados a mdia aritmtica,
muito utilizada academicamente para verificar o aproveitamento do aluno
em uma disciplina. Aprendemos ainda que para a obteno da mdia para
distribuio de frequncia, devemos levar em conta tanto a frequncia
quanto o valor da varivel.
Abordamos a moda, que indica a(s) maior(es) frequncias em
uma srie de dados. Foram apresentadas as trs abordagens para a
obteno. A mediana, posio que indica o centro de uma srie de
dados (divide a srie em duas partes de 50%) tambm foi apresentada
das trs maneiras.
No que se refere s medidas de disperso, estudamos trs das principais,
novamente nas trs abordagens (dados no agrupados, distribuio sem
intervalo e distribuio com intervalo).
Aprendemos que a varincia, definida pela mdia dos quadrados das
diferenas dos valores em relao a sua mdia, importante, porm no
muito utilizada, pelo fato de a unidade da grandeza envolvida no clculo
estar elevada ao quadrado. Vimos, entretanto, que o desviopadro,
cuja definio a raiz quadrada da varincia, muitssimo utilizado
em vrias reas do conhecimento, para quantificar a disperso de uma
srie de dados.
Para termos uma noo percentual da disperso em relao mdia,
foi apresentado o coeficiente de variao, que uma medida de disperso
derivada do desvio-padro e da mdia dos dados analisados.
42
ESTATSTICA
Exerccios
Questo 1. Foi realizada uma pesquisa sobre a faixa etria das crianas participantes de um
acampamento. O grfico a seguir mostra os resultados:
8
7
6
Freq
5
4
3
2
1
0
5
Idade
11
13
15
Figura 8
Unidade I
Anlise das afirmativas
I Afirmativa correta.
Justificativa: no histograma, cada coluna corresponde ao nmero de classes da tabela de frequncias.
No grfico anterior h seis colunas que correspondem s seis classes da tabela de frequncias.
II Afirmativa incorreta.
Justificativa: o limite inferior da primeira classe o extremo inferior 4, sendo esse o valor em que
comea a coluna correspondente primeira classe. O limite superior da primeira classe o extremo
superior 6, sendo esse o valor em que termina a coluna correspondente da primeira classe.
III Afirmativa correta.
Justificativa: os pontos mdios de cada classe so os pontos que dividem as classes em duas partes
iguais, e os valores dos pontos mdios do histograma anterior so 5, 7, 9, 11, 13 e 15.
IV Afirmativa incorreta.
Justificativa: a moda uma medida de tendncia central que indica o valor que ocorre com maior
frequncia no conjunto de dados. No histograma podemos visualizar que h duas modas: 11 e 13. Este
conjunto de dados chamado de bimodal.
V Afirmativa incorreta.
Justificativa: o polgono de frequncias deve ser construdo ligando-se os pontos de cruzamentos do
eixo x (os pontos mdios de cada classe) com o eixo y (a frequncia em cada uma das classes).
Questo 2. (Oficial de Fazenda-SEFAZ 2011) Com base no resultado final do concurso para o cargo
de Especialista em Polticas Pblicas e Gesto Governamental da SEPLAG, prova realizada pelo CEPERJ
em 01.08.2010, as frequncias para o nmero de acertos obtidos nas cinco questes de Estatstica pelos
1.535 candidatos que realizaram a prova esto mostradas no quadro a seguir:
Quadro 1
44
Nenhum acerto
393 candidatos
1 acerto
627 candidatos
2 acertos
417 candidatos
3 acertos
81 candidatos
4 acertos
12 candidatos
5 acertos
5 candidatos
TOTAL
1.535 candidatos
ESTATSTICA
O grfico a seguir mostra a frequncia relativa dos acertos.
Estatstica - Prova para EPPGG
45,0%
40,8%
40,0%
35,0%
30,0%
27,2%
25,6%
25,0%
20,0%
15,0%
10,0%
5,3%
5,0%
0,0%
1
3
4
Nmero de acertos
0,8%
0,3%
Figura 9