Beruflich Dokumente
Kultur Dokumente
Descrio do tema
2.1 Distribuio da frequncia e seus grficos
2.2 Mais grficos e representaes
2.3 Medidas de tendncia central
Distribuio de frequncia
e seus grficos
Objetivos da Seo
Construir distribuies de frequncia
Construir histogramas de frequncia, polgonos de
frequncia, histogramas de frequncia relativa e
ogivas
Distribuio de frequncia
Distribuio de
frequncia
Uma tabela que mostra
classes ou intervalos
de dados com uma
contagem do nmero
de entradas em cada
classe
A frequncia, f, de
uma classe o nmero
de entradas de dados na
classe
Classe Frequncia, f
Tamanho da
classe 6 1 = 5
15
6 10
11 15
16 20
21 25
26 30
Limite inferior da
classe
Limite superior
da classe
Construindo uma
distribuio de frequncia
1. Decida o nmero de classes.
Geralmente entre 5 e 20; do contrrio, pode ser
difcil detectar padres
2. Encontre o tamanho da classe.
Determine a variao dos dados
Divida a variao pelo nmero de classes
Arredonde para cima para o prximo nmero
conveniente
11.29
#classes
7
Arredondando para
cima: 12
Limite Limite
mnimo mximo
Tamanho da
classe = 12
7
19
31
43
55
67
79
O limite mximo da
primeira classe 18 (um a
menos que o limite mnimo
da segunda classe).
Some o tamanho da classe,
12, para definir o limite
mximo da prxima classe.
18 + 12 = 30
Encontre os limites
mximos restantes.
Limite
mnimo
Limite
mximo
7
19
31
43
55
67
79
18
30
42
54
66
78
90
Tamanho da
classe = 12
Registro
Frequncia, f
IIII I
19 30
IIII IIII
10
31 42
13
43 54
IIII III
55 66
IIII
67 78
IIII I
79 90
II
2
f = 50
Determinando o ponto
mdio
Ponto mdio de uma classe
(Limite mnimo da classe) + (Limite mximo da classe)
2
Classe
7 18
Ponto mdio
7 18
12.5
2
19 30
19 30
24.5
2
31 42
31 42
36.5
2
Frequncia, f
6
Tamanho da classe = 12
10
13
14
Determinando a
frequncia relativa
Frequncia relativa de uma classe
Poro da porcentagem dos dados que se encaixa em
um classe em particular
Frequncia da classe
Frequncia relativa =
Tamanho da amostragem
Classe
Frequncia, f
7 18
19 30
10
31 42
13
Frequncia relativa
6
0.12
50
10
0.20
50
13
0.26
50
15
Classe
Frequncia, f
Frequncia acumulada
7 18
19 30
+ 10
16
31 42
+ 13
29
16
Distribuio de
frequncia expandida
Classe
Frequncia, f
Ponto
mdio
7 18
12.5
0.12
19 30
10
24.5
0.20
16
31 42
13
36.5
0.26
29
43 54
48.5
0.16
37
55 66
60.5
0.10
42
67 78
72.5
0.12
48
79 90
84.5
0.04
f
1
n
50
f = 50
Frequncia
relativa
Frequncia
acumulada
Grficos de distribuio
de frequncia
Frequncia
Histograma de frequncia
Um grfico de barras que representa a distribuio da
frequncia
O eixo horizontal quantitativo e mede os valores dos dados
O eixo vertical mede as frequncias das classes
Barras consecutivas precisam se tocar
Valores dos
dados
Fronteiras de classes
Os nmeros que separam as classes sem formar
espaos entre elas
A distncia do limite superior da
primeira classe para o limite
inferior da segunda 19 18 = 1
A metade dessa distncia 0,5
Fronteira inferior da primeira
classe = 7 0.5 = 6.5
Fronteira superior da
primeira classe = 18 + 0.5 =
18.5
Classe
7 18
Fronteiras Frequncia,
de classes
f
6.5 18.5
19 30
10
31 42
13
Classe
7 18
19 30
31 42
43 54
55 66
67 78
79 90
Fronteiras de Frequncia,
classes
f
6.5 18.5
6
18.5 30.5
10
30.5 42.5
13
42.5 54.5
8
54.5 66.5
66.5 78.5
78.5 90.5
5
6
2
Exemplo: histograma
de frequncia
Construa um histograma de frequncia para a
distribuio da frequncia do uso da internet.
Classe
Fronteiras de
classes
Ponto
mdio
Frequncia,
f
7 18
6.5 18.5
12.5
19 30
18.5 30.5
24.5
10
31 42
30.5 42.5
36.5
13
43 54
42.5 54.5
48.5
55 66
54.5 66.5
60.5
67 78
66.5 78.5
72.5
79 90
78.5 90.5
84.5
Soluo: histograma de
frequncia (usando pontos mdios)
Frequncia
Uso de Internet
Soluo: histograma de
frequncia (usando fronteiras de classes)
Frequncia
Uso de Internet
6.5
18.5
30.5
42.5
54.5
66.5
78.5
90.5
Grficos de distribuies
de frequncia
Frequncia
Polgono de frequncia
Um grfico em linha que enfatiza a mudana contnua
nas frequncias.
Valores dos
dados
Exemplo: polgono de
frequncia
Construa um polgono de frequncia para a distribuio
da frequncia do uso de Internet.
Classe
Ponto mdio
Frequncia, f
7 18
12.5
19 30
24.5
10
31 42
36.5
13
43 54
48.5
55 66
60.5
67 78
72.5
79 90
84.5
Soluo: polgono de
frequncia
Internet
Usage
Uso de Internet
Frequency
Frequncia
O grfico deve
comear e terminar no
eixo horizontal, ento
estenda o lado
esquerdo at o
tamanho de uma
classe antes do ponto
mdio da primeira
classe e estenda o lado
direito at o tamanho
de uma classe depois
do ponto mdio da
ltima classe.
14
12
10
8
6
4
2
0
0.5
12.5
24.5
36.5
48.5
60.5
72.5
84.5
96.5
Tempo conectado
minutos)
Time online(em
(in minutes)
Grficos de distribuio
de frequncia
Frequncia
relativa
Valores dos
dados
Exemplo: histograma de
frequncia relativa
Construa um histograma de frequncia relativa para a
distribuio da frequncia do uso de Internet.
Frequncia, f
Classe
Fronteiras de
classes
Frequncia
relativa
7 18
6.5 18.5
0.12
19 30
18.5 30.5
10
0.20
31 42
30.5 42.5
13
0.26
43 54
42.5 54.5
0.16
55 66
54.5 66.5
0.10
67 78
66.5 78.5
0.12
79 90
78.5 90.5
0.04
Soluo: histograma de
frequncia relativa
Frequncia
Uso de Internet
6.5
18.5
30.5
42.5
54.5
66.5
78.5
90.5
Grficos de distribuio
de frequncias
Frequncia
cumulativa
Valores dos
dados
Exemplo: ogiva
Construir uma ogiva para a distribuio de frequncia
do uso da Internet.
Classe
Fronteiras de Frequncia,
classes
f
Frequncia
cumulativa
7 18
6.5 18.5
19 30
18.5 30.5
10
16
31 42
30.5 42.5
13
29
43 54
42.5 54.5
37
55 66
54.5 66.5
42
67 78
66.5 78.5
48
79 90
78.5 90.5
50
Soluo: ogiva
Cumulative
cumulativa
Frequnciafrequency
Internet
Usage
Uso de Internet
60
50
40
30
20
10
0
6.5
18.5
30.5
42.5
54.5
66.5
78.5
90.5
TempoTime
on-line
minutos)
online(em
(in minutes)
Sumrio da Seo
Construmos distribuies de frequncia
Construmos histogramas de frequncia, polgonos de
frequncia, histogramas de frequncia relativa e
ogivas
Seo 2.2
Mais grficos e representaes
Objetivos da Seo
Fazer grficos de dados quantitativos usando
diagrama de ramos-e-folhas e um diagrama de pontos
Fazer grficos de dados qualitativos usando grficos
de pizza e de Pareto
Fazer grficos de conjunto de dados emparelhados
usando grficos de disperso e grficos da srie
temporal
Fazendo grficos de
conjuntos de dados quantitativos
Diagrama de ramos-e-folhas
Cada nmero separado em um ramo e uma folha
Similar a um histograma
Ainda contm os valores dos dados originais 26
Dados: 21, 25, 25, 26, 27,
28, 30, 36, 36, 45
2
3
1 5 5 6 7 8
0 6 6
Exemplo: construindo um
diagrama de ramos-e-folhas
Os nmeros seguintes representam a quantidade de
mensagens de texto enviadas no ms passado pelos
usurios de celulares em um andar do dormitrio da
faculdade. Mostre os dados em um diagrama de
ramos-e-folhas.
155 159 144 129 105 145 126 116 130 114 122 112 112 142 126
118 118 108 122 121 109 140 126 119 113 117 118 109 109 119
139 139 122 78 133 126 123 145 121 134 124 119 132 133 124
129 112 126 148 147
Soluo: construindo um
diagrama de ramos-e-folhas
155
118
139
129
159
118
139
112
144
108
122
126
129
122
78
148
105 145 126 116 130 114 122 112 112 142 126
121 109 140 126 119 113 117 118 109 109 119
133 126 123 145 121 134 124 119 132 133 124
147
Fazendo grficos de
conjuntos de dados quantitativos
Diagrama de pontos
Cada entrada de dados posta usando um ponto
acima de um eixo horizontal
Dados: 21, 25, 25, 26, 27, 28, 30, 36, 36, 45
26
20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45
Exemplo: construindo um
diagrama de pontos
Use um diagrama de pontos para organizar os dados das
mensagens de texto.
155
118
139
129
159
118
139
112
144
108
122
126
129
122
78
148
105 145 126 116 130 114 122 112 112 142 126
121 109 140 126 119 113 117 118 109 109 119
133 126 123 145 121 134 124 119 132 133 124
147
Soluo: construindo um
diagrama de pontos
155
118
139
129
159
118
139
112
144
108
122
126
129
122
78
148
105 145 126 116 130 114 122 112 112 142 126
121 109 140 126 119 113 117 118 109 109 119
133 126 123 145 121 134 124 119 132 133 124
147
Fazendo grficos de
conjunto de dados qualitativos
Grfico de pizza
Um crculo dividido em vrios setores, que
representam categorias
A rea de cada setor proporcional frequncia de
cada categoria
Exemplo: construindo um
grfico de pizza
O nmero de ocupantes de veculos motorizados mortos
em acidentes em 2005 exibido na tabela. Use um
grfico de pizza para organizar os dados. (Fonte: U.S.
Department of Transportation, National Highway
Traffic Safety Administration.)
Tipo de
Mortes
veculo
Carros
18.440
Caminhes
13.778
Motocicletas
4.553
Outros
823
Soluo: construindo um
grfico de pizza
Encontre a frequncia relativa (porcentagem) de cada
categoria.
Tipo de
Veculo
Frequncia,
f
Carros
18.440
Caminhes
13.778
Motocicletas
Outros
4.553
823
Frequncia
relativa
18440
0.49
37594
13778
0.37
37594
4553
0.12
37594
823
0.02
37594
Tipo de
veculo
Frequncia, Frequncia
f
relativa
ngulo central
Carros
18.440
0,49
360(0,49)176
Caminhes
13.778
0,37
360(0,37)133
4.553
0,12
360(0,12)43
823
0,02
360(0,02)7
Motocicletas
Outros
Ocupantes de veculos
Tipo de
veculo
Frequncia
relativa
ngulo
central
Carros
0,49
176
Caminhes
0,37
133
Motocicletas
0,12
43
Outros
0,02
Caminhes
Outros
Carros
Fazendo grficos de
conjunto de dados qualitativos
Frequncia
Grfico de Pareto
Um grfico de barras verticais no qual a altura de
cada barra representa uma frequncia ou uma
frequncia relativa
As barras so posicionadas por ordem decrescente de
altura; a barra mais alta posicionada esquerda
Categorias
Exemplo: construindo um
grfico de Pareto
Recentemente, a indstria de varejo perdeu 41 milhes
com reduo nos estoques. A reduo de estoque uma
perda de estoque por meio de quebra, roubo de carga,
roubo em lojas e assim por diante. As causas da reduo
de estoque so erro administrativo (7,8 milhes), roubo
por funcionrios (15,6 milhes), furto das lojas (14,7
milhes) e fraude dos vendedores (2,9 milhes). Se
voc fosse um varejista, para qual causa de reduo de
estoque voc olharia primeiro? (Fonte: National Retail
Federation and Center for Retailing Education,
University of Florida.)
Soluo: construindo um
grfico de Pareto
US$ (em
milhes)
Erro adm.
7,8
Roubo por
funcionrios
15,6
Furto das
lojas
14,7
Fraude dos
vendedores
2,9
Causa
Roubo por
Furto das
funcionrios
lojas
Erro adm.
Causa
Fraude dos
vendedores
Fazendo grficos de
conjunto de dados emparelhados
Conjunto de dados emparelhados
Cada entrada em um conjunto de dados corresponde
outra entrada em um segundo conjunto de dados
Grficos usam um grfico de disperso y
Os pares ordenados so representados
como pontos em um plano coordenado
Usado para representar a relao entre
duas variveis quantitativas
Exemplo: interpretando
um grfico de disperso
O estatstico britnico Ronald Fisher (ver p. 28)
apresentou um famoso conjunto de dados chamado de
conjunto de dados de ris de Fisher. Esse conjunto de
dados descreve vrias caractersticas fsicas, como o
comprimento de ptalas e a sua largura (em milmetros)
para trs espcies de ris (flor). No grfico de disperso
mostrado, os comprimentos de ptalas formam o
primeiro conjunto de dados e as larguras formam o
segundo conjunto de dados. Conforme o comprimento
da ptala aumenta, o que tende a acontecer com a
largura? (Fonte: Fisher, R. A., 1936.)
Cada ponto no
esquema
disperso
representa o
comprimento e a
largura da ptala
de uma flor.
Soluo: interpretando
um grfico de disperso
Conjunto de dados de ris de Fisher
Interpretao
Partindo do grfico de disperso, pode-se notar que
conforme o comprimento da ptala aumenta, a
largura da ptala tambm tende a aumentar.
Fazendo grficos de
conjunto de dados
Dados
quantitativos
Srie temporal
Conjuntos de dados so compostos de entradas
quantitativas tomadas em intervalos regulares em um
perodo de tempo
Por exemplo, a quantidade de precipitaes
medidas a cada dia por um ms
Usa um grfico de perodos de tempo
Tempo
Exemplo: construindo um
grfico de srie temporal
A tabela lista o nmero de telefones
celulares (em milhes) para os anos
de 1995 at 2005. Construa um
grfico de srie temporal do nmero
de telefones celulares. (Fonte:
Cellular Telecommunication &
Internet Association.)
Ano
Usurios
(em milhes)
Soluo: construindo um
grfico de srie temporal
Faa com que o eixo horizontal
represente os anos
Deixe o eixo vertical representar
o nmero de celulares (em
milhes)
Marque os dados emparelhados e
conecte-os com os segmentos de
linha
Ano
Usurios
(em milhes)
Ano
Anos
Sumrio da Seo
Fizemos grficos de dados quantitativos usando um
diagrama de ramos-e-folhas e diagrama de pontos
Fizemos grficos de dados qualitativos usando
grficos de pizza e de Pareto
Fizemos grficos de dados emparelhados usando
grficos de disperso e grficos de srie temporal
Seo
Medidas de tendncia central
Medidas de tendncia
central
Um valor que representa uma entrada de um conjunto
de dados como tpico ou central
Medidas de tendncia central mais comuns:
Mdia
Mediana
Moda
Medidas de tendncia
central: mdia
Mdia
A soma de todas as entradas de dados divididas pelo
nmero de entradas
Notao sigma: x = adicione todas as entradas (x)
no conjunto de dados
Mdia populacional: x
N
Mdia amostral:
x
x
n
Exemplo: encontrando a
mdia da amostra
Os preos (em dlares) para uma amostra de viagens
feitas de Chicago, Illinois, para Cancun, Mxico, so
listados.
Qual o preo mdio dos voos?
872 432 397 427 388 782 397
Soluo: encontrando a
mdia da amostra
872 432 397 427 388 782 397
A soma dos preos dos voos
x = 872 + 432 + 397 + 427 + 388 + 782 + 397 = 3.695
Para encontrar o preo mdio, divida a soma dos
preos pelo nmero de preos na amostra
x 3695
x
527.9
n
7
O preo mdio dos voos cerca de $ 527,90.
Medidas de tendncia
central: mediana
Mediana
O valor que est no meio dos dados quando o
conjunto dos dados ordenado
Mede o centro de um conjunto de dados ordenado
dividindo-o em duas partes iguais
Se o conjunto de dados possui um nmero de
entradas:
mpar: o mediano o elemento do meio
par: o mediano ser a mdia dos dois elementos
centrais
Exemplo: encontrando
a mediana
Os preos (em dlares) para uma amostra de viagens
feitas de Chicago, Illinois, para Cancun, Mxico, so
listados. Encontre a mediana.
872 432 397 427 388 782 397
Soluo: encontrando
a mediana
872 432 397 427 388 782 397
Primeiramente, ordene os dados
388 397 397 427 432 782 872
Existem sete entradas (um nmero mpar), e a
mediana o elemento central, ou o quarto, do
conjunto de dados
Exemplo: encontrando
a mediana
O preo dos voos em $ 432 no est mais disponvel.
Qual o preo mediano dos voos restantes?
872 397 427 388 782 397
Soluo: encontrando
a mediana
872 397 427 388 782 397
Primeiramente, ordene os dados
388 397 397 427 782 872
H seis elementos (um nmero par), a mediana a
mdia das duas entradas centrais.
397 427
Mediano
Median
412
2
O preo mediano dos voos $ 412.
Medidas de tendncia
central: moda
Moda
A entrada de dados ocorre com a maior frequncia
Se no houver entradas repetidas, o conjunto de
dados no tem moda
Se duas entradas ocorrem com a mesma e mais alta
frequncia, cada entrada um moda (bimodal)
Exemplo: encontrando
a moda
Os preos (em dlares) para uma amostra de viagens
feitas de Chicago, Illinois, para Cancun, Mxico, so
listados. Encontre a moda dos preos dos voos.
872 432 397 427 388 782 397
Soluo: encontrando
a moda
872 432 397 427 388 782 397
Ordenar os dados ajuda a encontrar a moda
388 397 397 427 432 782 872
A entrada de 397 ocorre duas vezes, enquanto as
outras ocorrem somente uma vez.
A moda dos preos dos voos $ 397.
Exemplo: encontrando
a moda
Em um debate poltico uma amostra de membros da
audincia foi questionada respeito de seus partidos
polticos. Suas respostas esto na tabela. Qual a moda
de suas respostas?
Partido poltico
Democrata
Republicano
Frequncia, f
34
56
Outros
21
No responderam
Soluo: encontrando
a moda
Partido poltico
Democrata
Republicano
Outros
No responderam
Frequncia, f
34
56
21
9
Comparando a mdia,
a mediana e a moda
Todas as trs medidas descrevem uma entrada tpica
de um conjunto de dados
Vantagens de usar a mdia:
A mdia uma medida confivel porque leva em
conta cada entrada do conjunto de dados
Desvantagens de usar a mdia:
Muito afetada por valores discrepantes (uma
entrada que muito distante das outras entradas no
conjunto de dados)
Exemplo: comparando a
mdia, a mediana e a moda
Encontre a mdia, a mediana e a moda da amostra de
idades de uma classe. Qual medida de tendncia central
descreve melhor uma entrada tpica desse conjunto de
dados? Existe algum valor discrepante?
Idades em uma classe
20
20
20
20
20
20
21
21
21
21
22
22
22
23
23
23
23
24
24
65
Soluo: comparando a
mdia, a mediana e a moda
Idades em uma classe
Mdia:
20
20
20
20
20
20
21
21
21
21
22
22
22
23
23
23
23
24
24
65
x 20 20 ... 24 65
x
23.8 years
anos
n
20
21 22
anos
Mediana:
21.5 years
2
Moda:
Moda = 20 anos
82
83
Mdia ponderada
A mdia de um conjunto de dados cujas entradas
possuem pesos variantes
( x w)
x
em que w o peso de cada entrada x
w
84
Exemplo: encontrando a
mdia ponderada
Voc est frequentando uma aula na qual sua nota
determinada com base em 5 fontes: 50% da mdia de
seu exame, 15% do seu exame bimestral, 20% de seu
exame final, 10% de seu trabalho no laboratrio de
informtica e 5% de seus deveres de casa. Suas notas
so: 86 (mdia do exame), 96 (exame bimestral), 82
(exame final), 98 (laboratrio) e 100 (dever de casa).
Qual a mdia ponderada de suas notas? Se a mdia
mnima para um A 90, voc obteve uma nota A?
Soluo: encontrando a
mdia ponderada
Fonte
xw
Notas, x
Peso, w
Mdia do exame
86
0,50
86(0,50)= 43,0
Exame bimestral
96
0,15
96(0,15) = 14,4
Exame final
82
0,20
82(0,20) = 16,4
Laboratrio
98
0,10
98(0,10) = 9,8
Dever de casa
100
0,05
100(0,05) = 5,0
w = 1
(xw) = 88,6
( x w)
88.6
x
88.6
w
1
Sua mdia ponderada para essa aula foi 88,6. Voc no
tirou um A.
( x f )
x
n
n f
Encontrando a mdia
da distribuio de uma frequncia
Em palavras
1. Encontre o ponto mdio de
cada classe.
Em smbolos
x
(Limite limit)+(upper
inferior) + (Limitelimit)
superior)
(lower
2
( x f )
n f
4. Encontre a mdia da
distribuio das frequncias.
( x f )
n
Exemplo: encontrando a
mdia da distribuio
de uma frequncia
Use a distribuio de frequncia para aproximar a mdia
do nmero de minutos que uma amostra de internautas
passou conectada em sua ltima sesso.
Classe
Ponto
mdio
Frequncia, f
7 18
12,5
19 30
24,5
10
31 42
36,5
13
43 54
48,5
55 66
60,5
67 78
72,5
79 90
84,5
Classe
Ponto
mdio, x
Frequncia,
f
(xf)
7 18
12,5
12,56 = 75,0
19 30
24,5
10
24,510 = 245,0
31 42
36,5
13
36,513 = 474,5
43 54
48,5
48,58 = 388,0
55 66
60,5
60,55 = 302,5
67 78
72,5
72,56 = 435,0
79 90
84,5
84,52 = 169,0
n = 50
(xf) = 2.089,0
( x f ) 2089
minutos
x
41.8 minutes
n
50
O formato das
distribuies
Distribuio uniforme (retangular)
Todas as entradas tm frequncias iguais ou quase iguais
Simtrica
Medidas de variao
Objetivos da Seo
Determinar a amplitude de um conjunto de dados
Determinar a varincia e o desvio padro da
populao e da amostra
Usar a Regra Emprica e o Teorema de Chebychev
para interpretar o desvio padro
Aproximar o desvio padro da amostra para dados
agrupados
Varincia
Varincia
A diferena entre as entradas mxima e mnima em
um conjunto de dados
Os dados precisam ser quantitativos
Varincia = (Entrada mx.) (Entrada mn.)
Exemplo: encontrando a
varincia
Uma corporao contratou 10 graduados. Os salrios
iniciais de cada um so demonstrados abaixo. Encontre
a varincia dos salrios iniciais.
Salrios iniciais (milhares de dlares)
41 38 39 45 47 41 44 41 37 42
Mximo
Desvio, varincia e
desvio padro
Desvio
A diferena entre a entrada de dados, x, e a mdia do
conjunto de dados
Conjunto de dados da populao:
Desvio de x = x
Conjunto de dados da amostra:
Desvio de x = x x
Exemplo: encontrando
o desvio
Uma corporao contratou 10 graduados. Os salrios
iniciais de cada um so demonstrados abaixo. Encontre
a variao dos salrios iniciais.
Salrios iniciais (milhares de dlares)
41 38 39 45 47 41 44 41 37 42
Soluo:
Primeiro, determine a mdia dos salrios
iniciais.
x 415
41.5
N
10
Soluo: encontrando
o desvio
Salrio ($ 1.000s), x Desvio: x
Determine o desvio
para cada entrada.
41
41 41,5 = 0,5
38
38 41,5 = 3,5
39
39 41,5 = 2,5
45
45 41,5 = 3,5
47
47 41,5 = 5,5
41
41 41,5 = 0,5
44
44 41,5 = 2,5
41
41 41,5 = 0,5
37
37 41,5 = 4,5
42
42 41,5 = 0,5
x = 415
(x ) = 0
Desvio, varincia e
desvio padro
Varincia da populao
( x )
N
2
(
x
)
2
Encontrando a varincia
populacional e o desvio padro
Em palavras
1. Encontre a mdia do
conjunto de dados da
populao.
2. Encontre o desvio de cada
entrada.
3. Eleve os desvios ao
quadrado.
Em smbolos
x
x
(x )2
SSx = (x )2
Em palavras
5. Divida por N para obter a
varincia populacional.
Em smbolos
2
(
x
)
2
N
( x ) 2
Exemplo: encontrando o
desvio padro da populao
Uma corporao contratou 10 graduados. Os salrios
iniciais de cada um so demonstrados abaixo. Encontre
a variao dos salrios iniciais.
Salrios iniciais (milhares de dlares)
41 38 39 45 47 41 44 41 37 42
Lembrar = 41,5.
Soluo: encontrando o
desvio padro da populao
Desvio: x
Quadrados: (x )2
41
41 41,5 = 0,5
(0,5)2 = 0,25
38
38 41,5 = 3,5
(3,5)2 = 12,25
39
39 41,5 = 2,5
(2,5)2 = 6,25
45
45 41,5 = 3,5
(3,5)2 = 12,25
47
47 41,5 = 5,5
(5,5)2 = 30,25
41
41 41,5 = 0,5
(0,5)2 = 0,25
44
44 41,5 = 2,5
(2,5)2 = 6,25
41
41 41,5 = 0,5
(0,5)2 = 0,25
37
37 41,5 = 4,5
(4,5)2 = 20,25
42
42 41,5 = 0,5
(0,5)2 = 0,25
Salrio, x
Determine SQx
N = 10
(x ) = 0
SSx = 88,5
Varincia da populao
( x )
88.5
8.9
N
10
2
Desvio, varincia e
desvio padro
Varincia da amostra
2
(
x
x
)
s2
n 1
( x x )
s s
n 1
2
Encontrando a varincia
e o desvio padro da amostra
Em palavras
1. Encontre a mdia do
conjunto de dados da
amostra.
Em smbolos
x
x
n
xx
( x x )2
SS x ( x x ) 2
Em palavras
5. Divida por n 1 para obter
a varincia da amostra.
6. Encontre a raiz quadrada
para obter o desvio padro
da amostra.
Em smbolos
2
(
x
x
)
s2
n 1
( x x ) 2
s
n 1
Exemplo: encontre o
desvio padro da amostra
Os salrios inicias so para uma filial da empresa em
Chicago. A empresa tem vrias outras filiais e voc
planeja usar os salrios iniciais de Chicago para estimar
os salrios iniciais da populao maior. Encontre o
desvio padro dos salrios iniciais da amostra.
Salrios iniciais (milhares de dlares)
41 38 39 45 47 41 44 41 37 42
Soluo: encontrando o
desvio padro da populao
Determine SQx
n = 10
Desvio: x
Quadrados: (x )2
41
41 41,5 = 0,5
(0,5)2 = 0,25
38
38 41,5 = 3,5
(3,5)2 = 12,25
39
39 41,5 = 2,5
(2,5)2 = 6,25
45
45 41,5 = 3,5
(3,5)2 = 12,25
47
47 41,5 = 5,5
(5,5)2 = 30,25
41
41 41,5 = 0,5
(0,5)2 = 0,25
44
44 41,5 = 2,5
(2,5)2 = 6,25
41
41 41,5 = 0,5
(0,5)2 = 0,25
37
37 41,5 = 4,5
(4,5)2 = 20,25
42
42 41,5 = 0,5
(x ) = 0
(0,5)2 = 0,25
SSx = 88,5
Salrio, x
Varincia da amostra
( x x )
88.5
9.8
s
n 1
10 1
2
88.5
3.1
s s
9
2
33,50
37,00
23,75
26,50
31,25
36,50
40,00
32,00
39,25
37,50
34,75
37,75
37,25
36,75
27,00
35,75
26,00
37,00
29,00
40,50
24,50
33,00
38,00
Interpretando o desvio
padro
Desvio padro a medida do valor tpico que uma
entrada desvia da mdia
Quanto mais as entradas esto espalhadas, maior o
desvio padro
Interpretando desvio
padro: Regra Emprica
(Regra 68 95 99.7)
Para dados com uma distribuio em formato de sino
(simtrico), o desvio padro tem as seguintes
caractersticas:
Cerca de 68% dos dados esto dentro de um desvio
padro da mdia
Cerca de 95% dos dados esto dentro de dois desvios
padro da mdia
Cerca de 99,7% dos dados esto dentro de trs
desvios padro da mdia
34%
34%
2.35%
2.35%
13.5%
x 3s
x 2s
13.5%
x s
x s
x 2s
x 3s
Exemplo: usando a
Regra Emprica
Em uma pesquisa conduzida pelo National Center for
Health Statistics, a amostragem mdia da altura de
mulheres nos Estados Unidos (20-29 anos) era de 64
polegadas, com um desvio padro da amostragem de
2,71 polegadas. Estime a porcentagem de mulheres que
esto entre 64 e 69,42 polegadas.
Soluo: usando a
Regra Emprica
Porque a distribuio tem formato de sino, voc pode
usar a Regra Emprica.
34%
13.5%
55,87
x 3s
58,58
x 2s
61,29
x s
64
66,71
x s
69,42
x 2s
72,13
x 3s
Teorema de Chebychev
A poro de qualquer conjunto de dados postos
dentro de k desvios padro (k > 1) da mdia no
1
mnimo:
1 2
k
k = 2: Em qualquer conjunto de dados, pelo menos
1 3
1 2 or 75% dos dados esto dentro de dois
2
4
desvios padro da mdia.
k = 3: Em qualquer conjunto de dados, pelo menos
1
1 8
or 88.9% dos dados esto dentro de trs
2
3
9
desvios padro da mdia.
Exemplo: usando o
Teorema de Chebychev
A distribuio de idades na Flrida mostrada no
histograma. Aplique o Teorema de Chebychev aos
dados usando k = 2. O que se pode concluir?
Soluo: usando o
Teorema de Chebychev
( x x ) f
s
n 1
2
em que n = f (o nmero de
entradas no conjunto de
dados)
Exemplo: encontrando o
desvio padro para dados agrupados
Voc coleta uma amostragem
aleatria do nmero de crianas por
casa em uma regio. Encontre a
mdia da amostra e o desvio padro
da amostra do conjunto de dados.
Nmero de crianas em
50 casas
1
Soluo: encontrando o
desvio padro para dados agrupados
Primeiro, construa a distribuio da
frequncia
Encontre a mdia da distribuio da
frequncia
xf 91
x
1.8
n
50
A mdia da amostra de cerca de
1,8 criana.
xf
10
0(10) = 0
19
1(19) = 19
2(7) = 14
3(7) =21
4(2) = 8
5(1) = 5
6(4) = 24
f = 50 (xf )= 91
xx
( x x )2
10
0 1,8 = 1,8
(1,8)2 = 3,24
3,24(10) = 32,40
19
1 1,8 = 0,8
(0,8)2 = 0,64
0,64(19) = 12,16
2 1,8 = 0,2
(0,2)2 = 0,04
0,04(7) = 0,28
3 1,8 = 1,2
(1,2)2 = 1,44
1,44(7) = 10,08
4 1,8 = 2,2
(2,2)2 = 4,84
4,84(2) = 9,68
5 1,8 = 3,2
(3,2)2 = 10,24
10,24(1) = 10,24
6 1,8 = 4,2
(4,2)2 = 17,64
17,64(4) = 70,56
( x x )2 f
( x x )2 f 145.40
( x x )2
( x x )2 f
( x x ) 2 f
145.40
s
1.7
n 1
50 1
Sumrio da Seo
Determinamos a amplitude de um conjunto de dados
Determinamos a varincia e o desvio padro da
populao e da amostra
Usamos a Regra Emprica e o Teorema de Chebychev
para interpretar o desvio padro
Aproximamos o desvio padro da amostra para dados
agrupados
Medidas de posio
Objetivos da Seo
Determinar os quartis de um conjunto de dados
Determinar a amplitude interquartil de um conjunto
de dados
Criar um grfico de caixa-e-bigodes
Interpretar outros fractis, como percentis
Determinar e interpretar o escore padro (escore z)
Quartilhos
Fractis so nmeros que particionam (dividem) um
conjunto de dados ordenados em partes iguais
Quartis dividem dados ordenados em quatro partes
aproximadamente iguais
Primeiro quartil, Q1: Cerca de um quarto dos
dados cai em ou abaixo de Q1
Segundo quartil, Q2: Cerca de metade dos dados
caem em ou abaixo de Q2 (mediana)
Terceiro quartil, Q3: Cerca de trs quartos dos
dados caem em ou abaixo de Q3
Exemplo: encontrando
quartis
As pontuaes dos testes de 15 empregados
matriculados em um curso de primeiros socorros so
listadas. Encontre o primeiro, o segundo e o terceiro
quartil das pontuaes dos testes.
13 9 18 15 14 21 7 10 11 20 5 18 37 16 17
Soluo:
Q2 divide o conjunto de dados em duas metades
Metade inferior
Metade superior
5 7 9 10 11 13 14 15 16 17 18 18 20 21 37
Q2
Soluo: encontrando
quartis
O primeiro e o terceiro quartis so as medianas das
metades inferior e superior do conjunto de dados
Metade inferior
Metade superior
5 7 9 10 11 13 14 15 16 17 18 18 20 21 37
Q1
Q2
Q3
Amplitude interquartil
Encontrando a amplitude interquartil (VIQ)
A diferena entre o terceiro e o primeiro quartis
VIQ = Q3 Q1
Exemplo: encontrando
a amplitude interquartil
Encontre a amplitude interquartil das notas dos testes.
Lembre-se: Q1 = 10, Q2 = 15 e Q3 = 18
Soluo:
VIQ = Q3 Q1 = 18 10 = 8
As notas dos testes na poro do meio do conjunto
de dados variam no mximo em 8 pontos.
Grfico de caixa-e-bigodes
Ferramenta exploratria de anlise de dados
Destaca qualidades importantes do conjunto de dados
Requer (sumrio de cinco nmeros):
Entrada mnima
Primeiro quartil Q1
Mediana Q2
Terceiro quartil Q3
Entrada mxima
Desenhando um grfico
de caixa-e-bigodes
1.
2.
3.
4.
5.
Exemplo: desenhando um
grfico de caixa-e-bigodes
Desenhe um grfico de caixa-e-bigodes que represente as 15
pontuaes dos testes.
Lembre-se: Mn. = 5 Q1 = 10 Q2 = 15 Q3 = 18
Mx. = 37
Soluo:
Percentis
Sumrio
Divide os dados em 4 partes
iguais
Divide os dados em 10 partes
iguais
Divide os dados em 100
partes iguais
Smbolos
Q1, Q2, Q3
D1, D2, D3,, D9
Exemplo: interpretando
percentis
A ogiva representa a
distribuio de frequncia
cumulativa para as provas do
SAT (vestibular dos EUA) de
estudantes em uma ano
recente. Qual nota representa o
72 percentil? Como voc
deve interpretar isso? (Fonte:
College Board Online.)
Soluo: interpretando
percentis
O 72 percentil corresponde
nota 1.700.
Isso significa que 72% dos
alunos obtiveram resultados
de 1.700 ou menos.
O escore padro
Escore padro (escore z)
Representa o nmero de desvios padro que um dado
valor x cai da mdia .
valor - mean
mdia
value
x
z
standard
desvio deviation
padro
Exemplo: comparando
escores z de diferentes
conjuntos de dados
Em 2007, o ator Forest Whitaker ganhou o Oscar de
melhor ator, aos 45 anos de idade, por sua atuao no
filme O ltimo Rei da Esccia. A atriz Helen Mirren
ganhou o prmio de melhor atriz aos 61 anos por seu
papel em A Rainha. A idade mdia para todos os
vencedores do prmio de melhor ator 43,7, com
desvio padro de 8,8. A idade mdia para as vencedoras
do prmio de melhor atriz 36, com desvio padro de
11,5. Encontre o escore z que corresponda idade de
cada ator ou atriz. Depois, compare os resultados.
Soluo: comparando
escores z de diferentes
conjuntos de dados
Forest Whitaker
Helen Mirren
45 43.7
0.15
8.8
61 36
2.17
11.5
z = 0.15
z = 2.17
Sumrio da Seo
Determinamos os quartis de um conjunto de dados
Determinamos a amplitude interquartil de um
conjunto de dados
Criamos grfico de caixa-e-bigodes
Interpretamos outros fractis, como percentis
Determinamos e interpretamos o escore padro
(escore z)