Sie sind auf Seite 1von 9

CAP1: Estatstica Descritiva para anlise da variabilidade uma amostra de dados

quantitativos
O aluno dever utilizar calculadora cientfica
Resumo Numrico dos dados
Suponha que os dados sejam representados por x1,x2,...xn.
Vamos utilizar a amostra de dados abaixo (tabela 1.1) para obter os valores das medidas ao longo deste captulo.
Tabela 1.1: 100 observaes do dimetro interno de anis de Pistons
74.030, 73.995, 73.988, 74.002, 73.992, 74.009, 73.995, 73.985, 74.008, 73.998,
73.994, 74.004, 73.983, 74.006, 74.012, 74.000, 73.994, 74.006, 73.984, 74.000,
73.988, 74.004, 74.010, 74.015, 73.982, 74.002, 73.992, 74.024, 73.996, 74.007,
73.994, 74.006, 74.003, 73.995, 74.000, 73.998, 74.000, 74.002, 73.967, 74.014,
73.984, 74.012, 74.010, 74.002, 74.010, 74.001, 73.999, 73.989, 74.008, 73.984,
74.019, 74.001, 74.021, 73.993, 74.015, 73.997, 73.994, 73.993, 74.009, 73.990,
73.994, 74.007, 73.998, 73.994, 73.998, 74.005, 73.986, 74.018, 74.003, 74.013,
74.009, 73.990, 73.990, 73.993, 73.995, 73.992, 74.011, 74.005, 74.015, 73.989,
73.985, 74.000, 74.015, 74.005, 74.007, 73.995, 74.000, 73.997, 74.000, 73.999,
73.998, 74.005, 74.003, 74.005, 74.020, 74.005, 74.006, 74.009, 74.000, 74.017,
74.008, 74.004, 74.002, 74.009, 74.014, 73.993, 74.005, 73.988, 74.004, 73.995,
73.990, 73.996, 74.012, 73.984, 74.007, 73.996, 74.007, 74.000, 73.997, 74.003,
73.996, 74.009, 74.014, 74.010, 74.013


Mdia: centro de massa dos dados da amostra


Exemplo 1.1: Dados da tabela 1.1; mdia = 9250,147/125 = 74,001mm
Para efeitos de exerccio na calculadora utilize os valores da primeira linha da tabela (neste caso n=10)
(74.030+ 73.995+ 73.988+ 74.002+ 73.992+ 74.009+ 73.995+ 73.985+ 74.008+ 73.998)/10
Voc dever obter mdia = 74.0002

Varincia amostral: mede a variabilidade dos dados porm sua unidade o quadrado da unidade dos dados.



Exemplo 1.2: Dados da tabela 1.1; varincia = 0,000101 mm
2

Para efeitos de exerccio na calculadora utilize os valores da primeira linha da tabela (neste caso n=10)
[(74.030-74.0002)
2
+ (73.995-74.0002)
2
+ (73.988-74.0002)
2
+ (74.002-74.0002)
2
+ (73.992-74.0002)
2
+ (74.009-
74.0002)
2
+ (73.995-74.0002)
2
+ (73.985-74.0002)
2
+ (74.008-74.0002)
2
+ (73.998-74.0002)
2
]/9 = 0.0015356/9
Voc dever obter varincia = 0.0001706222 mm
2


Desvio Padro amostral: mede a variabilidade dos dados na mesma unidade de medida dos dados.




Exemplo 1.3: Dados da tabela 1.1; S = 0,010 mm
Para efeitos de exerccio na calculadora utilize os valores da primeira linha da tabela (neste caso n=10)

Voc dever obter desvio padro = 0.01306224 mm



OBS: Calculadoras cientficas possuem modo estatstico que facilitam um pouco os clculos acima.

Exemplo 1.4
Utilize os exemplos abaixo para treinar o modo estatstico de sua calculadora:
Amostra 1 Amostra 2 Amostra 3 Amostra 4
2 1 1 101
4 3 5 103
6 5 9 105
Mdia 4 3 5 103
Desvio Padrao 2 2 4 2
Varincia 4 4 16 4

Percentil de ordem k: um valor tal que pelo menos k% dos dados so iguais ou inferiores a este valor e pelo
menos k% dos dados so iguais ou superiores a este valor.
Para obter o valor do percentil, os dados devem estar ordenados crescentemente pois este valor depende da
posio.
Em geral a posio de um percentil de ordem k pode ser obtida fazendo-se
(k/100)*n + 0.5 (sendo n a quantidade de valores da amostra).

Exemplo 1.5: Para os dados da tabela 1.1 temos n= 125.
Observe os dados ordenados:
73.967 73.982 73.983 73.984 73.984 73.984 73.984 73.985 73.985 73.986 73.988
73.988 73.988 73.989 73.989 73.990 73.990 73.990 73.990 73.992 73.992 73.992
73.993 73.993 73.993 73.993 73.994 73.994 73.994 73.994 73.994 73.994 73.995
73.995 73.995 73.995 73.995 73.995 73.996 73.996 73.996 73.996 73.997 73.997
73.997 73.998 73.998 73.998 73.998 73.998 73.999 73.999 74.000 74.000 74.000
74.000 74.000 74.000 74.000 74.000 74.000 74.001 74.001 74.002 74.002 74.002
74.002 74.002 74.003 74.003 74.003 74.003 74.004 74.004 74.004 74.004 74.005
74.005 74.005 74.005 74.005 74.005 74.005 74.006 74.006 74.006 74.006 74.007
74.007 74.007 74.007 74.007 74.008 74.008 74.008 74.009 74.009 74.009 74.009
74.009 74.009 74.010 74.010 74.010 74.010 74.011 74.012 74.012 74.012 74.013
74.013 74.014 74.014 74.014 74.015 74.015 74.015 74.015 74.017 74.018 74.019
74.020 74.021 74.024 74.030

Assim, o percentil de ordem 50, tambm conhecido como mediana, o valor observado na posio 0.5*(125)+
0.5 = 63.
Atente para o fato que 63 no o valor do percentil e sim a posio onde tal valor se encontra.
Mediana = valor da posio 63 = 74,001
O valor do percentil obtido extraindo-se o valor da respectiva posio, sempre com os dados ordenados
crescentemente.

Exemplo 1.6:
i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
xi 11 11 11 11 11 11 11 14 14 14 14 16 16 16 21
Para estes dados temos n=15
Obtendo alguns percentis:
Percentil de ordem 10:
Posio do percentil: 0.1*15+0.5=2
Valor do percentil = 11 (valor da posio 2)

Percentil de ordem 25:
Posio do percentil: 0.25*15+0.5=4.25; como no h posio 4.25, em situaes como esta utilizaremos uma
interpolao entre os valores da posio 4 e 5. Para o caso em questo no ser necessrio, pois os valores so
iguais nas duas posies (valor 11 em ambas). Valor do percentil = 11

Percentil de ordem 45:
Posio do percentil: 0.45*15+0.5=7,25; como no h posio 7,25, o percentil um valor entre os valores da
posio 7 e 8, ou seja, um valor entre 11 e 14. Podemos obter o valor do percentil por interpolao simples entre
os valores 11 e 14.
Ilustrao genrica de uma interpolao simples entre dois valores


O valor do percentil obtido por semelhana de tringulo (veja ilustrao):





Ou seja,




Valor do percentil = (14-11)*0.25 + 11 = 11.75

Percentil de ordem 75:
Posio do percentil: 0.75*15+0.5=11,75; como no h posio 11,75, o percentil um valor entre os valores da
posio 11 e 12, ou seja, um valor entre 11 e 14. Podemos obter o valor do percentil por intepolao simples
entre 14 e 16.




Valor do percentil = (16-14)*0.75 + 14 = 15.5

Percentis que se destacam:
Percentil 25, o primeiro quartil; se dividirmos a amostra em 4 partes o primeiro quarto.
Percentil 50, a mediana que pode ser pensada como o valor que divide a amostra ao meio. tambm o
segundo quartil se pensarmos na amostra divida em 4 partes.
Percentil 75, o terceiro quartil; se dividirmos a amostra em 4 partes o terceiro quarto.

Intervalo Interquartil = P75-P25 (diferena entre o terceiro e o primeiro quartil). Usado como medida de
variabilidade para detectar possveis pontos discrepantes (outliers).

Exemplo 1.7
Para os 15 dados acima temos
P25 = 11
P75 = 15.5
Intervalo Interquartil = 15.5 11 = 4.5
Valores na amostra, que se apresentam fora dos limites abaixo, so considerados discrepantes:
Limite inferior: P25 -1.5*Intervalo Interquartil = 11 -1.5*4.5 = 4.25
Limite superior: P75 + 1.5*Intervalo Interquartil = 15.5 +1.5*4.5 = 22.25
Para os dados em questo no h pontos fora destes limites.
Exerccios:
1.1)Obtenha a mdia e o desvio padro utilizando modo estatstico da calculadora:
i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
xi 11 11 11 11 11 11 11 14 14 14 14 16 16 16 21
Resposta: Mdia, desvio padro e varincia respectivamente:
13,46667
2,924445
8,552381

1.2)Obtenha a mediana e o intervalo interquartil das porcentagens de algodo em um material usado para a
fabricao de camisas (n=12):
i 1 2 3 4 5 6 7 8 9 10 11 12
xi 34.2 33.1 34.5 35.6 34.3 35.1 34.7 33.6 33.6 34.7 35 35
Resposta:
Dados ordenados:
33.1 33.6 33.6 34.2 34.3 34.5 34.7 34.7 35.0 35.0 35.1 35.6
Posio da mediana = 12.5
Valor da mediana = 34.6
Posio de P25 = 3.5
Valor de P25 = 33.9
Posio de P75 = 9.5
Valor de P75 =35
Intervalo Interquartil = 35 33.9 = 1.1
1.3) Identifique os valores discrepantes da amostra abaixo (n=8):
18.0 16.6 30.5 13.1 68.6 20.5 18.0 12.2
Resposta
P25 = 14.85
P75= 25.5
Intervalo Interquartil = 25.5 -14.85 = 10.65

Limite inferior = 14.85 1.5*10.65 = -1.125
Limite superior = 25.5 + 1.5*10.65 = 41.475
H apenas um valor acima do limite superior: 68.6 (nico valor discrepante)

Aps estes exerccios voc dever realizar o teste 1.

CAP2: Grficos que descrevem a variao dos dados

Grfico Ramo e Folhas:
Dividimos cada nmero xi em duas partes: um ramo, formado por um ou mais dgitos iniciais; e uma folha,
formada pelos dgitos restantes. Estabelecer de 5 a 20 ramos para este tipo de grfico.
Exemplo 2.1: Os dados da tabela 1.1 podem ser divididos como, ramos com os quatro primeiros dgitos; folhas
com os dgitos restantes. Assim, formamos um grfico com 8 ramos!
7396 | 7
7397 |
7398 | 23444455688899
7399 | 0000222333344444455555566667778888899
7400 | 0000000001122222333344445555555666677777888999999
7401 | 00001222334445555789
7402 | 014
7403 | 0
Observamos um grfico com forma aproximadamente simtrica, um nico pico. Podemos observar os valores
ordenados, a tendncia central aproximadamente 74.004; a variabilidade: o quanto os dados se concentram em
torno de um ponto central!
Script do R:
x<-c(74.030,...,74.013);stem(x,scale=.5)

Histograma:
o grfico dos intervalos de valores da varivel observada versus as respectivas frequencias observadas.
Os intervalos no eixo x representam os valores da varivel; as alturas dos retngulos so as frequncias com que
se observa os valores da varivel em cada intervalo.
Exemplo 2.2: Os intervalos para o dimetro no eixo x e as frequncias observadas no eixo y.
Neste grfico temos 7 intervalos; o primeiro 73.96 a 73.97 inclusive, observa-se frequncia 1 (73.967); o segundo
73.97 a 73.98 inclusive, observa-se frequncia 0; o terceiro 73.98 a 73.99 inclusive, observa-se frequncia 20
(verifique!) e assim por diante.
A anlise semelhante ao grfico ramo e folhas.

Script do R
hist(x,breaks=8,main="Histograma",xlab="dimetro do anel",ylab="frequencia")
Box Plot
Exibe diversos aspectos importantes alm dos exibidos pelo histograma e ramo e folhas como por exemplo o
afastamento da simetria, a disperso, identificao de pontos discrepantes ou outliers.
Para construir esse grfico precisamos de 5 valores: menor valor; P25,P50,P75 e maior valor
O menor e o maior valor so definidos pelo menor ou maior valor observado ou pelos limites fornecidos pela
amplitude interquartil, o que for menos extremo.
Exemplo 2.3:
Os valores extremos observados so: 73.967 e 74.030 (verifique!)
P25 = 73.994 (acredite!)
P50 = 74.001 (acredite!)
P75 = 74.008 (acredite!)
Amplitude Inter quartil = 74.008 73.994 = 0.014
Limite inferior = P25 1.5*0.014 = 73.994 -1.5*0.014 = 73.973
Limite Superior = P75 + 1.5*0.014 = 74.008+1.5*0.014=74.029
Observe que os valores extremos dos dados superam os limites calculados, logo h pontos discrepantes.
Os 5 valores geram as linhas do box plot:

Alm de detectar outliers, estes grficos so teis para comparar dados entre grupos:
Observe o desempenho de 3 turmas distintas que foram submetidas mesma avaliao de contedo:

Turma 1 apresentou a menor mediana e a maior disperso; a turma 3 apresentou o melhor desempenho e a
menor disperso.
Vamos supor que voc precise escolher alunos para desenvolver um projeto e se baseie no desempenho
mostrado pelo Box Plot acima. Evidentemente voc escolher alunos da turma 3, melhor desempenho e menor
disperso.

Grfico de Pareto
um grfico de colunas ou barras ordenadas de acordo com a frequncia. As categorias so ordenadas
decrescentemente pelas freqncias observadas.
Os grficos de Pareto so muito teis na anlise dos dados defeituosos em sistemas de produo. Uma vez
identificados os defeitos crticos, deve-se desenvolver e programar aes corretivas para reduzir ou eliminar o
problema.
Exemplo 2.4
Considere os dados de causas de mortes acidentais em certo local. Observe as causas mais frequentes deste tipo
de ocorrncia.
Veculo\motorizado Quedas Envenenamento Afogamento
43500 12200 6400 4600
Incndio Ingesto de Alimentos ou Objetos Armas de fogo
4200 2900 1400
O grfico de Pareto para estes dados :


Grfico de linhas
(ou de segmentos) utilizado, em geral, para representar a evoluo dos valores de uma varivel no decorrer do
tempo.
O tempo representado no eixo x e os valores observados no eixo y.
Exemplo 2.5


Grfico de Disperso
Grfico que analisa a relao entre duas variveis. O grfico construdo a partir dos pares ordenados das duas
variveis x e y.
Exemplo 2.6
X o comprimento do fio; Y a fora de resistncia da soldadora de fio
Dados para 15 observaes
X: 2,8,11,10,8,4,2,2,9,8,4,11,12,2,4
Y: 9.95,24.45,31.75,35.00,25.02,16.86,14.38,9.60,24.35,27.50,17.08,37.00,41.95,11.66,21.65

O grfico sugere possvel associao entre x e y.
Exerccios:
2.1)Observe o grfico abaixo:

Com estas informaes elabore um grfico de Pareto
Resposta

2.2)Elabore um ramo e folhas para os dados abaixo:
11,11,11,11,11,11,11,14,14,14,14,16,16,16,21

Resposta
11 | 0000000
12 |
13 |
14 | 0000
15 |
16 | 000
17 |
18 |
19 |
20 |
21 | 0
2.3)
Considere a temperatura diria de uma grande cidade durante o perodo de 15 dias:
22.4 15.7 17.4 18.2 18.5 20.2 19.0 19.3 20.0 14.8 25.1 21.4 19.4 22.2 26.2
Esboce um histograma com 4 intervalos (iniciando em 10 e terminando em 30)
Respostas

2.4)Elabore um grfico de linhas para os dados da temperatura da questo anterior.

2.5) Elabore um grfico de disperso entre o dia de leitura e a temperatura (dados da questo 2.3)

Aps estes exerccios voc dever realizar o teste 2.

Das könnte Ihnen auch gefallen