You are on page 1of 20

UNIVERSIDADE ANHEMBI MORUMBI

ESTATSTICA DESCRITIVA

Autor: Prof. Carlos Roberto Carneiro

Sumrio 1. Organizao, Resumo e Apresentao de Dados .........3 2. Natureza dos Dados.............................................................3 3. Analise de Grandes Grupos de Dados .............................5 4. Distribuio de Freqncia ...............................................5 5. Medidas de Tendncia Central ...................................... 12 6. Medidas de Disperso ...................................................... 14 7. Medidas para Dados Agrupados .................................... 17

Estatstica Descritiva
1. Organizao, Resumo e Apresentao de Dados: Os mtodos estatsticos envolvem a anlise e a interpretao de nmeros; tais como : Renda anual, vendas mensais, nmero de peas defeituosas, etc... Vamos ento ver os mtodos mais usados na organizao e sumarizao dos dados estatsticos. 1.1. Dados versus Informao Grande quantidade de nmeros tendem a confundir. Na sua forma no processada, os dados quase no tem sentido. Ex.: Nmero de Acertos do Teste do Primeiro Dia.

O processamento dos dados constitui uma ajuda porque reduz a quantidade de detalhes. Alm disso facilita a constatao de relaes. O processamento transforma dados em informao. Ex. : Organizando e condensando-os em grficos ou em poucos nmeros, os quais, ento, nos transmitem a essncia dos dados . Para o processamento de dados, os grficos e mapas so particularmente atraentes porque proporcionam uma visualizao das caractersticas importantes dos dados. 2. Dados Estatsticos Os dados estatsticos obtm-se mediante um processo que envolve a observao ou outra mensurao de itens, tais como : renda anual, resistncia ruptura de fibras, dimetro de eixos, etc..... Esses itens chamam-se variveis. 2.1. Tipos de Dados As variveis contnuas podem assumir qualquer valor num intervalo contnuo. Os dados referentes a tais variveis dizem-se dados contnuos . Populao : qualquer conjunto de informaes que tenham, entre si, uma caracterstica comum Exemplo : a. Populao : pessoas residentes em uma cidade Varivel : idade b. Populao : sabonetes de certa marca Varivel : peso lquido c. Populao : peas produzidas por uma mquina

7 Varivel :dimetro externo. d. Populao : indstrias de uma cidade Varivel : ndice de liquidez. Outros : Alturas, velocidade, temperatura, consumo, ( valores quebrados ) As variveis discretas assumem valores inteiros, no negativos. Os dados discretos so o resultado da contagem do nmero de tens. Exemplo : a. Populao : casais residentes em uma cidade Varivel : nmero de filhos. b. Populao : as jogadas possveis com um dado. Varivel : o ponto obtido em cada jogada. c. Populao : aparelhos produzidos em uma linha de montagem Varivel : Nmero de defeitos por unidade. Outros : Nmero de alunos na sala de aula, nmero de clientes de uma padaria, nmero de acidentes numa fbrica. OBS.: Tantos os dados discretos como os contnuos se dizem quantitativos, porque so inerentemente numricos, isto , os valores numricos acham-se naturalmente associados as variveis que estamos medindo. So variveis qualitativas aquelas que devem ser convertidas em valores numricos antes de serem processadas estatisticamente. Ex.: Sexo ( Masculino / Feminino ) , Cor dos olhos; Desempenho ( excelente, bom, sofrvel, mau ) Os dados nominais surgem quando se definem categorias e se conta o nmero de observaes pertencentes a cada categoria. Ex. Campo de estudo ( Medicina, Direito, Administrao, Economia ), Sexo ( masculino / feminino ), Cor dos olhos ( azuis, castanhos, pretos, verdes ). Os dados por postos consistem de valores relativos atribudas para denotar ordem : Primeiro, segundo, terceiro, quarto, etc.... Ex. Concursos das Escolas de Samba ( Avaliao Subjetiva ) Concurso de Beleza Concurso da Sogra ( + jararaca ) OBS.: Muitas populaes podem originar os quatro tipos de dados

Tipos de Dados
Populaes Alunos 2 Grau Automveis Venda de Imveis 3. Notao Sigma Contnuo Altura/Peso Peso/Consum o Valor R$ Discreto nde alunos na classe n de defeitos n Ofertados Nominal menino/menina cores Acima do Preo Merc. Por Posto Alunas mais belas limpeza Melhor Layout Interno

x
i =1

Significa que devemos somar n (todas) observaes.

Costuma-se escrever abreviadamente Exemplo : 3.1. Propriedades : a.

x .. ou.. x
i

cx

= . cx

- Quando cada valor dever ser multiplicado ou divido por uma constante

b.

c
i =1

= nc - A soma de uma constante igual ao produto da constante pelo nmero de vezes

que ela ocorre. c.

( x

2 i

yi = xi2 yi - A soma de uma soma ( ou diferena ) de duas variveis igual


i =1 i =1

soma ( ou diferena ) das somaes individuais das duas variveis

3. Anlise de Grandes Conjuntos de Dados : Os homens requerem um grau suficientemente alto de estrutura ou organizao para bem se conduzirem na vida. Considere o leitor o caso de uma biblioteca, onde os livros so catalogados por ttulo, por autor, e por assunto, alfabeticamente, e imagine quanto lhe custaria localizar determinado livro, se eles fossem colocados nas estantes totalmente a esmo, onde quer que haja lugar, sem qualquer preocupao de ordenao, catalogao ou classificao. Os mtodos principais para organizar dados estatsticos compreendem o arranjo ou disposio dos itens em subconjuntos. Os dados grupados podem ser resumidos graficamente ou em tabelas, bem como mediante o uso de medidas numricas tais como mdia, intervalo, desvio padro, etc. A designao para os dados dispostos em grupos ou categorias a distribuio de freqncia. 4. Distribuio de Freqncia Uma distribuio de freqncia um mtodo de grupamento de dados em classes, exibindo o nmero ou percentagem de observaes em cada classe (freqncia de classe). Uma distribuio de freqncia pode ser apresentada sob forma grfica ou tabular. 4.1. Construo de uma Distribuio de Freqncia para Dados Contnuos. Os principais estgios na construo de uma distribuio de freqncia para dados amostrais so: Estabelecer as classes ou intervalos de grupamento dos dados. Enquadrar os dados nas classes, mediante contagem. Contar o nmero em cada classe. Apresentar os resultados numa tabela ou num grfico.

9 Exemplo: Construir uma distribuio de freqncia para a safra de pssegos do Sogro. Safra Anual (em arrobas/rvore) para 40 Pessegueiros 11,1 12,5 32,4 7,8 21,0 16,4 11,2 22,3 4,4 6,1 27,5 10,7 4.7 7,4 14,5 32,8 15,8 23,5 9,2 3,2 18,5 25,0 14,8 10,0 8,1 16,4 18,2 22,6 26,2 12,9 15,1 12,2 16,0 3,5 19,1 6,0 12,6 19,1 16,2 13,7

Etapas para a Construo


1. Determinar o intervalo dos dados. A maior safra , a menor . I = Maior Menor I= 2. Decidir quanto ao nmero de classes a usar. aconselhvel tomar entre 5 e 15 classes. Uma regra prtica consiste em tomar a raiz quadrada de n (nmero de observaes) e ajust-la (se necessrio) ao limites , entre 5 e 15.
k = numero de observacoes

3. Dividir o intervalo dos dados por k, nmero de classes, para obter uma amplitude de classe : Amplitude =

I k

4. Estabelecer os limites preliminares, comeando com um inteiro logo abaixo do menor valor. Exemplo ; Primeira Classe limite inferior : 3 limite superior : 3 + amplitude = Segunda Classe limite superior da classe anterior = 8 a 8 + amplitude = E assim por diante, at ltima classe Obs. Importante : A que classe pertence por ex. o nmero 8

5. Contagem : Fixadas as classes, cada ponto ser enquadrado numa classe mediante contagem Classe Contagem

10

6. Construir uma tabela de freqncia, ou um histograma de freqncia

Distribuio de Freqncia para Safra de Pssegos Nmero de Arrobas Nmero de rvores

Percentagem de rvores

A mesma informao pode ser apresentada atravs de um histograma de freqncia, que d as classes ao longo do eixo horizontal e as freqncias ( absolutas ou relativas ) ao longo do eixo vertical. As fronteiras das barras coincidem com os pontos extremos dos intervalos de classe.

11

4.1.2. Polgono de Freqncia Uma alternativa, til por vezes, o polgono de freqncia , construdo mediante a conexo dos pontos mdios dos intervalos do histograma com linhas retas

4.2. Construo de uma Distribuio de Freqncia para Dados Discretos Na construo de uma distribuio de freqncia utilizando dados contnuos, perde-se certa quantidade de informao porque os valores individuais perdem sua identidade quando so grupados em classes. Isto pode ou no ocorrer com dados discretos, dependendo da natureza dos dados e dos objetivos do analista.

12 Exemplo : Nmero de Acidentes num perodo de 50 dias na Imigrantes 6 5 3 4 5 9 4 8 7 1 2 4 8 5 2 7 4 4 3 3 0 4 4 7 6 8 2 4 1 0 2 5 7 3 5 5 6 7 8 6 4 3 6 0 6 2 7 5 6 3

Nota-se que os dados consistem de inteiros de 0 a 9 Poderemos construir uma distribuio de freqncia, sem perda dos valores originais, utilizando como classes os inteiros de 0 a 9.

Classe 0 1 2 3 4 5 6 7 8 9

Nmero de Dias com Acidentes

Percentagem Dias com Acidentes

Com perda de Informao Classe 0 2 4 6 8 1 3 5 7 9 Nmero de Dias com Acidentes Percentagem Dias com Acidentes

13 Grficos : Sem Perda e Com Perda de Informao

4.2.1. Construo de uma Distribuio de Freqncia Acumulada Uma distribuio de freqncia acumulada tem por objetivo indicar o nmero ou percentagem de itens menores do que, ou iguais a, determinado valor. No caso dos acidentes, podemos construir distribuies acumuladas para a distribuio sem perda ou com perda de informao. Classe Percentagem Dias com Freqncia Acumulada

0 1 2 3 4 5 6 7 8 9

Acidentes

14

Com perda de Informao Classe 0 - 1 2 - 3 4 - 5 6 - 7 8 - 9 Grficos Percentagem Dias com Acidentes Freqncia Acumulada

15

4.3.Distribuio de Freqncia para Dados Nominais ou por Postos Talvez as distribuies de freqncia de construo mais simples sejam as relativas a dados nominais ou por posto. Tal simplicidade decorre do fato de que as classes so mais facilmente reconhecveis , tornando mnimos os clculos. Exemplos: Vendas de Bebidas Leves do Mac Donald Freqncia Vendas Relativas

Tipo Cola Limo Laranja Uva Cereja Outras

Vendas absolutas 600 200 100 50 40 10

5. MEDIDAS DE TENDNCIA CENTRAL. As medidas de tendncia central so usadas para indicar um valor que tende a tipificar , ou a representar melhor, um conjunto de nmeros.

16 5.1. A MDIA A mdia aritmtica a idia que ocorre maioria das pessoas quando se fala em mdia. Calcula-se a mdia aritmtica determinando-se a soma dos valores do conjunto e dividindo-se pelo nmero de valores do conjunto. Ex. A mdia de 70, 80 e 120 ser:

A mdia de uma amostra representado por expressar-se em notao Sigma

( leia-se x barra ), e seu clculo pode

x=

x
i =1

ou x =

x
n

O processo de clculo da mdia aritmtica o mesmo, quer se trate de um conjunto de valores de uma amostra, quer seja de uma populao. Porm, utiliza-se o smbolo para a mdia de uma populao, e N para o nmero de itens da populao:

x
N

Propriedades da Mdia: A mdia de um conjunto de nmeros pode ser sempre calculada Para um dado conjunto de nmeros, a mdia nica A mdia sensvel ( ou afetada por ) todos os valores do conjunto. Somando-se uma constante a cada valor do conjunto, a mdia ficar aumentada do valor dessa constante. A soma dos desvios dos nmeros de um conjunto a contar da mdia zero : 5.2. A MDIA PONDERADA Clculo da mdia ponderada leva-se em conta os pesos desiguais que tem cada item.

Mdia ponderada =

wx
i =1 n

i i

w
i =1

onde wi o peso da observao de ordem i .

Exemplo :

Exame Not a 1 80 2 90 final 96

Peso
0.30. 0.30 0.40

17

5.3 A MEDIANA A mediana divide um conjunto ordenado de dados em dois grupos iguais; a metade ter valores inferiores mediana , a outra metade ter valores superiores mediana. Para calcular a mediana, necessrio primeiro ordenar os valores do mais baixo ao mais alto. Em seguida, conta-se at a metade dos valores para achar a mediana. A mediana ocupa a posio (n + 1 )/2 . Exemplo :

O processo para determinar a mediana : 1. Ordenar os valores 2. Verificar se h um nmero impar ou par de valores. 3. Para um nmero impar de valores, a mediana o valor do meio. Para um nmero par de valores, a mediana a mdia dos dois valores do meio.

5.4. QUARTIL Os quartis dividem conjuntos ordenados em 4 partes iguais : 25% dos valores sero inferiores ao primeiro quartil ( Q1 ) , 50 % sero inferiores ao segundo quartil ( Q2 = mediana ), 75 % sero inferiores ao terceiro quartil ( Q3 ) , 25 % sero superiores ao terceiro quartil. Exemplo :

5.5. A MODA A moda o valor que ocorre com maior freqncia num conjunto de dados. Exemplo:

5.6. COMPARAO ENTRE MDIA , MEDIANA E MODA

Definio

Vantagens

Limitaes

Mdia

x=

x
n

18
i

Mediana Metade dos valores so maiores, metade menores Moda


Valor mais freqente

1. reflete cada valor 2.Possui propriedades matemticas atraentes 1. menos sensvel a valores extremos do que a mdia

1. influenciada por valores extremos 1. difcil de determinar para grande quantidade de dados 1. no se presta a anlise matemtica

1. valor tpico: maior quantidade de valores concentrados neste ponto

6. Medidas de Disperso As medidas de disperso indicam se os valores esto relativamente prximos uns dos outros, ou separados. Consideraremos quatro medidas de disperso : o intervalo, o desvio mdio, a varincia e o desvio padro. Todas elas, exceto o intervalo, tem na mdia o ponto de referncia. Em cada caso, o valor zero indica ausncia de disperso; a disperso aumenta proporo que aumenta o valor da medida. Exemplo:

6.1. Intervalo O intervalo pode ser expresso pela diferena entre o maior e o menor nmero num grupo de dados, ou pela identificao desses dois nmero. O intervalo uma medida relativamente fcil de calcular. Exemplo :

19

6.2. DESVIO MDIO ABSOLUTO O desvio mdio absoluto de um conjunto de nmeros a mdia dos desvios dos valores a contar da mdia, ignorando-se o sinal de diferena.

DMA =

onde n o nmero de observaes no conjunto.

Exemplo : Determine o desvio mdio para o seguinte conjunto de nmeros: 2, 4, 6, 8, 10.

6.3. A VARINCIA A varincia de uma amostra a mdia dos quadrados dos desvios dos valores a contar da mdia , calculada usando-se n-1 em lugar de n.

2 x

( x =

x)

n 1

Estgios de Clculo: 1. Calcular a mdia 2. Subtrair a mdia a cada valor do conjunto 3. Elevar ao quadrado cada desvio 4. Somar os quadrados dos desvios. 5. Dividir a soma por ( n - l ) se trata de dados amostrais, ou simplesmente por n para somar o conjunto ou se os dados representam todos os valores de uma populao. Exemplo : Calcule a varincia da amostra : 2, 4, 6, 8, 10

20

6.4. O DESVIO PADRO O desvio padro simplesmente a raiz quadrada positiva da varincia.

S =

( x

x)

n 1

Obs.: Como anteriormente, a substituio de ( n - 1 ) por n produz as frmulas do desvio padro da populao. Exemplo. Calcule o desvio padro da amostra: 20, 5, 10, 15, 25

7. MEDIDAS PARA DADOS GRUPADOS As principais medidas para dados grupados so idnticas s medidas para pequenos conjuntos de dados., ou seja, a mdia, a mediana, a moda, a varincia, o desvio padro e o intervalo. 7.1. Mdia de uma Distribuio de Freqncia Para determinar a mdia de uma distribuio de freqncia usa-se a frmula de clculo da mdia ponderada, sendo que os pesos so substitudos pelas freqncias das classes e frmula fica :

x =

f x
i

Obs.: Se no h perda de informao na distribuio de freqncia, a frmula dar o mesmo resultado do clculo com os dados originais; se o grupamento causa perda de informao, os

xi s so substitudos pelos pontos mdios das respectivas classes.


Exemplo : Sem perda de informao

21

Exemplo : Com perda de informao

7.2. Moda de uma Distribuio de Freqncia A moda de uma distribuio de freqncia indica qual poro da distribuio tem a maior freqncia de ocorrncias.

22 7.3. Mediana de uma distribuio de freqncia. Podemos Calcular a mediana de uma distribuio de freqncia usando a seguinte frmula:

( n / 2 ) Fa Mediana = L1 + hmd onde f md L1 n Fa f md hmd

Exemplo :

7.4. Intervalo de uma Distribuio de Freqncia O intervalo simplesmente a diferena entre o maior e o menor valor.

7.5. Varincia e Desvio Padro de uma Distribuio de Freqncia A varincia de dados grupados se determina pela frmula

f ( x x) S =
2 i i

n 1

ou S =
2

f x ( f x)
2 i i i i

/n .

n 1

].

Usa-se ( n - 1 ) se a varincia de uma amostra , e n no caso dos dados constiturem por si a populao. Para uma distribuio sem perda de informao, os valores sero exatos: se houver perda de informao, os xi s sero os pontos mdios das classes.
,

23 Exemplo