Sie sind auf Seite 1von 121

ESTATÍSTICA

Para Ignácio (2010) “A estatística é definida como


um conjunto de métodos e técnicas que envolve
todas as etapas de uma pesquisa, desde o
planejamento, coordenação, levantamento de
dados por meio de amostragem ou censo, aplicação
de questionários, entrevistas e medições com a
máxima quantidade de informação possível para
um dado custo, a consistência, o processamento, a
organização, análise e interpretação dos dados para
explicar fenômenos socioeconômicos, a inferência,
o cálculo do nível de confiança e do erro existente
na resposta para uma determinada variável e a
disseminação das informações.”
Arredondamento dos Números
Norma NBR 5891 da ABNT
Quando o primeiro algarismo a ser abandonado no
arredondamento for 0, 1,2,3,4, fica inalterado o último algarismo a
permanecer. Ex. 72,34 passa a 72,3
Quando o primeiro algarismo a ser abandonado no
arredondamento for 6,7,8,9, aumenta-se uma unidade ao último
algarismo a permanecer. Ex. 53,86 passa a 53,9.
Quando o primeiro algarismo a ser abandonado no
arredondamento for 5, temos três situações:
Se após o algarismo 5 seguir em qualquer casa um número
diferente de 0, aumenta-se em uma unidade o algarismo que
anteceder o 5. Ex. 4,1503 passa a 4,2.
Se após o algarismo 5 não seguir, em qualquer casa decimal um
número diferente de zero, ao algarismo que anteceder o 5 será
acrescentada uma unidade, se for ímpar e permanecerá
inalterado se for par. 54,75 passa a 54,8 e 54,65 passa a 54,6
Estatística

estatística estatística
descritiva inferencial
ESTATÍSTICA DESCRITIVA

Envolve técnicas que permitem


representar, mensurar e analisar um
conjunto de dados para a tomada de
decisão.
ESTATÍSTICA INFERENCIAL

Envolve técnicas que permitem


utilizar dados de uma amostra para
fazer generalizações sobre a
população
DEFINIÇÃO DE CONCEITOS BÁSICOS

POPULAÇÃO:

.É O CONJUNTO DE TODOS OS
ELEMENTOS QUE CONSTITUEM A
ABRANGÊNCIA DO ESTUDO, OU É O
CONJUNTO DE ELEMENTOS QUE
TENHAM, ENTRE SI, UMA
CARACTERÍSTICA COMUM.
PLANO AMOSTRAL
O Plano Amostral relaciona cada unidade da
população e é usado como base para a
amostra.
Para montar o plano amostral depende da
população alvo.
Exemplo: Se a população for de médicos,
pode-se utilizar o cadastro de registro dos
mesmos, caso seja de alunos de uma
determinada escola, pode-se utilizar a
listagem de matrícula.
DEFINIÇÃO DE CONCEITOS BÁSICOS

AMOSTRA:

É um subconjunto da população.
TIPOS DE AMOSTRAS
Amostra Tendenciosa: Amostra Não Tendenciosa:
Quando a amostra é São amostras representativas
tendenciosa ela não é da população alvo, porque tem
representativa da população características semelhantes,
alvo, porque tem logo podemos fazer inferências
características diferentes, logo para a população.
não poderemos fazer Exemplo: Se fizéssemos uma
inferências para a população. pesquisa com os alunos da
Exemplo: Se fizéssemos uma Fatec e utilizássemos os alunos
pesquisa com os alunos da de todas as turmas, coletando
Fatec e só utilizássemos os amostra representativa dessas
alunos de determinado curso, turmas teríamos então uma
essa amostra seria amostra não tendenciosa e
tendenciosa, não poderíamos poderíamos fazer inferências
fazer inferências para todos os para a população.
alunos da Fatec.
Processo de coleta de Dados
• Definir os objetivos da pesquisa ou estudo (Ex: estimar a
renda familiar dos moradores de S.C.S)
• Definir a variável e a população de interesse (renda das
famílias de SCS)
• Definir os sistemas de coleta e medição de dados
(processo de amostragem, tamanho da amostra, dispositivo
de medição de dados (questionário, roteiro, telefone, etc)
• Coletar a amostra (seleção dos assuntos a serem incluídos
e coleta dos dados)
•Revisão do processo de amostragem após a coleta dos
dados.
Definições de Conceitos Básicos
Medidas estatísticas:

São os parâmetros que representam as


características estudadas da população
ou amostra em questão.
Definições de Conceitos Básicos

INFERÊNCIA:
Processo de generalizar para a
população os resultados obtidos em
uma amostra.
Definições de Conceitos Básicos
Unidade Observável:

A portadora da característica ou propriedade


que se deseja investigar.
Definições de Conceitos Básicos

VARIÁVEL:
Representação simbólica da
característica ou propriedade que
se deseja investigar.
Medidas e Níveis de
Mensuração
tipos de variáveis

Qualitativas Quantitativas
ou categóricas ou numéricas

nominal ordinal Intervalar Razão


ou discreta ou contínua
18
CLASSIFICAÇÃO DOS TIPOS DE PESQUISA

EXPLORATÓRIAS

PESQUISAS DESCRITIVAS

CONCLUSIVAS EXPLICATIVAS
PESQUISA EXPLORATÓRIA
È utilizada quando o pesquisador necessita de um
maior conhecimento sobre o tema da pesquisa
para formular questões ou hipóteses ou quando
conhecendo o tema precisa decidir qual será,
dentre as opções existentes, o enfoque de sua
pesquisa.
A pesquisa exploratória compreende:
Levantamentos em fontes secundárias,
Levantamentos de experiências, estudos de
casos e observação informal
LEVANTAMENTO EM FONTES SECUNDÁRIAS
Compreendem: Levantamentos bibliográficos,
Levantamentos documentais, Levantamentos de
Estatística e Levantamento de Pesquisas Realizadas.
Levantamentos Bibliográficos: Esse levantamento
envolve pesquisa sobre o assunto em livros, revistas
especializadas ou não, dissertações e teses apresentadas
em universidades e informações publicadas em jornais,
órgãos governamentais, sindicatos, associações de classe,
etc.
Levantamentos Documentais: Esse levantamento é
muitas vezes realizado nos arquivos da própria empresa
ou fora dela, quando se recorre à análise de documentos
de arquivos públicos.
LEVANTAMENTO EM FONTES SECUNDÁRIAS
Levantamentos de Estatísticas: são inúmeras as
instituições (governamentais ou não) que geram
estatísticas sobre os mais diferentes assuntos. Exemplos:
IBGE,Fipe, FGV, Fundação Seade.
Levantamentos de Pesquisas Realizadas: Esses
levantamentos ampliam a visão do pesquisador sobre o
tema, além de possibilitar um contato maior com outras
metodologias. As fontes para estes levantamento são:
empresas de pesquisas, universidades, faculdades,
institutos de pesquisa, publicações especializadas, etc.
LEVANTAMENTO DE EXPERIÊNCIAS
O objetivo do levantamento de experiências é o de obter e sintetizar
todas as experiências relevantes sobre o tema em estudo e, dessa
forma, tornar o pesquisador cada vez mais consciente da
problemática em estudo. As formas de levantamento de
experiências compreendem: entrevistas individuais ou em
grupo, realizadas com especialistas ou conhecedores do assunto.
As entrevistas individuais são realizadas quando o número de
especialistas for pequeno e com experiências variadas, já as
entrevistas em grupo são realizadas quando esse número for
grande e com experiências assemelhadas. Essas entrevistas
caracterizam-se pela informalidade e pouca estruturação.
Como o objetivo desse levantamento é ganhar conhecimento sobre
o tema, o próprio pesquisador é quem deve, de preferência, realizar
as entrevistas. Esses estudos exploratórios e não conclusivos,
objetivam aprofundar o conhecimento do assunto e gerar hipóteses
explicativas sobre fatos e fenômenos em estudo, sendo que as
informações são obtidas de amostra casual ou intencional de
pessoas com experiência no campo de estudo.
ESTUDOS DE CASOS SELECIONADOS
Trata-se de um método eficaz para estimular a
compreensão e sugerir hipóteses e questões para a
pesquisa. Esse método pode envolver o exame de
registros existentes, a observação da ocorrência do fato,
entrevistas estruturadas e não estruturadas, etc.
Trata-se de um método de pesquisa exploratória, que pode
ter como objeto de estudo um indivíduo, um grupo de
indivíduos, uma organização, um grupo de organizações
ou uma situação.
Costuma-se trabalhar com casos extremos, no sentido de
exagerar as diferenças que possam existir, e daí tirar
hipóteses explicativas para o fato.
OBSERVAÇÃO INFORMAL
A observação informal em pesquisas
exploratórias envolve nossa natural
capacidade de observar continuamente
objetos, comportamentos e fatos a nosso
redor. A observação deve ser informal e
dirigida, pois deverá centrar-se unicamente
em observar objetos, comportamentos e
fatos de interesse para o problema em
estudo, mesmo que obtidos informalmente.
PESQUISA CONCLUSIVA DESCRITIVA
A pesquisa conclusiva é caracterizada por possuir objetivos bem definidos,
procedimentos formais, ser bem estruturada e dirigida porá a solução de problemas
ou avaliação de alternativas de cursos de ação.
A elaboração das questões na pesquisa descritiva pressupõe profundo
conhecimento do problema a ser estudado. O pesquisador precisa saber
exatamente o que pretende com a pesquisa. A pesquisa descritiva é utilizada
quando o propósito for:
 descrever as características de grupos;
 estimar proporções de elementos numa população específica que tenham
determinadas características ou comportamentos;
 Descobrir ou verificar a existência de relação entre as variáveis.
A pesquisa conclusiva compreende o Levantamento de Campo e o Estudo de
Campo e podem ser Ocasionais ou Evolutivas.
O projeto de pesquisa Ocasional é o mais conhecido e usado, é caracterizado pelo
uso de uma amostra de elementos da população de interesse, em que os
elementos são medidos uma única vez no tempo e visa atender a um objetivo
específico, já o projeto de pesquisa evolutiva baseia-se na coleta e análise
periódica das mesmas variáveis de forma a permitir seus acompanhamentos
evolutivos no tempo.(índice Nielsen Alimentar, Índices de audiência de TV como o
Ibope.
PESQUISA EXPLICATIVA
Essa pesquisa é utilizada em diversas
situações tais como escolha do nome para
um novo produto, escolha de uma nova
embalagem para um produto existente,
quando se quer identificar o melhor perfil
para a equipe de vendas, quais as razões
para o insucesso de vendas, etc.
( Definição dos tipos de pesquisa-
Fonte:Fauze N. Mattar- Pesquisa de
Marketing)
Representando
Dados
dados

qualitativos quantitativos

métodos métodos métodos métodos


gráficos tabulares gráficos tabulares

barras setores tabela de histograma linhas classes de


(pizza) freqüên- freqüên-
cias cias
29
Tabela ABNT NBR 14724 (2011)
Quando precisamos representar as
informações de maneira concisa e de fácil
leitura utilizamos a forma tabular, que é um
quadro com o resumo das observações
realizadas.
Uma tabela possui: título, cabeçalho, corpo,
coluna indicadora, linhas, casas ou células,
fonte, notas e chamadas
EXEMPLO
Tabela 1:

Cabeçalho

corpo da
tabela

Total
Fonte:
ELEMENTOS COMPLEMENTARES DE
UMA TABELA ESTATÍSTICA
• Fonte: é a indicação da entidade responsável pelo
fornecimento dos dados ou pela sua elaboração.

• As notas são informações de natureza geral, destinadas a


conceituar ou esclarecer o conteúdo das tabelas ou indicar
a metodologia adotada no levantamento ou elaboração dos
dados.

• As chamadas são informações de natureza específica


sobre determinada parte da tabela, destinadas a conceituar
ou esclarecer dados.

• Tanto a fonte como as notas e as chamadas devem situar-


se de preferência no rodapé da tabela.
SINAIS CONVENCIONAIS MAIS UTILIZADO EM
TABELAS
Sinais Descrição
__ dado inexistente

... dado ignorado

? dado impreciso

0 dado que, ao se dividir


por uma potência de 10
não se atinge a unidade
Construção da Variável Contínua

AMPLITUDE TOTAL DE UMA SEQUÊNCIA:

É a diferença entre o maior e o menor elemento


de uma sequência.
At = Xmax - Xmin
Construção da Variável Contínua
NÚMERO DE CLASSES:
É o número de divisões que estipulamos para a
amplitude total.
Para o cálculo do número de classes podemos utilizar:
k = n ou podemos utilizar a fórmula de Sturges:
k = 1 + 3,32.log n

AMPLITUDE DO INTERVALO DE CLASSE:


É a diferença entre o limite superior e o limite inferior
da classe: h = L max – lmin
Para o cálculo da amplitude do intervalo de classe
utilizamos a fórmula: h = A t
K
Tabela de Distribuição de Frequência Para Dados
Agrupados sem Classe

xi fi Fiac Fiad fri(%) Friac(%) Friad(%)


17 3 3 50 6 6 100
18 18 21 47 36 42 94
19 17 38 29 34 76 58
20 8 46 12 16 92 24
21 4 50 4 8 100 8
Notação: Fórmulas Excel:
Xi = Variável em estudo
fi= frequência absoluta simples =CONT.SE(Valores da amostra; Valores do Xi)
Fiac = frequência absoluta acumulada crescente =FREQÜÊNCIA(valores da Amostra;valores do Xi)
Fiad = frequência absoluta acumulada decrescente
fri = frequência relativa simples
Friac= frequência relativa acumulada crescente
Friad = frequência relativa acumulada decrescente
Tabela de Distribuição de Frequência Para Dados Agrupados em Classe
Máximo 93 máximo valor da amostra . Fórmula Excel: =MÁXIMO(valores da amostra)
Minimo 45 mínimo valor da amostra . Fórmula Excel: =Mínimo(valores da amostra)
Range 48 Range ou amplitude total é o valor do máximo menos o mínimo
Nº de classes 6 O nº de classes pela fórmula de Sturges é no excel: =ARRED((1+3,32*LOG10(40));0)
Intervalo de classe é a divisão do Range pelo número de classes
Intervalo de classe 8
equivale a quantidade de termos da amostra. Fórmula do Excel: =CONT.NÚM(valores da amostra)
Tamanho da amostra 40

Xi Li Ls Lex Fi Fiac Fiad Fri Friac Friad


49 45 53 52,9 3 3 40 7,5 7,5 100
57 53 61 60,9 11 14 37 27,5 35,0 92,5
65 61 69 68,9 12 26 26 30,0 65,0 65,0
73 69 77 76,9 9 35 14 22,5 87,5 35,0
81 77 85 84,9 4 39 5 10,0 97,5 12,5
89 85 93 92,9 0 39 1 0,0 97,5 2,5
97 93 101 100,9 1 40 1 2,5 100 2,5

Notação: Fórmulas Excel:


Xi = Variável em estudo = média(li e ls)
fi= frequência absoluta simples
Fiac = frequência absoluta acumulada crescente =FREQÜÊNCIA(valores da Amostra;valores do Lex)
Fiad = frequência absoluta acumulada decrescente
fri = frequência relativa simples
Friac= frequência relativa acumulada crescente
Friad = frequência relativa acumulada decrescente
GRÁFICOS
Quando precisamos representar as informações
de maneira concisa e de fácil leitura podemos
utilizar a forma gráfica. Os gráficos devem ser
simples, claros e trazer informações verídicas,
sem levar a conclusões errôneas. Eles podem ser:
diagramas, cartogramas e pictogramas.
Diagramas: são os gráficos geométricos que
utilizam o diagrama cartesiano.
Cartograma: é a representação sobre uma carta
geográfica.
Pictograma: são gráficos que utilizam desenhos,
figuras para representar as variáveis em análise.
Representação Gráfica

• • Estamos bem acima dos


nossos competidores!

X
Y
Nós

30% 32% 34% 36%


Forma Correta de Representação
Gráfica

X 32%

Y 33%

NÓS 35%

0% 10% 20% 30% 40%


Gráfico de Ramo e Folhas
O gráfico ramo e folha é uma das mais
elementares representações utilizadas, sua
aparência é semelhante ao histograma ou
gráfico de barras, nada mais é que o rol com
uma nova disposição, exibe os dados
isolando o algarismo mais significativo,
denominado galho dos demais denominados
folha. Os ramos são dispostos ao longo do
eixo principal, sendo inserida uma folha para
cada valor de dados de forma que exibe a
distribuição dos dados.
Gráfico de Ramo e Folha
Exemplo: Dadas a amostra de 19 notas de provas
Amostra de 19 notas de provas:76 74 82 96 66 76 78 72 52 68 86 84
62 76 78 92 82 74 88
Os dados foram divididos em duas partes: dezenas e unidades,
sendo que a primeira parte apresenta as dezenas, são os ramos, e a
segunda parte representa as unidades , são as folhas.

5 2
6 2 6 8
7 2 4 4 6 6 6 8 8
8 2 2 4 6 8
9 2 6
Gráfico de Ramo e Folha
Se o número de dados for muito grande, pode-se dividir os ramos,
duplicando-os. Os algarismos 0,1,2,3,4 devem ser colocados na
primeira parte e os demais, 5,6,7,8,9 na segunda parte.
Exemplo:
2 1 1 2
2 5 6 8
3 2 4 4
3 5 5 5 5 67 8 9
4 0 1 2 3
4 5 5 6 6 7 7 8 8 9 9
5 0 1 1 2
5 5 5 6 6 7
6 2 3
6 7
Gráfico de Barras
Os gráficos de barras são muito utilizados por permitirem um
maior grau de precisão e maior flexibilidade. Gráficos que
mostram a quantidade de dados que pertence a cada categoria
como uma área retangular dimensionada proporcionalmente.
Este é o tipo de gráfico normalmente utilizado. Cada categoria é
representada por uma barra retangular distinta, sendo que a
frequência é indicada pelo comprimento (altura da barra)
Os gráficos de barras podem ser verticais ou horizontais. No
gráfico de barras verticais as categorias são representadas no
eixo horizontal e a frequência ou porcentagem no eixo vertical, já
no gráfico de barras horizontais os eixos são invertidos, ou seja,
as categorias são representadas no eixo vertical enquanto a
frequência ou porcentagem são representadas no eixo horizontal.
Os gráficos de barras podem ser com divisão de categorias,
quando se deseja comparar frequências ou também segmentados
em que cada barra é dividida de forma proporcional e o
comprimento total da barra indica a frequência total.
TAXA (%) PIB E SUBSETORES

(IBGE)
Evolução das Tarifas Industriais de
Energia
160
138
140
120
102
100
84
79
80 2002
64 2007
56 56
60 52 49
37
40
20
0
Brasil México Alemanha EUA França
Unidades de Jogos Digitais Vendidos por Gênero
na Cidade “X” em 2017

1300
Outros

3500
Armas
Gênero

7000
Ação

12000
Estratégias

28000
Esporte

0 5000 10000 15000 20000 25000 30000


Nº de unidades
Satisfação dos Jogadores por Gênero de Jogo na cidade
"X" no ano de 2017
35000

30000

25000
Número de Jogadores

20000

Insatisfeiros
15000
Satisfeitos

10000

5000

0
Esporte Estratégias Ação Armas Outros
Gênero
Gráfico Poligonal
Também conhecido como gráfico de
linhas é utilizado para representar dados
quantitativos e apresentar dados de séries
temporais. Os gráficos de linhas são muito
úteis para mostrar tendências em seus
dados, são usados para representar
frequências ou porcentagens.
Outro gráfico de linhas muito utilizado é o
de frequência acumulada, também
conhecido como Ogiva.
PIB e PIB per capita

(IBGE)
Taxa de Investimento e Poupança

(IBGE)
GRÁFICO DA FREQUÊNCIA ACUMULADA

Acesso ao site “X”


25

20
Nº de Pessoas

15

10

0
3 4 5 6 7 8
Tempo de Conexão
GRÁFICO DA FREQUÊNCIA ACUMULADA - OGIVA

Massa dos Clientes da Academia "Forte" 2017

45

40

35

30
Nº de Pessoas

25

20

15

10

0
45 53 61 69 77 85 93 101
Massa (Kg)
GRÁFICOS DE SETORES
Gráficos de setores, também conhecidos
como pizza ou torta ou gráficos em
círculo são úteis para mostrar a
quantidade de dados que pertence a
cada categoria como uma parte
proporcional de um círculo. São muito
usados na representação de variáveis
qualitativas e podem descrever as
informações com a utilização da
frequência relativa.
Taxa média do Crescimento do PIB Brasileiro por
Década

4%
16% 26%
1961-1970

1971-1980
11%

1981-1990

7%
1991-2000

36% 2001-2010

2011-2015
Níveis de Risco de Fundos Mútuos

41 29
Baixo
Médio
Alto
29

Tempo de Conexão dos Funcionários da


Empresa X
5% 5%
3
20% 15%
4
5

25% 6

30% 7
8
Histograma
O histograma é utilizado para representar
uma distribuição de frequência de uma
variável quantitativa contínua. No caso de
histograma a frequência é representada
pela área da barra.
Embora o histograma se pareça muito
com um gráfico de barras, existem duas
diferenças principais:
 O eixo na parte inferior (eixo x) possui
uma escala contínua, e os blocos são
dispostos juntos
A área de cada bloco representa a
frequência.
Número de Horas de Acesso à
Internet por semana
14

12

10
Número de pessoas

0
12 14 16 18 20
Número de Horas
Diagrama de Pareto
Diagrama de Pareto, ou diagrama ABC, é um
gráfico de barras que ordena as frequências
das ocorrências da maior para a menor,
permitindo a priorização dos problemas,
procurando levar a cabo o princípio de Pareto
(poucos essenciais, muitos triviais), isto é, há
muitos problemas sem importância diante de
outros mais graves. Sua maior utilidade é a de
permitir uma fácil visualização e identificação
das causas ou problemas mais importantes,
possibilitando a concentração de esforços sobre
os mesmos. É uma das sete ferramentas da
qualidade.
Gráfico de Pareto
Gráfico de Pareto do Crime de Ódio
5000 120

4500
100
4000

Porcdntagem
3500
Contagem

80
3000

2500 60

2000
40
1500

1000
20
500

0 0
Raça Orientação Religião Etnia Outros
Sexual
Tipo de Crime de Ódio
Gráfico de Pareto
Tarefas de Limpeza que Mais Desagradam ás
Mulheres
300 120

250 100

200 80

Porcentagem
Contagem

150 60

100 40

50 20

0 0
Limpar o Limpar o vaso Limpar a geladeira Tirar o pó Outros Limpar o chão
chuveiro/banheira sanitário
Tarefas de Limpeza
SÉRIES GEOGRÁFICAS
 representadas por barras ou setores
 permite identificar as localizações
onde o fenômeno atua com mais
intensidade
Assentados por Região
SUL 1.038

SUDESTE 1.566

CENTRO-
4.437
OESTE

NORDESTE 13.256

NORTE 16.004

0 2.000 4.000 6.000 8.000 10.000 12.000 14.000 16.000 18.000

Fonte Incra
SÉRIES TEMPORAIS
 Representadas por gráficos de linhas;
Permite visualizar o fenômeno ao longo do
tempo.
Número de Pessoas que frequentam
Cinemas

1,65
1,63

1,6
1,57
1,55
1,53

1,5
Bilhões

1,49
1,47
1,45
1,42
1,41
1,4

1,35

1,3
2005 2006 2007 2008 2008 2010 2011
Anos
MEDIDAS ESTATÍSTICAS
Medidas
Estatísticas

Posição Variação Forma Ordenamento

Média Assimetria Separatrizes


Amplitude
Mediana
Variância Desvio
Moda Inter-
Quartílico
Desvio Padrão

Coeficiente de variação
NOTAÇÃO
Medida Amostra População

Média X m

Desv. Padrão S s
2
Variância S s
2

Tamanho n N
MÉDIA

 Uma das medidas mais utilizadas para


representar uma distribuição de dados

 Reflete um ponto de equilíbrio

 Influenciada por valores extremos

 Só deve ser utilizada em distribuições:


 Não heterogêneas
 Simétricas ou levemente assimétricas
PROPRIEDADES DA MÉDIA
 A Média aritmética sempre existe e é única.
 A média aritmética é sensível a todos os valores
do conjunto. Se um valor se modifica a média
também se modifica
 Se a cada elemento de um conjunto numérico,
somarmos ou subtrairmos uma constante, a
nova média ficará acrescida ou subtraída desta
mesma constante
 Se cada elemento de um conjunto numérico
qualquer for multiplicado ou dividido por uma
mesma constante, a nova média ficará
multiplicada ou dividida por esta constante
MÉDIA

$ 20.000 ... Empregados reclamam que,


na maioria, recebem apenas
$ 10.000
$ 1.000,00 por mês.
$ 5.000 ... Presidente diz que,
em média, eles
$ 3.000
recebem
$1.000 aproximadamente
$ 5.300,00
Exemplo:
 Dados: 12 6 10 8 6 7

 Xi X1 + X 2 + X 3 + X 4 + X 5 + X 6
i =1
X = =
n 6
12 + 6 + 10 + 8 + 5 +7 48
= =
6 6
X =8
Média para Dados Agrupados
MÉDIA PONDERADA
Xi f i População
m= i =1
f
i

m
 Xi fi Amostra
i =1
X =
 f
i
Dados Agrupados sem Intervalo de Classe

Xi fi xi . fi Fiac
2 1 2 1
5 4 20 5
8 10 80 15
10 6 60 21
12 2 24 23
23 186

 Xi fi
i =1 = 186/23 = 8,1
X =
 f
i
Dados Agrupados com intervalo de Classe

Classes Xi fi xi . fi
2 -- 4 3 5 15
4 -- 6 5 10 50
6 -- 8 7 4 28
8 -- 10 9 1 9
20 102
Cálculo da Média de Dados Agrupados com
intervalo de Classe

mX f
X = 
i=
i
i
1
= 102/20 = 5,1
 fi
Média Geométrica
É a raiz, de índice igual ao número de fatores, do
produto dos números. A média geométrica pode ser
empregada na análise de dados agrupados ou não.
Torna-se muito útil em situações que buscam analisar,
por exemplo, um certo padrão ou razão de
n
crescimento. xg = n  xn
n =1
Exemplo: Dados dois números {9, 16} temos
que xg = 9.16 = 12
Exemplo: Dados três números { 5,8,25} temos
que xg = 3 5.8.25 = 10
Média Harmônica
É o inverso da média aritmética dos inversos dos
números. A utilização prática da média harmônica
concentra-se em cálculos que envolvam, por exemplo,
a obtenção de velocidades ou tempos médios.
Xh = n
n
1

i =1 xi
Exemplo: Dados os valores {2, 6} a média harmônica
será:
2
=3
1 1
+
2 6
MEDIANA
 Valor que divide a distribuição em duas
partes iguais
 Se n for ímpar, a mediana será a obs. que
ocupa a posição central
 Se n for par, a mediana será a média dos dois
valores centrais
 Não é influenciada por valores extremos,
é o termo central da distribuição.
MÉTODO DE CÁLCULO DA MEDIANA
1. Ordenar a série de valores
2. Determinar a posição da mediana

Se n é ímpar: n +1
2
Se n é par: n e n +1
2 2

O valor da mediana é o valor da variável relativo à posição


encontrada
EXEMPLO: MEDIANA (QUANTIDADE IMPAR)

Dados: 34 32 31 33 32
Ordenar: 31 32 32 33 34
Posição: 1 2 3 4 5
Posição: (n+1)/2 =(5+1)/2= 3
MEDIANA: 32
EXEMPLO: MEDIANA ( quantidade par)

 Dados: 10 4 8 11 6 7
 Ordenar: 4 6 7 8 10 11
 Posição: 1 2 3 4 5 6

Posição1 = n /2 = 6 / 2 = 3
n = 6 +1 = 4
Posição2 = +1
2 2
7 + 8
Mediana = = 7,5
2
MEDIANA – DADOS AGRUPADOS
1.Determinamos as frequências acumuladas
2. Calculamos a posição da mediana
3. Marcamos a classe correspondente e utilizamos a
interpolação para descobrir o intervalo em que a
Mediana se encontra:

Md = l* + ∑ fi – Fiac . h *
2
_________________
f*
CÁLCULO DA MEDIANA
i Classes fi Fiac

1 150 154 4 4

2 154 158 9 13

3 158 162 11 24

4 162 166 8 32

5 166 170 5 37

6 170 174 3 40

A posição da mediana será: 40 :2 = 20ª posição que


corresponde à 3ª classe 158 162
CÁLCULO DA MEDIANA

Md = 158 + 40/2 – 13 .4 = 160,54


11
MODA
 Valor mais freqüente

 Não é afetada por valores extremos

 Pode haver mais de uma moda

 Pode ser utilizada para dados qualitativos


e quantitativos
EXEMPLOS DE MODA

DADOS - 2,3,3,4,5,6,7 Moda = 3

DADOS - 2,2,5,5,6,7,8 Moda = 2 e 5

DADOS – 20,23,24,25,26 Moda = amodal


MODA- DADOS AGRUPADOS
FÓRMULA DE CZUBER

A classe que apresenta a maior freqüência é


denominada classe modal. Para calcular a
moda iremos utilizar os dados da classe
modal.
Existe um método mais elaborado para cálculo da
Moda, que faz uso da fórmula de Czuber:
M0 = l* + D1 . h*
D 1 + D2

D1= f* - fant D2= f * - fpost


MODA- DADOS AGRUPADOS
FÓRMULA DE KING
Para calcular a moda de dados agrupados
podemos utilizar a fórmula de King, que
também utiliza a classe modal .
Mo = l* + fpost . h*

f ant + fpost

l* = limite inferior da classe modal


h* = amplitude do intervalo da classe modal
Moda para dados agrupados sem Intervalo de
Classe

Xi fi xi . fi Fiac
2 1 2 1
5 4 20 5
8 10 80 15
10 6 60 21
12 2 24 23
23 186
Mo= 8
Moda para Dados Agrupados por Classe - Czuber

Classes Xi fi xi . fi
2 -- 4 3 5 15
4 -- 6 5 10 50
6 -- 8 7 4 28
8 -- 10 9 1 9
20 102
M0 = l* + D1 . h* M= 4 + 5 .2 = 4,9
D1 + D 2 5+6

D1= f* - fant = 10-5= 5 D2= f * - fpost = 10-4=6


MEDIDAS DE VARIAÇÃO
AMPLITUDE TOTAL
 Diferença entre a maior e a menor
observação:
 A = Lim sup. – Lim inf.
 Ignora como os dados estão
distribuídos
 Considera apenas dois valores da
distribuição: o valor máximo e o valor
mínimo
Variância & Desvio Padrão

Medidas mais comuns de variação absoluta

Indicam como os dados estão concentrados em


torno da média
FÓRMULA: VARIÂNCIA DADOS NÃO AGRUPADOS

n - 1 no denominador! (use N no
n caso da Variância da População)
2
 (X I- X )
i =1
S =
2
n -1

2 2
2 (X1 - X) + (X2 - X) + L + (Xn - X) 2
S =
n -1
FÓRMULA: Variância para dados não
agrupados

S2 = 1 ∑ xi2 - (∑xi)2
n-1 n
FÓRMULA DESVIO PADRÃO- DADOS NÃO
AGRUPADOS

n

2
(Xi - X )
i =1
s=
n -1

2 2 2
(X1 - X) + (X2 - X) + L + (Xn - X)
s=
n -1
EXEMPLO: VARIÂNCIA

 Dados: 10 4 8 11 6 9

6
  Xi
)2
(Xi - X n
i =1 i =1
= onde X = =8
n -1 6

2 2
(10- 8) + (4 - 8) 2
+ L + (9- 8)
=
6 -1
2
S = 6,8
Exemplo: Desvio padrão

 Dados: 5 5 10 10 20

n 6
  Xi
2
(Xi - X)
i =1 i =1
S = onde X = = 10
n -1 6
2 2 2
(5 - 10) + (5 - 10) + L + (20-10)
S =
5 -1
S = 37,5 = 6,1
Fórmula: Variância para dados agrupados sem
e com intervalo de classe

 (X i - X ).fi
i =1
S =
2
n -1
Fórmula: Variância para dados
agrupados sem e com intervalo de
classe

S2 = 1 .[∑(xi2.fi) - ∑(xi.fi)2 ]
n-1 n
Variância para Dados Agrupados por Classe: Czuber

Classes Xi fi xi . fi xi2.fi
2 -4 3 5 15 45
4 -6 5 10 50 250
6 -8 7 4 28 196
8 -10 9 1 9 81
20 102 572
S2 = 1 .[∑(xi2.fi) - ∑(xi.fi)2 ] = 1 . (572-1022 ) = 2,72
n-1 n 19 20
O desvio padrão é a raiz quadrada da variância = 1,65
PROPRIEDADES DO DESVIO PADRÃO
Se somarmos ou subtrairmos todos os
elementos de um conjunto original por uma
constante, o desvio padrão deste mesmo
conjunto não irá se alterar, ou seja,
permanecerá exatamente o mesmo.
Se multiplicarmos ou dividirmos todos os
elementos de um conjunto original por uma
constante, o desvio padrão do novo conjunto
ficará multiplicado ou dividido por essa
mesma constante.
Coeficiente de Variação

 Medida relativa de variação


 Indica se a distribuição é homogênea ou não
 Mede a dispersão dos dados em relação à média
 Serve para comparar séries distintas de dados.
CV < 15% BAIXA DISPERSÃO
Desvio Padrão * 100 15%≤CV<30% MÉDIA DISPERSÃO
CV =
Média CV≥30% ALTA DISPERSÃO
Quartis & Box Plot
QUARTIS

25% 25% 25% 25%


Q1 Q2 Q3

Posição o i-ésimo Quartil = X  i.n 1  com


i =1,2 ou 3  + 
 4 2
EXEMPLO: QUARTIS

 Dados: 10 4 8 11 6 7
 Ordenados: 4 6 7 8 10 11
 Posição: 1 2 3 4 5 6

Posição = x  i.n 1  =x 1.6 1  = 2


 +  +  
 4 2  4 2

Q = 6
1
EXEMPLO QUARTIS

 Dados: 10 4 8 11 6 7
 Ordenados: 4 6 7 8 10 11
 Posição: 1 2 3 4 5 6

Posição =x i.n 1 x 2.6 1 = 3,5


   
 +   + 
 4 2  4 2
Q = 7,5
2
EXEMPLO QUARTIS

 Dados: 10 4 8 11 6 7
 Ordenados: 4 6 7 8 10 11
 Posição: 1 2 3 4 5 6

Posição =x x = 5
 i.n 1   3.6 1 
 +   + 
 4 2  4 2

Q = 10
3
Medidas de Ordenamento
Precisamos muitas vezes proceder fazer a interpolação
linear para obtermos as medidas de ordenamento.
Exemplo: Dada a série de dados: { 3,7,9,11,15} ao aplicar
a fórmula para o cálculo do terceiro quartil encontramos
x4,25 para obtermos esse elemento verificamos que o
mesmo situa-se entre o 4º e o 5º termo, basta então
utilizar uma regra de três simples:
0,25 ______ 1
x ______ 4
Obtemos através do cálculo que x =1, logo o elemento
será igual a 11 +1 = 12
Q3 = 12
Outras medidas de ordenamento
Os quartis dividem a distribuição ordenada em 4
partes iguais, já os decis dividem a distribuição
ordenada em dez partes iguais e os percentis
dividem a distribuição ordenada em cem partes
iguais.
As fórmulas para localização são parecidas:
Qi = x Di = x Pi = x
 i.n 1   i.n 1   i.n 1 
 +   +   + 
 4 2  10 2   100 2 
Medidas de Ordenamento para Dados Agrupados por Classe
Para o cálculo dos quartis para dados agrupados com intervalo de classe
usamos a fórmula:
 i  fi 
Qi =  - Fiacant 
l * + 4 .h *
 fi * 
 
 
Para o cálculo dos decis para dados agrupados com intervalo de classe
usamos a fórmula:
 i  fi 
Di =  - Fiacant 
l * + 10 .h *
 fi * 
 
 
Para o cálculo dos decis para dados agrupados com intervalo de classe
usamos a fórmula:
 i  fi 
Pi =  - Fiacant 
l *+  100 .h *
 fi * 
 
 
DESVIO INTER QUARTILÍCO

 Medida de dispersão
 Diferença entre o 3º & o 1º quartis
 Não é afetado por valores extremos

dq = Q - Q
3 1
Box Plot

 Apresenta a dispersão dos dados usando 5 medidas


resumo

mín Q1 Md Q3 X máx
X

4 6 8 10 12
Outlier
 Observação discrepante (atípica)

Desvio Inter-Quartílico (dq)

OUTLIER Q1 Q3

* 1,5 dq 1,5 dq
*
4 6 8 10 12
MEDIDAS DE FORMA- ASSIMETRIA
 Descreve a forma da distribuição
 Denomina-se Assimetria o grau de afastamento de
uma distribuição, da unidade de assimetria
 Medida pelo coeficiente de assimetria

Assimetria negativa Assimetria positiva


Média Mediana Moda Moda Mediana Méd

Simétrica
Média = Mediana = Moda
Coeficientes de Pearson
Primeiro Coeficiente de Pearson: AS = x- Mo
s
Segundo Coeficiente de Pearson: AS = 3.(x-Md)
s
Coeficiente de Bowley: Q3 + Q1 – 2.Md
Q3 – Q1
ASSIMETRIA

Assimetria Assimetria
negativa Simétrica positiva
Q 1 Mediana Q 3 Q 1 Mediana Q3 Q 1 Mediana Q 3
CURTOSE
SIGNIFICA VERIFICAR O GRAU DE
ACHATAMENTO DA CURVA, OU SEJA, SABER
SE A CURVA APRESENTA-SE MAIS “AFILADA”
OU MAIS “ACHATADA” EM RELAÇÃO A
CURVA NORMAL.
TEMOS TRÊS TIPOS DE CURVA:
CURVA LEPTOCÚRTICA, MESOCÚRTICA E
PLATICURTICA.
ÍNDICE PERCENTÍLICO DE CURTOSE

C = (Q3 – Q 1 ) C = (Q3 - Q 1)
2(D9 - D1 ) 2(P90 - P10 )

C < 0,263 Distribuição Leptocúrtica


C = 0,263 Distribuição Mesocúrtica
C > 0,263 Distribuição Plati cúrtica
CURTOSE

Leptocúrtica
Mesocúrtica

Platicúrtica

Das könnte Ihnen auch gefallen