Sie sind auf Seite 1von 75

ESTATSTICA

Organizando dados para uma viso melhor

Por: Marden Rodrigues


Aluno de Administrao Segundo Perodo
CONCEITOS GERAIS DE ANLISE
DE DADOS

Por: Marden Rodrigues


DEFINIO E TIPOS DE VARIVEIS

Por: Marden Rodrigues


VARIVEIS QUALITATIVAS

Quando o resultado da observao


apresentado na forma de qualidade ou atributo,
dividem-se em:
Variveis nominais: quando podem ser
separadas por categorias chamadas de no
mensurveis
Variveis ordinais: quando os nmeros podem
agir como categorias ou ordenaes.
Por: Marden Rodrigues
EXEMPLOS DE VARIVEIS QUALITATIVAS

Variveis nominais: a cor dos olhos, tipo de


acomodao, marcas de carro, sexo, etc.

Variveis ordinais: como sugere o nome, elas


envolvem variveis que representam algum
elemento em ordem. Uma classificao em
anos pode ser um exemplo clssico

Por: Marden Rodrigues


VARIVEIS QUANTITATIVAS
Quando o resultado da observao um nmero,
decorrente de um processo de mensurao ou
contagem.
Variveis contnuas: so aquelas que podem
assumir qualquer valor num certo intervalo da
reta real.
Variveis discretas: so aquelas que podem
assumir apenas valores inteiros em pontos da
reta real.
Por: Marden Rodrigues
EXEMPLOS DE VARIVEIS QUANTITATIVAS

Variveis contnuas: no possvel enumerar


todos os possveis valores, essas variveis
geralmente provm de medies, como de
altura, peso, etc.
Variveis discretas: possvel enumerar todos
os possveis valores da varivel, como o
nmero de alunos em uma escola ou o nmero
de mensagens de uma secretria eletrnica.

Por: Marden Rodrigues


DISTRIBUIO DE FREQNCIAS

Por: Marden Rodrigues


Um conjunto de observaes de certo fenmeno,
no estando adequadamente organizado,
fornece pouca informao de interesse ao
pesquisador e ao leitor. Para uma viso rpida e
global do fenmeno deve-se fazer a organizao
dos dados coletados em uma pesquisa atravs
das distribuies de freqncia.

Por: Marden Rodrigues


REPRESENTAO DOS DADOS

Dados brutos: so aqueles que no foram


numericamente organizados, ou seja, esto na
forma com que foram coletados.

Rol: a organizao dos dados brutos em


ORDEM de grandeza crescente ou decrescente

Por: Marden Rodrigues


Distribuio da freqncia sem

intervalos de classe: a simples As imagens


condensao dos dados conforme respectivas s
as repeties de seus valores. Para
um rol de tamanho razovel, esta
distribuio de freqncia
classificaes
inconveniente, j que exige muito esto nas
espao.
Distribuio de freqncia com pginas 39 e
intervalos de classe: quando o 40 da apostila
tamanho da amostra elevada e o
nmero de variveis muito
grande, mais racional efetuar o
agrupamento dos valores em vrios
intervalos de classe.
REPRESENTAO DE DADOS

Por: Marden Rodrigues


CLASSE

Por: Marden Rodrigues


DEFINIO

So intervalos de variao da varivel.

As classes so representadas simbolicamente


por i, sendo i = 1,2,3...
(ou seja, i = 1 classe, 2 classe...)

Por: Marden Rodrigues


LIMITES DE CLASSE

So os extremos de cada classe. O menor


nmero o limite inferior da classe (li) e o
maior nmero o limite superior da classe (ls).

Por exemplo: se em uma classe temos que :


26|--- 36 (onde |--- indica: fechado em 26 e
aberto em 36), dizemos que li = 26 e ls = 36

Por: Marden Rodrigues


AMPLITUDE DE UM INTERVALO DE CLASSE

a medida de intervalo que define a classe.


Ela obtida pela diferena entre os limites
superior e inferior. A nomeando de h, temos
que:
h = ls li

Por exemplo, no exemplo anterior, podemos


afirmar que a amplitude de 10. (36-26)
Por: Marden Rodrigues
AMPLITUDE TOTAL (H)

a diferena entre o valor mximo e o valor


mnimo da amostra:

H = Li Ls

Se no total de uma amostra, temos que o


maior valor de 96 e o menor de 6, temos
que H= 96 6 = 90
Por: Marden Rodrigues
PONTO MDIO DE UMA CLASSE

O ponto mdio de uma classe (xi) o ponto que


divide o intervalo de classe em duas partes iguais.
xi = (li + ls)/2

No exemplo anterior do intervalo 26|--- 36, temos


que:
xi = (36+26)/2 = 62/2 = 31

Por: Marden Rodrigues


EM SNTESE...
Dados brutos so aqueles que no foram organizados.
Rol a organizao dos dados brutos em ordem de
grandeza crescente ou decrescente.
Distribuio de freqncias pode ser com ou sem
intervalos de classe.
Os elementos da distribuio de frequencias so:
Classe: so intervalos de variao da varivel.
Limites de classe: so extremos de cada classe.
Amplitude de classe e total: a diferena entre o maior
e o menor limite.
Ponto mdio: a mdia aritmtica dos limites de
classe.
Por: Marden Rodrigues
-DISTRIBUIO DE FREQNCIAS
-NMERO DE CLASSE
-TIPOS DE FREQNCIA

Por: Marden Rodrigues


DETERMINAO DO NMERO DE CLASSES (K)

importante que a distribuio conte com um


nmero adequado de classes. Se o nmero de
classes for excessivamente pequeno acarretar
perda de detalhe e pouca informao se
poder extrair da tabela. Por outro lado, se for
utilizado um nmero excessivo de classes,
haver alguma classe com freqncia nula ou
muito pequena, no atingindo o objetivo de
classificao que tornar o conjunto de dados
supervisionveis.
Por: Marden Rodrigues
TRS SOLUES PARA DETERMINAR K

1) Para n 25 , K = 5. E para n > 25, K = n

Por exemplo: se a amostra tiver 23


elementos analisados, o nmero de classes
5, pois n< 25. Por outro lado, supondo que a
amostra tenha 83 elementos analisados
(n>25), o nmero de classes dado por 83 =
9,1104335, que aproximando-se = 9 classes.

Por: Marden Rodrigues


TRS SOLUES PARA DETERMINAR K

2) Pode-se utilizar a regra de Sturges, que


fornece o nmero de classes em funo do
total de observaes:

K = 1 + 3,3 x log n

Por: Marden Rodrigues


TRS SOLUES PARA DETERMINAR K

3) Truman L. Kelley, sugere os seguintes


nmeros de classes, com base no nmero total
de observaes, para efeito de representao
grfica:

n 5 10 25 50 100 200 500

K 2 4 6 8 10 12 15

Por: Marden Rodrigues


RELEMBRANDO...

Qualquer regra para determinao do nmero de


classes da tabela no nos leva a uma deciso
final, esta vai DEPENDER, na realidade, de um
julgamento pessoal, que deve estar ligado
natureza dos dados.

Por: Marden Rodrigues


AMPLITUDE DO INTERVALO DE CLASSE

Amplitude do intervalo de classe nada mais


que o comprimento da mesma, dado por:

Ai = H/K

Onde H = Limite superior Limite inferior


K = nmero de classes

Por: Marden Rodrigues


TIPOS DE FREQNCIA

Por: Marden Rodrigues


FREQNCIA SIMPLES OU ABSOLUTA

Representada por fi, o nmero de repeties


de um valor individual ou de uma classe de
valores da varivel. A soma das freqncias
simples igual ao nmero total dos dados da
distribuio.
fi = n

Por: Marden Rodrigues


FREQNCIAS RELATIVAS

Representadas por fri, so os valores das


razes (divises) entre as freqncias
absolutas de cada classe e a freqncia total
da distribuio. A soma das freqncias
relativas igual a 1 ou 100%.

Fri = (fi/n) x 100

Por: Marden Rodrigues


FREQUENCIA SIMPLES ACUMULADA

Representadas por faci, o total das


freqncias de todos os valores inferiores do
limite superior do intervalo de uma
determinada classe.

Bilhete meu: se voc no entendeu aqui, no


exemplo entender.

Por: Marden Rodrigues


FREQNCIA RELATIVA ACUMULADA

Representada por fraci, a freqncia


acumulada da classe, dividida pela freqncia
total da distribuio.

fraci = faci/n

Por: Marden Rodrigues


Classe Fi Fri Fri (%) Faci Fraci xi

280|-- 305 2 8% 8 2 8% 293

305|-- 330 3 12% 12 5 20% 318

330|-- 355 4 16% 16 9 40% 343

355|-- 380 9 36% 36 18 76% 368

380|-- 405 5 20% 20 23 92% 393

405|--|430 2 8% 8 25 100% 418

25 100% 100 - - -
EM SNTESE...
Para determinar o nmero de classes, temos
trs casos: 1 caso:
Para n 25 nmero de classes K = 5
Para n > 25 nmero de classes K = n
2 caso:
Pela regra de Sturges K = 1 + 3,3 x log n
3 caso:
Pela regra de Truman. Conforme a tabela dada.
Por: Marden Rodrigues
EM SNTESE...
Amplitude do intervalo de classe: o comprimento da
classe, calculado por Ai = H/K.
Freqncia simples ou absoluta (fi) o nmero de
repeties de um valor individual.
Freqncias relativas (fri) so os valores das divises
entre fi e n
Freqncia simples acumulada (faci) o total das
freqncias de todos os valores inferiores ao limite
superior do intervalo de uma determinada classe.
Freqncia relativa acumulada (fraci) a freqncia
acumulada da classe (faci) dividida pela freqncia
total da distribuio. Por: Marden Rodrigues
MEDIDAS DESCRITIVAS

Por: Marden Rodrigues


MDIAS

Por: Marden Rodrigues


MDIA ARITMTICA SIMPLES
Para se obter a mdia aritmtica simples de um conjunto de
dados, devemos dividir a soma dos valores de todos os
dados do conjunto pela quantidade deles. Coisa que todos
ns j sabamos.

= xi/n

Onde:
indica soma de
xi = valores que a varivel x assume
n = nmero de valores
= a mdia aritmtica da amostra/populao

Por: Marden Rodrigues


MDIA ARITMTICA PONDERADA

Mdia ponderada uma mdia artmtica na


qual ser atribudo um peso a cada valor da
srie.
p = (xi . Pi)/Pi

onde o acrscimo da letra i na varivel, indica


o fator de todos os valores de, por exemplo:
Pi = todos os valores de P
Por: Marden Rodrigues
MDIA ARITMTICA PARA DADOS AGRUPADOS
SEM INTERVALOS DE CLASSES

As frequencias so as quantidades de vezes que


a varivel ocorre na oleta de dados, elas
funcionam como fatores de ponderao, o que
nos leva a calcular uma mdia ponderada.

= (xi . fi)/n

Por: Marden Rodrigues


MDIA ARITMTICA PARA DADOS
AGRUPADOS COM INTERVALO DE CLASSES
Neste caso, convencionamos que todos os valores
includos em um determinado intervalo de classe
coincidem com seu ponto mdio, e determinamos
a mdia aritmtica ponderada por meio da
seguinte frmula:

= (xi . fi)/n

Onde :
xi = (li + ls)/2 = ponto mdio
EXEMPLOS...
Sem intervalo de classes:
Aps ter sido realizado trabalho bimestral numa turma de
Estatstica, o professor efetuou levantamento das notas obtidas
pelos alunos, observou a seguinte distribuio e calculou a mdia
de sua turma:
Notas dos alunos Nmeros de alunos - fi xifi
1 1 1 =(xi . fi)/n
2 3 6 = 26/10
3 5 15 = 2,6
4 1 4
Total N = 10 26
Por: Marden Rodrigues
EXEMPLOS...
Com intervalo de classes:

Determine a renda familiar, de acordo com os dados da tabela:

Classes Renda Xi Fi numero de xifi


familiar famlias
=(xi . fi)/n
2 |--- 4 3 5 15
= 268/40
4 |--- 6 5 10 50
= 6,7
6 |--- 8 7 14 98
8 |--- 10 9 8 72
10 |--- 12 11 3 33
Total N = 40 268
MODA (MO)

Por: Marden Rodrigues


DEFINIO E LEMBRETE

Define-se a moda como o valor que ocorre com


maior freqncia em um conjunto de dados.

Primeiramente os dados devem ser ordenados


para, em seguida, observar o valor que tem maior
freqncia.
possvel que haja mais de uma moda dentro de
uma mesma amostra/populao, dependendo da
freqncia de determinado dado.
Por: Marden Rodrigues
EXEMPLOS...
Calcular a moda nos seguintes conjuntos de dados:

X = (4, 5, 5, 6, 6, 6, 7, 7, 8, 8)
Mo = 6 (o valor mais freqente)

Y = (1, 2, 2, 2, 2, 3, 3, 3, 4, 4, 4, 4, 5, 5, 6)
Mo = 2 e Mo = 4 (valores mais freqentes)
Conjunto BImodal

Z = (1, 2, 2, 2, 3, 3, 3, 4, 4, 4, 5)
Mo = 2, Mo = 3 e Mo = 4 (valores mais freqentes)
Conjunto POLImodal, ou seja, tem mais de 2 modas
Por: Marden Rodrigues
MEDIANA (MD)

Por: Marden Rodrigues


DEFINIO E OBTENO
uma medida de posio cujo nmero divide um conjunto
de dados em duas partes iguais. Portanto, a mediana se
localiza no centro de um conjunto de nmeros ordenados
segundo uma ordem de grandeza.

Para se obter o elemento mediano de uma srie


deveremos seguir os seguintes passos:
- Se N for mpar, a mediana o termo de ordem:
P = (N+1)/2
- Se N for par, a mediana a mdia aritmtica dos
termos de ordem:
P1 = N/2 e P2 = N/2 + 1
Por: Marden Rodrigues
EXEMPLOS...
1) Determine o valor da mediana da srie que composta dos
seguintes elementos: 56, 58, 62, 65 e 90.
N = 5 (mpar) P = (N + 1)/2 = 6/2 = 3
3 indica o 3 elemento Md = 62

2) Em um pesquisa realizada a respeito de erros por folha,


cometidos por digitadores, revelaram-se as seguintes
quantidades: 12, 12, 13, 13, 15, 16, 18 e 20. Determinar a
quantidade mediana de falhas.
N = 8 (par) P1 = N/2 = 8/2 = 4 4 elemento Md = 13
P2 = N/2 + 1 = 8/2 + 1 = 5 5 elemento Md = 15
Logo, a mediana ser (13 + 15)/2 = 28/2 = 14
Por: Marden Rodrigues
DICA IMPORTANTE

Para analisar a fundo a diferena


entre Mdia, Mediana e Moda,
estude a tabela da pgina 60 da
apostila.

Por: Marden Rodrigues


POSIO QUARTIS, DECIS E PERCENTIS

Por: Marden Rodrigues


DEFINIO E DIFERENCIAO
As medidas de posio denominadas quartis, decis e
percentis tm o mesmo princpio da mediana.
Enquanto a mediana separa a distribuio em duas
partes iguais, a caracterstica principal de cada uma
dessas medidas que:

Quartis: dividem a distribuio em quatro partes.


Decis: dividem em dez partes iguais.
Percentis: dividem em cem partem iguais.

Por: Marden Rodrigues


QUARTIS PARA DADOS NO AGRUPADOS
0% 25% 50% 75% 100%
Q1 Q2 Q3

Para o clculo das posies usaremos:

Q1 P1 = (n+1)/4
Q2 P2 = 2(n+1)/4
Q3 P3 = 3(n+1)/4

Onde n nmero de dados (valores).

Por: Marden Rodrigues


DECIS PARA DADOS NO AGRUPADOS
Para o clculo das posies usaremos:

D1 P1 = (n+1)/10
D2 P2 = 2(n+1)10
D5 P5 = 5(n+1)/10
D9 P9 = 9(n+1)/10

Onde n nmero de dados (valores).


Por: Marden Rodrigues
PERCENTIS PARA DADOS NO AGRUPADOS

Para o clculo das posies usaremos:

P1 P1 = (n+1)/100
P2 P2 = 2(n+1)/100
P50 P50 = 50(n+1)/100
P99 P99 = 99(n+1)/100

Onde nmero de dados (valores).


Por: Marden Rodrigues
LEMBRANDO QUE...

Utilizando medianas quartis, decis ou


percentis, se calcula uma POSIO,
ou seja, o valor obtido do clculo no
ser necessariamente o dado em si,
e sim sua posio dentro do rol.

Por: Marden Rodrigues


MEDIDAS DE DISPERSO (VARIABILIDADE)

Por: Marden Rodrigues


DEFINIO

So medidas utilizadas para medir o grau de


variabilidade ou disperso dos valores
observados em torno da mdia aritmtica.
Servem para medir a representatividade da
mdia e proporcionam o conhecimento do nvel
de homogeneidade ou heterogeneidade dentro
de cada grupo analisado. Para compreender
esse conceito, considere o exemplo a seguir.

Por: Marden Rodrigues


EXEMPLO (HOMO/HETEROGENEIDADE)
Um empresrio deseja comparar a performance de dois
empregados, com base na produo diria de determinada
pea, durante cinco dias:

Empregado A: 70, 71, 69, 70, 70 = 70


Empregado B: 60, 80, 70, 62, 83 = 71

A performance mdia do empregado A de 70 peas


produzidas diariamente enquanto que a do empregado B
de 71 peas. Com base na mdia aritmtica, verifica-se que
a performance B melhor do que a de A. Porm,
observando-se bem os dados, percebe-se que a produo
de A varia apenas de 69 a 71 peas, ao passo que a de B
varia de 60 a 83 peas, o que revela que a performance de
A bem mais uniforme do que a de B.
TIPOS DE MEDIDAS DE DISPERSO ABSOLUTA

Amplitude total (Ai): a diferena entre o maior e


o menor valor observado.

Exemplo: Pela situao sugerida na introduo,


temos para a amplitude total os seguintes clculos
para os empregados:

Empregado A Ai = 71 69 = 2
Empregado B Ai = 83 60 = 23

Por: Marden Rodrigues


LEMBRANDO QUE...
Utilizando como medida de disperso a amplitude
total de um grupo, se obtm algumas desvantagens,
que so:

- - Leva em conta apenas os valores mnimo e


mximo do conjunto. Se ocorrer qualquer variao
no interior do conjunto de dados, a amplitude total
no nos d qualquer indicao dessa mudana.
- - A amplitude total tambm sofre a influencia de
um valor atpico (extremo) na distribuio, ( um
valor muito elevado ou muito baixo em relao ao
conjunto)
Por: Marden Rodrigues
VARINCIA E DESVIO PADRO

Por: Marden Rodrigues


DEFINIO
So as medidas de disperso mais empregadas,
pois levam em considerao a totalidade dos
valores da varivel em estudo.
Ambos esto ligados como meios de se analisar a
disperso dos dados dentro de uma amostra.
Vocs vo ver.

Definiremos como: a varincia dada atravs da


mdia aritmtica dos quadrados dos desvios.
Analisaremos na prtica a seguir.
Por: Marden Rodrigues
FRMULAS: AMOSTRA X POPULAO

Ficar assim:
Dados no agrupados Dados agrupados

Populao S = (xi- ) S = (xi- ) . fi


--------- ------------
N N

Amostra S = (xi- ) S = (xi- ) . fi


--------- ------------
n-1 n-1

A legenda das frmulas est no slide seguinte.


LEGENDA DAS FRMULAS E DESVIO PADRO
S = Desvio padro, no entanto, o calcularemos elevado ao
quadrado, sendo assim:

Desvio Padro = varincia = S = S

= mdia (homenagem ao falecido Steve Jobs) rs

Xi = no caso no agrupado, so todos os valores que os dados


podem assumir e no caso agrupado, o ponto mdio de
determinado intervalo de classe.

Sobre a legenda de e n(ou N), vocs j conhecem, que ,


respectivamente: somatrio e total de valores.
Por: Marden Rodrigues
CONTINUAO DO EXEMPLO
Retomando-se o exemplo de homo/heterogeneidade
para fins de aplicar as frmulas dadas anteriormente,
efetuaremos os seguintes clculos:

Empregado A (mdia = 70)


S = (xi- )/N =
= (70-70)+(71-70)+(69-70)+(70-70)+(70-70)/5 =
2/5 = 0,4
portanto, temos que Desvio Padro = S = 0,4 = aproximadamente 0,64

Empregado B (mdia = 71)


S = (xi- )/N =
= (60-71)+(80-71)+(70-71)+(62-71)+(83-71)/5 =
428/5 = 85,6 .:. Desvio Padro = 85.6 = aproximadamente 9,25
LEMBRANDO QUE...

O enunciado da questo dever informar


se os dados esto sendo demonstrados
atravs de uma amostra ou de uma
populao, para que assim possa haver
a mudana necessria nas frmulas (e
sua interpretao).

Por: Marden Rodrigues


COEFICIENTE DE VARIAO DE PEARSON

Por: Marden Rodrigues


USO E CLCULO

O Coeficiente de variao de Pearson (CV)


calculado atravs da diviso entre o desvio
padro e a mdia multiplicado por cem. No
caso, expressado em porcentagem e facilita a
visualizao do quo dispersos esto os
valores da amostra ou da populao.

CV = (S x 100)/
Por: Marden Rodrigues
COMO QUALIFICAR A DISPERSO
Se CV 15% , est sendo indicada uma baixa
disperso.

Se 15% < CV < 30%, h uma mdia disperso.

E por fim, se CV 30%, est sendo representada uma


alta disperso entre os valores.

Por: Marden Rodrigues


Para finalizar...

MEDIDAS DE ASSIMETRIA

Por: Marden Rodrigues


DEFINIO

Modo de analisar a distribuio de freqncia


em uma amostra/populao atravs da
organizao de seus dados em forma de
grfico. Simples?

Por: Marden Rodrigues


CASOS

Caso 1: quando MDIA = MEDIANA = MODA, temos


uma distribuio de freqncias: SIMTRICA
MODA
MEDIANA E MDIA
CASOS

Caso 2: quando MDIA < MEDIANA < MODA, temos


uma distribuio de freqncias:
ASSIMTRICA ESQUERDA OU NEGATIVA

MEDIANA MODA

MDIA
CASOS

Caso 3: quando MDIA > MEDIANA > MODA, temos


uma distribuio de freqncias:
ASSIMTRICA DIREITA OU POSITIVA

MODA

MEDIANA
MDIA
LEMBRANDO QUE...
A mdia afetada pelos EXTREMOS, e por isso, em
grficos assimtricos, apresentada sempre
tendendo ao lado onde se encontram os mesmos.

Outro fator por simples observao que


representei a mdia dos grficos assimtricos
atravs de uma linha circular pois nos casos no
estamos aplicando valores, portanto no podemos
dar com exatido a mdia de cada um.
Por: Marden Rodrigues
BONS ESTUDOS!

Por: Marden Rodrigues

Das könnte Ihnen auch gefallen