You are on page 1of 26

ESTATSTICA USANDO EXCEL

UNIDADE I
REVISANDO O EXCEL

REVISANDO FUNES
Funo Soma
Ex: =SOMA(A1:A8)
A frmula ir somar todos os valores que se encontram no endereo A1 at o endereo A8.
Os dois pontos indicam at, ou seja, some de A1 at A8. A frmula ser sempre a mesma, s
mudar os devidos endereos dos valores que voc deseja somar.
Veja o outro exemplo:
1
2
3

A
10

B
25

C
15

D
10

E
=SOMA(A1:D1)

Neste exemplo estamos somando todos os valores do endereo A1 at o endereo D1. A


frmula seria digitada como no exemplo, e ao teclar ENTER o valor apareceria. No caso a
resposta seria 60.
Funo Mdia
Calcula-se a mdia de uma faixa de valores, aps somados os valores e divididos pela
quantidade dos mesmos.
Exemplo: Suponhamos que desejasse saber qual a mdia de idade numa tabela de dados abaixo:
1
2
3
4
5
6

A
IDADE
15
16
25
30
MEDIA IDADE

=MEDIA(A2:A5)

Funo Cont.Valores
Conta-se o nmero de indivduos numa determinada faixa de valores.
1

Exemplo: Suponhamos que desejasse saber o total de alunos desta turma que est listada na tabela
abaixo: A resposta seria 4.
1
2
3
4
5
6

A
ALUNOS
JOO
FRANCISCO
CARLOS
MARIA
TOTAL

=CONT.VALORES(A2:A5)

Funo Condicional SE
Suponhamos que desejasse criar um Controle de Notas de Aluno, onde ao se calcular a
mdia, ele automaticamente especificasse se o aluno fora aprovado ou no. Ento Veja o exemplo
abaixo. Primeiramente, voc precisa entender o que desejar fazer. Por exemplo: quero que no
campo situao ele escreva Aprovado somente se o aluno tirar uma nota Maior ou igual a 7
na mdia, caso contrrio ele dever escrever Reprovado, j que o aluno no atingiu a condio
para passar. Veja como voc deve escrever a frmula utilizando a funo do SE>
1
2
3

A
ALUNO
Mrcio

B
MDIA
7

C
SITUAO
=SE(B2>=7;Aprovado;Reprovado)

Bem, agora que voc lembrou como usar algumas funes bsicas do Excel daremos
incio as nossas planilhas eletrnicas.
EXERCCIO
Usando a planilha que recebeu do instrutor. Calcule e formate a planilha deixando-a como
no exemplo abaixo.

FRMULAS DA PLANILHA
Na Folha
Total de proventos
*INSS

Salrio Base + Hora Extra

Frmula condicional do SE, que ser detalhada a seguir

Total Lquido

Total dos Proventos INSS

No Resumo
Total de Funcionrios

Funo CONT.VALORES

Maior Salrio

Funo MXIMO

Menor Salrio

Funo MNIMO

Salrio Mdio

Funo MDIA

Total Sal. Engenh.

Funo SOMASE

Total Sal. Supervi.

Funo SOMASE

Total Sal. Vigias.


Outras

Funo SOMASE

Funo SOMA

Meta do Ms
Resultado

Funo do SE + Formatao condicional

Informaes para o clculo do INSS na Folha de Pagamento

*INSS
Frmula condicional do SE com as seguintes condies:
1 Condio

Se o total dos proventos for at 965.67, o desconto ser de 8 %.

2 Condio

Se o total dos proventos for de 965.68 at 1609.45, o desconto ser de 9%.

3 Condio

Se o total dos proventos for 1609.46 at 3218.90, o desconto ser de 11%.

4 Condio

Se o total dos proventos for acima de 3218.90 ser descontado o teto de 350.00.

GERENCIANDO UMA BASE DE DADOS COM UMA TABELA DINMICA

Com o uso da Tabela Dinmica podemos visualizar rapidamente a mdia de idade, a mdia
de peso e a mdia de altura, podendo ser visualizado por sexo ou de forma geral. Visualizamos
tambm quanto que o Lazer influencia nessas mdias. Tudo isso, dentre outras possibilidades.

UNIDADE II
Estatstica Descritiva
Algumas das funes estatsticas e todas as ferramentas de anlise do Excel utilizadas
neste curso, geralmente, no so includas ao iniciar o Excel. Sugerimos que o aluno realize a
verificao seguinte antes de darmos incio ao curso.
No menu Ferramentas escolha Suplementos. O Excel apresentar a caixa de dilogo
Suplementos com os Suplementos disponveis.
O suplemento Ferramentas de anlise deve estar selecionado como mostra a figura
seguinte.

O objetivo da Estatstica Descritiva organizar, resumir, analisar e interpretar


observaes disponveis.

1 - VARIVEIS
Varivel uma caracterstica da unidade elementar que pode ter valores diferentes entre as
unidades medidas.
Exemplo:
A tabela seguinte registra parte do Cadastro de Funcionrios da empresa. Quais so as
unidades elementares e as variveis deste cadastro?
Nome
Idade
Cargo
Sexo
Peso
Escolaridade
Joo
27
Supervisor
M
62 kg
2 Grau
Alex
38
Chefe
M
78 kg
3 Grau
Estela
34
Gerente
F
65 kg
3 Grau
Ana
32
Secretria
F
58 kg
1 Grau
Soluo. As seis variveis de cada funcionrio da empresa compem uma unidade elementar:
Nome, Idade, Cargo, Sexo, Peso e Escolaridade.
5

1.1 - Classificao das variveis


1.1.1 - Variveis Quantitativas: Refere-se a quantidades medidas numa escala numrica.
As variveis quantitativas podem ser do tipo: Discretas e Contnuas
Variveis Discretas Referem-se a variveis numricas que assumem somente nmeros
inteiros positivos. Ex: Quant. De vendas dirias de uma empresa; Quant. De peas
defeituosas num lote de produo.
Variveis Contnuas Assumem qualquer valor dos nmeros reais. Ex: Valor da venda
diria de uma empresa; Consumo mensal de energia eltrica.
1.1.2 Variveis Qualitativas: Referem-se a variveis no numricas. As variveis qualitativas
poder ser classificadas como nominais e ordinais.
Variveis nominais No tem ordenamento nem hierarquia. Ex: Sexo, Estado Civil.
Variveis ordinais So equivalentes as variveis nominais, porm incluindo uma ordem.
Ex: Bom, Regular, Ruim; Primeira, Segunda, Terceira.
1.1.3 Seqncia Temporal. Ex: As cotaes dirias de uma ao na bolsa; A demanda de
energia eltrica diria.

2 POPULAO E AMOSTRA

O grupo completo de unidades elementares de pessoas, objetos ou coisas denominado


populao.
Um subconjunto de unidades elementares selecionados numa populao denominado
amostra.

2.1 Tipos de Pesquisa

CENSO Pesquisa que coleta a totalidade de uma populao em busca da observao de


determinadas caractersticas.
AMOSTRAGEM Pesquisa que coleta um pequeno grupo de indivduos de uma
populao em busca da observao de determinadas caractersticas.

Amostra
Muitas aplicaes de estatstica operam com amostras retiradas de uma populao sobre a
qual se deseja obter respostas. Simplesmente amostrar no suficiente, a amostra deve ser
representativa da populao.

Uma amostra representativa tem as mesmas caractersticas da populao de onde foi retirada.

Gerando Dgitos Aleatrios com o Excel


O Excel 2003 dispe das funes ALEATRIO e ALEATRIOENTRE para gerar dgitos
aleatrios e da ferramenta de anlise Amostragem para extrair amostras com reposio de uma
populao.
ALEATRIO()
A funo matemtica ALEATRIO d um grupo de dgitos aleatrios entre 0,00...0 e 1,00...0 com
a quantidade de dgitos depois da vrgula definida pelo leitor, por exemplo: 0,236; 0,86945, etc.
ALEATRIOENTRE(inferior; superior)
A funo estatstica ALEATRIOENTRE d um grupo de dgitos aleatrios entre os grupos
inferior e superior definidos nos argumentos da funo.
Inserindo numa clula da planilha Excel a frmula =ALEATRIOENTRE(0;599), o Excel
fornecer como resultado um grupo de dgitos entre o grupo 000 e o grupo 599.
Ferramenta de Anlise Amostragem

3 - TABELAS DE FREQNCIA
A freqncia do valor de uma varivel o nmero de repeties desse valor.
Freqncia Absoluta: a contagem das repeties de cada valor dentro da varivel;
Freqncia Relativa: o resultado de dividir sua freqncia absoluta pelo tamanho da
amostra.
Freqncia Acumulada: a soma das freqncias absolutas ou relativas desde o valor
inicial da varivel.

Operaes Fechadas
por Dia

Frequncias
Absolutas

Frequncias
Relativas %

Frequncia Acum.
Absolutas

Frequncia Acum
Relativa

11
12
13
14
15
16
17

2
5
6
7
3
2
1
26

7,69%
19,23%
23,08%
26,92%
11,54%
7,69%
3,85%
100,00%

2
7
13
20
23
25
26

7,69%
26,92
50,00
76,92
88,46
96,16
100,00

Total
Tabela 1.1

HISTOGRAMA
O histograma uma forma grfica de apresentar a distribuio de frequncias de uma
varivel. O histograma um grfico de barras verticais construdo com os resultados da tabela
frequncias.

Frequncias absolutas

Histograma
8
6
4
2
0
11

12

13

14

15

16

17

Operaes fechadas
Fonte: Tabela 1.1

GRFICO DE PIZZA
O grfico de pizza deve ser usado preferencialmente para apresentar variveis com no
mximo 4 eventos.
8

Alunos de Estatstica - UFRN 2007

42%
58%

FEMININO

MASCULINO

Fonte: Base de Dados Alunos de Estatstica UFRN 2007.

3.1 - Distribuio de Freqncias Utilizando Classes


Fica complicado fazer tabela de freqncia de variveis contnuas, principalmente quando
o nmero de elementos muito grande.
No h regra exata para determinarmos o nmero de classes para anlise de uma varivel.
Apenas orientaes prticas para o analista.
Sero necessrias algumas tentativas, como tambm, estamos sujeitos a cometer erros.
Os valores da varivel so transformados numa nova varivel cujos mesmos esto
compreendidos entre os limites dos intervalos das classes.

3.1.1 - Clculo para o tamanho dos intervalos


N = Tamanho da amostra
K (Nmero de classes)
K = n
Obs. Arredonda para o mais prximo
Intervalo de Variao (Diferena do Max pelo Min)
IV = Max Min
Amplitude = IV/K

Alunos de Estatstica
70%
60%

50%
40%
30%
20%
10%
0%
18-23

23-28

28-33

33-38
53

38-43

43-48

48-

Idade
Fonte: Base de Dados Alunos de Estatstica UFRN 2007.

4 GRFICO DE PARETO
Para que serve o Grfico de Pareto?
O grfico de Pareto deve ser utilizado sempre que temos que estabelecer prioridades a
partir de um nmero variado de informaes e dados. Ajuda a dirigir nossa ateno e esforos para
problemas verdadeiramente importantes, aumentando nossas chances de obteno de bons
resultados.
Utilizaremos a tabela abaixo para demonstrar o grfico de pareto
Causas de no realizao de um gol

A
B
C
D
E
F
G
Tabela 1.2

Eventos
Passe errado
Chute errado a gol
Falta sofrida
Impedimento
Erro do juiz
Queda do Jogador
Defesa do goleiro
Total

Frequncia
52
26
10
06
02
01
01
98

10

Fonte: Tabela 1.2

Assim, considerando o processo de melhoria da qualidade, o grfico de Pareto utilizado


nas seguintes situaes:
Na seleo de problemas que sero como projetos de melhoria de qualidade;
Na identificao das causas fundamentais de problema;
Na comparao entre o antes e o depois de uma ao corretiva.
5 MEDIDAS DE ORDENAMENTO
Com as tabelas de freqncias e os mtodos grficos organizamos e comeamos a anlise
dos valores de uma varivel. Agora iniciamos os mtodos numricos para resumir e analisar os
valores de uma varivel, seja uma amostra ou a prpria populao.
Em algumas situaes o interesse est em conhecer a posio de um determinado valor em
relao ao grupo de valores. Por exemplo, qual a posio de um retorno de 15% ao ano com
relao s rentabilidades anuais das aplicaes do mercado financeiro? Quantos retornos do
mercado financeiro so maiores que 15 %.
5.1 - Percentil
Um percentil uma medida da posio relativa de uma unidade obsservacional em relao a todas
as outras. O p-simo porcentil tem no mnimo p% dos valores abaixo daquele ponto e no mnimo
(100 - p)% dos valores acima.
Por exemplo,
se uma altura de 1,80m o 90o. percentil de uma turma de estudantes, ento 90% da turma
tem alturas menores que 1,80m e 10% tm altura superior a 1,80m.
11

se o peso de uma pessoa de 75kg o 40o. percentil de um conjunto de empregados. ento


40% dos empregados pesam menos que 75kg e 60% pesam mais.
No Excel a funo estatstica PERCENTIL d o valor que divide a matriz em duas partes,
uma menor que o argumento k e a outra maior que k. O argumento k um valor entre 0 e 1
correspondendo respectivamente a 0% e 100% do nmero de valores da matriz.

Alguns percentis da varivel idade da Base de Dados Alunos Estatstica - UFRN 2007.
Formula: =PERCENTIL(Matriz; k)
Percentil 10 = 19
Percentil 20 = 20
Percentil 50 = 22
Percentil 82 = 26
Percentil 94 = 38

5.2 - Quartil
Os percentis dividem o intervalo de variao dos valores da varivel em cem partes iguais.
Dividindo os valores ordenados da varivel em quatro quartos iguais se obtm trs quartis
denominados: primeiro quartil, segundo quartil e terceiro quartil. Numa varivel com n valores
ordenados de forma crescente:

O primeiro quartil Q1 um valor tal que 25% dos valores da varivel so menores e os
restantes 75% so maiores.
O segundo quartil Q2 um valor tal que 50% dos valores da varivel so menores e os
restantes 50% so maiores.
O terceiro quartil Q3 um valor tal que 75% dos valores da varivel so menores e os
restantes 25% so maiores.
Quartis da varivel idade da Base de Dados Alunos Estatstica - UFRN 2007.

Formula: =QUARTIL(Matriz; quarto)


Quartil 1 (25%) = 20
Quartil 2 (50%) = 22
Quartil 3 (75%) = 22

6 - MEDIDAS DE TENDNCIA CENTRAL


As medidas de tendncia central nos do uma noo sobre qual valor representa o centro de
uma distribuio ordenada (rol), ou simplesmente um valor que melhor represente essa distribuio

12

6.1 Mediana
A mediana o valor localizado na posio central de uma distribuio de frequncia
ordenada. Sofre pouca influncia pelas caudas da distribuio.
Calculando a Mediana

31 38 19 27 24 42 32 18 43 15 39
Ordena-se os valores

15 18 19 24 27 31 32 38 39 42 43
Mediana = 31
Obs: Se a quantidade de valores n for um nmero par, a Md no ser um valor da varivel. A Md
ser o resultado da soma dos dois valores centrais dividido por 2.
No Excel: =MED(nm1;nm2;...;nmN)
6.2 Moda
A moda o valor da varivel que mais se repete. Sofre pouca influncia pelas caudas da
distribuio.
Moda o valor da varivel que mais se repete, ou seja, que tem maior freqncia em uma
varivel.

15 38 42 27 24 42 32 18 43 15 42
Moda = 42
No Excel: =MODO(nm1;nm2;...;nmN)
6.3 Mdia
Valor que representa uma distribuio. a medida de posio mais usada. Sofre forte
influncia pelas caudas da distribuio.
Mdia da populao o resultado de dividir a soma dos valores X1,X2,...,XN, da varivel
X pela quantidade de valores N.

No Excel: =MDIA(nm1;nm2;...;nmN)

13

7 - MEDIDAS DE DISPERSO
Para identificar uma varivel de forma completa deve-se adicionar uma medida numrica
que mostre a variabilidade ou disperso de seus valores. O conhecimento da disperso dos valores
uma medida chave na anlise estatstica de uma varivel.
7.1 Varincia
A varincia de uma varivel aleatria uma medida da sua disperso estatstica, indicando quo
longe em geral os seus valores se encontram do valor esperado.
Varincia da populao e varincia da amostra
A varincia de uma populao yi onde i = 1, 2, ...., N dada por
No Excel: =VARP(nm1;nm2;...;nmN)
Quando estimando a varincia da populao usando n amostras aleatrias xi onde i = 1, 2, ..., n, a
frmula seguinte um estimador no enviesado:

No Excel: =VAR(nm1;nm2;...;nmN)

7.2 Desvio Padro


O Desvio Padro a raiz quadrada da sua varincia. Dessa maneira:

O desvio padro considerado como populao :

No Excel: =DESVPADP(nm1;nm2;...;nmN)

O desvio padro considerado como amostra :

No Excel: =DESVPAD(nm1;nm2;...;nmN)

14

7.3 Coeficiente de Variao


O coeficiente de variao CV o resultado de dividir o desvio padro pela sua mdia. A
medida relativa CV permite a comparao de distribuies, pois seu resultado o desvio padro
por unidade de mdia. Comparando duas variveis, a varivel que tiver menor CV tem menor
disperso ou variabilidade.
8 INCLINAO DE UMA DISTRIBUIO
O coeficiente de inclinao o resultado de comparar a distribuio de frequncias dos
valores de uma varivel com uma distribuio normal.
No Excel: =DISTORO(nm1;nm2;...;nm30)
O resultado da funo DISTORO deve ser interpretado da seguinte forma:
Se o coeficiente de inclinao for igual a zero, a distribuio de frequncias ser simtrica.
Se o coeficiente de inclinao for negativo, a distribuio de frequncias ter inclinao
esquerda ou negativa.
Se o coeficiente de inclinao for positivo, a distribuio de frequncias ter inclinao direita
ou positiva.

9 CURTOSE DE UMA DISTRIBUIO


Se duas distribuies de frequncias tm a mesma disperso e inclinao no ser suficiente
para supor que as duas tenham a mesma forma, caracterstica denominada curtose.
A curtose medida pelo coeficiente de curtose que compara a distribuio de frequncias
de amostras com a distribuio normal.
No Excel: = CURT(nm1;nm2;...;nm30)
O resultado desta funo deve ser interpretado da seguinte forma:
Se o coeficiente de curtose for igual a zero, ento a distribuio de frequncias ser a prpria
distribuio normal.
Se o coeficiente de curtose for negativo, ento a distribuio ser achatada, plana.
Se o coeficiente de curtose for positivo, a distribuio ser concentrada ao redor da mdia,
distribuio com pico.

15

10 - FERRAMENTA DE ANLISE ESTATSTICA DESCRITIVA


No menu Ferramentas escolhemos Anlise de Dados e recebemos a caixa de dilogo com
todas as ferramentas de anlise disponveis. Depois de escolher Estatstica Descritiva e pressionar
o boto Ok o Excel apresenta a caixa de dilogo Estatstica descritiva.

Para utilizar a ferramenta de anlise Estatstica Descritiva utilizaremos a Varivel Idade


da planilha Base de Dados Alunos de Estatstica UFRN 2007.

16

11 - BOXPLOT
11.1 Criando o boxplot no Excel
1. O primeiro passo gerar as estatsticas para o conjunto de dados conforme descrito
abaixo, e na mesma seqncia.
1 Quartil
Mnimo
Mediana
Mximo
3 Quartil

Dados 1
155
149
160
173
165

Dados 2
170
155
173,5
181
175,75

2. Selecione toda a informao, incluindo os rtulos de dados e depois selecione Inserir > Grfico
e escolha Linha. Selecione o sub-tipo linha com marcadores exibidos a cada valor de dado.
Clique em avanar, e selecione sries em: linhas e depois click em concluir.
3. Agora sero executados comando sobre o
grfico. Clique com o boto direito do mouse sobre
uma das linhas do grfico. Selecione formatar
srie de dados, v para opes e selecione
linhas
de
mximo/mnimo
e
barras
superiores/inferiores.
A
largura
do
espaamento poder variar entre diversos valores,
pois isso no importa para o Boxplot. O resultado
dever ser algo do tipo:

185
180
175

1 Quartil

170

Mnimo

165

Mediana

160

Mximo

155

3 Quartil

150
145
140
F

4. As linhas sero removidas uma a uma, inicialmente clicando com o boto direito do mouse
sobre a linha. Selecionar formatar srie de dados em padres observar o campo linha e
marcar sobre nenhuma, da mesma forma para o campo marcador, deixando apenas o marcador
para a linha da mediana. Isso deve ser feito para todas as linhas. Em seguida, clique com o boto
direito sobre a rea do grfico, selecione opes de grfico, na guia linhas de grade desmarque
todas as opes de linha e na guia legenda desmarque a opo mostrar legenda. O resultado
final ser como est abaixo.
185
180
175
170
165
160
155
150
145
140
F

17

11.2 Exerccio:
Para utilizar o boxplot utilizaremos as variveis Sexo e Altura da planilha Base de Dados
Alunos de Estatstica UFRN 2007.

12 - ANLISE DE CORRELAO E REGRESSO LINEAR


O Coeficiente de Correlao R uma medida do grau de associao linear entre duas
variveis.
O Coeficiente de Determinao R uma medida do poder explicativo do modelo
utilizado.
12.1 Resumo dos valores do Coeficiente de Correlao
A seguir apresentaremos o significado dos valores possveis do coeficiente de correlao
limitados no intervalo -1 e +1.
r=+1
Correlao positiva perfeita. Os pares de valores das duas variveis esto numa mesma
reta com declividade positiva. Neste caso, pode-se ver a perfeita relao linear entre as variveis.
r prximo de +1
Forte correlao positiva. A maioria dos pares de valores est prxima de
uma reta com declividade positiva.
r prximo de +0
Fraca correlao positiva. Os pares de valores formam uma nuvem com
ligeira tendncia de declividade positiva.
18

r=0
No h relao. Os pares de valores formam uma nuvem de pontos sem nenhuma
tendncia.
r prximo de -0
Fraca correlao negativa. Os pares de valores formam uma nuvem com
ligeira tendncia de declividade negativa.
r prximo de -1
Forte correlao negativa. A maioria dos pares est prxima de uma reta com
declividade negativa.
r=-1
Correlao negativa perfeita. Os pares de valores das duas variveis esto numa mesma
reta com declividade negativa. Neste caso, mais uma vez, pode-se ver a perfeita relao linear
entre as observaes.
No Excel: =CORREL(matriz1;matriz 2)
Exemplo: Anlise de correlao entre Peso e Altura

Exemplo com a base de dados Alunos de Estatstica da UFRN Ano 2007.


Exibindo Grfico de Disperso com a Linha de Tendncia

19

UNIDADE III
APLICAES

1 Criando um grfico dinmico para acompanhamento de processos.

20

2 Transformando uma planilha comum em um Banco de Dados.


Relatrio de Anomalias - Planilha

Relatrio de Anomalias Banco de Dados

21

3 - Montando uma rvore de Anlises para definir qual o caminho indicativo


que dever ser seguido na hora de detalhar os nveis da informao.
RVORE DE ANLISES

Grficos seguindo a ordem da rvore


Eficincia por Unidade
55,8
%

60,0
%

40,0
%

91,4%
91,2%

91,2%

30,0
%

91,5%

91,4%
91,3%

% Eficincia

% E fici n ci
a

44,2
%

91,4%

91,4%
91,5%

50,0
%

91,3%

91,0%

91,2%

90,7%

91,2%
90,5%

91,1%

91,1%

91,1%
90,0%

91,0%

91,0%

20,0
%

90,8%

% Meta

91,9%

91,8%
91,6%

Eficincia da "Tecelagem 2" por tecnologia

% P ro d u
o

92,0%

91,0%
90,9%

89,5%

10,0
%
0,0%
Tecelagem 1

Tecelagem 2

L5200

Eficincia da "Tecelagem 2 - L5200" por


Artigo
93,0%

92,7%
92,1%

92,5%

Eficincia por Grupo/Turno "L5200"


92,5%
92,0%

94,0%

92,9% 92,8%
91,6% 91,4%

92,0%

91,5%

91,4%

91,0% 91,0%
90,1%

90,0%

%Me
ta

% Ef ic i n c
ia

92,0%

ZAX

91,0%
90,5%

89,5%

90,0%

89,0%

89,5%

88,5%
89,0%
88,0%
RIOLEEN

86,9%

86,0%

90,3%

RIOLEEN-157

84,0%
82,0%
4C

3A

5B

4B

2C

2B

Acima da Meta

5C

4A

Tolerncia

2A

3C

3B

Abaixo da Meta

5A

Meta

1C

1B

1A

22

23