Sie sind auf Seite 1von 10

MACS Estatstica

Censo/recenseamento: estudo estatstico de um universo de pessoas, instituio ou objetos


fsicos com o propsito de adquirir conhecimentos, observando todos os seus elementos, e
fazer juzos quantitativos acerca de caractersticas importantes desse universo.
Sondagem: estudo cientfico de uma parte da populao com o objetivo de conhecer melhor
atitudes,

hbitos

preferncias

da

populao

circunstncias e assuntos de interesse comum.

relativamente

acontecimentos,

Unidade
Estatstica

Populao: conjunto de elementos, as unidades estatsticas,


sobre os quais podem ser feitas observaes e recolhidos
dados relativos a uma caracterstica comum.
Amostra:

subconjunto

da

populao

formado

Populao

pelos

elementos, relativamente aos quais so recolhidos dados,

Amostra

designados por unidades estatsticas.


Estatsticas
Dimenso da amostra: nmero Variveis
de unidades
estatsticas

pertencentes amostra.
Varivel estatstica (xi): caracterstica que admite diferentes valores (um nmero ou uma
modalidade), um por cada varivel estatstica.
Cor preferida, estado civil

N irmos, n visitantes
Altura, precipitao
Tabela de Frequncias para Dados Qualitativos ou Quantitativos Discretos
Frequncia absoluta (ni): nmero de dados que pertencem categoria ou classe.
Frequncia relativa (fi): quociente entre a frequncia absoluta da categoria/classe e o
nmero total de dados.
Frequncia absoluta acumulada: obtm-se adicionando as frequncias absolutas at ao valor
considerado da varivel estatstica.
Frequncia relativa acumulada: obtm-se adicionando as frequncias relativas at ao valor
considerado da varivel estatstica.

L1

L2

L3

N de irmos
ni
Ni
fi%
Nota: nas variveis qualitativas no se calculam acumuladas!
(xi)
0
2
2
16.67%
1
3
5
25.00%
2
3
8
25.00%

L4
Fi%
16.67%
41.67%
66.67%

3
4
Total

2
2
12

10
12
-----

16.67%
16.67%
100.01%

2nd statopscunsumL1

ni X 100 / total

83.33%
100.00%
----2nd statopscunsumL3

Tabelas de Frequncias para Dados Contnuos


Regra de Struges: para organizar uma amostra de dados contnuos, de dimenso n, pode
considerar-se para nmero de classes o valor k, onde k o menor nmero inteiro, tal que
k

> n.

Ex:
X mnimo: 155

Amplitude = Xmximo Xmnimo = 184 155 = 29


k

X mximo: 184

>n

= 32 > 28 5 classes

29/5 = 5.8 6 amplitude de cada classe


Grficos de Barras
Na construo de um grfico de barras simples deve-se ter em ateno que:
-apenas uma das dimenses das barras varia;
-a dimenso que varia corresponde s frequncias dos valores da varivel estatstica;
-as barras devem estar separadas umas das outras por espaos iguais;
-o grfico deve ter um ttulo adequado.
Vantagens
Permite estabelecer

Desvantagens
S pode ser usado para transmitir

facilmente comparaes.
Tem forte impacto visual.

informaes simples.

Grficos Circulares
Num grfico circular:
- a amplitude de cada setor proporcional frequncia que representa;
-a legenda pode ser dispensada, inscrevendo-se os valores da varivel e as suas frequncias
junto dos respectivos setores;
-podem usar-se cores diferentes para cada setor;
-deve haver um ttulo adequado.
Vantagens
Permite a anlise das

Desvantagens
S deve ser usado quando a

propores.

varivel toma poucos valores.

Tem forte impacto visual.

Um s grfico no permite
comparar dois grupos de

dados.
Exemplo para encontrar a amplitude do ngulo de cada setor:
Total ni: 120

360

ni: 50

120

x=150

50
Pictogramas

Na construo de um pictograma, deve ter-se em ateno os seguintes aspetos:


-indicar o significado dos smbolos utilizados;
-utilizar smbolos sugestivos em relao varivel estatstica em estudo;
-utilizar sempre o mesmo smbolo;
-espaar igualmente os smbolos;
-o grfico deve ter um ttulo adequado.
Vantagens
Muito atractivo.
Tem forte impacto visual.

Desvantagens
D pouca informao.
Pouca preciso.

Histogramas
Um histograma deve ter as seguintes caractersticas:
-ttulo adequado;
-dados agrupados em classes (sejam contnuos ou discretos);
-todas as barras com a mesma largura;
-no ter espaos entre as barras.
Vantagens
Por vezes a nica forma de

Desvantagens
Difcil construo quando a

representar os dados.
D a ideias de como se

amplitude dos intervalos


diferente.

distribuem os dados.
Polgonos de Frequncias Para Dados Agrupados em Classes
Resulta da unio sucessiva, atravs de segmentos de reta, dos pontos mdios dos lados
superiores dos diferentes rectngulos de um histograma. Apenas se utiliza para histogramas em
que as classes tm amplitudes iguais.

Vantagens

Desvantagens

Permite comparar histogramas utilizando apenas os


respectivos polgonos de frequncia no mesmo quadro.

Difcil construo manual.

Diagramas de Cule-e-Folhas
Vantagens
Todos os dados da amostra aparecem no grfico.
No necessrio construir previamente uma tabela de
frequncias.
D uma interpretao visual sobre a forma como os dados
se distribuem.
Permite ordenar rapidamente a amostra.
Facilita a leitura ou a determinao de medidas
estatsticas.
muito sugestivo para comparar duas amostras.

Desvantagens
No aconselhvel quando h
muitos ou poucos caules.

D pouca informao no caso de


os dados serem muito dispersos.

Consideraes Gerais Sobre Representaes Grficas

Variveis qualitativas: grficos de pontos, grficos de barras, pictogramas e diagramas


circulares.
Variveis quantitativas discretas: grficos de pontos e grficos de barras., diagrama de
caule-e-folhas.
Variveis quantitativas contnuas: histogramas e diagramas de caule-e-folhas.
Os grficos de linhas usam-se para analisar a evoluo de uma varivel tempo.

Percentis
Exemplos de exerccios:
1.

Considere a amostra de dados seguinte:

X= (49, 32, 20, 16, 10, 35, 5, 9, 29, 17, 23, 8, 37, 40, 18, 12, 28, 32, 34, 45, 21, 41, 35, 15,
17, 44, 18, 49, 47, 50)
1.1.

Determine os percentis 25 e 50.

X= (5, 8, 9, 10, 12, 15, 16, 17, 17, 18, 18, 20, 21, 23, 28, 29, 32, 32, 34, 35, 37, 40, 41, 44,
45, 49, 49, 50)

25 X 30
100

= 7,5 8

50 X 30
100

= 15

1.2.

P25 =

P50 =

(8)

= 17

x ( 15 ) + x (16)
2

28+ 29
2

= 28,5

Dos 40% dos tempos mais elevados, determine aquele que teve menor durao.

100%-40%=60%

60 X 30
100
1.3.

= 18

P60 =

x ( 18 ) + x (19)
2

32+34
2

= 33

A que percentil pertence o tempo 28 minutos?


14 <

(15) = 28

30 k
100

30 k
100

<15

R: Percentis

47, 48 e 49.

30 k
14 < 100 <15

1400<30k 30k < 1500


k = 46,67 k = 50
Mediana e Quartis

A mediana representa-se por

ou Me e o percentil 50. Q 1 o percentil 25, Q2 a

mediana e Q3 o percentil 75.


Quando os dados esto agrupados em classes, a classe a que pertence a mediana
chama-se classe mediana.
Determinar a mediana e os quartis para dados agrupados em classes:

Diagrama de Extremos e Quartis


1: Desenhar um eixo graduado do valor mnimo ao valor mximo da amostra.
2: Desenhar, por baixo ou por cima desse eixo, um rectngulo cujo comprimento a
diferena entre o 3 e o 1 quartis (amplitude interquartis). As bases do rectngulo
coincidem, respetivamente, com o 1 e o 3 quartis.
3: Dividir o rectngulo por uma linha reta correspondente mediana. Unir o retngulo aos
extremos.

Enviesamento
para a direita

Mdia
Nmero que se obtm dividindo a soma dos valores de um conjunto de dados pelo nmero
total de dados. Representa-se por .
Mdia para dados agrupados:

Turma A
N de mensagens
N de alunos
recebidas
10
11
12
13
14
Total

5
6
5
10
2
28

105+116+125+1310+142
10,9 Propriedades da mdia:
28
1: A mdia situa-se entre o mximo e o mnimo da amostra e no pode ser igual ao
mnimo sem ser tambm igual ao mximo, o que acontece se e somente se a amostra for
constante.

2: Adicionando-se a cada um dos valores xi uma constante h (h

0), a nova mdia

ser igual mdia original adicionada de h.


3: Multiplicando xi por uma constante a (a

0), a nova mdia ser igual ao produto

da mdia original por a.


Moda
Categoria ou classe com maior frequncia absoluta.
Descobrir a moda em dados agrupados em classes:

Desvio em Relao Mdia


xi

ni

di (xi- )

di

0
1
2
3
4
Total

10
5
4
2
4
24

-1.4
-0.4
0.6
1.6
2.6

1.96
0.16
0.36
2.56
6.76

Varincia =

2 = 54/25 = 2.16

Desvio-padro =

ni x

s 2 = 54/25-1

Desvio-padro = s =

19.6
0.8
1.44
5.12
27.04
54

ou
Varincia =

di

5424

2.16=1.47

Calculadora:
L1: xi

Em grupos de dados com mdias iguais, o

L2: ni
L3:
L4:

L1

que

L3

tem

menor

desvio-padro

melhor, uma vez que os dados esto


2

L5: L4 x L2

menos afastados da mdia.

Dados bidimensionais: Grfico de Pontos


Dados bidimensionais ou bivariados so
dados obtidos de pares de variveis (a cada
dado corresponde um par de valores).
O grfico que representa e organiza
este tipo de informao tem o nome de
diagrama

de

disperso.

Um

diagrama

de

disperso , ento, uma representao grfica


para os dados bivariados, em que cada par de
dados (xi, yi) representado por um ponto de
coordenadas (xi, yi), num sistema de eixos
coordenados.
Variveis positivamente associadas: medida que x aumenta, y tambm aumenta. A
reta de regresso tem declive positivo.
Variveis negativamente associadas: medida que x aumenta, y diminui. A reta de
regresso tem declive negativo.
No h associao clara entre as variveis: a nuvem de pontos encontra-se bastante
dispersa. No existe associao entre as duas variveis.
Coeficiente de Correlao Linear e Sua Interpretao Geomtrica
Para quantificar o grau de associao linear entre duas variveis, utiliza-se uma
estatstica a que se d o nome de correlao linear ou coeficiente de correlao linear, que
se representa por r.
Propriedades do coeficiente de correlao:
1. Varia entre -1 e 1.
2. Quanto maior for o valor absoluto de r, mais forte ser a correlao.
3. Se r positivo, existe uma associao positiva entre as duas variveis. Se
negativo, existe uma associao negativa entre as duas variveis.

Diagrama de Disperso na Calculadora:


Stat calc 4: Linreg (ax+b) (se no aparecer o r: 2nd + 0 DiagnosticOn). Graph
Reta de regresso na calculadora:
Y= vars 5: statistics EQ 1: RegEQ. Graph

Das könnte Ihnen auch gefallen