Sie sind auf Seite 1von 14

NOES DE ESTATSTICA 1- Introduo:

Na vida diria de qualquer sociedade constituda por milhes de indivduos, h a necessidade de aplicao da estatstica na elaborao de censos demogrficos, no registro de natalidade e morte, na distribuio da populao por idade ou sexo, nos problemas que envolvem saneamento bsico, emprego, educao e muitos outros. Considere uma pequena cidade onde vivem apenas 1000 famlias. Em uma pesquisa sobre salrios, no seria difcil obter o salrio de cada famlia. Os dados numricos obtidos (os salrios) formam um conjunto chamado populao. Mas, freqentemente, por exemplo em uma cidade de 1.000.000 de pessoas, possvel conseguir os dados numricos apenas de uma parte ou amostra da populao, digamos 10.000 habitantes. Amostra , ento, um subconjunto do conjunto populao. Em geral, feita uma pesquisa sobre alguma caracterstica da populao. H algumas caractersticas que podem ser medidas, como idade, massa, altura. Os nmeros que as medem chamam-se valores das variveis. Algumas variveis, como sexo, nvel de escolaridade, estado civil e tipo de transporte utilizado para o deslocamento, apresentam como resultado uma qualidade, atributo ou preferncia da pessoa entrevistada . Variveis dessa natureza recebem o nome de varveis qualitativas. Outras variveis, como idade e renda mensal, apresentam como resposta um nmero, variveis assim definidas so chamadas variveis quantitativas. Exemplo 1: Entrevista efetuada com 7 pessoas na entrada de um cinema.

Sexo masculino masculino feminino masculino feminino feminino masculino

Idade 28 38 24 43 26 45 35

Nvel de escolaridade Ensino mdio Ensino mdio Ensino superior Ensino superior Ensino mdio Ensino superior Ensino mdio

Estado civil casado casado solteira separado separada casada solteiro

Transporte carro carro carro carro nibus carro nibus

Renda mensal (sal.min.) 11,8 10,9 12,4 19,5 5,0 15,4 6,5

2- TABELAS DE FREQUNCIA:

o modo de organizar as informaes de uma determinada pesquisa . Vejamos um exemplo. Exemplo 2 : Numa turma de 25 alunos, foram registradas todas as idades destes.
15 15 14 16 16 16 17 17 14 15 16 16 15 15 15 15 14 16 15 16 14 14 15 15 17

Observe que h apenas quatro valores diferentes das variveis quantitativas: 14, 15, 16 e 17. Formando uma tabela com esses dados:
Idade 14 15 16 17 soma Freqncia absoluta (fa) 5 10 7 3 25 Freqncia relativa (Fr) 5/25 = 0,20 10/25=0,40 7/25=0,28 3/25=0,12 100/100=1 Porcentagem 20% 40% 28% 12% 100%

2-1) Freqncia absoluta (fa) o nmero de vezes que um valor observado

no conjunto populao, que, no exemplo, o conjunto cujos elementos so os 25 alunos. A freqncia absoluta do nmero de alunos com 14 anos 5. A porcentagem de alunos com 14 anos 20%. 2-2) A freqncia relativa (fr) do nmero de alunos com 14 anos 0,20, isto , fr ! fa , onde n o nmero total de observaes.
n

Muitas vezes porm, pode ocorrer que os valores assumidos por uma varivel quantitativa variem em determinado intervalo real, no havendo, praticamente, repetio de valores, como no exemplo seguinte.
Sexo masculino masculino feminino masculino feminino feminino masculino Idade 28 38 24 43 26 45 35 Nvel de escolaridade Ensino mdio Ensino mdio Ensino superior Ensino superior Ensino mdio Ensino superior Ensino mdio Estado civil casado casado solteira separado separada casada solteiro Transporte carro carro carro carro nibus carro nibus Renda mensal (sal.min.) 11,8 10,9 12,4 19,5 5,0 15,4 6,5

OBSERVAES:
1- A notao a b refere-se ao intervalo real , que inclui a, mas no inclui b. b dada pela diferena b-a. 2- A amplitude da classe a

3- No h regras fixas para a construo de classes nas tabelas.Procuraremos, na medida do possvel, construir classes de mesma amplitude para que no haja comprometimento da anlise.

Exemplo 3:
Com os dados do exemplo 1 construiremos uma tabela com 3 classes de intervalo, todos de mesma amplitude, referentes a idade.
Classes de valores 20 30 40 total 30 40 50 fa 3 2 2 7 fr 0,43 0,285 0,285 1 Porcentagem 43,0% 28,5% 28,5% 100%

3- REPRESENTAO GRFICA: 3-1) HISTOGRAMA:


No histograma so utilizados retngulos contguos, um para cada intervalo. A base de cada um deles representa a amplitude do intervalo considerado, e a altura de cada um deles corresponde a freqncia ou porcentagem . Exemplo 4: -A altura de 80 homens de uma comunidade est distribuda de acordo com a tabela abaixo:
Altura(metros) 1,60 1,65 1,65 1,70 1,75 1,80 1,85 1,90 Total - Histograma:
Freqncia (fa) 30 y 25 y 20 y 15 y 10 y 5 y 4 12 10 8 2 18

1,70 1,75 1,80 1,85 1,90 1,95

fa 4 12 18 26 10 8 2 80

fr 0,05 0,15 0,225 0,325 0,125 0,10 0,025 1,000

Porcentagem 5% 15% 22,5% 32,5% 12,5% 10% 2,5% 100%

26

1,60

1,65

1,70

1,75

1,80

1,85

1,90

1,95

altura (m)

A anlise do histograma nos permite afirmar que: -- 75% dos homens desta comunidade tm altura at 1,80 m (observe que somamos : 5% + 15% + 22,5% + 32,5%) -- A distribuio das alturas nessa comunidade segue uma representao aproximadamente simtrica em torno da classe de altura que concentra a maior parte das observaes (de 1,75 m a 1,80 m).

3-2) POLGONO DE FREQUNCIAS OU GRFICO DE LINHA:


No histograma, se ligarmos os pontos mdios da parte superior de cada retngulo, e fecharmos a figura como se existissem mais dois intervalos com freqncia nula, um antes do primeiro retngulo e outro depois do ltimo, obteremos um polgono chamado polgono de freqncia .

- Histograma:

(fa) 30 y 25 20 15 10 y y y y 18 12

26

10 8 2

5 y 4

1,60

1,65

1,70

1,75

1,80

1,85

1,90

1,95

altura (m)

Exemplo 5:
A partir do histograma do exemplo 4 construiremos o polgono de freqncia.

(fa) 30 y 25 20 15 10 y y y y 18 12

26

10 8 2

5 y 4

1,60

1,65

1,70

1,75

1,80

1,85

1,90

1,95

altura (m)

3-3) GRFICO DE BARRAS:


O grfico de barras pode ser horizontal ou vertical.

Exemplo 6:

Dos pases mais visitados no ano de 1999, o Brasil ocupa a 29 colocaoem milhes de turistas.
Frana Espanha Estados Unidos Itlia China Inglaterra Mxico Canad Polnia ustria Brasil 71,4 51,9 46,9 35,8 27 25,7 20,2 19,5 17,9 17,6 5

Exemplo 7:
Tv por assinatura ( em 2000) (cidades atendidas) 346

186 176

40

38

Sudeste

Nordeste

Sul

Centro-Oeste

Norte

Fonte: Almanaque Abril, 2001

3-4) GRFICO DE SETORES:


No grfico de setores, tambm chamado pizza ou disco, um crculo dividido em setores circulares, cada um deles correspondendo a uma freqncia.

Exemplo 8: A tabela abaixo relaciona o tipo de transporte utilizado por 240


pessoas de uma metrpole nacional.

Transporte Metr nibus Trem Particular Total

fa 90 80 30 40 240

Com base na tabela acima construiremos o grfico de setores abaixo:

40

90 30

metro onibus trem particular total

80

As equivalncias de valores so: - 90 pessoas utilizam o metr para circularem pela cidade, que corresponde a 37,5% e a 135. - 80 pessoas utilizam o nibus para trafegar na cidade, que corresponde a 33,33% e a 120. - 40 pessoas utilizam veculos particulares para seu translado, que corresponde a 16,66% e a 60. - 30 pessoas usam trem para seu transporte, que corresponde a 12,5% e a 45.

4- MEDIDAS DE CENTRALIDADE: 4-1) MDIA ARITMTICA SIMPLES (M):


Vrios tipos de mdias podem ser definidos a partir de um conjunto de dados. Veremos inicialmente a mdia aritmtica simples, a mais comum, que costuma ser chamada simplesmente mdia.

Exemplo 9:
Observe as notas obtidas em Matemtica por um aluno durante o ano, e o clculo da mdia (nota mdia ): 1 bimestre 2 bimestre 3 bimestre 4 bimestre SOMA
4,5 6,5 9,0 6,0 26 M! 4,5  6,5  9,0  6,0 ! 6,5 4

Dizer que a mdia do aluno foi 6,5 significa que, apesar de ele ter obtido notas mais altas ou mais baixas em outros bimestres, a soma ao final do ano (26) a mesma que ele alcanaria se tivesse obtido a nota 6,5 em todos os bimestres.

4-2) MDIA ARITMTICA PONDERADA (M): Exemplo 10:


Observe agora a variao de idade de 20 alunos de uma classe:

Idade 13 14 15 16 Soma

Freqncia absoluta (fa) 4 8 6 2 20

Freqncia x Idade

4 v13 ! 52

8 v14 ! 112
6 v15 ! 90 2 v16 ! 32
286

Dizemos ento que a mdia aritmtica ponderada (de idade) deste grupo de alunos :

M!

52  112  90  32 286 ! ! 14,3 20 20

4-3) MEDIANA (Me):


Mediana o valor tal que o nmero de observaes menores (ou iguais) a ela igual ao nmero de observaes maiores (ou iguais) a ela.

Exemplo 11:
O controle de qualidade de uma industria forneceu o seguinte nmero de peas defeituosas (por lote de 100 unidades): 5 4 9 6 3 8 1 4 5 6 11 Vamos determinar a mediana (Me) do nmero de peas defeituosas. Para isso devemos ordenar os valores acima fornecidos em ordem crescente: 1 3 4 4 5 5 6 6 8 9 11 Como o nmero de termos impar n = 11, temos Me=5. Podemos observar, por fim, que h cinco valores menores (ou iguais) a 5 e cinco valores maiores (ou iguais) a 5: 1 3 4 4 5 5 6 6 8 9 11 q cinco observaes Me cinco observaes

Exemplo 12:
Vejamos agora os salrios de 6 pessoas que trabalham em um banco: R$ 600,00 R$ 800,00 R$ 900,00 R$ 1000,00 R$ 5700,00 R$ 6000,00 Neste caso a mediana (Me), ser a mdia dos dois dados centrais:
900,00  1000,00 ! 950,00 2

Me !

Interpretaremos a mediana assim: metade dos seis funcionrios ganham mais de R$ 950,00 e a outra metade, menos de R$ 950,00.

4-4) MODA (Mo):


Moda de um conjunto de valores (Mo), a realizao (ocorrncia) mais freqente entre os valores observados. Exemplo 13: Vamos encontrar a moda dos seguintes conjuntos de valores: a) 5 8 11 8 3 4 8 A moda Mo= 8, pois h trs observaes iguais a 8. b) 2 3 9 3 4 2 6 H duas modas: 2 e 3. Dizemos que se trata de uma distribuio bimodal. c) 1 3 4 6 9 11 2 Neste caso, todos os valores aparecem com a mesma freqncia unitria. Assim no h moda nessa distribuio.

5- MEDIDAS DE DISPERSO: 5-1) DESVIO: Exemplo 14:


Vejamos, por exemplo, um conjunto de dados: 2, 5, 6, 8, 14, onde a mdia aritmtica 7. A diferena entre cada valor e a mdia chamada de desvio. Assim, os desvios para o nosso conjunto de dados so: Desvio 2 7 = -5 5 7 = -2 6 7 = -1 87=1 14 7 = 7 Soma = 0 Observao: a soma dos desvios sempre nula.

5-2) VARINCIA (V):


Chamamos de Varincia de um conjunto de dados a mdia aritmtica dos quadrados dos desvios.

Exemplo 15:
Valores 2 5 6 8 14 Soma Mdia 7 7 7 7 7 Desvio -5 -2 -1 1 7 0 Quadrado dos desvios 25 4 1 1 49 80

A Varincia :

V!

80 ! 16 5

Exemplo 16:
Vejamos o desempenho dos 5 alunos de 4 turmas diferentes. - turma A: 5 5 5 5 5 - turma B: 5 6 5 4 5 - turma C: 3 7 6 5 4 - turma D: 1 8 5 2 9 Se calcularmos as mdias aritmticas das notas de cada uma das turmas, notaremos, nos quatro casos, que a mdia da turma igual a 5. Restringindo nossa anlise apenas a esse valor, concluiramos que as turmas apresentam desempenho mdio igual. Isso, porm, no suficiente, pois esse valor esconde informaes em relao homogeneidade ou heterogeneidade do desempenho dos alunos de uma mesma turma. Para isso temos:
2 2 2 2 2 -- Turma A: V ! (5  5)  (5  5)  (5  5)  (5  5)  (5  5) ! 0

O valor nulo da varincia indica que todos os alunos apresentaram desempenho idntico. -- Turma B:
(5  5) 2  (6  5) 2  (5  5) 2  ( 4  5) 2  (5  5) 2 V ! ! 0,4 5

O valor muito pequeno encontrado para a varincia indica que nessa turma os alunos apresentaram desempenhos muito prximos. -- Turma C: V !
(3  5) 2  (7  5) 2  (6  5) 2  (5  5) 2  (4  5) 2 !2 5

O valor revela um grau de heterogeneidade moderado, no havendo, porm, alunos com desempenhos muito discrepantes. -- Turma D:
V ! (1  5) 2  (8  5) 2  (5  5) 2  ( 2  5) 2  (9  5) 2 ! 10 5

O valor grande encontrado para a varincia nos evidencia a presena de alunos com desempenhos extremos ou muito bons ou muito ruins.

-- Turma A:

V !

(5  5) 2  (5  5) 2  (5  5) 2  (5  5) 2  (5  5) 2 !0 5

-- Turma C:

V !

(5  5) 2  (6  5) 2  (5  5) 2  ( 4  5) 2  (5  5) 2 ! 0,4 5

-- Turma B:

(3  5) 2  (7  5) 2  (6  5) 2  (5  5) 2  ( 4  5) 2 V! !2 5

-- Turma D:

V !

(1  5) 2  (8  5) 2  (5  5) 2  ( 2  5) 2  (9  5) 2 ! 10 5

5-3) DESVIO PADRO (D):


Chamamos de desvio padro a raiz quadrada da varincia. No exemplo acima temos: -- Turma A: -- Turma C: -- Turma B: -- Turma D:
D! 0 !0

D ! 0,4 $ 0,632

D ! 2 $ 1,414

D ! 10 $ 3,162

Das könnte Ihnen auch gefallen