Sie sind auf Seite 1von 62

Módulo 1

Estatística
Básica
Pesquisa Científica

Busca entender o objeto.


Desenvolve ideias e
percepções.
Ajuda a formular hipóteses.

Descreve em que
circunstância ou com que
frequência algo ocorre.
Avalia a relação entre 2 fatos

Busca esclarecer relações do


tipo causa- efeito entre duas
variáveis
Conceito de Estatística

• Estatística
Conjunto de técnicas destinadas ao estudo quantitativo de
fenômenos coletivos e empiricamente observáveis.
• Dado Estatístico
Número que mede a intensidade ou a característica do
fenômeno coletivo que está sendo estudado.

• Finalidade da Estatística
▪ Desenvolver métodos e técnicas p/ coleta, organização,
análise e interpretação de dados;
▪ Fornecer métodos para inferir conclusões sobre um
universo maior a partir das observações de um fenômeno
particular.
Conceito de Estatística: tipos

• Estatística Descritiva
Busca descrever a realidade. Usa técnicas para
organizar e sintetizar os dados observáveis dessa
realidade.

• Estatística Inferencial ou Indutiva


Busca inferir, induzir ou estimar sobre a característica
do todo (a população) com base nos dados da parte
(amostra). Usa técnicas para generalizar um fato
particular tendo como referência uma amostra
Conceito de Estatística

 Inferência
Método para tirar conclusão sobre um fenômeno através de
repetidas observações, mantendo sempre as mesmas
condições. Processo mental para chegar a uma conclusão
a partir de premissas(suposições).
 Incerteza
Como não é possível controlar todos os fatores que influem
na observação de um fenômeno estatístico há sempre um
grau de incerteza sobre a veracidade dos resultados
coletados.
 Probabilidade
Por isso as inferências estatísticas são sempre incertas, com
uma margem de erro, portanto probabilísticas
Probabilidade Conceito

• Probabilidade é a nossa incerteza sobre ocorrência


de um evento quando não se tem conhecimento
completo das circunstâncias que o causam.
• Probabilidade é a possibilidade que existe entre
várias de um fato ou fenômeno acorrer. 
• A Probabilidade tem a função mostrar a chance
de ocorrência de um evento.
• A Probabilidade é o ato de atribuirmos pesos aos
eventos.
Probabilidade

Baralho
52
Cartas

Qual a
probabilidade
de tirar
1 Az?
Conceito de Probabilidade

 Teoria da Probabilidade
A estatística é uma ciência sobre a incerteza. Se baseia
inteiramente na Teoria da Probabilidade (da ocorrência de
um fenômeno).
 Probabilidade Estatística
É a afirmação sobre a possibilidade ou probabilidade de um
fenômeno ocorrer, desde que satisfeitas um conjunto de
condições teóricas.
 Fenômenos aleatórios
São o objeto de estudo da estatística, e se referem a todos
fenômenos observáveis na natureza.
Fenômenos Aleatórios
Fenômenos Aleatórios
Fenômenos Aleatórios

 Características dos Fenômenos Aleatórios


▪ Repetição.
▪ Variabilidade.
▪ Não há previsibilidade sobre a variação futura.

 Frequência de um Fenômeno Aleatório


Quando um determinado fenômeno ocorre repetidas
vezes, diz-se que existe uma regularidade de ocorrências
ou frequência.
População e Amostra
População e Amostra Estatística

População de uma Variável


É o universo de todas as ocorrências possíveis de um
fenômeno aleatório. A população é o conjunto total de dados
de uma realidade.

Amostra
É um subconjunto da população. Representa uma parte dos
dados da população.
População e Amostra Estatística
População e Amostra Estatística
População e Amostra Estatística

Levantamento de dados
É o procedimentos de fazer observações de algum fenômeno da
população. Como é impossível levantar todos os dados de uma
população, coletamos parte desta informação: amostra.

Objetivo da Estatística
Levantar dados amostrais para concluir (inferir ou generalizar)
sobre as características da realidade mais ampla: população.

Indução Estatística
Processo pelo qual assumimos que os dados da amostra são
iguais ao de toda população. Essa generalização é feita através do
cálculo das probabilidades.
Amostra
Amostragem
Amostragem
Seleção da Amostra
As amostras devem se escolhidas de modo a permitir calcular a
probabilidade de ocorrência de um evento.
Amostra Representativa
É aquela que tem as mesmas características da população de onde
foi retirada
Amostra Probabilística
É aquela cujo processo de amostragem permite atribuir a cada
elemento da amostra uma probabilidade semelhante à da
população.
Amostragem Aleatória
É aquela em que cada elemento da população tem chance igual de
ser selecionado no levantamento dos dados.
Amostragem: Tipos

Amostragem casual simples com reposição


Os elementos da população entram mais de uma vez na amostra.

Amostragem casual simples sem reposição


Os elementos da população só podem entrar uma vez na amostra

 Amostragem sistemática:
Seleção da amostra com base num critério: Um em cada dez.

 Amostragem por conglomerados:


A amostra é selecionada por sorteio da área a ser pesquisada

 Amostra estratificada ou em estágios múltiplos:


A amostra é dividida em grupos e selecionada por etapas dentro de
cada grupo: cidade/bairro/quadra
Amostragem
Amostragem
Experimentação
Experimento e Variável

• Experimento – É a observação sistemática de um


fenômeno (evento aleatório) qualquer da população.

• Variável – É o valor que o fenômeno assume, em


um experimento qualquer.

• Domínio da Variável – São todos os valores


possíveis que um fenômeno pode assumir em um
experimento.
Experimento e Variável

Experimento Variável Domínio da Variável

Lançar 1 dado
1,2,3,4,5,6

Lançar 1 moeda

Cara
Coroa
Experimento e Variável
Variável: Tipologia

• Variável Qualitativa (Atributo)


– a qualidade assumida pelo evento (fenômeno).

• Ex: O que Vc acha do transporte público em SP


bom, ruim, regular

•Variável Quantitativa
– a medida da variação de um evento
(fenômeno)
•Ex: Qual é a idade média dos alunos da FAU
23, 24, 25
Variável: Tipologia

• Variável Quantitativa Contínua – aquela que pode


assumir qualquer valor numa escala de valores
(teoricamente infinitos valores): Altura da pessoas.
• Variável Quantitativa Discreta – aquela cujos valores
possíveis são números inteiros (contagem): No. de
alunos numa sala.
• Variável Dependente – aquela cujos valores depende
dos valores de outra variável: em matemática se
expressa por uma relação funcional (função)
y = f (x)
y = variável dependente
x = variável independente
Variáveis contínuas e discretas
Escalas de medidas de uma Variável

 Escala nominal quando as observações de uma variável


são apenas etiquetas para identificar, dar um nome, um
atributo de cada observação. Exemplos de variáveis de
escalas nominais: sexo/religião/estado civil. Aqui os
valores não possuem ordem intrínseca.

 Escala ordinal quando os dados têm propriedades


nominais e podem ser usados para ordenar as observações
nessa variável. Um exemplo de uma escala ordinal é a
utilizada em questionários de satisfação ou de avaliação
da qualidade. Exemplo: Transporte – (Bom) (Razoável)
(Ruim). Aqui os valores possuem uma ordem intrínseca
Escalas de medida de uma variável

Escala de razão – quando os dados têm propriedades


intervalares e faz sentido dividir duas observações.
Exemplo: As variáveis distância, peso, comprimento e
tempo medem-se através de escalas de razão, exigindo
sempre um ‘zero’ que representa a não existência de valor.
Aqui os valores numéricos possuem ordem e diferenças
têm significado

Escala de intervalos - quando os dados têm


propriedades ordinais e o intervalo entre as observações
pode ser expresso em termos de uma unidade fixa de
medida. Exemplo: A temperatura é um exemplo de variável
que usa uma escala intervalar de medição. Aqui os valores
numéricos possuem ordem e diferenças têm significado.
ESTATÍSTICA DESCRITIVA
Amostra : Classificação e Caracterização

• Distribuição das Freqüências

• Medidas de Tendência Central

• Medidas de Variabilidade

• Medidas de Proporcionalidade ou Relativas


Distribuição de Frequência
Variável discreta

• Frequência – é a quantidade de vezes que a variável


(evento) ocorre . Em outras palavras, é a quantidade de
vezes em que o atributo de qualidade aparece. Exemplo:
Experimento avaliação do Transporte: (bom) (regular) (ruim).
• Intervalo de Classe de uma variável discreta: São os
atributos variáveis de qualidade atribuídos à variável. Os
intervalos são os próprios atributos. Exemplo: o atributo
(bom) é em si mesmo uma classe da variação qualitativa.
• Limites de Classe – Não existem há limites de classe.
Distribuição de Frequência
Variável Contínua

 Frequência – é a quantidade de vezes que a variável


(evento) ocorre . Em outras palavras: a frequência é nº de
vezes em que a variável assume um certo valor.
 Intervalo de Classe : É obtido dividindo o conjunto
de valores assumidos pela variável em intervalos de classe
e indicando a frequência dos valores observados para
cada intervalo.
 Limites de Classe – É o intervalo entre o valor
máximo e mínimo de uma variável dentro de uma classe.
A cada intervalo de classe estão associados os limites de
classe (valores extremos) e o ponto médio.
Frequência de uma Variável

Pesquisa realizada com os 200 alunos de uma universidade buscava


identificar as preferências por esportes. Foram fornecidas as seguintes de
opções esportivas: futebol, vôlei, basquete, natação, tênis e ciclismo. Observe
os resultados:
Distribuição de Frequência

• Amplitude Total de uma série – É a extensão de variação


total da variável: A diferença entre valor maior da última classe e
o menor valor da primeira classe.

• Amplitude de Classe – É a diferença entre o valor máximo e


mínimo da variável dentro da classe.

• Ponto Médio de Intervalo de Classe = valor médio

limite inferior + limite superior


2
Distribuição de Frequência

Variável Frequência
Variável: Quantidade de $ no bolso
Intervalo Limites Variáveis Freqüência

10 2
Inferior 10
A 6
20 4
Superior 20

30 7
Inferior 30
B 15
40 8 40
Superior

50 9 Inferior 50
C 25
60 16 Superior 60

70 16 Inferior 70
D 26
80 10 Superior 80

90 9 Inferior 90
E 16
100 7 Superior 100

200 4 Inferior 200


D 7

500 3 Superior 500


Distribuição de Frequência

• Frequência Absoluta – Valor total das observações

• Frequência Relativa – Valor porcentual das observações

• Frequência Acumulada – Somatória das frequências de todos intervalos

Modalidade Frequencia Frequência Frequência Frequência


Esportiva Relativa Absoluta Acumulada Acumulada
Futebol 35% 70 70 35%
Vôlei 25% 50 120 60%
Basquete 20% 40 160 80%
Natação 10% 20 180 90%
Tênis 8% 15 195 98%
Ciclismo 2% 5 200 100%
100% 200 200 100%
Histograma

• Histograma: Gráfico das distribuições das frequências


de uma variável.

• Gráfico de Barras (Histograma) – Gráfico de


retângulos, diagrama de colunas; gráfico de áreas.

• Histograma – As frequências dos fenômenos são


proporcionais à superfície de cada retângulo que as
representam. Para intervalos de mesma amplitude as
frequências serão proporcionais às alturas
Distribuição de Frequência

Histograma
Processo de Elaboração do Histograma
• Organizar os dados em ordem crescente;
• Determinar a amplitude total;
• Dividir a amplitude total em um nº adequado de intervalos
de preferência com a mesma amplitude;
• O número mínimo de intervalos é 5, número máximo 20;
• Quando possível os pontos médios dos intervalos devem
coincidir com os valores realmente observados
Distribuição de Frequência

Histograma

• Distribuições Simétricas e Assimétricas - Os


histogramas podem apresentar distribuição simétricas ou
assimétricas. Indicadas nos slides a seguir,

• Polígono de Frequências – Unindo-se os valores


médios dos intervalos de classe, o histograma se
transforma num polígono de frequências. Pode-se então
comparar este polígono com uma curva teórica (Normal).
GRÁFICO DE FREQUÊNCIAS: Histograma

18
16
14
12 Variaveis Frequência
1 4
Frequências

10
2 6
8
3 16
6 4 8
4 5 7
2 6 2
0
1 2 3 4 5 6
Categorias
HISTOGRAMA E POLÍGONO DE FREQUÊNCIA

45 42

40
Pesos Nº alunos 35
( x 1) ( f1) 35 32
40-45 10 30
45-50 15
50-55 18 25 22
55-60 22 20 18 18
60-65 35 15
15
65-70 42 10 10
70-75 32 10
6
75-80 18
5
89-85 10
85-90 6 0
Total 208 40-45 45-50 50-55 55-60 60-65 65-70 70-75 75-80 89-85 85-90

simétrico
HISTOGRAMA E POLÍGONO DE FREQUÊNCIA
Assimétrico à esquerda

45
Pesos Nº alunos
( x 1) ( f1) 40
40-45 35 35
45-50 42
30
50-55 32
25
55-60 24
60-65 20 20
65-70 17 15
70-75 15
10
75-80 10
89-85 10 5

85-90 6 0
Total 208 40-45 45-50 50-55 55-60 60-65 65-70 70-75 75-80 89-85 85-90

assimétrico
HISTOGRAMA E POLÍGONO DE FREQUÊNCIA
Assimétrico à direita

45

Pes os Nº alunos 40
( x 1) ( f1)
35
40-45 5
45-50 8 30
50-55 12
55-60 15 25

60-65 17 20
65-70 21
70-75 24 15
75-80 29
10
89-85 42
85-90 35 5
Total 173
0
40-45 45-50 50-55 55-60 60-65 65-70 70-75 75-80 89-85 85-90

assimétrico
Medidas de Ordenamento ou Posição
Medidas de Tendência Central

• Valores Centrais ou Médias de uma Amostra – Valores


que indicam posição de centralidade, ou o ponto central da
distribuição.

• Média Aritmética Simples – Quociente da soma dos valores


observados, pelo número total de valores.

α = Σ xi i = 1.....n

n
Medida de Tendência Central

Levantamento
Observações Evento Observações Frequência
48 1 do peso
55 2 48 2 dos alunos
51 3 51 3 da classe
58 4 55 5
55 5 58 4
48 6 60 1
51 7
55 8 Média 54,4
58 9
51 10
55 11
58 12
60 13
55 14
58 15
Medidas de Tendência Central

• Média Aritmética Ponderada - Quando há valores que


se repetem ou ocorrem com mais frequência que outros.

• α = Σ x i . fi
Σ fi

• Ex: α = 48.2 + 51.3 + 55.5 + 58.4 + 60.1 = 54,4


15
• Utilização: média de cálculo mais fácil. Valor médio
significativo por incluir todos os valores observados. Usada em
estatística para o cálculo do desvio padrão. Em probabilidade
esta média é chamada Esperança Matemática.
Medidas de Tendência Central

• Mediana – Medida de posição. A mediana é o valor que


ocupa a posição central (meio) da distribuição.
• Série de valores com nº impar de termos
– Mediana = n + 1 /2
– Nº de termos 7
– Md = 7+1 = 8 / 2 = 4 (mediana é o 4º termo)
– Ex: 5, 7, 8, 11, 12, 13, 14 (7 termos) → Md = 11

• Série de valores com nº par de termos


– Mediana = n /2 + 1 e
– Mediana = n /2
– Nº de termos 8
– Md = 8/2 = 4 (mediana entre o 4º e 5 º termo)
– Md = 8/2+1 = 5
– Ex: 5, 7, 8, 11, 12; 13, 14, 15; (8 termos) → Md = 11+12 / 2 = 11,5

• Utilização: |A mediana é usada quando a distribuição apresenta resultados


extremos muito discrepantes. A mediana não sofre a influência de valores extremos
Medidas de Tendência Central

Moda – Valor dominante de uma distribuição.


•Numa série são os valores que ocorrem com a maior freqüência.
•Um conjunto de valores pode apresentar mais de uma moda:
plurimodal.

Ex: 48, 49, 50, 50 50, 55, 58, 59, 60 → M = 50

Ex: 4, 5, 6, 4, 5, 7, 4, 8, 5, 10 → M = 4 e 5
(plurimodal)
Medidas de Dispersão
Mediadas de Variabilidade

• Índices que indicam o grau de concentração ou dispersão de


uma distribuição em torno da média.
• Principais índices de variabilidade:
– Amplitude total
– Desvio médio
– Variância
– Desvio padrão

• Amplitude Total (Intervalo Total) - É a diferença entre o


maior e o menor valor de uma série.

• Ex: 48, 48 49,49,49,55,55,55,55,55,58,58,58,58,59,60


• → A = 60 - 48 = 12
Medidas de Variabilidade

• Desvio Médio – Média aritmética dos afastamentos (ou


desvios), tomados em valor absoluto, entre cada valor e a
média aritmética.

• DM = Σ │di . fi │ sendo di = │xi - α │


Σ fi sendo α = média aritmética

Ex: dm = (48 – 54,4).2 + (51-54,4).3 + (55-54,4).5 + (58-54,4).4 + (60-54,4).1


15

dm = 12,8 + 10,2 + 3,0 + 14,4 + 5,6


15

dm = 3,07

Utilização: Indica o quanto, em média, os valores se afastam do ponto central (média)


numa distribuição do tipo Curva de Gaus
Medidas de Variabilidade

• Variância – Considerando-se uma amostra de dados, cada


dado isolado pode ter um desvio (dispersão) em relação à
média da amostra. Essa dispersão é a diferença entre o valor
individual e a média da amostra de dados. Para se avaliar o
grau de dispersão de toda a amostra de dados utiliza-se a
variância que é a somatória dos desvios elevada ao quadrado
dividida pelo tamanho da amostra, menos 1.

• s2 = Σ (xi – α)2 • fi
Σ fi – 1

• Exemplo: s2 = 81,92 + 34,68 + 1,80 + 51,84 + 31,36


14
S2 = 14,4
Medidas de Variabilidade

• Desvio padrão – afastamento quadrático médio ou


afastamento padrão. É a raiz quadrada da variância.

• Desvio padrão dos dados isolados ponderados com freqüências distintas:

• s2 = √ Σ (xi – α)2 • fi
Σ fi – 1

• Exemplo: s2 = 81,92 + 34,68 + 1,80 + 51,84 + 31,36


14
s = √ 14,4 = 3,79
• Utilização: é a medida mais usada para mensurar a variabilidade de um
conjunto de dados. Usado principalmente na distribuição normal de dados.
O histograma de Densidades

0 .0 4
D e n s id a d e

0 .0 3

0 .0 2

0 .0 1

0 .0 0

30 40 50 60 70 80 90 1 00
Peso

Peso, em kg, de 1000 pessoas adultas selecionadas ao acaso em uma população


Distribuição dos valores da variável aleatória X.
Distribuição de probabilidades de X
A curva contínua da figura denomina-se Curva Normal

0.030
D e n s id a d e

0.015

0.000

30 40 50 60 70 80 90 100
Peso

X: peso, em kg, de uma pessoa adulta escolhida ao acaso da população.


Curva de Gauss
Distribuição Normal


Curva de Gauss
Distribuição Normal

-1s → 1s
68, 27 % dos casos estão incluídos entre M–1s e M+1s

-2s → 2s
95,45 % dos casos estão incluídos entre M–2s e M+2s

-3s → 3s
99,73 % dos casos estão incluídos entre M–3s e M+3s
Curva de Gauss
Distribuição Normal

Das könnte Ihnen auch gefallen