You are on page 1of 42

 

 
 
 
 
 
 

Guia Prático do
SPSS

Outubro/2010
Utilização do SPSS
(Statistical Package for the Social Sciences)
– Guia Prático I –

2
Programa “Utilização do SPSS”
1. Introdução

2. Origem

3. Abordagem conceptual

4. Áreas de interesse

5. Ambiente de trabalho

6. Criação de ficheiro de dados

7. Importação de ficheiros

8. Análise estatística de dados

9. Análise de gráficos

10. Ajuda - Utilização do tutorial

Bibliografia
• PESTANA, M. H., GAGEIRO, J. N., Análise de Dados para Ciências Sociais
– a complementaridade do SPSS, Ed. Sílabo, 1998
• PEREIRA, Alexandre, SPSS – Guia prático de utilização – Análise de
Dados para Ciências Sociais e Psicologia, Ed. Sílabo, Lisboa, 1999
• HILL MAGALHÃES, Manuela, Hill, ANDREW, Investigação por
Questionário, Ed. Sílabo, Lisboa, 2000.
• Site: www.spss.com

3
1. Introdução
O SPSS é um package estatístico que integra diversas funcionalidades que
envolvem a recolha, validação e a análise de dados. A sua utilização deve ser
sempre supervisionada por uma boa orientação em termos de
conhecimento e domínio das técnicas estatísticas envolvidas.

1.1 Objectivo:
¾ Dotar os formandos de conhecimentos básicos
para a utilização de determinadas técnicas para a
obtenção e análise de resultados estatísticos.

1.2 Requisitos básicos:


¾ Estatística (ou que utilizem como apoio um livro
de estatística).
¾ Informática (windows,..).
1.3 Resultados esperados:
¾ Introduzir dados num novo ficheiro; gravar
ficheiros e abrir ficheiro criado anteriormente;
definir e transformar variáveis;
¾ Importar dados do Excel e de outras aplicações;
¾ Analisar dados (estatística univariada e bivariada,
tabelas e gráficos);
¾ Executar alguns procedimentos de estatística
inferencial.

4
2. Origem

¾ Universidade de Londres nos anos 60. Tornou-se


muito popular no meio académico a partir da
década de 70;

Além do SPSS, foram desenvolvidos na década de 60


vários softwares estatísticos. De entre esses, podem ser
citados:

¾ SAS (Statistic Analysis System): foi desenvolvido na


Universidade da Carolina do Norte; é semelhante ao
SPSS; contém vários módulos; é muito popular nos
institutos de pesquisa;

¾ "BMD" (Biomedical Computer Programs):


desenvolvido na Universidade da Califórnia.

¾ EPINFO: foi desenvolvido sob os auspícios da ONU,


para ser utilizado e popularizado na área médica;
possui diversos módulos estatísticos; todavia,
tecnicamente constitui um software limitado,
principalmente quanto aos seus recursos gráficos;

5
¾ SPHINX: é originário da França; possui
particularidades como a capacidade de realizar
análises lexicais, factoriais e de correspondências
múltiplas; ao contrário dos softwares tradicionais,
possui uma visão dos dados que vai do particular ao
geral;

Alguns endereços estatísticos:


♦ www.spss.com — é o site do SPSS com alguns
links interessantes.

♦ www.statsoft.com — é o site de um pacote


menos conhecido, chamado Statistica.

♦ www.statsoft.com/textbook/stathome.html

♦ trochim.human.cornell.edu/selstat/ssstart.htm
— é um site para seleccionar procedimentos
estatísticos.

♦ www.ats.ucla.edu/stat/ — é o site sobre


recursos académicos da Univiversidade Califórnia
Los Angeles (UCLA).

6
3. Abordagem conceptual
Segundo alguns especialistas, o SPSS é:
¾ uma poderosa ferramenta informática que
permite realizar cálculos estatísticos complexos,
e visualizar os seus resultados, em poucos
segundos, (Pereira, 1999).

¾ Uma das muitas aplicações para o tratamento


estatístico de dados disponíveis e das mais
divulgadas no mundo inteiro (Fonseca & Silva,
2003).

¾ Um software útil para gerir e analisar


estatisticamente uma matriz de dados. Processa
em ambientes DOS e Windows e possui uma
visão que vai do geral para o particular.
¾ Um poderoso software estatístico especialmente
desenvolvido para a utilização por profissionais
de ciências humanas. Diferentemente de outros
pacotes estatísticos existentes no mercado, o
SPSS apresenta uma interface bastante amigável
ao usuário, facilitando em muito suas análises
estatísticas (Valentim, Fernando, 2001:
fvalentin@ig.com.br)

7
4. Áreas de interesse
O SPSS pode ser utilizado nas mais diversas
áreas do conhecimento e aplicações:

¾ Marketing
¾ Psicologia
¾ Administração
¾ Educação
¾ Ciências Sociais
¾ Serviço Social
¾ Economia
¾ Governamental
¾ Finanças
¾ Saúde Pública
¾ Pesquisa de Mercado
¾ Pesquisa Social
¾ Pesquisa Eleitoral
¾ Pesquisa de Opinião
¾ Pesquisa de Mídia
¾ Investigação cientifica.

8
5. Ambiente de trabalho
5.1 Janelas

Há oito tipos de janelas/windows no SPSS:

Figura 1 – Lista de janelas do SPSS.

9
Data Editor – A janela que apresenta o conteúdo do ficheiro de
dados. Os dados podem ser criados ou modificados
através desta janela. Só é possível ter uma destas
abertas num dado momento. É a primeira janela
que abre quando inicia o SPSS.

Barra de ferramentas
Barra de menus

Barra
de
estado

Figura 2 – Janela de edição de dados

Folha de edição de dados


Modo de visualização de dados

Modo de visualização e definição das variáveis.

10
Viewer (Output) – Janela onde são apresentados todos os
resultados estatísticos, tabelas, gráficos, etc. Abre
automaticamente, sempre que um determinado
procedimento gera resultados. É composto por duas sub-
janelas: à esquerda está um organigrama do output: à
direita estão os resultados propriamente ditos.

Figura 3 – Janela de visualização de resultados.

Draft Viewer – Os resultados podem ser apresentados em forma de


texto (instead of interactive pivot table) no Draft
Viewer.

Pivot Table Editor – permite editar e modificar tabelas (editor da


tabela dinâmica). Pode editar-se o texto,
trocar os dados de linhas com colunas,
adicionar cor, criar tabelas
multidimensionais, etc.

11
Chart Editor – permite editar e modificar gráficos. Podem alterar-
se as cores, seleccionar tipos e tamanhos de letras, trocar os eixos
vertical com horizontal, fazer rotações, etc.

Figura 4 - Janela de edição de gráficos.

Text Output Editor – permite alterar texto que não seja visível no
Pivot Table Editor. Pode alterar-se com o
tipo, tamanho, cor e estilo das letras.

Syntax Editor – Todos os comandos emitidos a partir dos menus


do SPSS podem ser apresentados numa janela de
sintaxe. Para isso, utiliza-se o comando Paste das
caixas de diálogo.

Script Editor – Janela de programação que permite personalizar e


automatizar tarefas do SPSS (pequenos
programas).

12
5.2 Menus
File Edit View Data Transform Analyze Graphs Utilities Windows Help

Tabela 1 – Menu da Janela de dados


M en u Funcionalidades

Criar, abrir, ler, gravar ou imprimir ficheiros.


File
Modificar, copiar ou colar textos das janelas de
Edit output ou de sintaxe; pesquisa de dados e
parametrização de opções diversas.
Activar diversas barras de ferramentas/botões,
fontes, grelhas, barra de status e mostrar os
View rótulos (labels) definidos.
Alterar globalmente os dados tais como: transpor
variáveis e casos, criar subconjuntos de casos para
Data análise, inserção de dados.
Obs: Estas alterações são temporárias e não
afectam o ficheiro, excepto se for efectuada uma
gravação com estas alterações.
Produzir alterações nas variáveis seleccionadas e,
Transform calcular novas variáveis a partir de valores de
outras já existentes.
Obs: Estas alterações só serão efectivas se forem
gravadas.
Seleccionar vários procedimentos estatísticos como
Analyze a análise descritiva, cruzamento de variáveis,
análise da variância, correlações, regressões,
clusters, séries, amostras, análise multivariada,
estatísticas não paramétricas, etc.
Criar gráficos de colunas, de sectores,
Graph histogramas, diagramas de dispersão, etc.
Obter informação acerca das variáveis, controlar
Utilities lista de variáveis que aparece nas caixas de
diálogos, correr scripts e alterar menus.
Add-ons
Comutar entre as várias janelas do SPSS ou
Windows minimizá-las.
Ajudar o funcionamento do SPSS.
Help Ligar à Página do SPSS na Internet.

13
6. Criação de Ficheiro de dados

6.1 Introdução de dados


Aspectos a considerar:

¾ Muitas das características da Janela do Data Editor do


SPSS são similares às de qualquer folha de calculo em
ambiente Windows, tal como o Excel.

¾ As colunas correspondem às variáveis (ou campos). E as


linhas aos casos (ou registos).

¾ As células podem apenas conter valor (numéricos e não


numéricos); não é possível, tal como se faz nas folhas de
cálculos, definir fórmulas nas células.
Definição das variáveis (Data → Define Variable):

¾ O primeiro caracter deve ser uma letra; os restantes


podem ser numéricos ou não numéricos; ou mesmo
incluir certos símbolos (@, #, _, ou $). Não deve incluir
espaços em branco ou conter os símbolos: &, !,? ou *.

¾ As palavras ALL, NE, EQ, TO, LE, LT, BY, OR, GT,
AND, NOT, GE, WITH não podem constituir nomes para
as variáveis. Estão reservadas para a Syntax.

¾ Deve indicar o tipo da variável: numérico, textos/não


numéricos (string), data (date), etc; descrever a variável e
dos seus valores (rótulos/labels); e codificar os valores em
falta/sem informação (missing values).
Obs: É recomendável definir uma variável qualitativa como numérica e
depois atribuir os rótulos ou labels. Por exemplo, a variável sexo: digitar 1 para
sexo feminino e 2 para sexo masculino e nos labels colocar a equivalência.

14
Exemplo 1 - Considere um exemplo prático.

Editor de Célula Célula activa


Número de linha Nome da variável

Figura 5 – Introdução de dados

1. Guarde o ficheiro: File → Save → nomeficheiro (osvaldo.sav)


2. Produza: Tabela de frequências para a variável ano.
Analyze → Descriptive Statistics → Frequencies → variável
3. Repita a alínea 2) para as outras variáveis.
4. Feche todas as janelas do SPSS. Abra de novo o SPSS.
5. Abra o ficheiro de dados introduzido anteriormente:
File → Open → nomeficheiro
6. Utilize no menu Edit as opções (copiar, apagar, paste, find, ...)
7. Introduza/Insira 5 novos casos: Data → Insert Case
8. Insira 2 novas variáveis: Data → Insert variable

15
Depois de efectuar o exemplo anterior, faça o seguinte:

9. Seleccione as variáveis sexo, idade, ano e turma e


construa as frequências e os respectivos gráficos de
barras.

Figura 6 – Selecção de variáveis

10. Cruze as variáveis ano e sexo.


Analyze → Descriptive Statistics → Crosstabs
ANO * SEXO Crosstabulation

Count
SEXO
f m Total
7 4 4
8 2 2
ANO
9 2 1 3
10 1 1
Total 4 6 10

Obs: Este resultado foi obtido para 10 casos/indivíduos.

16
11. Repita o procedimento utilizado em 10), separando
os resultados por turma.
¾ Split File: permite dividir uma variável
qualitativa/categórica por grupos.

Data → Split File → Organize output by groups

Figura 7 – Divisão de ficheiro

A seguir, cruze as variáveis ano e sexo.

¾ Para anular o Split File, deve fazer:

Data → Split File → Analyze all cases, do not create groups

12. Seleccione apenas os alunos do sexo feminino.

¾ Select Cases: Selecciona determinados casos.

Data → Select Cases → if condition, is satisfied

17
Figura 8

18
6.2 Transformação de variável (TRANSFORM)

Transform Função Como accionar e os subcomandos

Compute Calcula uma nova Colocar o nome da nova variável


variável a partir de
em target variable. Em numerical
outras já existentes,
expression colocar as variáveis
podendo usar todas existentes e as operações entre
as funções elas. Por exemplo:
matemáticas e soma=a1+a2+a3+a4.
estatísticas Ainda, pode seleccionar casos
utilizando a condição if .
Random Number Serve para gerar um número aleatório
Seed
Recode Recodifica variáveis • Into the same variable: altera
os valores da variável e guarda
as alterações na mesma
variável. Seleccionar a variável
e entrar em Old and new
values, e a cada valor antigo
colocar o valor novo e
adicionar clicando add, no fim
dar continue.
• Into the diferent variable: cria
uma nova variável em função
de uma já existente, seguir o
mesmo esquema do item
anterior.
Rank cases Atribui postos na variável segundo uma outra.

Automatic recode Cria uma nova variável com o mesmo conteúdo da


variável desejada
Run Pending Roda as transformações pendentes
transforms
Create Time Cria séries temporais.
Series

19
7. Importação de ficheiros

O SPSS dispõe de procedimentos de importação de ficheiros criados


noutras aplicações designadamente folhas de cálculo (Lotus 123, Excel),
bases de dados (dBase, Access), ficheiros ASCII (separados por
tabulações, vírgula, espaços), etc.

IMPORTAÇÃO DE FICHEIROS DE EXCEL

File → Open →

Figura 9 – Tipos de ficheiros

Nesta janela deve:

¾ Procurar a pasta onde se encontra o ficheiro;


¾ Especificar Excel e seleccionar a opção (*.xls).

Aparece de seguida uma caixa de diálogo, onde se especifica se as


primeiras células contêm os nomes das variáveis (se sim activar Read
variable names) e o intervalo (rectangular) de células (no exemplo,
A1:B11).

Por último, o SPSS cria um ficheiro com tantas variáveis quantas as


colunas e tantos casos quantas as linhas do bloco especificado. Não se
esqueça de guardá-lo na sua pasta (extensão .sav).

20
8. Análise de estatística de dados (STATISTICS)

¾ O SPSS apresenta um conjunto de funções e


procedimentos avançados para a análise estatística de
dados, os quais se encontram sob o comando Analyze
(Análise de dados).

8.1 Tabelas de Frequência


Antes de dar início à apresentação das diferentes funções
estatísticas, aconselha-se a interpretação das tabelas de
frequência (frequency).

Considere o seguinte exemplo:

Ano de Escolaridade

Valid Cumulative
Frequency Percent Percent Percent
7 18 36,0 36,0 36,0
8 14 28,0 28,0 64,0
Valid 9 11 22,0 22,0 86,0
10 7 14,0 14,0 100,0
Total 50 100,0 100,0

Interpretação:

¾ Dezoito (18) alunos frequentam o 7º ano de escolaridade. Ou


seja, 36% dos alunos estão a frequentar o 7º ano. ... 28% o 8º
ano de estudo. ...

¾ Há 64% de inquiridos estudam o 1º ciclo do ensino


secundário (7º e 8º anos de escolaridade). Por outro lado,
36% frequentam o 2º ciclo (9º e 10º anos de escolaridade).

¾ ...

21
8.2 Análise de Relatórios (Reports)
¾ O SPSS produz pequenos relatórios, contendo medidas
estatísticas. Por exemplo, para seleccionar uma ou mais
variáveis (ou categorias de variáveis), utiliza-se o seguinte
procedimento:

Analyze → Reports → OLAP Cubes...

OLAP: Online Analytical Processing.

Figura 10
• Ainda, pode-se seleccionar diferentes medidas estatísticas,
clicando no Statistics.

Figura 11

22
8.3 Medidas Estatísticas (Statistics)

8.3.1 Descritivas (Descriptives statistics)

¾ O SPSS apresenta as medidas:

Localização Localização/Posição
(Tendência não Central) (Tendência Central)

Figura 12 – Estatísticas Descritiva


Assimetria e
Achatamento/Curtose
Dispersão
(ou variabilidade)

¾ Podem ser obtidas de 2 formas:

Analyze → Descriptive Statistics → Frequencies → Statistics


Ou

Analyze → Descriptive Statistics → Descriptive → Options

23
¾ Medidas de Tendência Central

Mean (Media) – medida de tendência central mais utilizada,


sendo definida como o resultado da divisão da
soma de todos os valores observados pelo número
total de observações.

Median (Mediana) – valor central (meio) de uma


distribuição; divide a distribuição em 2 partes
iguais, tendo assim, 50% dos dados à sua direita
como à sua esquerda.

Mode (Moda) - valor que ocorre com maior frequência


numa distribuição. Ela pode não existir e, quando
existe, pode não ser única.

¾ Medidas de Tendência não Central (ou de ordem)

Quartiles (Quartis) – são 3 pontos (Q1, Q2 e Q3) que dividem


um conjunto de dados em 4 partes iguais: o Q1 (1º
Quartil) é precedido de 25% dos valores e sucedido
por 75%; o Q2 tem abaixo de si 50% dos valores e
acima de si também 50% e, por esta razão, coincide
com a Mediana; o Q3 é antecedido de 75% dos valores
e seguido por 25% dos mesmos.

Cut points for n equal groups – definem outros


separadores: Decis (dividem em 10 partes iguais: D1,
D2,...., D9), Percentis/centis (dividem em 100 partes
iguais: P1, P2 ,....,P99), ....

Percentile(s): permitem especificar o percentil pretendido,


(por exemplo, 67º, 15º, ....)

¾ Medidas de Dispersão (ou variabilidade)

24
Std deviation (Desvio Padrão) – mais importante medida de
dispersão, sendo definida como a raiz quadrada da
variância.
Variance (Variância) – média dos quadrados dos desvios de
cada valor em relação à sua média. Contudo, a sua
utilização como medida descritiva ocasiona alguma
dificuldade (sobretudo de interpretação) visto que se
trata, por definição, de uma média quadrática, não
possuindo a mesma unidade de medida dos dados
originais.

Range (amplitude do intervalo de variação) – diferença entre


os valores máximo e mínimo do conjunto de dados.

Mínino (Minimum) – valor mínimo de uma distribuição.

Máximo (Maximum) – Valor máximo de uma distribuição.

S.E. Mean (Estimativa do Erro amostral) – quociente entre o


desvio padrão e a raiz quadrada da dimensão da
amostra. Indica a variabilidade da média aritmética
entre amostras tiradas da mesma população. Esta
medida permite a construção dos intervalos de confiança
sobre o valor da média da população.

Intervalo Interquartil (Interquartile Range): Q3 - Q1.

¾ Medidas de Assimetria

A medida de assimetria utilizada pelo SPSS é dada pelo


quociente entre o Skewness e o seu Std Error. O resultado
desse quociente deve ser analisado da seguinte forma:

Assimétrica Não rejeitar a Assimetria


negativa simetria positiva
< -2 -2 0 +2 > +2

¾ Medidas de Achatamento (ou curtose)

A divisão do Kurtosis pelo seu Std Error dá o coeficiente de


achatamento (k). Quanto à forma de achatamento, uma

25
distribuição pode ser Mesocúrtica (k igual a 0), Platicurtica
(k menor que -2) e Leptocúrtica (k maior que +2).

Exemplo 4. Considere o seguinte output.

Statistics

IDADE
Valid 50
N
Missing 0
Mean 12,78
Std. Error of Mean ,25
Median 13,00
Mode 14
Std. Deviation 1,80
Variance 3,24
Skewness -,554
Std. Error of Skewness ,337
Kurtosis -1,093
Std. Error of Kurtosis ,662
Range 5
Minimum 10
Maximum 15
Sum 639
25 10,75
Percentiles 50 13,00
75 14,00

IDADE

Valid Cumulative
Frequency Percent Percent Percent
10 12 24,0 24,0 24,0
11 1 2,0 2,0 26,0
12 3 6,0 6,0 32,0
Valid 13 12 24,0 24,0 56,0
14 14 28,0 28,0 84,0
15 8 16,0 16,0 100,0
Total 50 100,0 100,0

26
Interpretação:

¾ A idade média dos inquiridos é de 12,78 anos (Mean).


¾ A mediana ou precentil 50 indica que metade dos alunos tem até 13
anos. Na tabela de frequência, a mediana é a idade que acumula até si
metade (50%) das observações, isto é, a idade que corresponde ao
Cumulative Percent imediatamente superior a 50 (13 ⇔ Cumulative
Percent=56,0), (Median).
¾ O quociente entre o desvio padrão (1,80) e a raiz quadrada da
dimensão da amostra (n=50) é 0,25. Significa que a variação entre a
média calculada (12,78) e a média de outras amostra aleatórias de
igual dimensão é de 0,25 anos (Std Error Mean).
¾ A maioria dos alunos tem 14 anos (Mode).
¾ A variância é de 3,24. O desvio padrão igual a 1,80 denota uma baixa
dispersão (coef.variação, 1,80/12,78=14%). Quanto menos dispersos
estiverem os valores da variável idade relativamente à média, menor
será o desvio padrão, e vice versa (Variance e Std Deviation).
¾ O coeficiente de skewness é de –0.554 e o seu Std Error (estimativa do
erro) é de 0.337. O quociente entre estes dois valores é igual a –1.64.
Como o resultado é negativo e menor que 2, pode-se concluir que a
distribuição é assimétrica negativa. Na prática, faz-se a diferença da
média e da moda e divide-se pelo desvio padrão. Neste caso, esta
diferença é negativa, - 0.68, e a conclusão é a mesma.
¾ Kurtosis/Std Error Kurtosis=-1,65. Como é menor que –2, diz-se que
a distribuição é Platicúrtica (mais achatada do que a normal).
¾ As idades variam entre os 10 (Mínimo) e os 15 (Máximo), sendo a
amplitude do intervalo de variação de 5 anos (Range).
¾ A soma de todas idades é de 639 (Sum).
¾ Percentil 75: Significa que 75% dos inquiridos têm até 14 anos.

27
Distribuição normal

¾ O SPSS apresenta o histograma com a distribuição normal


sobreposta.
¾ Recorda-se que a distribuição normal é:
¾ Teórica, contínua, simétrica e mesocúrtica;
¾ Tem a forma de um sino e é definida com base em dois
parâmetros: média e desvio padrão.
¾ O ponto máximo da distribuição é a média.

¾ Analyze → Descriptive Statistics → Frequencies → Chart

Figura 13 – Histograma com normal sobreposta

¾ Veja o Output:
IDADE
16

14

12

10

4
Frequency

Std. Dev = 1,80


2
Mean = 12,8

0 N = 50,00
10,0 11,0 12,0 13,0 14,0 15,0

IDADE

Figura 14 – Histograma com normal sobreposta

O histograma acima com ajustamento à distribuição normal tem o


aspecto onde sobressai o enviesamento da amostra para a direita em

28
relação à distribuição teórica, bem como um achatamento um
maior que o que seria de esperar.
¾ Opção Explore - calcula as estatísticas, e elabora o gráfico
caule-e-folhas e o gráfico de extremos-e-quartis, muito útil
para analisar a amostra em termos de concentração ou
dispersão dos valores por intervalos quartílicos, bem como a
sua simetria; além disso, é uma boa ferramenta de verificar
se há observações “outliers”, isto é, observações extremas
que se afastam muito da média dos valores da amostra.

Analyze → Descriptive Statistics → Explore

Selecciona-se a variável a analisar (idade), tal como descrito


atrás. De seguida, seleccionar o botão, Statistics.

Figura 15

Faça Continue para voltar ao Explore. Escolha, de seguida a


opção Plots. Seleccione histograma.

Faça Ok e analise o Output.

Figura 16

29
¾ Faça Explore, utilizando o Factor List para a variável Sexo.
Teste de Normalidade

¾ Testa a hipótese de que os dados da amostra estão


normalmente distribuídos.

¾ Analyze → Descriptives statistics → Explore → Plots

Figura 17

A tabela Teste de Normalidade (Tests of Normality) mostra os


resultados do Teste de Kolmogorov Smirnov (K-S). Se a
amostra tiver menos de 50 casos o SPSS também calcula o teste
de Shapiro-Wilk.

Tests of Normality
a
Kolmogorov-Smirnov Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
IDADE ,229 50 ,000 ,824 50 ,010**
**. This is an upper bound of the true significance.
a. Lilliefors Significance Correction

. Um baixo valor de significância (é geralmente considerado


baixo se Sig. < 0.05) indica que a distribuição dos dados difere
significativamente de uma distribuição normal.

30
Intervalos de Confiança sobre a média (IC μ)

Média: 12,78 com o Std Error = 0,25

¾ Níveis: Confiança de 95% ⇒ Significância (risco) de 5%

Figura 18

Resultado: IC95% μ = ] 12,27 ; 13; 29[

Significado: Existe uma probabilidade de 95% para que o valor


desconhecido da média da população pertença ao intervalo
]12,27 ; 13; 29[. Ou seja, com 95% de confiança, a verdadeira
média da população deverá pertencer ao intervalo de 12,27 a
13,29.

Este intervalo de confiança só tem interesse se os valores em


causa são de uma amostra seleccionada aleatoriamente de uma
população mais vasta.

¾ Níveis: Confiança de 99% ⇒ Significância (risco) de 1%

Figura 19

31
Resultado: IC99% μ = ] 12,10 ; 13; 46[

Conclusão: Diminuindo o nível de significância (risco)


implica um aumento do intervalo de confiança.

8.3.2 Análise Inferencial

8.3.2.1 Análise Bivariada: Cruzamentos e Medidas de


Associação (Crosstabs)

"p" (nível de) significância estatística (Asymp. Sig.). – Prob.

Geralmente, em ciências sociais, quando estas probabilidades


(Asymp. Sig.) são inferiores a 5%, ou seja, há menos de 5
possibilidades em 100 de suceder um determinado resultado,
considera-se que são estatisticamente significativas.

Variável Qualitativa – Nominal

Independência Estatística – utiliza-se normalmente o Teste de


Qui-Quadrado de Pearson, χ2.

As hipóteses do Teste de Qui-Quadrado são:

H0 (Hip. Nula): As variáveis turma e sexo são independentes.


Ha (Hip. Alternativa): As variáveis turma e sexo são dependentes
(existe uma relação entre as 2 variáveis).

¾ Analyze → Descriptive Statistics → Crosstabs → Statistics

32
Figura 20

Resultado:
Chi-Square Tests

Asymp. Sig.
Value df (2-sided)
Pearson Chi-Square 36,883a 2 ,000
Continuity Correction
Likelihood Ratio 40,291 2 ,000
Linear-by-Linear
Association
N of Valid Cases 50
a. 2 cells (33,3%) have expected count less than 5. The
minimum expected count is 3,90.

Conclusão:

Como o nível de significância do teste de Qui-Quadrado é de 0,000,


valor inferior a 0,05 (5% de signficância fixada), rejeita-se a
hipótese de serem independentes (H0), ou seja, há
evidência/significância estatística para aceitar a hipótese alternativa
de que são dependentes (existe relação entre 2 variáveis).

Portanto, pode-se inferir a relação de dependência observada na


amostra para o universo/população em estudo.

33
Medidas de Associação – baseadas no Teste de Qui-Quadrado

Symmetric Measures d

Asymp.
a b
Value Std. Error Approx. T Approx. Sig.
Phi ,859 ,000
Nominal by Nominal Cramer's V ,859 ,000
Contingency Coefficient ,652 ,000
Kendall's tau-b -,117 ,132 -,893 ,372
Ordinal by Ordinal Kendall's tau-c -,122 ,136 -,893 ,372
Gamma -,162 ,179 -,893 ,372
Measure of Agreement Kappa ,c
N of Valid Cases 50
a. Not assuming the null hypothesis.
b. Using the asymptotic standard error assuming the null hypothesis.
c. Kappa statistics cannot be computed.They require a symmetric 2-way table in which the values
of the first variable match the values of the second variable.
d. Correlation statistics are available for numeric data only.

Significado: Todos esses testes indicam que existe uma


associação forte entre as duas variáveis devido aos seus altos
valores. O teste Phi só se aplica para tabelas 2 x 2.

Variáveis Quantitativas

Coeficiente de Correlação de Pearson – aplica-se às variáveis


quantitativas. Varia entre –1 (negativa) e 1 (positiva).

Quanto mais próximo estiver dos valores extremos maior e a


associação linear.

Associação ou Correlação Negativa: variação entre as variáveis


for em sentido contrário (aumento de uma
variável está associada à diminuição de outra).

Associação ou Correlação Positiva : variação entre as variáveis


for no mesmo sentido.

¾ Analyze → Correlate → Bivariate → variáveis

34
Figura 21

Variáveis Ordinais

Coeficiente de Spearman – utiliza-se para as variáveis ordinais.

8.3.2.2 Regressão (Regression)


Modelo estatístico usado para prever o comportamento de uma
variável contínua (variável dependente ou Y) a partir de uma
ou mais variáveis (var. independentes ou X).
Modelo de Regressão Linear Simples (MRLS): Quando existe
apenas uma variável independente.

Modelo de Regressão Linear Múltipla (MRLS): Quando existe


mais do que uma variável independente.

Modelo de Regressão Linear Simples (MRLS): permite encontrar a


recta que melhor representa a relação entre 2 variáveis (X e Y).

35
Y = aX + b,
em que, Y: var. dependente/explicada
X: var. independente/explicativa
a: declive ou inclinação
b: ordenada na origem (CONSTANT)
Para proceder ao cálculo da equação da recta de regressão
linear, deve executar o seguinte procedimento:

¾ Analyze → Regression → Linear

Figura 22

Resultado da regressão linear


Coefficientsa

Standardi
zed
Unstandardized Coefficient
Coefficients s
Model B Std. Error Beta t Sig.
(Constant) ,238 ,276 ,864 ,413
1
ALTURAP ,858 ,154 ,892 5,574 ,001
a. Dependent Variable: ALTURAF

Declive Ordenada na origem


0.01<0.05 ....
Figura 23
H0 é rejeitada para o nível
de significância de 5%
36
Equação da recta ⇒ ALTURAF = 0.858ALTURAP + 0,238

Interpretação:

a = 0,858 - Por cada aumento de uma unidade na


altura dos País (X) implica um aumento de 0.858 na
altura dos Filhos (Y). O valor positivo indica de que a
recta cresce da esquerda para a direita. Se o declive
fosse negativo, a recta decresceria da esquerda para a
direita.

b = 0,238 – Para ALTURAP=0 ⇒ ALTURAF=0,238.

Método utilizado: Mínimos Quadrados (MMQ).

Exercício:

Se um Pai tiver 1,95 m de altura, a altura do Filho


será 1,91, aproximadamente.

Coeficiente de determinação (R2 e R2 Ajustado) – indica a


qualidade do ajustamento da recta estimada aos dados.

Model Summaryb

Std. Error
Adjusted of the
Model R R Square R Square Estimate
1 ,892a ,795 ,770 4,638E-02
a. Predictors: (Constant), ALTURAP
b. Dependent Variable: ALTURAF

Coeficiente de correlação

Coeficiente de determinação

Cerca de 80% (79,5%) da variação da variável dependente


(ALTURAF) em torno da sua média é explicada pela
regressão, ou seja, o modelo explica 80%. Portanto, considera-
se um bom ajustamento.

37
Teste T – testa a hipótese dos parâmetros, individualmente,
serem nulos.

Como o Sig.do Teste T é de 0,01, valor inferior a 0.05 (5%), pode-se


concluir que a variável ALTURAP é diferente de zero, isto é, esta
variável é estatisticamente significativa. Entretanto, a conclusão não
é a mesma para a CONSTANT.

Teste F – valida, em termos globais o modelo, e não cada um


dos parâmetros isoladamente.

ANOVAb

Sum of Mean
Model Squares df Square F Sig.
Regression 6,683E-02 1 6,683E-02 31,072 ,001a
1 Residual 1,721E-02 8 2,151E-03
Total 8,404E-02 9
a. Predictors: (Constant), ALTURAP
b. Dependent Variable: ALTURAF

Como o Sig.do Teste F é de 0,01, valor inferior a 5%, pode-se


concluir que o modelo é adequado para descreve esta relação, ou
seja, o modelo é estatisticamente significativo.
Diagrama de Dispersão (ou de pontos)

I. Graphs → Scatter → Simple → Define


II. Escolha as variáveis dependente e independentes

III. Label Cases by → colocar o nome da variável que


identifique os pontos nos gráficos. Seleccione Options e
active Display chart with case labels.

38
Figura 24

Resultado: Utilizando o ajustamento da recta.


2,0
Elmano, Pedro

1,9

Antonio, Joao
El ton, Elio

Mapa, Melo
1,8 Leao, Santos

Pedr o, Jorge
Tavares, Silva

1,7 Li to, Silva


Montei ro, Pina
ALT URAF

Borges, Elzo

1,6
1,6 1,7 1,8 1,9 2,0

ALTURAP

Figura 25

39
Tabela 2 - Procedimentos de estatística: descritiva, inferencial e
multivariada disponíveis pelo SPSS.

Analyze Sub-comandos Função

Summarize
Descriptives Frequencies Calcula a tabela de distribuição de
statistics frequências.
Descriptives Calcula as principais estatísticas
descritivas.
Explore Faz uma análise completa das
variáveis, podendo ainda repetir
essas análises por outra variável.
Crosstabs Calcula a tabela de distribuição de
frequências cruzadas, calcula o
teste Qui-quadrado e o Coeficiente
de Pearson para associação de
variáveis e outros testes.
List cases Lista casos escolhendo as
variáveis desejadas
Report Summaries Organiza relatórios em linhas,
in Rows segundo uma variável
Compare Means Calcula a média, o desvio padrão,
means soma, etc. das variáveis desejadas.
Independent– Calcula o teste de diferença de
sampled T-test duas médias de populações
independentes
Paired-sampled T- Calcula o teste de diferença de
test duas médias de populações
emparelhadas.
One-Way ANOVA Testa a diferença de médias de
mais de duas amostras
ANOVA Simple factorial Testa a diferença de médias do
models modelo fatorial
General factorial Testa a diferença de médias do
modelo geral
Multivariate Calcula o teste de análise de
variância multivariada
Correlate Bivariate Calcula a matriz de correlação,
tomando as variáveis de duas em
Partial duas.
Distances Calcula o coeficiente de correlação

40
parcial.
Calcula a distância euclidiana entre
os casos.
Regression Linear Ajusta o modelo de regressão
Logistic linear
Probit Ajusta o modelo de regressão
Nonlinear logística
Ajusta o modelo Probit
Ajusta um modelo não linear
Loglinear General
Hierarchical
Logit
Classify K-means cluster Análise de clusters
Hierarchical Análise de clusters hierárquicos
clusters Análise discriminante
Discriminant
Data Factor Análise factorial
Reduction
Scale Reliabity analysis Análise de confiabilidade
Multidimensional
Scaling
Non Chi-square Testes não paramétricos ou de
Parametric Binomial distribuição livre
Test Runs
1-Sample K-S
2-Independent
Samples
k-Independent
Samples
2-Related Samples
K-Related Samples
Survival Análise de sobrevivência
Multiple Análise de respostas múltiplas
response

Obs: As versões mais recentes do SPSS (11.0) apresentam mais


procedimentos estatísticos.

41
9. Análise de gráficos (GRAPHS)

A representação gráfica é uma das possibilidades de análise de dados


sob uma forma ilustrada, produzindo uma visão mais clara e imediata
dos resultados.

• SPSS oferece vários tipos de gráficos:

Graphs Função Tipo de variáveis

Bar Gráfico de barra Qualitativas, discretas de poucos


valores
Line De linha Séries de tempo
Area De área Série de tempo
Pie Circular Qualitativas
Boxplot Da caixa Quantitativas
Scatter De dispersão Relação entre duas variáveis
quantitativas, podendo colorir
segundo outra variável
Histogram Histograma Quantitativa (de preferência
contínua). Tem a opção de
desenhar a curva normal
superposta ao histograma

42