Beruflich Dokumente
Kultur Dokumente
Fundir archivos
Fundir
archivos
permite
unir
en
una
sola
base
de
datos,
informacin
de
distintos
archivos
de
datos.
Es
un
procedimiento
sumamente
comn,
que
se
utiliza
especialmente
en
dos
casos:
cuando
una
encuesta
de
corte
transversal
ha
sido
segmentada
en
varias
bases
de
datos;
cuando
se
trata
una
encuesta
de
tipo
longitudinal,
que
implica
acoplar
bases
de
datos
en
distintos
puntos
del
tiempo.
Aadir casos
Se
combinan
archivos
con
las
mismas
variables,
pero
con
distintos
casos.
Pasos:
1. Datos
2. Fundir
archivo
3. Aadir
casos
4. Seleccionar
la
base
de
datos
externa
que
se
pretende
fundir
con
la
base
de
datos
de
trabajo
5. Seleccionar
variables
que
se
deseen
incluir,
y
que
se
deseen
excluir.
6. Seleccionar
si
se
quiere
indicar
el
origen
del
caso
como
variable.
Esta
opcin
crea
una
nueva
variable
de
identificacin,
en
la
que
asigna
un
0
a
los
casos
provenientes
originalmente
del
archivo
de
trabajo,
y
un
1
a
los
casos
provenientes
del
archivo
externo.
7. Aceptar
Variables
desemparejadas:
Muestra
las
variables
que
no
se
van
a
fundir
en
el
nuevo
archivo
combinado,
por
3
motivos:
a) Son
variables
que
se
encuentran
slo
en
uno
de
los
archivos
b) Variables
definidas
como
numricas
en
un
archivo
y
como
cadenas
en
el
otro
c) Variables
de
cadena
de
distinto
ancho
Las
variables
desemparejadas
es
posible
incluirlas
en
el
nuevo
archivo
combinado,
traspasndolas
a
la
sub-ventana
de
variables
del
nuevo
conjunto
de
datos.
Dado
que
Aadir variables
Se
combinan
archivos
con
los
mismos
casos,
pero
con
distintas
variables.
Pasos:
1. Ordenar
los
casos
de
forma
ascendente,
en
las
variables
que
sern
utilizadas
como
criterio
de
emparejamiento
2. Datos
3. Fundir
archivo
4. Aadir
variables
5. Seleccionar
la
base
de
datos
externa
que
se
pretende
fundir
con
la
base
de
datos
de
trabajo
6. Seleccionar
asignar
casos
en
variable
clave
(procedimiento
ms
comn)
7. Seleccionar
variable
clave
8. Seleccionar
la
casilla
que
sea
acorde
a
las
caractersticas
de
los
datos
para
realizar
el
acoplamiento
de
datos
9. Aceptar
Variables
excluidas:
muestra
las
variables
que
tienen
el
mismo
nombre
y
formato
en
ambas
archivos
de
trabajo,
por
lo
cual
no
sern
incluidas
en
el
nuevo
archivo
combinado.
Si
se
las
quiere
incluir,
se
les
debe
cambiar
el
nombre
y
traspasar
a
la
sub-ventana
de
nuevo
conjunto
de
datos
activo.
Estas
se
identifican
con
un
signo
+.
Nuevo
conjunto
de
datos
activo:
muestra
las
variables
que
sern
parte
del
nuevo
archivo
combinado.
Incluye
a) Todas
las
variables
del
archivo
de
trabajo
b) Todas
las
variables
del
archivo
externo
que
no
se
encuentren
duplicadas
en
el
archivo
de
trabajo.
Si
ambos
archivos
contienen
la
misma
cantidad
de
casos,
se
selecciona
aceptar
y
los
archivos
de
trabajo
y
externo
se
funden
correctamente.
En
caso
de
que
los
archivos
no
contengan
la
misma
cantidad
de
casos
(lo
ms
frecuente),
es
necesario
seleccionar
una
variable
clave
para
emparejar
correctamente
los
archivos.
La
variable
clave
debe
ser
idntica
en
ambos
archivos
y
estar
ordenada
de
forma
ascendente.
La
variable
clave,
al
estar
duplicada,
se
encuentra
en
la
sub-ventana
de
variables
excluidas.
AGREGAR DATOS
Consiste
en
agregar
varios
casos
para
conformar
uno
o
varios
grupos.
Esta
funcin
permite
generar
un
nuevo
archivo,
compuesto
por
los
grupos
creados
anteriormente
a
travs
de
una
variable
de
segmentacin
y
una
de
agregacin
Este
comando
es
til
cuando
se
quiere
cambiar
la
unidad
de
anlisis.
Por
ejemplo,
podramos
querer
agrupar
el
promedio
de
ingreso
por
provincia,
por
lo
que
podramos
agrupar
todos
los
casos
por
provincia
e
indicarle
que
agregue
segn
la
media
de
ingreso.
Pasos:
1. Datos
2. Agregar
3. Seleccionar
variable
de
segmentacin
4. Agregar
variable
5. Seleccionar
funcin
(o
dejar
defecto)
6. Seleccionar
mtodo
de
guardado
7. Ordenar
archivo
antes
de
agregarlo
8. Aceptar
Variable
de
segmentacin:
en
este
cuadro
hay
que
introducir
la
variable
que
ser
utilizada
como
criterio
para
agrupar
los
datos.
La
variable
de
segmentacin
puede
ser
numrica
o
de
cadena.
Agregar
variables:
las
nuevas
variables
agregadas,
se
obtienen
al
aplicar
alguna
funcin
u
operacin
a
las
variables
del
archivo
original.
Si
no
se
indica
alguna
en
particular,
el
SPSS
asume
la
media.
Nombre
y
etiqueta:
se
puede
dejar
el
nombre
por
defecto
que
otorga
el
SPSS
o
modificarlo
y
agregar
una
etiqueta
de
identificacin.
Funcin:
la
agregacin
de
variables
se
obtiene
al
aplicar
una
funcin,
la
cual
por
defecto
el
SPSS
asume
que
es
la
media.
Es
posible
modificar
esta
funcin
segn
los
propsito
particulares
de
investigacin.
Consiste
en
dividir
la
base
de
datos
en
grupos,
de
modo
que
todo
anlisis
de
datos
que
se
realice
con
el
archivo
segmentado,
se
repite
para
cada
grupo
producto
de
la
segmentacin.
Este
comando
es
til
cuando
se
tiene
un
segmento
especfico
de
la
poblacin
sobre
la
que
se
quieren
realizar
todos
los
anlisis.
Por
ejemplo,
para
un
reporte,
nos
podra
interesar
hacer
varios
anlisis
para
las
mujeres
trabajadoras
de
cada
una
de
las
regiones
del
pas.
Esta
funcin
permite
ir
obteniendo
automticamente
los
anlisis
para
este
grupo
segmentado
por
regin.
Pasos:
1. Datos
2. Dividir
archivo
3. Seleccionar
el
mecanismo
de
divisin
de
archivos
4. Seleccionar
variable
o
variables
de
segmentacin
5. Seleccionar
si
requiere
el
archivo
ordenado
por
las
variables
de
segmentacin
6. Aceptar
Analizar
todos
los
casos,
no
crear
grupos:
es
el
estado
por
defecto
del
SPSS,
es
decir,
cuando
se
encuentra
activada
esta
opcin
el
SPSS
opera
con
la
base
de
datos
sin
segmentar.
Comparar
los
grupos:
esta
opcin
activa
la
segmentacin.
Si
se
corren
anlisis
simultneos,
el
SPSS
ordena
los
resultados
mostrando
el
primer
anlisis
solicitado
para
todos
los
grupos,
el
segundo
anlisis
para
todos
los
grupos,
el
tercer
anlisis
para
todos
los
grupos,
etc.
Organizar
los
resultados
por
grupo:
esta
opcin
activa
la
segmentacin.
Si
se
corren
anlisis
simultneos,
el
SPSS
ordena
los
resultados
mostrando
todos
los
anlisis
para
el
primer
grupo,
todos
los
anlisis
para
el
segundo
grupo,
todos
los
anlisis
para
el
tercer
grupo,
etc.
Grupos
basados
en:
se
selecciona
la
o
las
variables
de
segmentacin.
Estas
pueden
tener
ser
un
mximo
de
8.
En
caso
de
incluir
ms
de
una
variable
de
segmentacin,
el
anlisis
va
ir
siendo
segmentado
en
el
orden
de
inclusin
de
las
variables.
Ordenar
los
archivos
segn
variables
de
agrupacin:
ordena
la
base
de
datos
segn
las
variables
de
segmentacin.
Recomendado.
Seleccionar casos
Selecciona
un
subconjunto
de
datos
especfico
para
el
anlisis,
el
cual
es
determinado
segn
si
cumple
determinada
condicin
(if).
Tambin
permite
generar
una
muestra
aleatoria
de
casos
que
por
definicin
es
tiene
un
N
menor
a
la
base
de
datos
original.
Es
recomendable
cuando
se
tiene
una
gran
base
de
datos
(como
la
CASEN)
y
se
est
interesado
en
un
grupo
especfico.
A
diferencia
de
la
segmentacin
de
datos,
no
repite
necesariamente
todos
los
anlisis
para
todos
los
grupos
del
nuevo
conjunto
de
datos
seleccionados.
Tambin
es
til
cuando
se
tienen
bases
de
datos
con
un
gran
nmero
de
casos,
para
ahorrar
tiempo
en
procesamiento.
Por
ejemplo,
una
base
de
datos
administrativa
suele
contener
de
miles
a
millones
de
casos,
por
lo
que
sera
ms
conveniente
seleccionar
una
sub-muestra
aleatoria
para
los
anlisis.
Pasos:
1. Datos
2. Seleccionar
casos
3. Seleccionar
mecanismo
de
divisin
de
casos
4. Seleccionar
resultado
5. Aceptar
Todos
los
casos:
es
el
estado
por
defecto
del
SPSS,
es
decir,
cuando
se
encuentra
activada
esta
opcin
el
SPSS
opera
con
la
base
de
datos
completa.
Si
satisface
la
condicin:
selecciona
casos
que
cumplen
una
determinada
condicin,
la
cual
puede
estar
basada
en
una
o
ms
operaciones
lgicas,
aritmticas,
etc.
Es
til
cuando
se
requiere
combinar
varios
criterios
de
seleccin.
Muestra
aleatoria
de
casos:
crea
una
muestra
aleatoria
de
casos
en
base
a
dos
criterios:
a)
Tomando
un
%
de
los
casos;
b)
Tomando
un
rango
de
casos.
Basndose
en
el
rango
del
tiempo
o
de
los
casos:
si
los
casos
cuentan
con
una
variable
que
indique
tiempo
(meses,
das
u
horas),
es
posible
solicitar
al
SPSS
que
seleccione
casos
que
se
encuentren
dentro
de
cierto
marco
temporal,
tomando
esa
variable
por
referencia.
Usar
variable
filtro:
opera
con
variables
numricas.
Selecciona
los
casos
que
tienen
valores
distintos
de
cero
en
la
variable
de
filtro.
Los
casos
con
valor
cero,
no
son
seleccionados.
Descartar
casos
no
seleccionados:
descarta
(los
tacha)
los
casos
seleccionados
para
el
anlisis,
pero
sin
borrarlos
de
la
base
de
datos
activa.