Sie sind auf Seite 1von 10

31

PROCESAMIENTO DE DATOS DE LA ENCUESTA


PERMANENTE DE HOGARES

INSTITUTO NACIONAL DE ESTADSTICA Y CENSOS (INDEC)


ARGENTINA

32

Procesamiento de datos de la encuesta permanente...

NDICE
Pgina

1.

Encuesta Permanente de Hogares .......................................................................................... 33


Sntesis del estado actual, mayo 2003 ................................................................................... 33
Actividades previstas............................................................................................................. 33

2.

Antecedentes Informticos..................................................................................................... 34
EPH habitual.......................................................................................................................... 36
EPH continua......................................................................................................................... 39

Procesamiento de datos de la encuesta permanente...

33

1.- Encuesta Permanente de Hogares


Sntesis del estado actual, Mayo 2003
La Encuesta Permanente de Hogares (EPH) es un programa nacional de produccin sistemtica y
permanente de indicadores sociales, que permite conocer las caractersticas sociodemogrficas y
socioeconmicas de la poblacin.
En su modalidad original, se ha venido aplicando en Argentina desde 1973, dos veces al ao (mayo y
octubre), llegando actualmente, en un plan de incorporacin progresiva, a cubrir 31 aglomerados urbanos
y un rea urbano-rural.
En esta modalidad puntual, la EPH se aplica en el marco del esquema de centralizacin normativa y
descentralizacin ejecutiva, siendo realizados los relevamientos por las Direcciones Provinciales de
Estadstica bajo las normas tcnicas y metodolgicas fijadas y monitoreadas por el equipo central de la
EPH en INDEC.
En base a esta encuesta se proporcionan regularmente, entre otros resultados, las tasas oficiales de
empleo, desocupacin, subocupacin y pobreza, que se complementan con la produccin habitual de ms
de 2.500 tabulados anuales, bases de datos y publicaciones.
Tambin se realizan regularmente tareas de desarrollo de metodologas y de anlisis de resultados.
La Reformulacin de la EPH se ha desarrollado con el objetivo de reelaborar la metodologa de medicin
y las formas de operacin atendiendo a las caractersticas socioeconmicas actuales, a las nuevas
modalidades de insercin en el mercado de trabajo y a su dinmica de cambio.
La Reformulacin de la EPH abarca aspectos temticos, en funcin de la adecuacin de los instrumentos
de captacin y las dimensiones de anlisis y presentacin de resultados; muestrales, tendientes a adecuar
el diseo a cambios ms frecuentes en los fenmenos medidos; y organizativos, ajustando la modalidad
de trabajo a los diseos temticos y muestrales establecidos.
En funcin del desarrollo tcnico de esos aspectos de la reformulacin, la nueva encuesta cuenta con
cuestionarios rediseados, a aplicar en una muestra distribuida en el tiempo, bajo una modalidad de
relevamiento continuo y con mayor frecuencia de presentacin de resultados.
Ambas modalidades de la EPH (habitual- puntual y reformulada- continua) se encuentran actualmente en
campo, relevndose en todo el pas (rea cubierta), en el esquema metodolgico de transicin de un
modelo a otro.
Actividades previstas
EPH Puntual:

Relevamiento, en Mayo, en todos los aglomerados urbanos que abarca la encuesta. Incluye
cuestionario adicional sobre Plan Jefas/jefes de Hogar, para caracterizacin y medicin de su
incidencia sobre desocupacin y pobreza. El relevamiento de Mayo est relacionada con el del
aglomerado urbano-rural ya realizado (marzo, poca de cosecha). Relevamiento en octubre de los 3
aglomerados urbanos de reciente incorporacin y en el aglomerado urbano-rural (septiembre, etapa
de receso).

Difusin de Informes de Prensa:


Cinco informes de prensa correspondientes a la onda de mayo de 2003 (Mercado de trabajo total
de aglomerados, Mercado de trabajo Gran Buenos Aires, Pobreza total de aglomerados, Pobreza
Gran Buenos Aires, Indicadores sociodemogrficos y socio-econmicos).

34

Procesamiento de datos de la encuesta permanente...

Tres informes de prensa en relacin a la onda de octubre sobre los aglomerados de ms reciente
incorporacin y el aglomerado urbano-rural.
Siete informes (junio-diciembre, difusin mensual) de Valorizacin de la Canasta Bsica
Alimentaria.

Elaboracin de las restantes herramientas de difusin (bases, tabulaciones, publicaciones, etc.)

EPH Reformulada:

Relevamiento en el total de los aglomerados urbanos que releva la encuesta (exceptuando los 3 de
reciente incorporacin), en curso desde Enero 2003, hasta Diciembre en la modalidad continua.
Encuesta de nuevo diseo, en campo de manera permanente (distribucin de la muestra en el
tiempo). Incluye cuestionario adicional sobre Plan Jefas/jefes de Hogar.

Avances en los desarrollos metodolgicos de la Reformulacin, y de indicadores especiales (Pobreza


y otros).

Difusin de la informacin procedente de la EPH reformulada para distintos dominios de estimacin.

TRANSICIN: Programa de presentaciones, en distintos mbitos, de la transicin de EPH Puntual a


Reformulada, continuando contactos con interlocutores especializados de organismos oficiales,
instituciones sociales, acadmicos, expertos nacionales y extranjeros, usuarios calificados de la
informacin, etc. Profundizacin de las jornadas de capacitacin a periodistas de distintos medios, para la
comprensin de las caractersticas tcnicas de la informacin estadstica disponible de la EPH puntual y
las implicancias de su Reformulacin.
2.- Antecedentes informticos
Ao 1987/88

En 1987, la Encuesta Permanente de Hogares incorpor el uso de las microcomputadoras al ingreso


de datos y al procesamiento de la informacin. Este hecho permiti por una parte la descentralizacin
del ingreso de datos y al mismo tiempo el desarrollo de herramientas informticas que mejoraron los
controles y el anlisis de la informacin.

Si bien se tendi a la descentralizacin, se consider necesario mantener centralizado el desarrollo de


aplicaciones para homogeneizar criterios en el ingreso de los datos e implementar los mismos controles
en los distintos aglomerados del pas.

Se desarroll un Sistema de ingreso (en clipper) el cual permita:


Ingresar la identificacin de las viviendas seleccionadas (a fin de efectuar los controles de
diseo)
Ingresar los cuestionarios de la EPH
Efectuar la expansin la muestra.
Obtener salidas de control de la informacin ingresada.

En lo que respecta al ingreso de los cuestionarios, el sistema tena incorporado la secuencia de las
preguntas, el aceptar slo los cdigos vlidos (precodificados) y algunas consistencias bsicas.
Sobre dicho sistema se fueron efectuando mejoras tendientes a su adaptacin a las necesidades de la
EPH. Dichas mejoras se relacionan con:

Procesamiento de datos de la encuesta permanente...

35

Nuevas consistencias
Nuevos listados
Distintos mtodos de seleccin de viviendas
Cambio del cuestionario bsico de la EPH.
Ao 1989

Se comenz la transferencia (instalacin y capacitacin) del Sistema de ingreso de datos a las


Direcciones Provinciales de Estadstica (DPE).
Ao 1990

En el ingreso de los cuestionarios se tendi a lo que denominamos Ingreso Directo Simultneo,


es decir, que se ingresaran las encuestas durante el operativo de campo, para que el encuestador
pueda volver a tomar contacto con el entrevistado ante incompletitudes e inconsistencias.

El Ingreso Directo requiri tambin ajustar el sistema a los efectos de contar con la mayor cantidad de
consistencias y validaciones on- line.
Ao 1992

Se realiz una prueba piloto de la reformulacin, para lo cual se desarroll una aplicacin con el
paquete ISSA (Integrated System for Survey Analysis).

Ao 1996

Se encaro un cambio en el sistema de ingreso con el objetivo de que se ajustara fcilmente a los
cambios de cuestionario y efectuara una mayor cantidad de controles en cuanto a calidad de la
informacin.

Esto se logr parametrizando en bases de datos las preguntas de los cuestionarios, y toda la informacin
referente a validaciones, saltos, consistencias etc. de manera que el agregar, sacar modificar una
pregunta y/o una consistencia no implicara modificar la estructura del sistema, sino simplemente
modificar agregar un registro a una base de datos.
Otras caractersticas del sistema es poder contar con planillas, reportes y procesos que colaboran con los
controles de gabinete, el ingreso de las encuestas y la depuracin de la informacin.
Para el comunicado de prensa, se aprovech la modalidad del ingreso simultneo para obtener a travs
del sistema los datos necesarios para la elaboracin de las tasas que se informan en el mismo; siguiendo
las DPE con la etapa de ltima depuracin.

Se llev a cabo la segunda prueba de la reformulacin de la EPH, en INFORMIX , como previsin al


sistema que se implementara en la DPE.

Ao 1997

Se desarroll un Sistema de control de calidad, mediante el cual se busc disponer en mdios


magnticos de informacin proveniente de distintas fuentes : planillas que completaban en campo los
encuestadores, supervisores y recuperadores; listados del personal; bases de datos con la identificacin
de las direcciones seleccionadas; base de datos con los datos de las encuestas ingresadas, para permitir
distintas lneas de anlisis, entre ellas:

36

Procesamiento de datos de la encuesta permanente...

Colaborar con la organizacin del trabajo de campo para mejorar la calidad de los datos
Disponer de datos acerca del desempeo de los encuestadores en campo y brindar a los mismos
un detalle de su trabajo.
Detectar porcentajes de cambios producidas en la supervisin, aportando datos para la
elaboracin de estrategias de recapacitacin a los encuestadores.
Ao 1998:

Se realiz una prueba piloto utilizando notebook. El objetivo de esta prueba fue observar y
analizar la influencia del uso de las computadoras porttiles en la situacin de entrevista. Se
utiliz un cuestionario reducido y se adapt el sistema de ingreso actual de la EPH de forma de
poder poder utilizarlo para realizar la entrevista en campo.

EPH habitual
Sistema Actual de Captura, Procesamiento y Explotacin
El sistema de gestion y procesamiento abarca desde la incorporacin de las viviendas seleccionadas del
MMNU hasta la obtencin de una base consolidada.
El sistema utilizado por la EPH se basa en el registro de los datos en los cuestionarios impresos en papel.
La EPH habitual cuenta con un sistema desarrollado ntegramente en clipper (1985) que permite los
siguientes procesos:
Preparar el operativo

Incorporar al sistema los archivos provistos por el Marco Muestral


Actualizar la muestra, obteniendo las direcciones para las etiquetas, cartas, hojas de ruta y los
cdigos de viviendas vlidas.

Incorporar al sistema los archivos en el formato que los recibimos del Marco Muestral, realizar
controles sobre esos datos. (txt)

Mdulo de envo de archivo a las pcias.

Se envan a las provincias los insumos para empezar el ingreso de la informacin


-Instructivos
-Ejecutables
-Bases (area.dbf, area_hog.dbf, hogar.dbf, personas.dbf, perso2.dbf)
-Archivos del MMNU
Proceso de Captura y Consistencias
El sistema de ingreso y procesamiento esta descentralizado. Todos los procesos que se detallan son
realizados en las Direcciones Provinciales de Estadstica.
La EPH cuenta con un sistema de ingreso ntegramente desarrollado en Clipper que permite:

Ingresar al sistema los cuestionarios

Ingreso de otros materiales de campo

Procesamiento de datos de la encuesta permanente...

37

Posibilidad de ingresar, planillas que se utilizan en el trabajo de campo Y de todos los materiales
que permiten consistir y evaluar el trabajo de campo.

Posibilidad de correr otros procesos de consistencias Batch y otros controles


Control de Completitud (relacin entre las viviendas seleccionadas y las ingresadas)
Impresin de Planillas R1 con la informacin de los cuestionarios ingresados

Realizar consistencias en lnea


El sistema cuenta con una base de consistencias que utiliza para validar la informacin al
momento del ingreso del cuestionario.

Controles de Incompletos, repetidos

Variabkes construidas definidas en programa de captura


Condicin de actividad
Categora ocupacional

Variables Codificadas
En la Eph Habitual la rama de actividad y la Ocupacin
validadas por el sistema al momento del ingreso.

son codificadas previamente y

Calculo de tasas

Una vez finalizado el ingreso y realizado los controles y consistencias las bases son remitidas a EPHIndec (hogar.dbf , personas.dbf, perso2.dbf, area.dbf, area_hog.dbf)
Los procesos que se realizan a las bases recibidas son
En EPH- Indec se continan con los siguientes procesos

Imputacin (solo aglomerado: Gran Buenos Aires)


-Mtodo Hot-Deck: se utiliza en casos de ausencia o rechazo del cuestionario individual,
personas de las que disponemos de los datos demogrficos. Se imputa condicin de actividad,
categora ocupacional y nivel educativo.
-Hogares que fueron respuesta en la onda anterior y que en la onda actual existe alguna
informacin faltante demogrfica y/o educacin (solapamiento).

Se informa a los usuarios la cantidad de casos imputados y los mismos pueden ser identificados ya que
existe un campo (imputa) con marca que los identifica.

Ponderacin: posibilidad de aplicar la expansin a la muestra y el ajuste proyeccin


demogrfica.
(Variable construida: pondera).

Deciles :Posibilidad de distribuir a los hogares y a la poblacin segn escalas decilicas.


En este proceso se generan variables construidas de deciles que se detallan en el Documento
Base Usuaria AmpliadaCalculo de tasas y desvos
Posibilidad de calcular tasas y desvos: muestrales y/o ponderadas segn permisos asociados.

Estructuras

38

Procesamiento de datos de la encuesta permanente...

Posibilidad de calcular las estructuras como resultado de los datos ingresados y compararlos con
informacin histrica.
Posibilidad de establecer universos: Ej: Aglomerados, Regiones, Total Aglomerados EPH
Una vez finalizado todos los procesos detallados contamos con una base Total
(Aglomerados - Eph)
Sistema de Explotacin Bases Total_Eph
Se cuenta con sistemas en Clipper que permite generar

Comunicados de Prensa
-Indicadores socioeconmicos para 31 aglomerados
-Mercado de trabajo: principales Indicadores de los aglomerados Urbanos
-Mercado de trabajo: principales indicadores del aglomerado Gran Buenos Aires
-Incidencia de la Pobreza y de la Indigencia en los aglomerados Urbanos
-Incidencia de la pobreza y de la Indigencia en el Gran Buenos Aires

Base Usuaria Ampliada


La bases usuarias (hog_bua.dbf y per_bua.dbf) son bases desagregadas que contienen todas las
preguntas del cuestionario, las variables construidas (estado, inghora, imputa, variables generadas
en el proceso de deciles).
Se encuentra a disposicin de cualquier usuario
Internet .http://www.indec.mecon.gov.ar/.

Se puede acceder a las bases de cada Aglomerado por separado, y a la del Total de Aglomerados.
Documento de Base Usuaria Ampliad
Contiene informacin y recomendaciones para su utilizacin, desde diseo de estructura de las
bases, utilizacin de la Tabla de Errores de Muestreo, variables construidas, etc.

Tabulados
La EPH cuenta con un Tabulador desarrollado en Clipper que nos ha permitido generar tabulados
muestrales y ponderados, Tabla de errores de muestreo, frecuencias, identificar aquellos datos
cuyo coeficiente de variacin es superior al 10%, frecuencias.
-Tabulados Bsicos

-Tabulados Complementarios
-Publicaciones Especiales

Publicaciones
-Anuario Estadstico de la Republica Argentina
-Publicacin Encuesta Permanente de Hogares

Otros Documentos
- Diseo de registro de la Base Usuaria Ampliada (BUA) para los Aglomerados
- Diseo de registro de la Base Usuaria Ampliada (BUA) para el Total de Aglomerados

Procesamiento de datos de la encuesta permanente...

39

- Utilizacin de Clasificadores de Ocupacin en las BUA


- Novedades de cada Onda
-Clasificador Nacional de OcupacionesInternet .http://www.indec.mecon.gov.ar/.
EPH continua
Para la Encuesta continua desde el punto de vista informatico se parte de cambios importantes
-Los controles de informacin y el envo de la informacin ser mensual.
-La informacin llegara a Indec mensualmente y se consolidara en una base Nacional.Se
desarrollaron programas que acompaan la metodologa de trabajo.

Programa de Instalacin
Se envan a las DPE programa de instalacin que genera el directorio de trabajo con todos los
insumos necesario para comenzar el ingreso de la informacin:
-Base con viviendas seleccionadas (con los archivos de MMNU incorporados)
-Bases (area.dbf, area_hog.dbf, viv_gral.dbf, hogar.dbf, personas.dbf, perso2.dbf, viv_gra.dbf,
hog_cara.dbf, viv_cara.dbf, viv_pers.dbf)
-Incorpora la informacin provenientes de otros trimestres. Las preguntas de caractersticas de
vivienda y hogar solo se preguntan una sola vez.

Proceso de Captura y Consistencias


El sistema de ingreso y procesamiento esta descentralizado. Todos los procesos que se detallan son
realizados en las Direcciones Provinciales de Estadstica.
La EPH cuenta con un sistema de ingreso ntegramente desarrollado en Clipper que permite:

Ingresar al sistema los cuestionarios

Ingreso de otros materiales de campo


Posibilidad de ingresar, planillas que se utilizan en el trabajo de campo Y de todos los materiales
que permiten consistir y evaluar el trabajo de campo.

Posibilidad de correr otros procesos de consistencias Batch y otros controles


Control de Completitud (relacin entre las viviendas seleccionadas y las ingresadas)
Impresin de Planillas R1 con la informacin de los cuestionarios ingresados

Consistencias en lnea
Se estn incorporando las consistencias para los nuevos cuestionarios (vivienda, hogar,
individual) que sern incorporadas en el programa de Ingreso.

Controles de Incompletos, repetidos

Variables construidas definidas en programa de captura


Condicin de actividad
Categora ocupacional

40

Procesamiento de datos de la encuesta permanente...

Variables Codificadas
La Rama de la Actividad y Tarea de la Ocupacin no se codifican en DPE. Se ha comenzado a
utilizar Codificacin automtica y/o asistida en bases trimestrales de Eph-Indec

Calculo de tasas

Envo de la base mensual de la DPE a Eph-Indec


Se ha desarrollado un Sistema que arma archivos con un formato determinado que solo se genera si se
han seguido los pasos de controles definidos (consistencias, completitud, repetidos, incompletos)
La base mensual es recibida en Indec-Eph en la primer semana del mes siguiente.
Recepcin y Consolidacin de los datos
Se cuenta con un sistema en red que tiene definidos roles de usuarios que garantizan que los procesos
sean corridos por aquellos que estn autorizados.
En EPH- Indec se continan con los siguientes procesos

Levanta los archivos remitidos por la DPE y los incorpora a la base trimestral.

Calculo de la No Respuesta
Permite procesar informacin por estrato y por grupo de rotacin, comparar con datos histricos.

Control y aprobacin de la muestra


Permite controlar y aprobar la muestra comparando con los datos histricos de trimestres
anteriores (viviendas seleccionadas, viviendas respuesta, viviendas por causa de no respuesta).
Solo se procesa despus de haber recibido los tres envos mensuales.

Calculo de tasas (Comunicado de Prensa)


Solo se procesa despus de haber recibido los tres envos mensuales.

Ponderar y ajustar a la Proyeccin


Solo se procesa despus de haber recibido los tres envos mensuales.

Procesos de deciles
Solo se procesa despus de haber recibido los tres envos mensuales.

Paralelamente se desarrolla este mismo sistema (Recepcin y Consolidacin de los datos) en Oracle.
Este sistema abarca la totalidad de las tareas y permite analizar y visualizar la informacin ya ingresada
desde distintas formas de agrupamiento
Durante un tiempo debern coexistir los dos sistemas. En este momento estamos controlando los
resultados de los procesos generados en ambos sistemas.