Beruflich Dokumente
Kultur Dokumente
Estrategia de difusin de informacin estadstica basada en PC-Axis La experiencia del ISTAC y del IBESTAT
Ponentes: Fernndez Vzquez, Sara sfernandez@ibestat.caib.es Institut dEstadstica de les Illes Balears (IBESTAT) Gonzlez Yanes, Alberto jgonyanp@gobiernodecanarias.org Instituto Canario de Estadstica (ISTAC)
Resumen: El Instituto Canario de Estadstica (ISTAC) y el Instituto de Estadstica de Baleares (IBESTAT) una vez evaluado el volumen y las caractersticas de la informacin estadstica a publicar han considerado que la herramienta adecuada para el cumplimiento de tal objetivo es el PC-Axis al tratarse de un sistema para visualizacin de tablas estadsticas que ofrece: Una sencilla interfaz de usuario basada en hoja de clculo. Personalizacin de tablas. El usuario decide qu variables y valores intervienen y en qu orden. Confeccin de grficos estadsticos. Confeccin de mapas temticos (se necesita instalar el programa PX-Map y las colecciones de mapas). Exportacin y copia de datos a otras aplicaciones.
PC-Axis es una serie de softwares creados para servir de plataforma para la difusin de estadsticas oficiales coherentes, eficientes y amables a los usuarios. Es ideal para oficinas nacionales de estadsticas y otros organismos encargados de la difusin de estadsticas sociales y econmicas. La serie soporta a todo el espectro de productos de difusin: bases de datos en lnea comprensibles, productos electrnicos como CD-ROM, y publicaciones disponibles en papel o en la red. El formato de archivo PC-Axis es rico en metadatos y es un archivo en ASCII que refleja las ideas utilizadas en el sistema Axis y su sucesor, el modelo macro meta PX. En la ponencia se describir la experiencia del ISTAC y del IBESTAT en la produccin y difusin de informacin estadstica en el estndar PC-Axis. Palabra clave: Difusin estadstica, PC-Axis, metadatos, cubos.
Estrategia de difusin de informacin estadstica basada en PC-Axis La experiencia del ISTAC y del IBESTAT
La estrategia de difusin de informacin estadstica basada en PC-Axis, por la que ha apostado tanto el ISTAC como el IBESTAT, se dirige hacia el cumplimiento del principio anteriormente citado; difundiendo conjuntamente los datos estadsticos con metadatos tanto estructurales como documentales, y con ello poder descubrir, entender, extraer y administrar la informacin estadstica aportada por nuestros institutos.
Estrategia de difusin de informacin estadstica basada en PC-Axis La experiencia del ISTAC y del IBESTAT
formatos, como por ejemplo Microsoft Excel o HTML, y elaborar grficos estadsticos. Algunos de los programas que componen la familia son los siguientes:
Mdulo principal de PC-Axis
PC-Excel
De forma resumida, de entre otras muchas funcionalidades, se incluyen las siguientes: Difusin de estadsticas en lnea (componentes PX-Web o JAXI) y sin conexin (Mdulo principal PC-Axis). Tablas Dinmicas funcin para pivotar (Mdulos principales PX-Web y PC-Axis). Conversin a diferentes formatos de archivo (PX-Web y PC-Axis) por ejemplo Excel, Lotus, txt, etc. y para PC-Axis nicamente Gesmes/TS y XML. Base de datos de resultados (bases de datos PC-Axis y/o SQL). Matrices multidimensionales (archivos PC-Axis y bases de datos SQL). Modelo de informacin rico en metadatos en SQL y en el formato de archivo PC-Axis. Windows (PC-Axis) e Internet (PX-Web). Los archivos PC-Axis en una estructura de catalogacin forman una base de datos PCAxis y es accesible sin tener que utilizar SQL (Mdulo principal PC-Axis y PX-Web). Las extensiones SQL (Servidores Sybase/Oracle/MS-SQL) para la base de datos SQL se estructuran de acuerdo al modelo macrometa comn de informacin (PCAxis SQL y en algunos casos los componentes PX-Web y PC-Axis/PX-Batch en Internet a una base de datos macro). Facilidades de agrupamiento (PC-Axis y PX-Web). Grficas (PX-iGraph). 3
Estrategia de difusin de informacin estadstica basada en PC-Axis La experiencia del ISTAC y del IBESTAT
Mapas (PX-Map y PX-iMap). Creacin de archivos PC-Axis de diferentes fuentes (PC-Axis SQL, PX-Batch, PXMake, PX-Edit y el SuperStar/SuperCross Australiano). Tablas creadas en una base de datos SQL o PC-Axis e insertadas en MS-Word o MSExcel (PX-Publ).
DECIMALS=0;
DATOS DATA= 2155484 1842207 1710484 1713821 4244017 4346613 167965 162184 110463 111697 316041 358411 28909 26791 23822 23982 58352 62592
Figura 2. Ejemplo de fichero de PC-Axis
Cuando todos los datos y metadatos son incluidos y estn tcnicamente bien grabados, el archivo puede usarse en todas las aplicaciones principales de la familia de productos de PCAxis: PC-Axis, PX-Web, PX-Map y PX-Edit (a partir de ahora nos referiremos a stas como
Fernndez Vzquez, Sara Gonzlez Yanes, Alberto
Estrategia de difusin de informacin estadstica basada en PC-Axis La experiencia del ISTAC y del IBESTAT
aplicaciones). PX-Edit, que es tambin una herramienta de correccin y revisin de archivos, puede ser usada para abrir ficheros con contenidos deficientes o ligeramente errneos a nivel sintctico. En estos casos, PX-Edit indicar los errores que identifique y para algunos errores tpicos, se sugerirn correcciones.
Es importante saber que SDMX ha sido recomendado oficialmente en los siguientes foros: Febrero 2007: SDMX es aprobado por el Comit de Programas Estadsticos de la Unin Europea Marzo 2008: La Comisin de las Naciones Unidas declara SDMX como el estndar preferido para datos y metadatos.
Estrategia de difusin de informacin estadstica basada en PC-Axis La experiencia del ISTAC y del IBESTAT
Consejo de la Reserva Federal de los EEUU: Permite realizar selecciones y descargar en formato SDMX. http://www.federalreserve.gov/datadownload/default.htm Reserva Federal del Banco de Nueva York: Facilita los datos en formato SDMX. http://www.newyorkfed.org/xml/index.html Banco Central Europeo: Posiblemente una de las mejores pginas web que usan SDMX porque no slo permiten la descarga de los datos en SDMX sino permite visualizar grficamente toda la informacin. http://www.ecb.int/stats/exchange/eurofxref/html/eurofxref-graph-usd.en.html Eje Comn de la Deuda Externa (WB, IMF, OECD, BIS). http://www.jedh.org Divisin de Estadsticas de las Naciones Unidas (UN/COMTRADE) http://comtrade.un.org Cuentas Nacionales de OECD / Eurostat (NAAWE). http://stats.oecd.org/nawwe/default.aspx Eurostat Institutos Nacionales de Estadstica, tales como Estadsticas de Canad o el Sistema Federal Mexicano UNESCO OCDE: Representacin grfica e interactiva http://stats.oecd.org/nawwe/csp/default.html de las estadsticas:
Visor de estadsticas de la OECD que incluye visualizacin de metadatos, mapas, grficos,... http://stats.oecd.org/Index.aspx
El grupo de trabajo ESSnet on SDMX del Sistema Estadstico Europeo (ESS), coordinado por el INE de Portugal, trabaja entre otros temas en el mapeo PC-Axis a SDMX. Asimismo la FAO en su producto CountrySTAT1, con el asesoramiento de Metadata Technology, ya integra PCAxis con SDMX.
Por lo tanto, el paso por PC-Axis es una buena estrategia para la migracin hacia el estndar internacional SDMX; pues facilita a las organizaciones estadsticas un primer acercamiento a la produccin y difusin de metadatos.
PC-AXIS
http://unstats.un.org/unsd/accsub/2006docs-8th/SA-2006-13Add1-FAO.pdf
SDMX
6
Estrategia de difusin de informacin estadstica basada en PC-Axis La experiencia del ISTAC y del IBESTAT
4.2. SOLUCIONES BASADA EN BUSINESS INTELLIGENCE. Las soluciones BI son precisamente eso, soluciones BI, con sus aciertos y sus problemas. NO SON SOLUCIONES PENSADAS PARA LA DIFUSIN DE ESTADSTICAS, aunque en algunos casos pueden ser tiles. 1. Es factible cruzar todo con todo? Cuntos cubos necesitamos? 2. Escasa o nula integracin de metadatos 3. En algunos casos no aceptacin de valores no numricos, no diferenciacin de distintos tipos de valores NULL.
4. Problemas de control de secreto estadstico 5. Alto coste y alta dependencia tecnolgica de empresas y/o Servicios de Informtica 6. Poca flexibilidad 4.3. SOLUCIONES COMERCIALES. Existen mltiples soluciones comerciales, entre las que destacamos Beyond 20/202 o Super Star3, que en buena medida resuelven muchos de los problemas planteados en la difusin de estadsticas; pero suelen ser aplicativos de alto coste y escasa interoperabildad. 4.4. RAZONES PARA OPTAR POR PC-AXIS. Ante lo expuesto anteriormente, las razones barajadas para optar por PC-Axis son las siguientes: 1. Conjunto de metadatos mapeables con el estndar internacional SDMX y fcilmente interpretables. 2. Estndar de facto, implementado en un amplsimo conjunto de pases.
3. Sistema pensado para la difusin de estadsticas pblicas con una importante integracin de metadatos de uso estadstico. 4. Estructura de cubos, con posibilidad de simulacin OLAP, y aceptacin de valores no numricos en el conjunto de datos. 5. Alta flexibilidad y prcticamente nula dependencia tecnolgica por parte de las unidades de produccin y difusin de estadsticas. 6. Tecnologa sencilla basada en ficheros ligeros sobre txt y con un importante conjunto de herramientas de produccin y difusin de uso libre, e incluso abiertas (JAXI).
2 3
http://www.beyond2020.com/ http://www.spacetimeresearch.com/
Estrategia de difusin de informacin estadstica basada en PC-Axis La experiencia del ISTAC y del IBESTAT
Y complementariamente: PX-Make de Statistics Denmark (utilizado por el INE) Notepad++ Traductor de PC-Axis para la migracin entre vocabularios, del ISTAC Traductor multilenguaje para la traduccin entre lenguas, del IBESTAT ValPX de validacin de normas internas de produccin de metadatos, del ISTAC.
Estrategia de difusin de informacin estadstica basada en PC-Axis La experiencia del ISTAC y del IBESTAT
6.2. DIFUSIN ON-LINE. Para la difusin en la Web, se parti del cdigo fuente del aplicativo JAXI desarrollado por el Instituto Nacional de Estadstica (INE). Se opt por el uso del JAXI frente a PX-Web, pues en el primer caso se poda disponer del cdigo fuente y por lo tanto realizar las adaptaciones necesarias a los requisitos previstos por el ISTAC en primer lugar y posteriormente por el IBESTAT. FASE PRIMERA: Mejoras bsicas sobre el JAXI-INE desarrollas por el ISTAC En esta primera fase se realizaron las siguientes acciones: 1. Adaptacin a la imagen corporativa del ISTAC Adaptacin general a formato vertical Solucin a textos largos en la pgina de seleccin de categoras con formato vertical Paginado de tablas en la pgina de presentacin de tablas
2. Lectura de ms metadatos por parte del JAXI: AUTOPEN, INFO, UNITS, STOCKFA, CFPRICES, DAYADJ, SEASADJ, REFPERIOD, BASEPERIOD, CONTVARIABLE, PRECISION, SOURCE, SURVEY, CONTACT, NOTE , NOTEX, VALUENOTE, VALUENOTEX, CELLNOTE, CELLNOTEX, DATANOTECELL. 3. Mejoras en las ayudas
Fernndez Vzquez, Sara Gonzlez Yanes, Alberto
Estrategia de difusin de informacin estadstica basada en PC-Axis La experiencia del ISTAC y del IBESTAT
FASE SEGUNDA: Mejoras sobre el JAXI-INE desarrollas por el IBESTAT Sobre las mejoras realizadas por el ISTAC posteriormente el IBESTAT incorpor las siguientes funcionalidades: 1. Lectura de ficheros PC-Axis multilenguaje 2. Generacin de mapas temticos 3. Generacin de grficos
6.3. TECNOLOGA PARA LA REPRESENTACIN ON-LINE DE GRFICOS. La librera para dibujar grficos estadsticos es JFreeChart, implementada en Java. Entre los grficos que se pueden dibujar se encuentran: grfico de lneas, grfico de barras, grfico sectorial y pirmide de poblacin.
Estrategia de difusin de informacin estadstica basada en PC-Axis La experiencia del ISTAC y del IBESTAT
6.4. TECNOLOGA PARA LA REPRESENTACIN ON-LINE DE MAPAS. La tecnologa usada para representar mapas es el framework javascript MapFish. Esta librera permite realizar consultas y editar entidades geogrficas. A su vez esta librera se apoya en el framework OpenLayers que permite establecer mapas geogrficos en la web. En nuestro caso MapFish nos permite representar mapas temticos. Nuestra fuente de datos para representar las entidades geogrficas ser un archivo en formato Shapefile. Con este archivo es posible geolocalizar y pintar el mapa. A continuacin se establece una capa con las regiones del mapa temtico, esta capa se sirve en formato GeoJson al MapsFish. Adems de este GeoJson que representa los datos seleccionados por el usuario, se utiliza otra capa de GeoJson con las entidades bsicas a pintar en el mapa. Esta ltima capa se puede obtener fcilmente a travs del shapefile de partida.
Estrategia de difusin de informacin estadstica basada en PC-Axis La experiencia del ISTAC y del IBESTAT