Sie sind auf Seite 1von 6

Projeto de um Data Warehouse para a Saúde Pública

Ricardo S. Santos1, Marco Antônio Gutierrez2, Sergio Furuie2, Umberto Tachinardi3


1
Departamento de Informática em Saúde (DIS)
Universidade Federal de São Paulo (UNIFESP), Brasil
2
Serviço de Informática, Instituto do Coração (INCOR)
Universidade de São Paulo (USP), Brasil
3
Secretaria de Estado da Saúde de São Paulo

Resumo – As técnicas de Data Warehouse para produzir informações estratégicas destinadas à tomada de
decisão têm despertado o interesse de organizações desde os anos 90. A área da saúde, sobretudo o segmento
da saúde pública, começa adotar esta tecnologia para obter uma maior eficiência no gerenciamento da saúde. O
objetivo deste trabalho é apresentar um projeto de Data Warehouse para a gestão da saúde pública. O Data
Warehouse proposto pretende suprir a Secretaria de Estado de Saúde de São Paulo com informação gerencial
obtida através da integração dos dados provenientes de diversas fontes isoladas. Este artigo detalha a
metodologia e a estratégia adotadas para o projeto, as ferramentas utilizadas, os desafios encontrados e as
soluções estabelecidas. A conclusão do trabalho mostra que os resultados obtidos, até o estágio atual, superam
as expectativas iniciais e encorajam a ampliação do projeto. A experiência obtida com a implementação do data
warehouse apresentada neste trabalho, pode contribuir, significativamente, em projetos similares na área da
saúde.

Palavras-chave: Data Warehouse, Gestão da Saúde, OLAP, Banco de Dados, Informática Médica.

Abstract – The Data Warehouse techniques for powered strategic decision-making information are dominating
the companies attention since the 1990s. The healthcare organizations, including the public healthcare
organizations, are adopting this technology to achieve the better efficiency in the health management. The
objective of this work is to present a Data Warehouse project for the management of the public health. The Data
Warehouse will supply the Health Secretary of São Paulo with strategic information through the integration from
several isolated data sources. This Paper details the methodology and strategy adopted for the project, the used
tools, the challenges and the solutions. The conclusion show the success in the implementation of the first part of
project and stimulate the continuity of the project. The experience obtained with the implementation of the data
warehouse showed by this work, can be used to similar projects in the health care organizations.

Key-words: Data Warehouse, Health Management, OLAP, Databases, Medical Informatics.

1. Introdução Muitas iniciativas de sucesso, como o DW


desenvolvido pela Universidade do Sul da Flórida
para gerenciamento da saúde comunitária [2] e
A produção de informações estratégicas para ferramentas para gerenciamento de doenças que
tomadas de decisão, através das técnicas de data identificam e incluem cidadãos com potencial para
warehouse (DW), tem despertado o interesse de determinadas doenças em programas preventivos
organizações desde os anos 90 [1]. Os benefícios [3], incentivam a adoção desta tecnologia como um
obtidos com a utilização desta tecnologia são facilitador para o aumento de qualidade da saúde
muitos. Entre eles destacam-se: - agilidade na pública.
tomada de decisão, melhor gerenciamento dos O objetivo deste trabalho é apresentar um
recursos, descoberta de novas oportunidades de projeto de implementação de um DW destinado à
negócio, etc. gestão da saúde pública. O DW pretende suprir a
A área da saúde, sobretudo a da saúde Secretaria de Estado de Saúde de São Paulo (SES-
pública, também busca, através de soluções DW, SP) com informação gerencial obtida através da
maior eficácia dos programas de saúde pública.

1
integração de dados provenientes de diversas dados contidos no DW. O principal meio para obtê-
fontes isoladas. los ocorre através de ferramentas OLAP (On Line
O projeto será apresentado detalhadamente, Analytical Processing), que são apropriadas para
mostrando o contexto e o escopo, a metodologia e
trabalharem com o modelo dimensional. Estas
estratégia adotada, as ferramentas utilizadas, e as
soluções adotadas para os principais desafios. ferramentas permitem ao usuário elaborar análises
sofisticadas através de diferentes e complexas
2. Definições visões [5].
Para auxiliar os processos envolvidos em uma
Para melhor compreensão do projeto solução DW, existe um amplo dicionário de dados
apresentado neste trabalho, é necessário conhecer denominado metadados. Segundo Berson [5],
a arquitetura de uma solução DW, que está metadados são dados utilizados para descreverem
representada pela figura 1.
os dados contidos no DW, além de descreverem,
Shams [1] define DW como uma plataforma
também, informações técnicas necessárias à
que contém todos os dados da organização,
administração do DW. As descrições contidas no
centralizados e organizados de forma que usuários,
metadados facilitam a elaboração de consultas e
de maneira muito simples, possam extrair relatórios
relatórios pelo usuário final.
analíticos complexos, contendo informações
gerenciais para apoio à decisão. D a d o s O p e r a c i o n a is
Pode-se observar, pela arquitetura, que os
BD1 BD2 BD3
dados contidos no DW são provenientes dos
sistemas operacionais. São considerados sistemas
operacionais ou OLTP (On line Transaction
P ro c e s s o d e C a rg a
Processing), os sistemas que registram os detalhes ( F e r r a m e n ta s E T L )
das transações ocorridas na organização [4].
A extração dos dados operacionais e a sua
inclusão no DW, são denominados processo de
DW M e ta d a d o s
carga, e correspondem a uma das mais árduas
tarefas do projeto. Neste processo, são realizados
procedimentos de limpeza, integração e
Acesso aos Dados
transformação dos dados. Isto é necessário para ( F e r r a m e n ta s O L A P )
que eles sejam inseridos no DW em um formato
adequado à produção de informação gerencial [5].
Os procedimentos do processo de carga podem ser
implementados por programas desenvolvidos em C o n s u lt a s /R e la t ó r io s G e r e n c ia is
alguma linguagem de programação, ou, podem ser
utilizadas ferramentas disponíveis no mercado Figura 1 – Arquitetura de uma solução DW.
destinadas a esta finalidade. São denominadas
ferramentas ETL (Extracting, Transforming and 3. O contexto do projeto
Loading).
Após a carga, os dados contidos no DW Além de uma visão geral sobre a arquitetura
estão num modelo propício para a produção de de um DW, também é necessária uma noção sobre
informação gerencial. Este modelo é denominado as instituições relacionadas ao projeto: A Secretaria
Modelo Dimensional. Segundo Kimball [6], este da Saúde do Estado de São Paulo, como cliente das
modelo corresponde a uma maneira intuitiva de informações e o DATASUS, como provedor dos
organizar os dados permitindo um acesso rápido. O dados. As informações aqui apresentadas foram
modelo consiste em uma tabela central, extraídas dos sites institucionais das respectivas
denominada tabela fato, e num conjunto de tabelas instituições [7],[8].
periféricas ligadas à tabela fato, denominadas A Secretaria de Estado da Saúde de São
tabela dimensão. Paulo (SES-SP), é o gestor estadual do SUS -
Finalmente é necessário disponibilizar ao Sistema Único de Saúde. Está constituída por 6
usuário, em forma de informação gerencial, os coordenadorias e 24 diretorias regionais. Além
destas, integram a estrutura organizacional da SES-

2
SP, Fundações, Autarquias, Conselhos e As fontes de dados, representadas na figura
Assessorias. Uma das metas da SES-SP é a 2, correspondem às bases de dados provenientes
construção de uma rede estadual de informações, dos sistemas do DATASUS, além de planilhas e
cujo objetivo é garantir acesso à informação a todos documentos internos. Cada base de dados do
os gestores do SUS e a cidadãos comuns. DATASUS corresponde a um conjunto de sistemas
O Departamento de Informática do SUS que foram agrupados na fase do estudo inicial.
(DATASUS) é o órgão responsável por “coletar, As informações produzidas devem atender
processar e disseminar informações sobre saúde". três tipos diferentes de usuários: Os gestores
O DATASUS possui vários sistemas, cujos dados municipais, os diretores regionais e os
serão utilizados como fonte para o DW, entre eles coordenadores.
destacam-se: O sistema de Informações
4.1. Metodologia de Desenvolvimento
Ambulatoriais (SIA); Informações Hospitalares
(SIH); Estatísticas Vitais (IEV); Informações Existem várias abordagens metodológicas
Epdemiológicas (IEP); Prestadoras de Serviços para o desenvolvimento de um DW. Inmon [9],
(PS) e materiais médicos (MAT). estabelece uma metodologia que pode ser resumida
de acordo com a tabela 1.
4. O projeto
Etapa Descrição
O objetivo primordial é suprir a SES-SP e os 1- Análise do Modelo de Dados Elaborar o modelo de dados
gestores municipais de informações estratégicas para o DW.
2- Dimensionamento Estimar o volume de dados que
referentes à “saúde” no estado de São Paulo. O o DW vai conter.
objetivo do projeto é a definição e implementação 3- Avaliação Técnica Definição das configurações
de um DW para centralizar, integrar e disponibilizar técnicas para o DW
as informações provenientes dos sistemas do 4- Preparação do Ambiente Identificar tecnicamente como
DATASUS. Técnico a configuração definida será
acomodada.
Após um estudo inicial foi possível limitar um 5- Análise das áreas de Seleção da área de negócio
escopo para o projeto (figura 2). Interesse para ser povoada.
6- Projeto do Data Warehouse Elaborar o projeto físico de
DATASUS banco de dados para o DW.
7- Análise do Sistema Fonte Identificar, nos sistemas
existentes, a fonte de dados
SIA SIH IEV IEP PS MAT para o DW, e efetuar um
mapeamento entre eles.
8- Especificações Definir, em especificações de
programas, as rotinas para
carga dos dados.
XLS WEB 9- Programação Codificação das especificações
DOC
Carga
para as rotinas de carga
10-Povoamento Execução das rotinas de carga
do DW

Tabela 1. Metodologia para desenvolvimento de um


DW DW (Inmon).
SESSP
Considerando as particularidades do nosso
projeto, definimos uma metodologia específica,
baseada na proposta por Inmon, porém, com a
Front-End
alteração de algumas etapas. A principal diferença é
que Inmon sugere definir inicialmente o modelo do
DW e depois estudar os sistemas fontes. Em nosso
projeto iniciamos pelo estudo dos sistemas fontes
Coordena Diretorias Gestores para posteriormente definir o modelo do DW. Esta
-dorias Regionais Município decisão é fundamentada no fato dos sistemas fontes
pertencerem a outra instituição (DATASUS),
portanto, o nosso modelo deve ser projetado em
função dos dados disponibilizados por estes
Figura 2. Escopo global do projeto. sistemas. A tabela 2 mostra a metodologia adotada
para o projeto.

3
Etapa da metodologia Equivalente Inmon Conseqüentemente, na fase de modelagem
1- Estudo dos sistemas existentes Etapa 7 de dados são criados dois modelos: O modelo
(sistemas fontes) relacional, representado pelo DER (Diagrama de
2- Modelagem dos Dados Etapa 1
Entidade e Relacionamento) e o modelo
3- Análise do volume de dados Etapa 2
3- Definição das regras para carga Etapa 8
dimensional, representado pelo Esquema Estrela. A
4- Definição da arquitetura do DW Etapa 6 figura 4 mostra uma parte do modelo dimensional do
5- Análise do Ambiente Etapa 3 projeto, referente aos atendimentos ambulatoriais.
Operacional Ainda, nas definições estratégicas, deve-se
6- Implementação do Ambiente Etapa 4 escolher as ferramentas para o desenvolvimento do
Operacional
7- Implementação das rotinas de Etapa 9
projeto. O processo de escolha abrange vários
carga aspectos, entre eles: robustez para suportar o
8- Execução da Carga Etapa 10 volume de dados; existência de casos de sucesso
9- Desenvolvimento dos relatórios implementados na ferramenta e um custo acessível.
Considerando estes aspectos, foi adotado um
Tabela 2. Metodologia adotada para o projeto. conjunto de ferramentas Oracle, conforme tabela 3.
Além das ferramentas adotadas, também foi
4.2. Estratégia de Desenvolvimento utilizada uma ferramenta específica para
automatização do processo de carga.
Visando permitir ao usuário usufruir dos
benefícios rapidamente e, ainda, possibilitar uma Tarefa Ferramenta
avaliação parcial dos resultados, foi adotada a Armazenamento do DW Oracle 9i
estratégia de implementação modular, onde cada Modelagem Oracle Designer
1
módulo corresponde a uma fonte de dados ETL Oracle WarehouseBuilder
1
Metadados / Ferramenta OLAP Oracle Discoverer
proveniente dos sistemas do DATASUS.
Esta estratégia reforça o motivo de iniciar o
desenvolvimento com o estudo dos sistemas fontes, Tabela 3. Ferramentas Utilizadas
pois, só após este estudo, foi possível a definição
D_TEMPO
dos módulos. D_SEXO D_UNIDADE
.
Outro aspecto estratégico significativo é a .
criação de um banco de dados relacional .
(operacional) além do dimensional. O motivo é
manter os dados fontes em um meio mais seguro. D_FAIXA_ETARIA . D_MUNICIPIO
Eles estão disponíveis para download na home- . . .
.
page do DATASUS, porém, não há garantias que .
F_ATENDIMENTOS
sempre estarão lá. A figura 3 mostra o fluxo dos .
dados no projeto. . .
D_SERVICO
D_PROCEDIMENTO .
. . .
.
R e la t ó r io s
/ C o n s u lt a s

.
. .

D_ESPECIALIDADE D_TIPO
D_CID
B D
D im e n s io n a l
Figura 4 – Esquema Estrela – Modelo Dimensional

B D
R e la c io n a l 4.3. O processo de carga

Devido a estratégia adotada, o processo de


carga dos dados é constitui-se de duas fases. Na
A r q u iv o s S U S primeira fase os dados dos sistemas fontes
(DATASUS) são carregados em um banco
Figura 3 – Fluxo de dados no projeto relacional, e posteriormente, os dados são

4
carregados da base relacional para o banco são desenvolvidos pela ferramenta Oracle
dimensional (figura 3). Discoverer. A figura 9 mostra um exemplo de
Na primeira etapa da carga, há um grande consulta analítica desenvolvida para o usuário. O
número de arquivos recebidos por download numa exemplo analisa procedimentos realizados por cada
grande variedade de formatos. Visando facilitar a município em um determinado período, de acordo
carga para a base relacional, foi desenvolvida, em com o tipo de gestão e tipo de serviço.
parceria com a Compumédica Informática Ltda,
uma ferramenta para automatização do processo de
download, descompactação, transformação e carga
dos arquivos contidos na home-page do DATASUS
para a Base Relacional. A ferramenta também
efetua a validação do conteúdo e da estrutura do
arquivo para garantir a integridade dos dados. Todo
o processo de carga é armazenado em um arquivo
log, permitindo auditorias ou a repetição da carga. A
figura 5 mostra a interface da ferramenta.
A segunda etapa da carga é efetuada por
scripts simples gerados pelos mapeamentos
implementados no Oracle Warehouse Builder. As
rotinas são extremamente simples, pois, as tarefas
de limpeza, padronização e consistência dos dados
foram efetuadas na primeira etapa. Figura 5 – Consulta Analítica Pré-Definida

5. Resultados e Discussão

Embora o projeto ainda não esteja


implementado em sua totalidade, resultados
preliminares podem ser discutidos.
Atualmente, o projeto encontra-se em fase
final da implementação do primeiro módulo (SIA).
O desenvolvimento do primeiro módulo
permitiu a identificação de algumas dificuldades.
Estas dificuldades confirmam os desafios de um
projeto de DW para a área da saúde citadas por
autores como Berndt et al.[2], DeJesus [10], Isken et
al. [11]. Os desafios encontrados estão listados na
tabela 4.

Desafio Ação Adotada


- Dados provenientes A ferramenta de carga desenvolvida
de muitas fontes e em possui uma função de padronização
diversos formatos que unifica os vários formatos dos
arquivos.
- Constantes A ferramenta de carga analisa a
Alterações na estrutura do arquivo e efetua os ajustes
estrutura dos arquivos necessários.
Figura 4 – Ferramenta para carga (etapa 1). - Dados lançados em Inclusão de um campo para controle no
um determinado modelo de dados e tratamento desta
período, particularidade, através de uma regra
4.4. A exibição dos Dados do DW correspondentes a de negócio, no metadados. e
períodos anteriores consequentemente nos relatórios
Nesta etapa, além do cadastramento das desenvolvidos.
- Relatórios (saídas) Para prover todos os usuários com a
descrições dos dados e das regras de negócio no devem ser informação analítica, a estratégia é
metadados, são desenvolvidos relatórios e disseminados para disponibilizar o acesso via Web.
usuários separados
consultas pré-definidos para atender os principais geograficamente
requisitos dos usuários. Os relatórios e consultas Tabela 4. Principais desafios do projeto

5
Os próximos passos, já em andamento, são a
Outros resultados preliminares que podem avaliação da satisfação dos usuários para o módulo
ser discutidos, são o volume de dados e o desenvolvido e a implementação dos demais
desempenho do processo de carga.
módulos. Após a implementação de todos o
Considerando apenas o módulo SIA, o
volume mensal de dados para serem carregados no módulos, será iniciada a introdução de técnicas de
DW é de 1.800.000 registros, que corresponde a Data Mining para realização de simulações e
aproximadamente a 211 Mb. Acrescentando as análises mais complexas.
tabelas auxiliares, este número aproxima-se de 250
Mb. Isto corresponde a 2,9 Gb por ano. Somando 7. Agradecimentos
outras estruturas de banco de dados, como índices
e log, o volume anual será de, aproximadamente, Aos funcionários da Secretaria de Estado da
3,5 Gb. Embora não seja um número assustador, é Saúde de São Paulo.
um volume razoável se comparado aos 23 Gb. do
CDR (Clinical Data Repository) da Universidade de
Virgínia [12] após 5 anos de existência. 8. Referências
Os tempos para o processo de carga estão
plenamente satisfatórios, mesmo sendo realizados [1] Shams K., Farishta M. (2001), “Data Warehousing: Toward
os testes de performance em um ambiente muito knowledge Management”, Topics in Health Information
inferior ao ambiente de produção. Os testes foram Management, v. 21, n. 3, p. 24-32.
realizados em um servidor x-series 200 da IBM, [2] Berndt D.J., Hevner A.R., Studnicki J. (2003) “The Catch Data
Warehouse: Support for Community Health Care
com 128 Mb de RAM, uma rede de 10 Mbps, e Decision-Making”, Decision Support Systems, v.35 n.3,
acesso web speedy 256 mbps. A primeira fase da p.367-384.
carga, que inclui as rotinas de limpeza e [3] Ramick D.C. (2001), “Data Warehousing in Disease
consistência demorou aproximadamente 2 horas. A Management Programs”, Journal of Healthcare
segunda fase, bem mais simples, demora menos
Information Management, v. 15, n. 2, p. 99-105.
que 10 minutos. O tempo para download dos
[4] Moody, D. L., Kortink, M.A.R. (2000), “From Entreprise Models
arquivos de um mês é de aproximadamente 30
minutos. to Dimensional Models: A Methodology for Data
No estágio atual, ainda não é possível Warehouse and Data Mart Design”, Proceedings of the
mensurar a satisfação do usuário, nem quantificar International Workshop on Desing and Management of
os benefícios obtidos com a nova solução, embora Data Warehouse, Stockholm, Sweden, p. 5.1-5.12, 5-6
eles sejam óbvios. June.
[5] Berson A., Smith S. J. (1997), Data Warehousing, Data Mining,
6. Conclusões & OLAP, New York: McGraw-Hill.
[6] Kimball R. (1997), “A Dimensional Modeling Manifesto”,
DBMS Online, (http:/www.dbmsmag.com/9708d15.html).
O artigo mostrou um projeto de uma solução [7] Secretaria de Estado da Saúde de SP. Disponível em
DW para fornecer informações estratégicas para a http://www.saude.sp.gov.br. Acesso em 05 mai. 2003.
[8] DataSUS – Ministério da Saúde. Disponível em
gestão da saúde pública. O estágio atual do projeto, http://www.datasus.gov.br. Acesso em 05 mai. 2003.
mostra um resultado positivo que supera as [9] Inmon, W. H. (1997), Como Construir o Data Warehouse, Rio
de Janeiro: Campus.
expectativas iniciais e encoraja a implementação
[10] DeJesus E.X. (1999), “Disease Management in a Warehouse:
dos demais módulos.
Data Warehouse Technology Makes a Good Fit for
Uma das grandes contribuições do trabalho é
Disease Management programs.”, Healthcare Informatics,
a identificação de alguns aspectos peculiares da
v.16, n. 9, p. 33-36, 38-39
área da saúde e a implementação de mecanismos
[11] Isken M.W., Littig S.J., West M. (2001), “A data Mart for
para a superação destes desafios.
Operations Analysis”, Journal of Healthcare Information
O projeto foi desenvolvido utilizando um
Management, v. 15 , n. 2, p.143-153.
conjunto de ferramentas robustas e adotando
[12] Einbinder J.S., Scully K.W., Pates R.D., Schubart J.R.,
metodologia adequada para garantir o sucesso do
Reynolds R.E. (2001), “Case Study: A Data Warehouse
empreendimento.
for an Academic Medical Center”, Journal of Healthcare
Os fatores mensuráveis apresentaram
Infornmation Management, v. 15, n. 2, p. 165-175.
números positivos. O volume de dados é razoável,
comparado a outros projetos, e o desempenho dos
Contato
procedimentos de carga está plenamente
rsantos@compumedica.com.br
satisfatório.

Das könnte Ihnen auch gefallen