Sie sind auf Seite 1von 14

BIBLIOTECAS DIGITAIS NA ERA DA WEB SEMNTICA: REFLEXES NO MBITO DA GESTO DE CONTEDOS INFORMACIONAIS Resumo: No mbito da gesto de contedos informacionais

os processos de organizao e recuperao sempre estiveram condicionados s tecnologias associadas, de modo que a constante evoluo tecnolgica e o avano exponencial na quantidade de informao disponvel, principalmente no meio digital, vm conduzindo a um estgio em que os modelos clssicos de organizao e recuperao de informaes precisam ser repensados sob diferentes perspectivas. Este artigo compreende uma discusso de literatura interdisciplinar acerca dos conceitos e tecnologias relacionados ao projeto Web Semntica, verificando sua fundamentao terica, avaliando em que medida a rea da Cincia da Informao pode contribuir para sua concretizao e verificando tambm os reflexos destas novas abordagens aplicadas ao contexto de bibliotecas digitais. Palavras-chave: Web Semntica; Bibliotecas Digitais, Cincia da Informao; Cincia da Computao; Organizao do Conhecimento, Ontologia. Abstract: In the scope of information content management, the process of organization and recovery had always been conditioned to the associated technologies, so that the constant evolution of the technologies and the exponential advances in the quantity of available information, mainly in the digital media, have been leading to a stage that the classical models of information organization and recovery need to be rethought under different perspectives. This paper comprehend a discussion of an interdisciplinary literature about the concepts and technologies related to the Semantic Web project, verifying its theoretical foundation, evaluating in what level the Information Science area can contribute to its concretization and also verifying the reflexes of these new approaches applied to the context of digital libraries. Keywords: Semantic Web; Digital libraries; Information Science; Computer Science, knowledge organization, Ontology. 1 INTRODUO

Considerando-se a organizao da informao como elemento fundamental para a garantia de qualidade na recuperao, destaca-se como proposio deste trabalho a necessidade de estudos tericos e metodolgicos interdisciplinares que possibilitem a elaborao de novas tecnologias capazes de responder com maior preciso s buscas realizadas diretamente pelos usurios finais, favorecendo um aumento na eficincia e seletividade dos sistemas de recuperao de informaes (SRI), e o desenvolvimento de mtodos mais adequados para a gesto de contedos informacionais. Dentro deste contexto, as tecnologias relacionadas ao projeto Web Semntica vm destacando-se como uma nova perspectiva no mbito da gesto de contedos informacionais. Deste modo, apresenta-se neste trabalho uma discusso de literatura acerca dos conceitos e tecnologias subjacentes ao projeto Web Semntica, verificando sua fundamentao terica, avaliando em que medida a rea da Cincia da Informao pode

contribuir para sua concretizao e verificando tambm os reflexos destas novas abordagens aplicadas ao contexto de bibliotecas digitais. Na prxima seo apresentado um breve histrico sobre a evoluo da Internet, e o surgimento do projeto Web Semntica. A seo 3 compreende algumas consideraes a cerca da representao da informao no meio digital. A seo 4 contextualiza algumas utilizaes destas novas abordagens aplicadas no mbito de bibliotecas digitais e finalmente na seo 5 so apresentadas as concluses da anlise realizada. 2 A evoluo da Internet e o projeto Web Semntica

O homem sempre aspirou desenvolver meios que permitissem reunir e disponibilizar de maneira integral todo o conhecimento da humanidade, tal inteno vai ao encontro de fatos histricos como a construo da Biblioteca de Alexandria, criada por Ptolomeu, o Mundaneum, idealizado por Paul Otlet, pelo Memex, de Vannevar Bush, pelo projeto Xanadu, de Theodore Nelson, e, de certo modo, mais recentemente pelo desenvolvimento da Internet, a qual diferentemente dos anteriores, constitui-se de um conjunto de tecnologias originarias da combinao de estudos independentes, de modo no existe um consenso a respeito de um nome que possa representar a sua idealizao ou desenvolvimento de forma integral. Um dos primeiros fatos marcantes na breve histria da Internet ocorreu em outubro de 1969, quando o pesquisador Leonard Kleinrock estabeleceu a primeira comunicao entre dois computadores conectados a ento denominada Advanced Research Project Agency Network, (ARPANET), uma rede experimental financiada pela Defende Advanced Research Projects Agency dos EUA, (DARPA), enviando uma mensagem do computador localizado na Universidade da Califrnia em Los Angeles (UCLA), para o do Instituto de Pesquisa de Stanford (SRI). Desde ento, Leonard Kleinrock considerado como o inventor dos princpios bsicos da comunicao por pacotes de dados, uma das bases para o funcionamento da Internet. (GILLIES e CAILLIAU, 2000) Tendo surgido em plena guerra fria, o objetivo inicial da ARPANET era descentralizar as informaes militares, pois devido ao fato de no possuir um centro definido, nem mesmo uma rota nica para o envio de informaes, tornou possvel que os computadores conectados pudessem se comunicar mesmo em caso de um ataque inimigo que prejudicasse o restante da estrutura da rede. Foi ento, a partir da dcada de 1970, que os estudos relacionados com a ARPANET possibilitaram o desenvolvimento de redes acadmicas, tais como: HEPNet, Usenet, Eunet, Bitnet, entre outras. De modo que os princpios que regiam a ARPANET constituam a coluna vertebral de todas as redes. Foi em 1985 que a National Science Foundation (NSF) estabeleceu a NSFNet, uma rede criada com o propsito de interligar vrias universidades, tomando uma srie de medidas, que apresentaram-se posteriormente fundamentais para o desenvolvimento da Internet. J no final da dcada de 1980, mais especificamente em 1989, Tim Berners-Lee, pesquisador do European Organization for Nuclear Research Center, (CERN), foi responsvel pela elaborao de um ambiente grfico para a utilizao da Internet, o qual foi denominado como World Wide Web (WWW), ou simplesmente Web. Tal ambiente possibilitou a difuso de textos, imagens estticas, udios, vdeos e animaes de forma integrada, facilitando a utilizao da Internet, tornando-a uma tarefa mais agradvel e

conseqentemente viabilizando sua utilizao para fins comerciais. Conforme relada Barreto (2002, p.73).
[...] Foi s em 1989 que Tim Berners-Lee, cidado ingls, tecnologista da informao, trabalhando no European Organization for Nuclear Research Center Cern, escreveu os primeiros softwares que permitiram a atual configurao grfica da web.

Assim, a Internet saiu do circunscrito mundo acadmico e militar, transformando-se em uma promissora rede mundial de computadores interligados ao redor do mundo, a qual constitui atualmente uma das mais ricas fontes de contedos informacionais, devido ao grande volume de informaes que disponibiliza, tal fato que primeira vista apresenta ser o seu maior apelo ao mesmo tempo um de seus fatores crticos, pois devido falta de descrio dos recursos disponveis na Internet, e a grande quantidade existente, muitas vezes localizar uma informao especfica se torna uma tarefa inexeqvel. Deste modo, apresenta-se como desafio a necessidade de singularizao contextual, na reconstruo do conhecimento, determinando requisitos de qualidade e relevncia dos contedos, tornando-se necessrio a utilizao de categorias que permitam organizar, de maneira eficiente, o oceano de dados disponveis, permitindo a identificao daquilo que realmente interessa ao usurio num contexto preciso. Na realidade tais categorias j existem, porm estas so compreendidas apenas pelos humanos, e no possuem nenhum sentido lgico para os programas de computador. Dentro deste contexto, buscando o desenvolvimento de alternativas que ao menos minimizassem tais problemas, foi fundado em outubro de 1994, no Massachusetts Institute of Technology (MIT), o Word Wide Web Consortium (W3C) um consrcio mundial liderado por Tim Berners-Lee que rene empresas, instituies acadmicas, profissionais e cientistas, com o intuito de padronizar novas tecnologias que possibilitem estender gradativamente as funcionalidades do ambiente Web. Assim, a partir do empenho de um grande contingente de pesquisadores filiados ao W3C em meados de 1998 comearam a formalizar-se pesquisas relacionadas ao desenvolvimento de uma nova gerao da Web, a partir da qual espera-se possibilitar a incorporao de ligaes semnticas aos contedos, de modo que os computadores possam compreendelas. Machine understandable information, com esta sucinta expresso Berners-Lee (1998) impulsionou os primeiros estudos em direo ao ousado projeto da Web Semntica. Segundo Bernes-Lee (1999), o primeiro passo para o desenvolvimento da Web Semntica a incluso de dados em um formato que os sistemas computacionais possam naturalmente compreender de forma direta ou indireta. Aps a publicao desta definio, em seu instigante livro Weaving the Web, a expresso Web Semntica comeou a ser disseminada, como um ttulo genrico que representa uma srie de pesquisas que tm como principal objetivo possibilitar um melhor aproveitamento das potencialidades do ambiente Web, onde por meio do uso intensivo de linguagens computacionais e instrumentos de metadados espera-se obter o acesso automatizado s informaes de maneira mais precisa, utilizando-se para isso processamentos semnticos de dados e heursticas automticas. Assim, pode-se verificar que a Web Semntica uma tentativa inversa de soluo, comparando-se com as tradicionalmente desenvolvidas, onde a idia pensar nas mquinas para que estas possam servir os humanos de maneira mais eficiente. Conforme afirmam

Berners-Lee et al. (2001, p.2, traduo nossa): A Web Semntica uma extenso da Web atual, onde a informao possui um significado claro e bem definido, possibilitando uma melhor interao entre computadores e pessoas. Deste modo, evidente que o objetivo final da Web Semntica atender as pessoas e no os computadores, mas para isso torna-se necessrio construir instrumentos que forneam sentido lgico e semntico para as mquinas. Tradicionalmente a linguagem utilizada para o desenvolvimento de pginas Web a linguagem computacional denominada HTML, ou Hyper Text Markup Language (Linguagem de Marcao de Texto), de modo que sua origem confunde-se com a prpria criao da Web, porm a linguagem HTML prioriza o modo de apresentao dos contedos, no possibilitando a descrio de estruturas semnticas ou o desenvolvimento de qualquer tipo de restries de integridade. Segundo Freitas (2003), para representar os dados na Web Semntica torna-se necessria uma linguagem com mais recursos, que permita descrever o contedo semntico e os significados contextuais, alm da estrutura e da forma de exibio de documentos. Assim, para suprir tais necessidades, foi desenvolvida a linguagem computacional intitulada XML (eXtended Markup Language). A linguagem computacional XML foi a precursora de uma srie de novas tecnologias desenvolvidas e padronizadas com o intuito de tornar cada vez mais prximo a concretizao do projeto Web Semntica. Dentro deste contexto, o W3C desempenha um papel fundamental no desenvolvimento e padronizao de novas tecnologias baseadas no ambiente Web. Assim, recentemente o W3C publicou uma nova proposta de arquitetura, conforme apresentado na figura 1, baseando-se em uma srie de camadas sobrepostas, de modo a refletir os passos e tecnologias que devem ser desenvolvidas para a concretizao da Web Semntica.

FIGURA 1 Arquitetura da Web Semntica Fonte: Berners-Lee, 2005. p.27

Tal modelo de arquitetura visa padronizar as tecnologias subjacentes ao projeto Web Semntica, apresentando como se relacionam as tecnologias indicadas para o seu desenvolvimento, de modo que cada camada desta arquitetura deve obrigatoriamente ser complementar e compatvel com as camadas inferiores ao mesmo tempo em que no deve depender das camadas superiores, possibilitando assim uma estrutura idealmente escalonvel. A seguir, apresenta-se como podem ser entendidos, sucintamente, os conceitos e tecnologias inerentes a esta arquitetura. URI: um Identificador nico de Recursos que possibilita a definio de nomes para os recursos, e seus respectivos endereos na Internet, de maneira precisa. Unicode: Consiste de um esquema padronizado de codificao de caracteres, o qual diminui consideravelmente a possibilidade de redundncias dos dados, pois funciona independentemente da plataforma utilizada. XML: uma linguagem computacional que possibilita a estruturao dos dados por meio da definio de elementos e atributos, permitindo a definio de regras sintticas para a anlise e validao dos recursos. Namespace: uma coleo de nomes, identificados por um URI, que so utilizados em documentos XML para validar elementos e atributos. Signature: Conjunto de tecnologias desenvolvidas com o intuito de substituir, em ambiente computacional, a funo exercida pela assinatura formal de uma pessoa em um suporte fsico como papel. Segundo Pftzenreuter (2004), a assinatura digital garante a integridade dos dados e a comprovao da procedncia dos recursos. Encryption: Consiste de um processo em que as informaes so cifradas de modo que no possam ser interpretadas por qualquer pessoa ou sistema computacional, garantindo assim a confidencialidade das informaes. Segundo Nakamura e Geus (2003, p.287), [...] encryption o processo de disfarar a mensagem original, [...], de tal modo que sua substncia escondida em uma mensagem com texto cifrado. RDF Core: o ncleo que compreende as especificaes do modelo e sintaxe da Resource Description Framework (Estrutura de Descrio de Recursos), possibilitando a descrio dos recursos por meio de suas propriedades e valores. Segundo Daum e Merten (2002), a RDF pode ser vista como uma tecnologia de capacitao para a modelagem semntica, sobre a qual podem ser criadas linguagens computacionais especficas. RDF Schema: Linguagem utilizada para a descrio do vocabulrio RDF, possibilitando a definio de taxonomias de recursos em termos de uma hierarquia de classes. Segundo Brickley et al. (2004), a RDF Schema uma extenso semntica do cdigo RDF, fornecendo mecanismos para descrever grupos de recursos e os relacionamentos existentes entre tais recursos. SparQL: Segundo recentes trabalhos apresentados por pesquisadores ligados ao W3C, (Prud'hommeaux e Seaborne, 2005; Clark, 2005), SparQL uma linguagem computacional utilizada para realizar consultas a partir de estruturas RDF, favorecendo a recuperao de informaes de maneira mais eficaz. Tal linguagem ainda no se

encontra completamente padronizada, motivo pelo qual no recomendada oficialmente pelo W3C, sendo denominada como uma tecnologia candidata recomendao. DLP: Tambm considerada uma tecnologia candidata recomendao. Segundo Grosof et al. (2003) e Vrandecic et al. (2005), a DLP constitui a interseco entre os dois principais paradigmas utilizados atualmente para desenvolver computacionalmente sistemas baseados em representao do conhecimento, Lgica Descritiva (OWL DL) e Programao Lgica (F-Logic), fornecendo uma estrutura extremamente flexvel. Deste modo a DLP ainda no considerada atualmente como uma linguagem de representao do conhecimento, mas sim como uma ponte que possibilita a unio entre os dois principais paradigmas utilizados. OWL: Ontology Web Language, a linguagem computacional recomendada pelo W3C para o desenvolvimento de ontologias1. Segundo McGuinness e Harmelen (2004), a linguagem OWL utilizando a lgica descritiva para explicitao dos aspectos semnticos dos termos e seus respectivos relacionamentos, possibilitando representaes mais abrangentes que as linguagens RDF e RDF Schema e favorecendo uma maior interoperabilidade. Rules: Permite a definio de regras lgicas relacionadas aos contedos informacionais. Segundo Daconta, Obrst e Smith (2003), esta camada possibilita uma espcie de Intruduo Lgica, enquanto que a camada superior, Logic Framework, possibilita a incorporao de Lgicas Avanadas. Logic Framwork: Nesta camada pode-se definir regras mais abrangentes para o tratamento das informaes descritas nos nveis inferiores, possibilitando que agentes computacionais possam realizar inferncias automticas, a partir das relaes existentes entre os contedos informacionais, podendo inclusive inferir novas informaes. Proof: Espera-se que esta camada possibilite a verificao/comprovao da coerncia lgica dos recursos, de modo que os aspectos semnticos das informaes estejam descritos de maneira consideravelmente adequada e atendendo todos os requisitos das camadas inferiores. Trust: Camada de Confiana, a partir da qual espera-se garantir que as informaes estejam representadas de modo correto, possibilitando um certo grau de confiana.

Dentro deste contexto, existe atualmente um enorme contingente de pesquisadores trabalhando para a evoluo de tais tecnologias, porm devido a grande abrangncia do tema verifica-se ainda a necessidade de estudos tericos interdisciplinares que reflitam a evoluo destas tecnologias, a partir da sedimentao de tais avanos no campo terico.

O termo ontologia utilizado no contexto da Web Semntica referindo-se a modelos formais utilizados para a representao de um determinado conjunto de significados e as relaes existentes entre estes, dentro de um domnio especificado e restrito.

Representao da Informao em ambientes digitais

Com o advento, desenvolvimento e intensificao da utilizao das tecnologias digitais uma nova gama de possibilidades foram incorporadas aos processos de gesto de contedos informacionais, constituindo uma realidade sem precedentes. Em decorrncia desta verdadeira ruptura, os ambientes digitais passaram a requerer mtodos mais adequados que possibilitem a representao e organizao de seus contedos de modo mais preciso, impulsionando uma srie de pesquisas, nas mais variadas reas do conhecimento, entre as quais pode-se destacar a Cincia da Informao e a Cincia da Computao, focalizadas no estudo e desenvolvimento de meios de organizao de conjuntos especficos de informao e instrumentos de representao. Segundo Saracevic (1996), a recuperao de informao pode ser considerada como a vertente tecnolgica da Cincia da Informao. Fato este que contribuiu para uma tendncia de aproximao entre as reas de Cincia da Informao e Cincia da Computao. Dentro deste contexto, deve-se salientar as diferenas terminolgicas e conceituais identificadas de acordo com o enfoque de cada rea do conhecimento, como no caso do prprio conceito de informao. Conforme relata Ferneda (2003, p.1-2), ao comentar sobre as relaes existentes entre a Cincia da Informao e a Cincia da Computao, verificando que: [...] a informao, objeto de comum interesse de ambas as cincias, paradoxalmente o que mais as distancia. Para a Cincia da Informao, segundo Le Coadic (1996, p.5), a informao [...] comporta um elemento de sentido. um significado transmitido a um ser consciente por meio de uma mensagem inscrita em um suporte espao-temporal: impresso, sinal-eltrico, onda sonora, etc.. Enquanto que, para a rea de Cincia da Computao o conceito de informao tradicionalmente restringe-se aos conceitos relacionados com a Teoria Matemtica da Informao, mais especificamente com os fundamentos estabelecidos por Shannon e Weaver (1949), presentes no artigo intitulado The Mathematical Theory of Communication, onde apresentada uma teoria matemtica para a transmisso de mensagens e troca de sinais, teoria a qual no se preocupa com a semntica dos dados, porm adequada para a construo de sistemas informticos, onde a informao possa ser quantificada, processada e transmitida por mquinas. Segundo Capurro (2003), embora a rea de Cincia da Informao tambm tenha sido influenciada em seu campo terico pela assim chamada information theory de Shannon e Weaver (1949), a mesma no se limita a esta viso puramente fisicista, abarcando tambm outros aspectos: contextuais, semnticos, sociais e culturais. Contextualizando tais definies e utilizando como exemplo um processo de recuperao de informao no ambiente Web, pode-se verificar que no contexto da rea de Cincia da Informao evidente a presena de componentes semnticos em tal processo, pois, para os usurios as informaes recuperadas possuem um significado semntico implcito. Porm, levando-se em considerao o enfoque mais tcnico da rea de Cincia da Computao, ainda utilizando o mesmo exemplo, verifica-se que os tradicionais motores de busca (search engines) funcionam como sistemas de recuperao de dados que no levam em considerao as semnticas contidas nas pginas da Web, selecionando apenas seqncias de caracteres que satisfaam determinadas condies de busca.

Assim, partindo do princpio que representar pode ser compreendido como ato de apresentar algo por meio de, deve-se ressaltar que os mecanismos de representaes utilizados, modelos/formalismos, so encarados de maneiras diferentes de acordo com a rea de conhecimento. Na rea de Cincia da Informao, por exemplo, tais mecanismos so utilizados para a elaborao de instrumentos de tratamento e recuperao de informaes contidas em documentos, de modo que se espera representar o prprio conhecimento, abarcando os aspectos semnticos inerentes aos contedos e tendo como meta maior o processo de comunicao humana. Segundo Alvarenga (2003), no contexto da rea de Cincia da Informao os processos de representao de informaes podem ocorrer basicamente em trs momentos distintos: na sua produo, na organizao e no momento do acesso pelos usurios. Em contrapartida, na rea de Cincia da Computao, os mecanismos de representao so utilizados com o intuito de auxiliar o desenvolvimento de estruturas computveis, onde tradicionalmente a preocupao principal limita-se a elaborao de estruturas de dados/fatos e os aspectos semnticos no so considerados. Tal enfoque pode ser facilmente identificado na sub-rea de Inteligncia Artificial (IA). Para alguns pesquisadores, a noo de representao de conhecimento pode compreendida a partir de definies ligadas aos papis que pode desempenhar. Segundo Davis (1993), a representao do conhecimento pode ser definida basicamente pelas cinco funes que ela exerce: 1. Substituio da realidade: um substituto. 2. Um conjunto de compromissos ontolgicos. 3. Materializao da concepo de um raciocnio, um conjunto de inferncias que ela apia e recomenda. 4. Um meio para computao eficiente. 5. Linguagem que permite aos humanos trocar conhecimento. Assim, considerando-se que o conceito de representao do conhecimento pode ser entendido a partir de definies ligadas aos papis que se espera que tal representao desempenhe, no mbito da representao de contedos digitais pode-se utilizar a definio apresentada por Campos (2004, p.24):
Uma representao de conhecimento um meio de computao pragmaticamente eficiente. Na realidade, esta questo aborda a utilidade prtica da representao. Se ela torna coisas possveis, mas no facilmente computveis, a representao pode, ento, no ser de muita valia para o problema em mos.

A partir destas definies, verifica-se atualmente uma forte tendncia de pesquisas, principalmente na rea de Cincia da Computao, referindo-se a instrumentos de modelagem cognitiva de objetos digitais por meio da utilizao do termo ontologia. Historicamente a palavra ontologia tem origem no grego ontos (ser) e logos (palavra). Apesar do estudo do ser originar-se nos estudos de Aristteles e Plato, o uso do termo Ontologia para designar um ramo da Filosofia muito mais recente, tendo sido introduzido na transio da idade mdia para a idade Moderna, na escolstica por volta dos sculos

XVII e XVIII. Segundo Welty e Guarino (2001), o termo foi cunhado na rea de Filosofia em 1613 por Rudolf Goclenius e aparentemente de forma independente por Jacob Lorhard. Numa formulao bastante sucinta pode-se dizer que Ontologia dentro do contexto da Filosofia o ramo que estuda tudo aquilo que existe, ou utilizando-se a formulao clssica de Aristteles, estuda o ser enquanto ser, isto , do ser concebido como tendo uma natureza comum que inerente a todos e a cada um dos seres. Segundo Campos (2001), as ontologias so utilizadas dentro do contexto da rea de Cincia da Computao com o intuito de desvendar o significado das coisas do mundo, procurando descrever suas naturezas, referindo-se, na realidade, a artefatos de engenharia formados por um vocabulrio especfico que usado para descrever uma certa realidade e um conjunto de afirmaes explcitas sobre o significado das palavras do vocabulrio. Ainda segundo a mesma autora, os modelos de representao do conhecimento so construdos a partir da definio de conceitos e os relacionamentos existentes entre eles, por esse motivo tambm so conhecidos como modelos conceituais, os quais podem ser elaborados por meio de uma perspectiva indutiva, partindo de conceitos individuais de um determinado domnio para se alcanar os conceitos gerais ou considerando-se uma perspectiva dedutiva, realizando abstraes e pensando primeiramente no domnio e nos conceitos gerais para, numa segunda etapa, se alcanar os conceitos individuais e suas relaes. Segundo Alvarenga (2003), no ambiente digital o processo de representao extrapola, a instncia da epistemologia (representao de conhecimentos j registrados) atingindo acervos ontolgicos, ou utilizando-se dos prprios objetos digitais para a construo de pontos de acesso condizentes, pois no meio digital a representao no se limita a uma nova informao condensada que substitui um determinado contedo, mas apresenta-se, muitas vezes, como parte constituinte do prprio documento. Ainda segundo a mesma autora, a partir de tal explanao possvel explicar a apropriao do termo ontologia, por parte da Cincia da Computao, para designar as chaves de indexao ou temticas referentes a objetos digitais, pois a utilizao de tal termo, que para alguns pode parecer imprprio, deve-se ao fato de que o ambiente digital possibilita no somente representaes no momento da organizao ou acesso das informaes secundrias a partir do conhecimento sobre os seres ou objetos, podendo constituir excertos dos prprios objetos virtuais ou representaes primrias como no caso das imagens digitais. Pois uma imagem digital possui uma existncia potencial, limitada ao prprio ambiente, compe-se e decompe-se sem realmente ter uma existncia fsica, ou t-la de forma efmera. 4 Web Semntica no mbito de bibliotecas digitais

Verifica-se atualmente uma forte tendncia de disponibilizao de contedos digitais, os quais no se limitam apenas ao formato textual, de modo que seus contedos so constitudos de uma variedade de formatos, como imagens estticas, animaes, sons e vdeos. Dentro deste contexto, os bibliotecas digitais, vm crescendo em importncia e utilizao. Segundo Hodge (2000), as bibliotecas digitais utilizam-se de tecnologias denominadas como Knowledge Organization Systems (KOS), Sistemas de Organizao de Conhecimento, os quais so utilizados tanto para a classificao e organizao de materiais de modo geral, fornecendo meios de acesso a partir de buscas por ttulos ou assunto, como

tambm possibilitam a incorporao de funcionalidades mais avanadas, possibilitando relacionar os contedos, a partir da implementao de redes semntica e ontologias. Dentro deste contexto, as tecnologias subjacentes ao projeto Web Semntica vo ao encontro dos objetivos das bibliotecas digitais, tendo como principal enfoque propiciar meios mais adequados de representar e organizar os contedos informacionais e levando em considerao os aspectos semnticos inerentes a tais contedos, possibilitando responder de maneira mais eficiente e adequada s buscas realizadas diretamente pelos usurios finais. Nesta perspectiva, possvel identificar atualmente alguns projetos que tm como principal objetivo o desenvolvimento de bibliotecas digitais utilizando-se das tecnologias relacionadas ao projeto Web Semntica, entre os quais pode-se destacar o JeromeDL e o MarcOnt. Conforme Kruk et al. (2005), apresenta no artigo sugestivamente intitulado como JeromeDL - Reconnecting Digital Libraries and the Semantic Web, o projeto JeromeDL consiste de uma biblioteca digital de cdigo aberto baseada nas principais tecnologias presentes no projeto Web Semntica, permitindo a descrio de recursos a partir da linguagem computacional RDF e a realizao de buscas semnticas baseadas em ontologias, o que possibilita uma melhora considervel na preciso das buscas, alm de uma maior interoperabilidade. Segundo Synak e Kruk (2005), o principal objetivo do projeto MarcOnt criar uma ontologia capaz de tornar-se um padro de representao de informaes para bibliotecas digitais, possibilitando a descrio dos aspectos semnticos dos contedos e favorecendo a integrao de bibliotecas. Assim, esta em fase de desenvolvimento e avaliao a ontologia MarcOnt, desenvolvida utilizando-se a linguagem OWL, de modo que espera-se que tal ontologia seja compatvel ao menos com o formato MARC21, e possivelmente outros como o Dublin Core, de modo que as descries semnticas possam ser convertidas para outros formatos, possibilitando grande interoperabilidade e o reaproveitamento das bases de conhecimento, por meio da incorporao de outras ontologias que sigam os mesmos critrios. 5 Concluses

A partir da anlise da literatura apresentada e levando-se em considerao os pressupostos da rea de Cincia da Computao possvel justificar a origem do termo Web Semntica, considerando-se que os mecanismos de busca e as pginas Web tradicionais no levam em considerao aspectos semnticos. Fato que no ocorre caso seja analisado sob o ponto de vista da Cincia da Informao e sob prisma de um usurio que inegavelmente ir utilizar-se de aspectos semnticos para localizar as informaes que procura na Web. Dentro deste contexto, verifica-se tambm que o termo ontologia adquire significados distintos quando contextualizado na rea de Filosofia ou na rea de Cincia da Computao, de modo que a rea de Cincia da Informao encontra-se no cerne deste complexo cenrio, devido ao fato de utilizar-se do conceito filosfico deste termo em sua literatura, ao mesmo tempo em que cresce a cada dia seu interesse por estudos relacionados com a representao de contedos informacionais, oriundos principalmente da rea de Cincia da Computao, os quais tm sido freqentemente denominados como ontolgicos.

Portanto, conclui-se que devido ao atual carter polissmico do termo ontologia, torna-se necessrio uma contextualizao adequada e cuidadosa na rea de Cincia da Informao. Nesta perspectiva, verifica-se ainda que a partir de estudos interdisciplinares a rea de Cincia da Informao, mesmo que ainda timidamente, esta tem contribudo para uma mudana de paradigma na rea de Cincia da Computao, pois no momento em que os pesquisadores da rea de Cincia da Computao passam a se preocupar em desenvolver mecanismos que permitam organizar e descrever os aspectos semnticos das informaes, de certo modo, estariam trabalhando com o mesmo conceito de informao utilizado pelos pesquisadores da rea de Cincia da Informao. Aldo Barreto (2002, p.73) j sinalizava para tal fato, quando em seu artigo A condio da Informao utiliza o termo tecnologista da informao ao se referir a Tim Berners-Lee, pesquisador diretamente ligado rea de Cincia da Computao e justamente o grande precursor da Web Semntica. Assim, torna-se evidente o carter interdisciplinar que delineia o corpus terico dos estudos relacionados ao projeto Web Semntica, englobando essencialmente reas como a da Cincia da Informao, Cincia da Computao entre outras, de modo que ao mesmo tempo em que os profissionais da informao possuem muitas habilidades e embasamento terico que vo ao encontro destas novas abordagens tecnolgicas, verifica-se tambm que tecnologias oriundas da rea de Cincia da Computao podem possibilitar melhorias significativas nos processos de representao, organizao e recuperao de contedos informacionais, possibilitando novas perspectivas no fazer profissional da rea de Cincia da Informao, principalmente no mbito de bibliotecas digitais.

REFERNCIAS ALVARENGA, L. Representao do Conhecimento na perspectiva da Cincia da Informao em Tempo e Espao Digitais. Encontros Bibli, Florianpolis, n. 15, primeiro semestre de 2003. BARRETO, A. de A. A condio da informao. So Paulo em Perspectiva, v.16, n.3, p.67-74, jul./set., 2002. BERNERS-LEE, T. Semantic Web Road map. 1998. Disponvel em: Disponvel em: <http://www.w3.org/DesignIssues/Semantic.html>. Acesso em: 18 set. 2005. BERNERS-LEE, T. ;HENDER, J. ;LASSILA, O. The Semantic Web: a new form of Web content that is meaningful to computers will unleash a revolution of new possibilities. Scientifc American, New York, May 2001. BERNERS-LEE, T. Semantic Web Concepts. 2005. Disponvel em: Disponvel em: <http://www.w3.org/DesignIssues/Semantic.html>. Acesso em: 18 out. 2005. BERNERS-LEE, T. Weaving the Web. San Francisco: Harper, 1999. BRICKLEY, D. et al. RDF Vocabulary Description Language 1.0: RDF Schema. . W3C Recommendation. 10 Fev. 2004. Disponvel em: <http://www.w3.org/TR/2004/REC-rdfschema-20040210/> Acesso em: 16 set. 2005.

CAMPOS, M. L. A. A Organizao de Unidades de Conhecimento em Hiperdocumentos: O modelo conceitual como espao comunicacional para a realizao da autoria. 2001. 198 f. Tese (Doutorado em Cincia da Informao) Escola de Comunicaes da Universidade Federal do Rio de Janeiro, Rio de Janeiro, 2001. CAMPOS, M. L. de A. Modelizao de domnios de conhecimento: uma investigao de princpios fundamentais. Cincia da informao, v. 33, n. 1, p. 22-32, jan./abril 2004 CAPURRO, R. Epistemologia e cincia da informao. IN: ENCONTRO NACIONAL DE PESQUISA EM CINCIA DA INFORMAO - ENANCIB, 5., UFMG: Belo Horizonte, 2003. Clark, K. G. SPARQL Protocol for RDF. W3C Working Draft. 14 Set 2005. Disponvel em: <http://www.w3.org/TR/2005/WD-rdf-sparql-protocol-20050914//> Acesso em: 18 set. 2005. DACONTA, M. C.; OBRST, L. L.; SMITH, K. T. The Semantic Web: a guide to the future of XML, Web Services, and Knowledge Management. United States of America: Wiley, 2003. 279 p. DAUM, B.; MERTEN, U. Arquitetura de Sistemas com XML. Rio de Janeiro: Campus, 2002. DAVIS, R., et al. What Is a Knowledge Representation, AAAI Journal. Spring, 1993. FERNEDA, E. Recuperao de Informao: anlise sobre a contribuio da Cincia da Computao para a Cincia de Informao. 2003. 137 f. Tese (Doutorado em Cincia da Informao) Escola de Comunicaes e Artes, So Paulo, 2003. FREITAS, F.L.G. Ontologias e a Web Semntica. 2003. In: Renata Vieira; Fernando Osrio. (Org.). Anais do XXIII Congresso da Sociedade Brasileira de Computao. Volume 8: Jornada de Mini-Cursos em Inteligncia Artificial. Campinas, 2003, v. 8, p. 152. GILLIES, J. ; CAILLIAU, R. How The Web was Born. New York: Osford University Press, 2000. GROSOF, B. et al. Description logic programs: Combining logic programs with description logics. In Proc. of WWW 2003, Budapest, Hungary, Mai 2003, p. 4857. Disponvel em: <http://www.cs.man.ac.uk/~horrocks/Publications/download/2003/p117-grosof.pdf/> Acesso em: 16 set. 2005. HODGE, G. Systems of knowledge organization for digital libraries: beyond traditional authority files. The Digital Library Federation Council on library and Information resources. Washington. 2000. KRUK, S. R. et al. JeromeDL Reconnecting Digital Libraries and the Semantic Web. Disponvel em: < http://www.marcont.org/marcont/pdf/www2005_jeromedl.pdf> Acesso em: 10 out. 2005. LE COADIC, Y-F. A Cincia da informao. Braslia: Briquet de Lemos, 1996. MCGUINNESS, D. L.; HARMELEN, F. OWL Web Ontology Language Overview. W3C Recommendation. 10 Fev. 2004. Disponvel em: < http://www.w3.org/TR/2004/REC-owlfeatures-20040210/> Acesso em: 16 set. 2005.

NAKAMURA, E. T.; Geus, P. L. Segurana de Redesem ambientes corporativos. So Paulo: Futura, 2003. PFTZENREUTER, E. Aplicabilidade e desempenho do protocolo de transporte SCTP. 2004. 119 f. Dissertao (Mestrado em Cincia da Computao) - Universidade Federal de Santa Catarina, Florianpolis, 2004. PRUD'HOMMEAUX, E.; SEABORNE, A. SPARQL Query Language for RDF. W3C Working Draft. 21 Jul 2005. Disponvel em: < http://www.w3.org/TR/2005/WD-rdf-sparqlquery-20050721/> Acesso em: 16 set. 2005. SARACEVIC, T. Cincia da Informao: origem, evoluo e relaes. Perspec. Ci. Inf. Belo Horizonte, v1, n.1, p.41-62, jan/jun. 1996. SHANNON, C ; WEAVER, W. The Mathematical theory of communication. Urbana, Illinois: University of Illinois Press, 1949. Disponvel em: <http://cm.belllabs.com/cm/ms/what/shannonday/shannon1948.pdf>. Acesso em: 18 ago. 2005. SYNAK, M.; KRUK, S. R. MarcOnt Initiative the Ontology for the Librarian World. Disponvel em: http://www.marcont.org/marcont/pdf/ms_eswc2005marcont.pdf> Acesso em: 10 out. 2005. VRANDECIC, D. et al. DLP An introduction. Disponvel em: < http://logic.aifb.unikarlsruhe.de/download/dlpintro.pdf>. Acesso em: 18 set. 2005. WELTY, C., GUARINO, N. Suporting Ontological Analysis of Taxonomic Relationships. Data and Knowledge Engineering, v. 39, n.1, p. 51-74, 2001.

BIBLIOTECAS DIGITAIS NA ERA DA WEB SEMNTICA: REFLEXES NO MBITO DA GESTO DE CONTEDOS INFORMACIONAIS RAMALHO, R. A. S.; VIDOTTI, S. A. B. G.; FUJITA, M. S. L. Programa de Ps-Graduao em Cincia da Informao - UNESP Campus de Marlia.

Das könnte Ihnen auch gefallen