Sie sind auf Seite 1von 30

Difusão de partituras através da web: o desafio de tornar acessíveis os repertórios

brasileiros
Rodrigo DE SANTIS *
Rosana LANZELOTTE **

RESUMO: Grande parte dos projetos e pesquisas que focalizam arquivos e coleções de partituras
brasileiras destina-se, entre outras formas, à difusão através da web. As consultas à web se guiam por
informações descritivas e, consequentemente, para que sejam efetivas, é necessário que as partituras
sejam descritas de maneira uniforme. Mais ainda, a expansão da web requer que os sítios interoperem
entre si, no sentido de responderem cooperativamente a uma determinada busca. O presente trabalho, que
se insere no âmbito do projeto Musica Brasilis, discute como se pretende tratar as questões de descrição
de partituras com vistas à interoperabilidade, de forma a ampliar o alcance via web a partituras de
compositores brasileiros.

PALAVRAS-CHAVE: MIR; interoperabilidade; web semântica.

ABSTRACT: Many research projects on Brazilian musical collections aim to make resources available
on the web. User queries often address bibliographical aspects of musical resources. Thus, to attain large-
scale availability and interoperability, musical resources should be uniformly described. This work is
developed in the scope of Musica Brasilis project, which aims to investigate methods and techniques for
making Brazilian musical scores available on the web.

KEYWORDS: Musical Information Retrieval; interoperability; semantic web.

1. Introdução
Em projetos de pesquisa voltados a coleções de documentos musicais, um dos
aspectos primordiais diz respeito à descrição de partituras com vistas à recuperação. O
surgimento de softwares para a edição de música, nos anos 1980, ensejou o
aparecimento de versões digitais das partituras, o que acarreta novos problemas no
tocante à descrição e, consequentemente, à recuperação destes documentos.
A expansão da web e a multiplicação de sítios que oferecem recursos musicais
em formato digital ensejaram o surgimento de uma nova área do conhecimento,
denominada MIR – Recuperação da Informação Musical1 –, que reúne competências de
diversas outras áreas (DOWNIE, 2001), conforme mostra a Figura 1.

*
Pesquisador do Instituto Musica Brasilis (IMB). Doutorando em Ciência da Informação, Universidade
Federal do Rio de Janeiro (UFRJ)/Instituto Brasileiro de Informação em Ciência e Tecnologia (IBICT).
E-mail: rodrigo@musicabrasilis.org.br
**
Fundadora do Instituto Musica Brasilis (IMB). Doutora em Informática, Pontifícia Universidade
Católica do Rio de Janeiro (PUC-Rio). E-mail: rosana@musicabrasilis.org.br
1
No original, em inglês, Music Information Retrieval.
Figura 1. Áreas de conhecimento envolvidas em MIR

Em qualquer projeto que envolva coleções de partituras, os musicólogos


deparam-se com as seguintes questões:
a) Como descrever uma partitura: quais campos – metadados2 – utilizar;
b) Como preencher os valores dos campos, por exemplo, como grafar o nome do
compositor.
Essas questões são geralmente estudadas no âmbito da Ciência da Informação e
na sub-área de Biblioteconomia Musical.
O desconhecimento de sistemáticas oriundas da Ciência da Informação leva à
especificação empírica de metadados na maioria dos projetos. Como consequência,
torna-se impraticável a troca de informações entre os sítios e a difusão em larga escala
através da web. Segundo José Maria Neves:
“[...] a intercomplementaridade de nossos arquivos musicais somente
produzirá seus resultados quando pudermos lançar mão de catálogos
sistemáticos que incluam todas as informações disponíveis [...] e que, por
sua construção, permitam todos os cruzamentos desejáveis”. (NEVES,
1998, p. 145)

O projeto Musica Brasilis tem, dentre seus principais objetivos, a difusão de


partituras de compositores brasileiros através da web (MUSICA BRASILIS, 2012).
Para além das questões de descrição de recursos, busca-se a interoperabilidade com

2
Metadados são campos para descrever recursos musicais. Por exemplo, nome do compositor, nome da
obra e data de composição são metadados descritivos de uma composição musical.
sítios de mesma finalidade. Define-se como interoperabilidade a capacidade de um
sistema – informatizado ou não – de se comunicar de forma transparente com outro
sistema. Uma consulta feita a um determinado sítio poderá ser respondida com base nas
informações armazenadas por ele e por todos os sítios com os quais ele interopera.
Atualmente, a informação é organizada na web de forma que apenas o ser
humano é capaz de interpretá-la e, consequentemente, conduzir a tarefa de recuperação
de informação. Por esse motivo, um pesquisador que busque uma determinada partitura
na web é forçado a repetir a busca a sítios que ele conheça e sabe que são,
possivelmente, detentores da partitura que o interessa.
Este cenário tem evoluído no sentido da web semântica, em que padrões são
propostos pelo consórcio W3C3 para descrever a informação de forma a que possa ser
automaticamente processada pelo computador. Segundo Tim Berners-Lee, a web
semântica é “uma nova forma de conteúdos na web compreensíveis pelos computadores
desencadeará uma revolução de novas possibilidades”4 (BERNERS-LEE et al, 2001,
p.28).
A Web Semântica não é outra web, mas uma extensão da atual, em que a
semântica da informação é expressa de acordo com padrões, o que possibilita que tanto
computadores como seres humanos possam interpretá-la.
O presente trabalho dá continuidade às pesquisas para investigar as
contribuições das áreas de Ciência da Computação e Ciência da Informação para a
difusão de partituras via web (LANZELOTTE et al, 2004), (BALLESTÉ et al, 2006),
(LANZELOTTE e BALLESTÉ, 2006), (STANECK e LANZELOTTE, 2007) e (DE
SANTIS e FERREIRA, 2007).
Na seção 2 deste trabalho, discute-se a problemática da organização e descrição
de coleções de partituras. A seção 3 é dedicada aos desafios para a busca e recuperação
de partituras em formato digital, na seção 4 são apresentados os conceitos básicos da
web semântica e as conclusões são resumidas na seção 5.

3
O World Wide Web Consortium (W3C) é um consórcio internacional que tem por finalidade estabelecer
os padrões para a criação e a interpretação de conteúdos para a web.
4
No original, em ingles, “A new form of Web content that is meaningful to computers will unleash a
revolution of new possibilities."
2. Organização e descrição de coleções de partituras
Partituras são colecionadas por instituições litúrgicas, por orquestras, por
bibliotecas, por músicos e compositores, entre outros.
Nesta seção são discutidas questões de organização e descrição de coleções de
partituras e o impacto do surgimento do suporte digital.

2.1. Organização e descrição de partituras em suporte de papel


A organização de coleções de partituras em papel, sejam elas manuscritas ou
editadas, tem se apoiado nas metodologias propostas pela área de Arquivologia,
conforme ilustra a figura 2.

Figura 2. Organização de coleções segundo padrões e métodos da Arquivologia

enquanto padrões propostos pela Ciência da Informação deveriam ser adotados na


descrição de suas unidades, conforme ilustra a figura 3.

Figura 3. Descrição das unidades considerando padrões propostos pela Ciência da


Informação

A organização de uma coleção e a descrição de suas unidades são atividades


complementares e tem objetivos diferentes. A descrição de uma unidade documental,
cuja finalidade é a recuperação da informação nela contida, tem como objeto tanto o
suporte quanto seu conteúdo. Quando se trata de música, uma unidade documental – a
partitura – não necessariamente coincide com uma unidade musical, ou obra,
(CASTAGNA, 2004), o que acarreta em maior complexidade na atividade de descrição.
2.1.1. Organização e descrição de coleções do ponto de vista arquivístico
Para a organização e descrição de coleções, usa-se comumente a Norma Geral
Internacional de Descrição Arquivística ISAD(G), publicada pelo Conselho
Internacional de Arquivos (ICA, 2012), com o objetivo de identificar e descrever o
contexto e o conteúdo de documentos de um arquivo.
O ISAD(G) preconiza a organização hierárquica de um arquivo em níveis:
fundos, sub-fundos, séries e subséries, até chegar-se às unidades documentais, ou
documentos.
Em seu modelo proposto para a organização documental de acervos de
manuscritos musicais, Paulo Castagna (2004) propõe a utilização dos conceitos de
parte, conjunto e grupo, que guardam entre si uma relação hierárquica similar àquela
proposta pela norma ISAD(G), sendo a parte a unidade documental:
“A parte é um documento com música para uma única voz, instrumento
ou naipe (conjunto de vozes ou instrumentos) e não deve ser confundido
com partitura.[...]
O conjunto corresponde à totalidade das partes vocais e/ou
instrumentais referentes à(s) mesma(a) obra(s), elaboradas por um
mesmo copista e em uma mesma época [...]
O grupo [...] é uma reunião de conjuntos que possuem a mesma música,
ou de conjuntos que compartilham obras entre si, podendo ter ainda
outras características comuns.” (CASTAGNA, 2004, p.83).

A figura 4 ilustra a metodologia de organização documental.

Figura 4. Metodologia de organização documental

Cada unidade de descrição é identificada por um código estabelecido pelo


arquivista quando da organização do arquivo. Além do código, a norma ISAD(G)
propõe outros 25 elementos de metadados para descrever as unidades, dentre os quais:
Título, Nome do Criador, Data de Criação, Descrição do Conteúdo, Nível.
No universo arquivístico, não existe a demanda de interoperabilidade, pois a
organização, e a decorrente codificação e descrição, são específicos de um arquivo e
ficam circunscritos ao mesmo.

2.1.2. Unidades documentais do ponto de vista musicológico


No modelo proposto por Paulo Castagna, voltado aos manuscritos de música
religiosa brasileira, uma unidade documental é uma parte vocal ou instrumental e um
conjunto refere-se a uma obra (CASTAGNA, 2004). Para além de sua identificação e
organização arquivística, torna-se necessária a catalogação bibliográfica, do
documento, que consiste em descrevê-lo e aos seus conteúdos através de metadados,
para fins de pesquisa e recuperação.
Para descrever, ou catalogar, o conteúdo de uma unidade documental devem ser
adotados padrões e normas oriundos da área de Ciência da Informação. O mais utilizado
universalmente é o MARC 21, versão atual do padrão MARC – Machine-Readable
Cataloguing –, o primeiro padrão de catalogação passível de processamento por
computadores (MARC, 2012). O padrão MARC data de 1960, quando da
informatização da Biblioteca do Congresso dos Estados Unidos. Por ser aplicável a
recursos provenientes de todas as áreas do conhecimento, tornou-se extremamente
complexo e diversificado. Normas complementares fizeram-se necessárias para orientar
a catalogação no âmbito de áreas específicas, como a música.
Para além de um padrão de catalogação, o MARC é um padrão de intercâmbio
entre bibliotecas, que trocam registros MARC entre si.
A figura 5 mostra a aplicação do padrão MARC 21 à partitura da Ladainha de
Nossa Senhora das Dores, de autoria de José Maurício Nunes Garcia, editada por
Márcio Miranda Pontes, localizada na Biblioteca Nacional do Rio de Janeiro (BNRJ,
2012).
Figura 5. Ficha MARC21 correspondente à partitura da Ladainha de Nossa Senhora das
Dores contida na BNRJ

Conforme apontado na Seção 1, o problema da descrição de partituras envolve


duas questões:
a) quais campos – metadados – utilizar;
b) como preencher os valores dos campos.
O responsável pela catalogação deve selecionar os campos e subcampos MARC
aplicáveis ao recurso. Para o preenchimento dos campos, são geralmente adotadas as
regras AACR2 – Anglo American Cataloguing Rules (AACR2, 2012), que determinam
como preencher campos de nomes e datas, entre outros. As regras AACR2 preconizam
que um campo de nome deve ser preenchido começando pelo sobrenome, seguido de
vírgula, seguido do nome. Os anos de nascimento e falecimento do compositor devem
ser grafados: ano de nascimento, seguido de hífen, seguido do ano de falecimento.
Na Figura 5, consta um único campo referente ao título, que é o Título Principal,
tal como aparece na publicação. O catalogador optou por não utilizar o campo de Título
Uniforme, que, de acordo com AACR2 pode ser empregado:
“[...] para reunir todas as entradas de uma obra, quando aparecerem
apresentações diferentes (por exemplo, edições, traduções) dessa obra
sob vários títulos; para identificar uma obra, quando o título pelo qual é
conhecida difere do título principal do item que está sendo catalogado;
para distinguir entre duas ou mais obras publicadas sob títulos
principais idênticos; para organizar o arquivo.” (CCAA2, 2004, p. 25).

Na área da musicologia, surgiu em 1952 a iniciativa RISM – Repertório


Internacional de Fontes Musicais5 –, projeto de âmbito internacional de coleta de
informações sobre manuscritos musicais (RISM, 2012). A coleta é centralizada por um

5
Do original, em francês, Repertoire Internationale des Sources Musicales.
comitê de redação sediado em Frankfurt, Alemanha, cuja função é normatizar e validar
os metadados enviados pelos órgãos colaboradores, obtidos a partir da análise de
documentos musicais manuscritos. A iniciativa RISM propôs um padrão de catalogação
a ser seguido pelos contribuintes que, por ser voltado para manuscritos musicais,
engloba aspectos específicos de partituras, como o incipit musical utilizado nos
catálogos temáticos.
Embora importante em seu momento de criação, a iniciativa RISM vai de
encontro às tendências atuais, pois, em plena era de cooperação em rede, propõe
concentrar, em uma base única, metadados sobre manuscritos de instituições espalhadas
pelo mundo. Além disso, o padrão RISM não se alinha com os modernos padrões
utilizados na web, com vistas à web semântica.

2.2. Coleções digitais de partituras


Com o aparecimento dos programas de edição de partituras, nos anos 1980,
surgiram as coleções digitais, a exemplo do que já havia ocorrido com os documentos
textuais. A existência de documentos em formato digital e a expansão da web ensejaram
o surgimento das bibliotecas digitais, termo utilizado pela primeira vez em 1988 e que
se consagrou na década de 1990 (LESK, 2004). Uma biblioteca digital é definida como
uma coleção organizada de recursos em formato digital. Da mesma forma que em uma
biblioteca convencional, os recursos são identificados através de metadados descritivos.
Uma das principais vantagens das bibliotecas digitais em comparação às
bibliotecas convencionais consiste na facilidade de acesso através da web que
possibilita o acesso remoto e simultâneo dos usuários aos documentos (POULTER,
1994).
Pode-se distinguir dois tipos de sítios web referentes a coleções de partituras:
• Sítios concentradores de metadados, como o RISM e o CMSRB6, em que o
usuário tem acesso apenas aos metadados descritivos das partituras e é remetido
a outros sítios;
• Sítios de partituras digitais, como o Musica Brasilis, CPDL7, IMSLP8 e SESC
Partituras9, em que o usuário tem acesso tanto aos metadados quanto aos
arquivos digitais das partituras em formato de imagem ou pdf.

6
Catálogo de Publicações de Música Sacra e Religiosa Brasileira, organizado pelo Professor Doutor
Carlos Alberto Figueiredo. Disponível em <http://www.musicasacrabrasileira.com.br>. Acesso em: nov.
2012.
2.2.1. Padrões para a descrição de recursos em formato digital
Com o surgimento dos documentos digitais, tornou-se necessária a criação de
padrões para a descrição dos mesmos. Para atender a este objetivo, foi proposto em
1995 o Dublin Core (DC). Originada por um grupo interdisciplinar de representantes
das áreas de Biblioteconomia, Museologia e Ciência da Computação reunidos em
Dublin, Ohio, Estados Unidos, a iniciativa propõe um conjunto mínimo (em inglês,
core), de quinze elementos descritivos – metadados – para permitir a descrição e
recuperação de recursos digitais na web (DCMI, 2012).
A tabela 1 apresenta os elementos Dublin Core aplicados à edição digital da
Ladainha das Dores de Nossa Senhora de José Mauricio Nunes Garcia, disponível no
sítio Musica Brasilis.

Tabela 1. Elementos Dublin Core para a versão digital da partitura da Ladainha das
Dores de Nossa Senhora, contida no sítio Musica Brasilis
Elemento DC Significado Exemplo de conteúdo
title Título dado ao recurso Ladainha das Dores de Nossa Senhora
creator Autor Garcia, José Maurício Nunes
subject Assuntos Clássico;vocal;ladainha
publisher Responsável pela publicação Musica Brasilis
contributor Colaborador (neste caso, o Monteiro Neto, Antonio Campos
editor)
source Fonte a partir da qual o Manuscrito contido no Acervo do Maestro
recurso foi gerado Vespasiano Gregório dos Santos
date Data da edição 2010
type Natureza ou gênero do Recurso eletrônico
recurso
format Formato do recurso pdf
Identifier URL do recurso http://www.musicabrasilis.org.br/obras/jose-
mauricio-nunes-garcia-ladainha-dores-de-
nossa-senhora-cpm050a/partituras
language Idioma do conteúdo lat
language Idioma do conteúdo por
language Idioma do conteúdo eng

7
Choral Public Domain Library. Disponível em: <http://www.cpdl.org>. Acesso em: nov. 2012.
8
International Music Score Library Project. Disponível em: <http://imslp.org/>. Acesso em: nov. 2012.
9
SESC Partituras. Disponível em <http://www.sesc.com.br/sescpartituras>. Acesso em: nov. 2012.
Quando necessário, pode-se repetir um elemento Dublin Core para comportar
múltiplos valores, como no caso de language, no exemplo acima. O elemento identifier
remete ao URI – Identificador Uniforme de Recursos10. Trata-se de um endereço único
e estável de um recurso na web, que possibilita o apontamento e recuperação de forma
direta, sem obrigar o pesquisador a entrar na página inicial do sítio e procurar pelo
recurso a cada vez que desejar consultá-lo.
As principais características da proposta Dublin Core são:
• Simplicidade na descrição dos recursos – pode ser usado por uma larga
comunidade de usuários que não tenham conhecimento prévio de regras de
catalogação;
• Interoperabilidade;
• Consenso internacional;
• Extensibilidade – pode ser expandido para se adequar a modelos de descrição
mais elaborados ou a requisitos de aplicações específicas, como é o caso da
música.

O Dublin Core tem sido utilizado por agências governamentais e instituições em


vários países nas mais diversas áreas, dentre elas o The MusicBrainz Project11, projeto
que busca definir um conjunto de metadados para a descrição de gravações musicais, e a
base de dados da Biblioteca Digital de Teses e Dissertações da USP12 no Brasil.
É importante ressaltar que o Dublin Core não substitui os padrões de catalogação
utilizados pelas bibliotecas e sim soma-se a eles, quando se trata da versão digital de um
documento. Existe uma correspondência exata de cada elemento Dublin Core com um
campo ou subcampo MARC. Assim, fica assegurado o intercâmbio entre bibliotecas de
uma descrição feita segundo o Dublin Core.

2.2.2. Fidedignidade de recursos digitais


Quando se trata de documentos digitais, há uma preocupação com aspectos de
fidelidade ao original, segurança e validade. Essas questões são enfatizadas pelo
benchmark proposto pela Federação de Bibliotecas (DIGITAL LIBRARY

10
Do original, em inglês, Uniform Resource Identifier.
11
MusicBrainz - The Open Music Encyclopedia. Disponível em: <http://musicbrainz.org>. Acesso em:
nov. 2012.
12
Biblioteca Digital de Teses e Dissertações da USP. Disponível em: <http:// www.teses.usp.br>. Acesso
em: nov. 2012.
FEDERATION, 2012). Segundo o benchmark, um documento digital é uma reprodução
fidedigna se é formatado e descrito para atender aos seguintes requisitos:
• qualidade de reprodução, do ponto de vista de funcionalidade e uso;
• persistência, ou seja, o documento digital é permanentemente acessível;
• interoperabilidade, através de diferentes plataformas e ambientes de software.
Os critérios aplicam-se primordialmente a documentos digitais textuais, mas
podem ser estendidos a partituras em formato digital.
No tocante a coleções digitais de partituras, a persistência não tem sido sempre
assegurada. Exemplos conhecidos da comunidade de Musicologia são:
• os manuscritos musicais do acervo do maestro Vespasiano Gregório dos Santos,
de autores dos séculos XVIII, XIX e início do XX, inicialmente disponíveis
através do sítio <http://www.tmb.uemg.br>, e que podem ser hoje obtidos em
<http://www.editorapontes.com.br/tmb>;
• a Base Minas, desenvolvida pelo Laboratório de Musicologia, da ECA-USP,
sobre manuscritos musicais dos séculos XVIII e XIX, de Minas Gerais, acessível
originalmente através do sítio <http://www.cmu.eca.usp.br/lam/minas/>, e que
não está mais disponível para consultas.
O problema da falta de persistência só seria solucionado por uma política
pública de preservação de documentos digitais, a exemplo do que é feito pela Biblioteca
Nacional de França, que coleta, desde 2006, o conteúdo de todos os sítios franceses
(BNF, 2012). Esta coleta é o análogo do depósito legal, ao qual estão obrigados os
editores de obras impressas ou gravadas. A diferença, neste caso, é que a coleta dos
conteúdos de sítios é feita automaticamente pela Biblioteca Nacional da França e não
depende de ação por parte do “editor” do sítio.

3. Busca e recuperação de partituras em formato digital


O aumento significativo do número de sítios que disponibilizam partituras de
música brasileira através da web, ocorrido nos últimos anos, permitiu um avanço
incontestável no que diz respeito à difusão e ao acesso a esses recursos (COTTA, 2011).
No entanto, essas iniciativas são, na sua maioria, isoladas, sem a preocupação
com o intercâmbio dos dados. Em muitos casos, não se alinham aos padrões que
possibilitariam o aproveitamento pleno das potencialidades oferecidas pela web. Essas
limitações acarretam perda de precisão nas buscas e dificuldades na recuperação das
informações.
Nesta seção, essas questões são discutidas a partir apresentação de um problema-
exemplo: a busca na web da partitura da Ladainha das Dores de Nossa Senhora, de José
Mauricio Nunes Garcia.

3.1. Busca da partitura da Ladainha das Dores de Nossa Senhora


A busca da partitura foi realizada a partir da ferramenta mais popular da web, o
Google <http://www.google.com.br>13, através da submissão de consultas, com as
seguintes palavras-chave:
• partitura ladainha das dores de nossa senhora garcia
• ladainha das dores de nossa senhora garcia
• partitura ladainha dores nossa senhora jose mauricio nunes garcia
• ladainha dores nossa senhora jose mauricio nunes garcia
• partitura cpm 50a jose mauricio nunes garcia
• cpm 50a jose mauricio nunes garcia
• partitura ladainha nossa senhora dores nunes garcia
• ladainha nossa senhora dores nunes garcia
• partitura ladainha nossa senhora nunes garcia
• ladainha nossa senhora nunes garcia
Os resultados obtidos para as consultas foram bastante parecidos. Nas primeiras
posições invariavelmente apareceu o sítio Musica Brasilis. Nas pesquisas sem a palavra-
chave partitura, o sítio Catálogo de Publicações de Música Sacra e Religiosa Brasileira
também figurou sempre entre as primeiras respostas apresentadas14.
Esses resultados podem ser considerados surpreendentemente incompletos. Por
conhecimento prévio, é sabido que outros sítios contem informações a respeito da
referida partitura, dentre os quais: o da Biblioteca Nacional; o do Choral Public Domain
Library (CPDL); o da Editora Pontes (EP) e o sítio José Maurício Nunes Garcia

13
Segundo o relatório Experian Hitwise 2012, o Google, lidera o ranking de buscadores com 90,23% de
participação das buscas realizadas no Brasil. Disponível em: <http://www.experianplc.com>. Acesso em:
nov. 2012.
14
A Ladainha foi encontrada também no sítio Acervo Cleofe Person de Mattos, disponível em
<http://www.acpm.com.br>. No entanto, por ser um sítio sobre o acervo da pesquisadora e não de coleção
de partituras, o mesmo não foi utilizado para fins de comparação.
(JMNG). No entanto, nenhum destes foi apresentado como resultado às consultas
submetidas à ferramenta de busca Google15.
Esta primeira dificuldade revela um aspecto importante das buscas no ambiente
web: os sítios precisariam respeitar os padrões de construção estabelecidos pelo
consórcio W3C, sob a pena de não serem recuperados pelas ferramentas de busca. Este
cenário passa a exigir do pesquisador que conheça previamente todos os sítios que
podem conter o recurso procurado e o obriga a lançar consultas individuais a cada sítio.
Outra dificuldade encontrada em dois dos sítios – Editora Pontes e José
Mauricio Nunes Garcia –, é que estes não possuem mecanismos internos de busca. Isso
obriga o pesquisador a conhecer a estrutura do sítio ou então a “folhear” todo o
conteúdo até encontrar o que deseja.
Metade dos sítios considerados não utiliza o URI para apontar um recurso, o que
obriga o pesquisador a se utilizar da página de busca do sítio para chegar até ele.
A tabela 2 sumariza os sítios onde a Ladainha foi encontrada e algumas
características observadas em cada sítio.

Tabela 2. Características dos sítios


Sítio Endereço Tipo do sítio Localizado Busca URI
pelo Google interna
Biblioteca Nacional www.bn.br Biblioteca não sim não
– BNRJ
Catálogo de www.musicasacrab Concentrador sim sim sim
Publicações de rasileira.com.br de metadados
Música Sacra e
Religiosa Brasileira
– CMSRB
Choral Public www.cpdl.org Partitura sim sim sim
Domain Library – digital
CPDL
Editora Pontes – EP www.editorapontes Partitura não não não
.com.br digital
José Maurício Nunes www.josemauricio. Partitura não não não
Garcia – JMNG com.br/ digital
Musica Brasilis – www.musicabrasili Partitura sim sim sim
MB s.org.br digital

15
A partitura também foi buscada em outros sítios: o do Acervo Musical do Cabido Metropolitano do Rio
de Janeiro, o do Museu de Música de Mariana, o da Biblioteca do Congresso dos Estados Unidos, o da
British Library e o do International Music Score Library Project – IMSLP. Nesses casos não foram
encontradas referências à Ladainha das Dores de Nossa Senhora.
3.2. Padronização como requisito para a recuperação
Na tabela 2, o sítio CPDL é dito “localizável” pelo Google, no entanto, não
retornou resultados para as consultas à Ladainha. Isto aconteceu porque a partitura foi
cadastrada com o título em inglês: Litany for the Sorrows of Our Lady, o que
impossibilita a sua recuperação através de uma busca por palavras-chave em português.
Vê-se aqui um exemplo de como a não utilização do título uniforme impacta
negativamente o acesso a um recurso.
Considerados os dois aspectos da descrição discutidos na seção anterior, a) quais
campos utilizar; e b) como preencher os campos, a tabela 3 ilustra o primeiro aspecto,
apresentando como se denominam os campos utilizados para descrever a Ladainha em
cada um dos sítios. Foram tabulados apenas alguns dos campos disponíveis,
notadamente aqueles que estavam presentes na maior parte dos sítios, o que serve ao
intuito de demonstrar como a falta de padronização se manifesta.

Tabela 3. Nomes de campos (metadados) utilizados em cada sítio


Sítio Autor Título Código Edição Instrumentação Seção
BNRJ Autoria Título n/d Título Título n/d
CMSRB Autor Nome Referên- Editor; Formação n/d
da obra cias Editora
CPDL Composer Title n/d Editor Instruments Movements
EP (sem Título n/d Cópia Partes Seções
metadado)
JMNG (sem Título Nº CPM n/d n/d Movimentos
metadado)
MB Compositor Título Título n/d Partes Movimentos

À exceção do sítio da Biblioteca Nacional, que adota o padrão MARC para


definir os metadados, nenhum outro sítio adota um padrão consagrado para a descrição
dos seus recursos. Cada sítio utiliza um conjunto empírico de metadados para descrever
os conteúdos, conforme seus objetivos internos. O CMSRB, por exemplo, é o único
sítio preocupado com as especificidades de descrição de música sacra e religiosa, ao
prever metadados como Destinação e Unidade, enquanto apenas o sítio da Editora
Pontes contém informações sobre Andamento, Tonalidade e Fórmula de Compasso de
cada seção.
A não adoção de normas de descrição para os valores dos metadados também
resultam numa confusão terminológica. Novamente a exceção é a Biblioteca Nacional,
que segue a norma AACR2 para a descrição de títulos, nomes e datas. A tabela 4 ilustra
o problema.

Tabela 4. Preenchimento dos campos (metadados) em cada sítio


Sítio Autor Título Código Edição Instrumen- Seções
tação
BNRJ Garcia, Ladainha n/d Pesquisa para coro, n/d
José de Nossa e edição: cordas, trompas
Maurício Senhora Márcio e flauta solo =
Nunes das Dores Miranda for choir,
Pontes strings, french
horns and solo
flute
CMSRB GARCIA, Ladainha CPM Pontes, Soprano, n/d
José de Nossa 50a / Márcio Contralto,
Maurício Senhora MIOP Miranda; Tenor, Baixo
Nunes das Dores 254 Editora [coro], Flauta,
Pontes Trompa I-II,
Violino I-II,
Viola,
Violoncelo,
Contrabaixo
CMSRB GARCIA, Ladainha CPM Monteiro Soprano, n/d
José das Dores 50a / Neto, Contralto,
Maurício de Nossa MIOP Antônio Tenor, Baixo
Nunes Senhora 254 Campos; [coro], Flauta,
Choral Clarineta,
Public Trompa I-II,
Domain Violino I-II,
Library Viola,
(CPDL) Violoncelo
CPDL José Litany for n/d Antonio Flute, clarinet, Kyrie Eleison;
Maurício the Campos trumpets, Pater de Coelis;
Nunes Sorrows of Monteiro strings Mater Angustiis;
Garcia Our Lady Neto Turtur Gemibunda;
Rupes Constantiae;
Portus
Naufragantium;
Magistra
Apostolorum; Ab
Omni Malo; Per
Lugubrem
Corporis; Filia
Dei; Agnus Dei
EP Jose Ladainha n/d Cópia: s; a; t; b; v1; Kyrie eleison; Fili
Mauricio de N. S. Santos, v2; va; vc; cb; redemptor; Mater
Nunes das Dores Vespasia fl; cl; cr 1 e 2; Augustiis; Tur
Garcia no tp 1; tp2; tn gemibunda; Rupris
Augusto constandi;
dos Belo Magistra
Horizont apostolorum; Per
e lugubrem corporis;
Agnus Dei
JMNG José Ladainha 50a n/d n/d Kyrie Eleison;
Maurício das Dores Pater de Coelis;
Nunes de N. Sr.ª Mater Angustiis;
Garcia Turtur Gemibunda;
Rupes Constantiae;
Portus
Naufragantium;
Magistra
Apostolorum; Ab
Omni Malo; Per
Lugubrem
Corporis; Filia
Dei; Agnus Dei
MB José Ladainha CPM Antônio Clarineta; Coro Ab Omni Malo
Mauricio das Dores 50a Campos (SATB); Libera nos
Nunes de Nossa Flauta; Domine; Agnus
Garcia Senhora Trompas; Dei; Filia Dei;
Viola; Kyrie Eleison;
Violinos; Magistra
Violoncelo / Apostolorum;
Contrabaixo Mater Angustiis;
Pater de Coelis;
Per Lugubrem
Corporis; Portus
Naufragantium;
Rupes Constantiae;
Turtur Gemibunda

A primeira constatação é que existem duas publicações distintas relativas à


mesma obra, e com títulos diferentes: Ladainha das Dores de Nossa Senhora e
Ladainha de Nossa Senhora das Dores. O único sítio que reflete esta questão é o
CMSRB, uma vez que os demais abordam apenas uma das publicações. Ainda em
relação ao título, além do já mencionado problema da tradução para o inglês no sítio
CPDL, observa-se a falta de padronização na grafia e o uso de abreviaturas de forma
não consistente entre os sítios (N. S. das Dores e Dores de N. Sr.ª).
Também é representativa a falta de padronização das informações relativas à
edição, à formação instrumental e às seções da obra: não há sequer dois sítios que
descrevam essas informações da mesma forma.
Somente um pesquisador conhecedor da terminologia empregada na área
musical é capaz de fazer as relações que identificam, por exemplo, que s, a, t, b nas
informações sobre Partes do sítio da Editora Pontes equivale a soprano, contralto, tenor
e baixo no campo Formação utilizado pelo CMSRB. Um computador não é capaz de
realizar esses cruzamentos dos dados obtidos nos vários sítios de forma automática.
Portanto, além de ser um aspecto necessário para permitir a correta recuperação
da informação, a padronização é um aspecto imprescindível para a consecução da
interoperabilidade.

3.3. Iniciativas para a interoperabilidade na web


Os sítios que contêm as partituras digitais da Ladainha provem arquivos digitais
diferentes. Um pesquisador interessado em todos os arquivos digitais ou em algum
específico possivelmente precisará percorrer todos os sítios até obter os resultados
desejados. A tabela 5 sumariza os conteúdos digitais oferecidos pelos sítios provedores
de partituras.

Tabela 5. Recursos de partituras digitais


Sítio Partitura completa Seções disponíveis Partes
disponível disponíveis
Choral Public Domain sim, editorada sim, editoradas não
Library – CPDL
Editora Pontes – EP sim, manuscrita sim, manuscritas sim, manuscritas
José Maurício Nunes não sim, editoradas não
Garcia – JMNG
Musica Brasilis – MB sim, editorada sim, editoradas sim, editoradas

Embora sejam provedores de conteúdos complementares, nenhum dos sítios


mencionados interopera com outros.
Mesmo o mais trivial e antigo dos mecanismos de integração existentes na web,
o hyperlink, só é utilizado pelo sítio CPDL, que aponta para o sítio da Editora Pontes,
onde estão os manuscritos digitalizados16. O Catálogo de Música Sacra e Religiosa

16
O Musica Brasilis compartilha recursos com o sítio SESC Partituras através do apontamento mútuo de
hyperlinks, no entanto, a Ladainha das Dores de Nossa Senhora não está incluída neste “intercâmbio”.
Brasileira apresenta referências textuais para os sítios da Editora Pontes e do CPDL,
mas não através de hyperlinks.
É de se notar, portanto, que apesar de todos os sítios estarem disponíveis na web
e serem complementares, eles permanecem isolados, não compartilhando dados nem
trocando recursos uns com os outros. Nem mesmo o sítio CMSRB, o único a considerar
as duas edições da Ladainha, promove a integração direta com as versões digitais dessas
publicações. As iniciativas centralizadoras, aliás, ao partirem do pressuposto de abrigar
todos os conteúdos existentes, vão de encontro ao princípio da interoperabilidade na
web, que se baseia na comunicação entre as múltiplas soluções distribuídas na rede.
Uma das principais iniciativas a se ocupar do propósito da interoperabilidade na
web foi o OAI-PMH – Protocolo para Coleta de Metadados, da Iniciativa Arquivos
Abertos17 (OAI-PMH, 2012).
Lançado em 2001, e atualmente na versão 2.0, o OAI-PMH tem por objetivo
agregar os descritores das várias fontes afiliadas à iniciativa e permitir uma busca
integrada. Cada instituição interessada em participar do projeto deve descrever os seus
recursos utilizando o padrão Dublin Core e cadastrar-se para que os descritores sejam
coletados regularmente pelo serviço de coleta – harvester – e passem, deste modo, a
fazer parte da base de dados central do serviço. A partir deste momento, qualquer
consulta lançada a este serviço central será respondida com base nos dados coletados de
todos os sítios afiliados. A figura 6 ilustra o funcionamento do OAI-PMH.

Figura 6. Funcionamento do OAI-PMH

17
Do original, em inglês, Open Archives Initiative - Protocol for Metadata Harvesting.
Apesar de oficialmente ainda estar em curso, o projeto OAI-PMH não é
atualizado desde 2008 e vem perdendo espaço como solução para o problema da
interoperabilidade na web por dois motivos principais:
• Embora resolva tecnicamente o problema, na prática o serviço é uma
proposta centralizadora que parte do princípio de uma base única que contem
as descrições em formato Dublin Core. A adesão a propostas centralizadoras
vai de encontro às atuais tendências de cooperação em rede, o que gera
resultados parciais e não satisfaz, de forma automática, a necessidade de
intercomplementaridade.
• O segundo motivo é que a iniciativa não resolve inteiramente o problema da
padronização das descrições. Ao estabelecer o Dublin Core como padrão de
metadados, o OAI-PMH resolve parte do problema, mas não dá conta do
modelo de catalogação. No breve exemplo a respeito da catalogação da
Ladainha, percebe-se a dificuldade em encontrar um título uniforme ou um
consenso acerca das informações sobre editor ou formação instrumental.
Portanto, mesmo que os metadados (quais campos) sejam padronizados, o
modelo de catalogação utilizado para descrever os recursos (como
preencher) também precisaria ser uniformizado para que as buscas
automáticas pudessem ser realizadas de forma satisfatória.

A informação na web é, por natureza, distribuída e sempre haverá múltiplas


iniciativas tratando do mesmo assunto, o que inviabiliza soluções centralizadoras. Mais
ainda, cada uma das iniciativas provavelmente descreve os recursos de forma diferente
das demais, conforme ilustrado no presente trabalho. O caminho, portanto, seria buscar
meios para que as diferentes formas de descrição possam ser processadas pelo
computador, de forma a possibilitar o cruzamento entre as múltiplas fontes, como um
ser humano é capaz de fazer. Essa é a proposta da web semântica, que busca explicitar a
semântica existente nas descrições dos recursos.

4. Web semântica
O conceito da web semântica surgiu da constatação feita pelo próprio criador da
web, Tim Berners-Lee, de que a web é incompleta, pois as informações nela existentes
não são exatas nem processáveis por computadores (BERNERS-LEE e FISCHETTI,
2001).
A partir desta constatação, foi criado um projeto de grande escala, capitaneado
pelo consórcio W3C, que tem por objetivo a proposta de padrões para se atingir a web
semântica (também chamada de web 3.0), baseado nos seguintes princípios:
• A informação existente na web deve ter significado exato;
• A informação existente na web deve ser processável por computadores;
• Os computadores devem poder integrar de forma automática a informação
oriunda da web. (SEMANTIC WEB, 2012).

A web semântica é implantada por uma arquitetura em camadas, conforme


ilustra a figura a seguir 7.

Figura 7. Arquitetura da web semântica

A camada estrutural diz respeito à identificação dos recursos. Um recurso deve


ser persistente e univocamente identificado através de seu URI. No exemplo da partitura
da Ladainha das Dores de Nossa Senhora, de José Maurício, existente no sítio Musica
Brasilis, o URI é http://www.musicabrasilis.org.br/obras/jose-mauricio-nunes-garcia-
ladainha-dores-de-nossa-senhora-cpm050a/partituras.
A camada sintática diz respeito à descrição dos recursos utilizando padrões de
metadados, como o exemplo apresentado na Tabela 1.
As camadas estrutural e sintática resolvem o primeiro princípio da web
semântica: o de garantir que a informação existente na web tenha um significado exato.
A camada semântica, por sua vez, é a responsável por fazer com que a
informação existente na web seja processável por computadores. Nela são definidos os
níveis de relacionamento entre os vocabulários.
A camada lógica se ocupa do terceiro e último princípio da web semântica,
tendo por objetivo permitir a criação de motores de busca que sejam capazes, não
apenas de recuperar informações declaradas de forma explícita, mas também de inferir
novas informações a partir dos relacionamentos entre os conteúdos. Isso é feito com
base em regras lógicas, o que torna os computadores capazes de realizar os cruzamentos
das informações oriundas da web, como o ser humano é capaz de fazer ao se deparar
com novos conteúdos.
Por fim, a camada de confiança, é a camada que tem por objetivo definir
mecanismos de garantia da confiabilidade das inferências realizadas na camada lógica,
evitando os sofismas e as inferências ambíguas.
Nas seções anteriores foram discutidos os aspectos relacionados às camadas
estrutural e sintática. A seguir, serão focalizadas as camadas semântica e lógica,
apresentando os padrões definidos pelo consórcio W3C com o objetivo de alcançar a
interoperabilidade na web.

4.1 Semântica e regras na descrição dos recursos


A descrição semântica dos conteúdos na web se dá através da criação de uma
nova camada sobre os dados já existentes. Essa é uma característica importante da web
semântica: ela não exige que as instituições refaçam a catalogação dos seus recursos
nem que reconstruam os seus sítios. A web semântica aproveita as estruturas e os dados
já existentes (desde que estejam em conformidade com as normas de descrição de
recursos na web) e é capaz de torná-los interoperáveis a partir da adição de uma camada
de descrição.
Essa descrição é realizada em três níveis de profundidade, conforme ilustra a
figura 8.
Figura 8. Níveis de descrição na web semântica

4.1.1 XML – Linguagem de Marcação Extensível18


Devido à sua capacidade de representar sintaticamente e de forma flexível uma
grande variedade de informações, a linguagem XML converteu-se em um padrão
internacional para o intercâmbio de dados em formato digital (ROLAND, 2000).
O projeto MusicXML (GOOD, 2001), no qual a XML é utilizada para acomodar
informações de partituras musicais, é um exemplo de sua flexibilidade e alta capacidade
expressiva. A MusicXML é compatível com as principais ferramentas de edição de
partituras, tais como Finale e Sibelius e tornou-se um formato de representação e
intercâmbio de dados musicais.
Como representado na figura 8, a XML é a base para as demais propostas da
web semântica. Através dela é possível representar qualquer conjunto de dados,
organizando-o de forma hierárquica e atribuindo-lhe uma estrutura consistente através
da representação através de pares “atributo  valor”.
A figura 9 apresenta um exemplo de representação visual da descrição em XML
dos atributos título e compositor de uma obra.

Figura 9. Representação visual de uma descrição em XML

18
Do original, em inglês, eXtensible Markup Language.
4.1.2 RDF – Estrutura para Descrição de Recursos19
O nível seguinte da arquitetura da web semântica é o RDF. Ele consiste de uma
estrutura de dados baseada na XML, mas com uma diferença importante: enquanto a
XML define a estrutura dos dados na forma “atributo  valor”, o RDF as declara na
forma “sujeito  predicado  objeto”.
Os sujeitos são os elementos que se deseja descrever, como, por exemplo, Obra,
Compositor, Instrumento. Os objetos são os elementos que contêm os valores das
descrições, como Nome, Título etc. Os predicados são as relações entre sujeitos e
objetos, como é composta por, possui, é parte de etc.
A figura 10 apresenta um exemplo de representação visual da descrição de
compositor e título de uma obra, usando o RDF.

Figura 10. Representação visual de uma descrição em RDF

Esta característica do RDF, de descrever usando triplas, aumenta a


expressividade das representações uma vez que os objetos podem ser sujeitos em outros
predicados, o que permite a criação de uma rede de significados com semântica. No
exemplo da Figura 10, Compositor é o sujeito na relação Compositor possui Nome ao
mesmo tempo em que é objeto na relação Obra é composta por Compositor.
As relações permitidas entre os sujeitos, predicados e objetos são definidas no
RDF Schema, o que impede a criação de declarações inválidas como Instrumento é
compositor de Obra, por exemplo.
Sujeitos e objetos são valorados a partir da criação de instâncias, por exemplo,
José Mauricio Nunes Garcia é uma instância de Compositor; Flauta é uma instância de
Instrumento. A figura 11 apresenta um exemplo de representação visual da descrição
em RDF considerando o uso de instâncias.

19
Do original, em inglês, Resource Description Framework.
Figura 11 Representação visual de uma descrição em RDF com instâncias

4.1.3 OWL – Linguagem de Ontologia para Web20


O nível mais alto de descrição da web semântica é a OWL. A OWL utiliza a
mesma estrutura do RDF para descrever os conteúdos, mas adiciona a ela um nível de
regras lógicas, visando a atender às necessidades de inferência para a integração
automática. A essa estrutura de representação semântica foi dada, na Ciência da
Computação, a denominação de ontologia.
Com a utilização de uma ontologia é possível criar uma representação, sob o
ponto de vista lógico, do modo como os usuários humanos constroem os
relacionamentos entre predicados e objetos. A seguir são apresentadas algumas
propriedades lógicas disponíveis na linguagem OWL, contextualizadas ao exemplo da
descrição da Ladainha.
• A propriedade Inversa permite fazer declarações tais como: toda vez que
houver um predicado é composta por relacionando Obra e Compositor
haverá outro predicado é o compositor de relacionando Compositor e Obra.
• A propriedade Funcional permite declarar que o valor de um predicado para
aquele sujeito é único, identificando-o funcionalmente. Por exemplo: cada
relação entre Obra e Edição caracteriza uma instância de publicação. Se
houver mais de uma edição para uma mesma obra, são publicações
diferentes, como no caso das edições da Ladainha feitas por Antônio
Campos Monteiro Neto e Márcio Miranda Pontes.

20
Do original, em inglês, Web Ontology Language.
• A propriedade Equivalente permite estabelecer que dois ou mais sujeitos são
equivalentes. A definição dessa propriedade resolve o problema de sítios
distintos usarem metadados diferentes para se referirem ao mesmo conteúdo.
É possível estabelecer que Compositor no contexto do Musica Brasilis é
equivalente a Autor no contexto do CMSRB. A propriedade Equivalente
aplica-se também para as instâncias, permitindo identificar, por exemplo,
que uma instância nomeada Ladainha das Dores de Nossa Senhora é
equivalente a Ladainha das Dores de N. Sra..
• A propriedade Transitiva permite declarar que uma propriedade se aplica a
todos os sujeitos que compõem uma hierarquia. Por exemplo: ao definir que
uma Obra é composta de Seções e que a propriedade Edições de uma Obra é
transitiva, isso significa, automaticamente, que uma Edição também conterá
Seções.

Os três níveis – XML, RDF e OWL – são complementares e compatíveis entre


si. Isso quer dizer que os dados descritos sintaticamente em XML podem ser estendidos
usando o framework RDF de forma a passarem a ter sua semântica descrita de forma
explícita. Da mesma forma, dados descritos em RDF podem receber informações sobre
as regras lógicas e passarem a compor uma ontologia OWL, que é o nível mais alto para
atingir a interoperabilidade na web semântica.

4.2 Interoperabilidade na web semântica


Sendo a interoperabilidade um dos principais objetivos da web semântica,
algumas iniciativas começam a se destacar neste sentido.
Uma delas é a OAI-ORE – Reuso e Intercâmbio de Objetos, da Iniciativa
Arquivos Abertos21 (OAI-ORE, 2012). Essa iniciativa, embora transcorra em paralelo,
pode ser entendida como a substituta natural da OAI-PMH abordada na seção 3.
A OAI-ORE consiste em um agregador de recursos descritos semanticamente
usando RDF. Uma mudança importante em relação ao OAI-PMH é o entendimento da
inviabilidade de centralizar as descrições dos recursos. Enquanto o OAI-PMH baseava-
se na coleta de metadados dos sítios afiliados, o OAI-ORE propõe que, a partir do

21
Do original, em inglês, Open Archives Initiative Object Reuse and Exchange.
mapeamento dos sítios que oferecem recursos, os próprios sítios contenham e ofereçam
a descrição semântica dos seus recursos em RDF.
No entanto, ainda há resquícios de um pensamento centralizador nesta proposta,
uma vez que o mapeamento dos sítios é feito através de um modelo específico, RMD –
Mapa de Descoberta de Recursos22 –, que espera uma descrição padronizada em Dublin
Core dos recursos e exige que as iniciativas afiliadas adotem o modelo proposto.
Uma iniciativa mais abrangente é o grupo de trabalho LDP – Plataforma de
Dados Interligados23, organizado pela W3C (W3C LDP, 2012) com o objetivo de
definir padrões aplicáveis e reutilizáveis à descrição dos recursos disponíveis na web.
Ao contrário das iniciativas OAI, ao invés de propor um padrão que deve ser seguido
por todos os participantes, a LDP não impõe um padrão e possibilita a conversão dos
diferentes padrões usados por cada iniciativa. Isso é feito a partir do mapeamento dos
metadados, assegurando-se a correspondência semântica.
Em um futuro breve, as buscas realizadas na web consultarão as descrições
distribuídas pelos diversos sítios e serão respondidas a partir dos cruzamentos das
informações, mesmo que estas estejam (e certamente estarão) descritas em formatos
diferentes.

4.3 Iniciativas para a web semântica no âmbito musical


Na área musical, a principal iniciativa relacionada à definição de um modelo
semântico é a MusicOntology (RAIMOND et al, 2007). Destinada especificamente à
descrição de fonogramas, artistas e álbuns, é parte importante do projeto DBTune
(DBTUNE, 2012).
No momento da elaboração deste trabalho, o DBTune é a única iniciativa do
âmbito musical integrante do Grupo de Trabalho LDP. A proposta do DBTune é mapear
semanticamente os registros de fonogramas e álbuns das coleções dos sítios MySpace,
MusicBrainz e rádio da BBC.
Não foram encontradas iniciativas similares destinadas à descrição de outros
recursos musicais, como partituras, nem tampouco modelos e padrões preocupados com
a descrição de características específicas de conteúdos musicais, como instrumentação,
tonalidade e compasso.

22
Do original, em inglês, Resource Map Discovery
23
Do original, em inglês, Linked Data Platform Working Group.
5. Conclusão
Ao longo deste trabalho, foram discutidas questões relativas à descrição de
partituras com vistas à recuperação. Do estágio inicial, da busca em arquivos e
bibliotecas, o problema evoluiu para a busca na web, o que implica em maior
complexidade no tocante à descrição. A pesquisa em bibliotecas, guiada por padrões
propostos pela Ciência da Informação, fica circunscrita a uma única instituição,
enquanto que, idealmente, a pesquisa na web deveria ser respondida por todos os sítios
que contem instâncias do recurso buscado, conforme ilustra a Figura 12.

Figura 12. Alcance das buscas na web

Percebendo a necessidade de concentrar em um único local as informações de


vários sítios, surgiram as iniciativas centralizadoras, como o RISM e o CMSRB.
Embora prestem um serviço inestimável, essas soluções vão de encontro às recentes
tendências de descentralização devido à dificuldade de se manterem atualizadas frente à
multiplicação de sítios e conteúdos disponíveis na internet.
O projeto RISM, criado em 1952, tinha o propósito de ser:
“[...] um projeto o mais exaustivo possível, que abarcasse todas as
fontes musicais históricas existentes no mundo, com vistas a solucionar
de uma vez por todas o problema do conhecimento o mais exato possível
das fontes” (RISM, 1996, p. 10).

No momento de sua criação, anterior à internet, o RISM tratava o propósito de


cooperação em rede com a única abordagem viável: a da centralização dos metadados.
Atualmente, com a conectividade através da internet, a acuidade das iniciativas
centralizadoras é ameaçada pela volatilidade e pela inevitável obsolescência dos dados
(LÉVY, 1996).
Para atingir a interoperabilidade dentro do contexto da web, é necessário que os
vários sítios que contem recursos digitais cooperem entre si, o que só é viável se dois
requisitos forem atendidos:
a) A descrição dos recursos deve ser feita segundo padrões de metadados;
b) O sítio deve ser dotado de uma camada que exporte os metadados de forma a
explicitar a semântica da sua estrutura interna.
No tocante à questão “a”, dentre todas as iniciativas mencionadas, apenas a
Biblioteca Nacional utiliza um padrão internacionalmente consagrado – o MARC –,
embora as outras iniciativas utilizem um modelo interno consistente, ou seja: definem
um conjunto de metadados e o utilizam para descrever os seus recursos de maneira
uniforme.
O alinhamento com padrões web aponta para aqueles propostos pelo consórcio
W3C, principalmente o padrão RDF e a linguagem OWL. Atualmente, nenhuma das
iniciativas mencionadas no escopo desse artigo atende ao requisito “b”.
No âmbito do projeto Musica Brasilis, busca-se ambas as metas. No que se
refere aos metadados, por não se tratar de uma biblioteca, as partituras são descritas
seguindo um conjunto de metadados que guarda uma correspondência com padrões
como o MARC e o Dublin Core. Cada partitura do Musica Brasilis é univocamente
identificada por um endereço – o URI – o que faz com que possa ser apontada por
outros sítios. Uma vantagem subjacente é que a busca Google pelo título de uma obra
atinge, quase sempre, páginas de partituras do Musica Brasilis.
Tudo indica que o Google em breve incorporará aspectos da web semântica
(EFRATI, 2012). O Musica Brasilis busca desde já o alinhamento com o padrão RDF,
visando a atingir a interoperabilidade com outros sítios detentores de partituras, de
forma a assegurar o maior alcance possível dos repertórios brasileiros.

Referências Bibliográficas
BALLESTÉ, Adriana Olinto; ABREU JUNIOR, Jupiter Martins; LANZELOTTE,
Rosana. Biblioteca Digital para a coleção de lundus do acervo Mozart de Araújo
In: XVI Congresso da Associaçao Nacional de Pesquisa e Pos-Graduaçao em
Musica - ANPPOM, Anais. Brasília, 2006.
BERNERS-LEE, Tim; FISCHETTI, Mark. Weaving the Web: The original design and
ultimate destiny of the World Wide Web by its inventor. DIANE Publishing
Company, 2001.
BERNERS-LEE, Tim,;HENDLER, James; LASSILA, Ora. The semantic web.
Scientific american, v. 284, n. 5, p.28-37, 2001.
BNRJ. Biblioteca Nacional. Disponível em: <http://www.bn.br>. Acesso em: nov.
2012.
BNF. Bibliothèque nationale de France – Digital Legal Deposit. Disponível em:
<http://www.bnf.fr/en/professionals/digital_legal_deposit.html>. Acesso em: nov.
2012.
CAA2. Código de Catalogação Anglo Americano. Preparado sob a direção do Joint
Steering Commitee for Revision of AACR. – ed. 2. rev. 2002. São Paulo:
FEBAB, 2004.
CASTAGNA, Paulo. Níveis de organização na música religiosa católica dos séculos
XVIII e XIX: implicações arquivísticas e editoriais. In: I Colóquio Brasileiro De
Arquivologia E Edição Musical. Anais. Mariana: Fundação Cultural e
Educacional da Arquidiocese de Mariana, p.79-104, 2004.
COTTA, André Guerra. Novas considerações sobre o acesso ao Patrimônio Musical no
Brasil. Liinc em Revista, v. 7, n. 2, p.466-484, 2011.
DE SANTIS, Rodrigo; FERREIRA, Tiago. Dspace para a implantação de bibliotecas
digitais – aplicação a uma coleção de recursos musicais. In: SEMINÁRIO
INTERNACIONAL DE BIBLIOTECAS DIGITAIS BRASIL - SIBDB. Anais.
São Paulo: Biblioteca Digital da UNICAMP, 2007.
DBTUNE – Music-Related RDF. Disponível em: <http://www.dbtune.org/>. Acesso
em: nov. 2012.
DCMI. Dublin Core Metadata Initiative. Disponível em: <http://www.dublincore.org>.
Acesso em: nov. 2012.
DIGITAL LIBRARY FEDERATION. Benchmark for Faithful Digital Reproductions of
Monographs and Serials. Disponível em:
<http://www.diglib.org/standards/bmarkfin.htm>. Acesso em: nov. 2012.
DOWNIE, J. Stephen. Music information retrieval annotated bibliography website
project, phase I. In: J. S. Downie and D. Bainbridge (Eds.), Proceedings of the
Second Annual International Symposium on Music Information Retrieval: ISMIR,
2001.
EFRATI, Amir. Google gives search a refresh. Wall Street Journal, Nova Iorque, 15
mar. 2012. Disponível em
<http://online.wsj.com/article_email/SB1000142405270230445980457728184285
1136290-lMyQjAxMTAyMDIwNzEyNDcyWj.html>. Acesso em: nov. 2012.
GOOD, Michael. MusicXML for notation and analysis. The virtual score:
representation, retrieval, restoration. pp. 113-124, 2001.
ICA – International Council of Archives. Disponível em:
<http://www.ica.org/10207/standards/>. Acesso em: nov. 2012.
LESK, Michael. Understanding Digital Libraries. The Morgan Kaufmann Series in
Multimedia Information and Systems, Elsevier, 2004.
LANZELOTTE, Rosana; BALLESTÉ, Adriana Olinto. Modelos de dados para
Catálogos Temáticos In: VI Encontro de Musicologia Histórica Brasileira, 2006,
Juiz de Fora. Anais. Juiz de Fora: Centro Cultural Pró-Musica, p.362-375. 2006.
LANZELOTTE, Rosana; ULHOA, Martha Tupinambá; BALLESTÉ, Adriana Olinto.
Sistemas de Informações Musicais - disponibilização de acervos musicais via
Web. OPUS - Revista da Associação Nacional de Pesquisa e Pós-graduação em
Música - ANPPOM. v.10, pp.7-15, 2004.
LÉVY, Pierre. As tecnologias da inteligência. O futuro do pensamento na era da
informática. São Paulo: Editora 34, 1996.
MARC. Machine-Readable Cataloguing. Disponível em: <http://www.loc.gov/marc>.
Acesso em: nov. 2012.
MUSICA BRASILIS. Disponível em: <http://www.musicabrasilis.org.br>. Acesso em:
nov. 2012.
NEVES, José Maria. Arquivos de manuscritos musicais brasileiros: breve panorama.
Recuperação e propostas para uma sistematização latino-americana. Anais. I
Simpósio Latino-Americano de Musicologia. Curitiba: Fundação Cultural de
Curitiba, p.137-163, 1998.
OAI-ORE. Open Archives Initiative Object Reuse and Exchange. Disponível em:
<http://www.openarchives.org/pmh/>. Acesso em: nov. 2012.
OAI-PMH. Open Archives Initiative – Protocol for Metadata Harvesting. Disponível
em: <http://www.openarchives.org/ore>. Acesso em: nov. 2012.
POULTER, Alan. Building a browsable virtual library. Anais. Aslib, vol. 46, no. 6, pp.
151-155. MCB UP Ltd, 1994.
RAIMOND, Yves, ABDALLAH, Samer, SANDLER, Mark, GIASSON, Frederick. The
music ontology. Anais. International Conference on Music Information Retrieval,
pp. 417-422. 2007.
RISM. Répertoire International des Sources Musicales. Disponível em:
<http://www.rism.info>. Acesso em: nov. 2012.
RISM – Répertoire International des Sources Musicales. Normas Internacionales para
la catalogación de fuentes musicales históricas. Tradução espanhola e
comentários: José V. González Valle, Antonio Ezquerro, Nieves Iglesias. Madrid:
Arco/Libros, 1996.
ROLAND, Perry. XML4MIR: Extensible markup language for music information
retrieval. Anais. International Conference on Music Information Retrieval 2000,
2000.
SEMANTIC WEB. Disponível em: <http://www.w3.org/standards/semanticweb/>.
Acesso em: nov. 2012.
STANECK, José; LANZELOTTE, Rosana. Padrões de interoperabilidade para a
difusão de recursos musicais. In: XVII Congresso da Associação Nacional de
Pesquisa e Pós-Graduação em Música - ANPPOM, Anais. São Paulo, 2007.
W3C. World Wide Web Consortium. Disponível em: <http://www.w3c.org>. Acesso
em: nov. 2012.
W3C LDP. Linked Data Platform (LDP) Working Group. Disponível em:
<www.w3.org/2012/ldp/>. Acesso em: nov. 2012.

Das könnte Ihnen auch gefallen