o semestre 2006 Docente: ristina Dotta !rte"a UMA TEORIA DOS SISTEMAS DE RECUPERAO DA INFORMAO Um sistema de recuperao de in#ormao $SRI% pode ser de#inido como um con&unto de dados padroni'ados( arma'enados em meio eletr)nico( utili'ados para identi#icar in#ormao e #ornecer sua locali'ao* Dito de outro modo( a meta de um sistema de in#ormao + permitir ,ue um usu-rio recupere documentos atrav+s de certas caracter.sticas espec.#icas $por autor( t.tulo con/ecido( assunto ou ,ual,uer combinao desses elementos%* 0 maneira mais prim-ria de conse"uir in#ormao contida em documentos + inspecionar todos os documentos( um a um( at+ ,ue se&am encontrados todos os documentos com as in#orma1es dese&adas* Uma maneira mais e#iciente de encontrar a in#ormao + consultar sistemas ,ue conten/am substitutos de documentos* Portanto( so necess-rias opera1es de #abricao desses substitutos( ou se&a( #abricao de representa1es( ,uais se&am( as informaes documentrias* 2sses substitutos listam as caracter.sticas atrav+s das ,uais os documentos podem ser procurados e so arran&ados de tal #orma ,ue todas e cada uma destas caracter.sticas possam ser e3aminadas individualmente ou em ,ual,uer combinao dese&ada* 2sse procedimento consiste em dividir o universo de documentos em subunidades administr-veis* 0ssim( um sistema de in#ormao no trata necessariamente de documentos reais( nem se preocupa com sua transmisso #.sica ao usu-rio* $2mbora esta atividade se&a poss.vel /o&e com os lin4s aos documentos eletr)nicos%* !s documentos #.sicos so arma'enados e relacionados aos substitutos por meio de uma subrotina do sistema ou so colocados em uma instituio de arma'ena"em de documentos* Portanto( um sistema de in#ormao tem uma sa.da S( ,ue consistir- em uma lista ordenada de substitutos de documentos ,ue satis#aam as se"uintes condi1es: 5* !s substitutos dos documentos devem identi#icar cada documento de maneira 6nica $por meio da descrio biblio"r-#ica%* 2* !s substitutos devem ser re"istrados por s.mbolos ,ue se&am con/ecidos tanto pelos operadores ,uanto pelos usu-rios do sistema* 7* !s substitutos dos documentos devem ser ordenados em se,89ncia universalmente con/ecida( como: al#ab+tica( num+rica( al#anum+rica $por meio da elaborao dos pontos de acesso( os ,uais #ormam os .ndices%* 5 :* Se nen/um documento novo + colocado no sistema( este manter-se-- em estado de e,uil.brio( pois nada perturbar- o arran&o dos substitutos dos documentos nos v-rios ar,uivos mantidos no sistema* Processos t.picos de um sistema de in#ormao: a% #uno descritiva orientada a para #orma #.sica e identi#icao do documento $catalo"ao% b% #uno descritiva orientada para o conte6do $inde3ao( classi#icao( condensao% c% transcrio dos dados descritivos em um substituto do documento $representao% d% arran&o se,8encial destas representa1es e% #uno de e3plorao do sistema Dessas #un1es( a #uno descritiva orientada para a #orma #.sica e para a identi#icao do documento( a transcrio dos dados $representao% e o arran&o podem ser submetidos a pleno controle( "overnado por re"ras aplic-veis de maneira "en+rica* 0 #uno de descrio orientada para o conte6do e a #uno de e3plorao no so inteiramente control-veis* Dessa maneira( pode-se a#irmar ,ue /- limites na recuperao da in#ormao* Recuperao da informao ! conceito de recuperao da in#ormao est- relacionado ao conceito de controle biblio"r-#ico* ! termo controle biblio"r-#ico( se"undo ;ellisc/( #oi introdu'ido na -rea em 5<:<( por 2"an e S/era( no arti"o =Prole"omena to biblio"rap/ic control>* ! termo no #oi de#inido #ormalmente( mas caracteri'ado operacionalmente en,uanto processo ,ue proporciona acessibilidade ao conte6do do documento e acessibilidade #.sica ao mesmo* 2"an e S/era procuraram substituir o termo =controle> por =or"ani'ao>( temendo uma indese&-vel associao com censura* Por+m( o termo #i3ado #oi =controle>* ! termo #oi #ormalmente de#inido pela U?2S! e pela @ibrarA o# on"ress como o dom.nio sobre os re"istros escritos e publicados( suprido pela Biblio"ra#ia $cu&a iniciativa pioneira se deve a !tlet por meio do RepertBrio Biblio"r-#ico Universal-RBU%* 2m 5<6C( ;ilson distin"uiu o controle descritivo $caracter.sticas #ormais do documento% do controle tem-tico* 0o #a'er tal distino( a#irma ,ue( pelo menos em teoria( o controle descritivo pode ser #eito de maneira completa( mas somente de #orma parcial no dom.nio do conte6do* ?o entanto( /- pessoas ,ue acreditam ,ue( tendo instrumentos de controle potentes( seria poss.vel a reali'ao do controle completo* 0#irma-se ,ue o controle completo dependeria apenas da utili'ao de computadores cada ve' mais potentes e r-pidos( dotados de inteli"9ncia( portanto com /abilidade para recon/ecer si"ni#icados em conte3tos* 2 0 mel/or compreenso da nature'a dos elementos descritivos dos documentos( os r-pidos pro"ressos da tecnolo"ia da comunicao e a cooperao internacional( tem tornado vi-vel a obteno do controle descritivo de ,ual,uer documento* ?esse sentido( em 5<D5( o ontrole Biblio"r-#ico Universal $BU%( um termo cun/ado por EaltFasser( #oi adotado pela GI0B $Gederao Internacional de 0ssocia1es de Bibliotec-rios%( como pol.tica o#icial* ! ob&etivo do BU era o de tornar universal e imediatamente dispon.vel( numa #orma internacionalmente aceit-vel( os dados biblio"r-#icos b-sicos de todas as publica1es editadas em todos os pa.ses* 0 id+ia de controle biblio"r-#ico certamente no + nova* H- na Renascena( onrad Iesner $considerado o pai da Biblio"ra#ia%( tentou em sua #amosa =Bibliot/eca Universalis>( publicado em 5J:J( listar os trabal/os de =todos os autores contemporKneos e passados( anti"os e novos( eruditos e populares( publicados e depositados em bibliotecas>* Por+m( mesmo na +poca de Iessner( ,uando o n6mero de trabal/os era relativamente pe,ueno( se comparado com o presente( essa meta se revelou en"anosa* ?o era poss.vel no sB listar descritivamente tudo( como era ainda menos poss.vel e3plorar seu conte6do tem-tico de maneira e3austiva e abran"ente* Lesmo assim( essa impossibilidade era atribu.da M aus9ncia de m+todos e recursos t+cnicos ade,uados* om o advento dos computadores( pensou-se ,ue essa meta poderia ser #acilmente alcanada* ! trabal/o de inde3adores e resumidores /umanos seria substitu.do por processos autom-ticos de inde3ao e elaborao de resumos* ! trabal/o "an/aria em velocidade e preciso( "arantindo o controle tem-tico total e sua recuperao* Para contestar isso( no + necess-rio ir muito lon"e: a Neoria Ieral dos Sistemas permite-nos compreender os limites dessa utopia* Pode-se lanar mo( primeiramente( das noes de regulao e controle num modelo de sistema: - 23iste um sistema aberto num ambiente 0* ! sistema tem uma sa.da S ,ue( para manter o sistema vi-vel( deve ser mantido dentro de certos limites* - ! sistema recebe entrada de dados do e3terior* O claro ,ue a entrada constitui sempre uma perturbao D( ,ue ameaa o estado de e,uil.brio de S* - Para controlar o e,uil.brio da sa.da S( o sistema deve ter um dispositivo de controle e um re"ulador R( de modo a #ormar um subsistema S5( cu&a #inalidade + controlar o #lu3o de variedade ameaadora ou indese&-vel entre D e S* 0 id+ia importante a,ui + ,ue todo sistema aberto necessita de mecanismos de controle para manter sua e#ic-cia* Se pensarmos em um sistema de in#ormao( ,uais so os mecanismos re"uladores necess-riosP Baseado em te3to did-tico de ?air Eobas/i $20QUSP% $maio 2006% ;2@@ISR( R* R* Uma !eoria do" "i"!ema" de recuperao da informao# Bras.lia: IBIN( 5<CD* 7