Beruflich Dokumente
Kultur Dokumente
menos
Pedro Alexandre Cabral Bacharel em Administrao pela Universidade Estadual do Piau UESPI.
Especialista em Administrao Estratgica pelo Centro de Ensino Unificado de Teresina- CEUT. Mestrando em
Comunicao no PPGCOM da UFPI. E-mail: pedroale@pedroale.com.
2
Gustavo Said doutor em Cincias da Comunicao pela Unisinos. Professor do Programa de Ps-Graduao
em Comunicao da Universidade Federal do Piau. E-mail: gsaid@uol.com.br.
1
1 INTRODUO
O armazenamento da informao caracterstica intrnseca ao ser humano. Ao
analisar a histria percebemos que desde os primrdios o homem carece da necessidade de
guardar informaes: figuras rupestres em cavernas ou escritas em paredes de pedras
encravadas nas pirmides egpcias so apenas alguns exemplos. Isto tambm visto nas
culturas que somente dominam a linguagem oral, na busca de perpetuar o antigo por
intermdio da oralidade (LIMA JUNIOR, 2011).
Hoje, a penetrao da internet e das tecnologias digitais no cotidiano do cidado
comum alavancou uma incrvel mobilidade e ubiquidade comunicacional e informacional
no nvel do indivduo, e no mais apenas no nvel das organizaes, catalisando assim, tanto
o controle e a transparncia, quanto s possibilidades de auto exposio em nveis inditos
na nossa histria (GABRIEL, 2010).
O valor mais acessvel de mquinas computacionais (processamento e memria) e dos
dispositivos de captura e armazenagem de dados (sensores, cmeras fotogrficas e de vdeo,
celulares, pen-drives, flash memory, discos rgidos externos, etc.) criaram inimaginvel
quantidade de dados, que esto sendo disponibilizados na Web, proporcionando a formao
da Era do Big Data (LIMA JUNIOR 2011).
Em outro trabalho desenvolvido em 2012 , intitulado de Big Data, Jornalismo
Computacional e Data Journalism: estrutura, pensamento e prtica profissional na Web de
dados, Lima Junior (2012, p. 211) define Big Data (BD) como sendo um
podem ser capturados e processados. Variedade, por sua vez, pauta-se nas diversas fontes de
dados em que estes podem ser encontrados e o ltimo aspecto, veracidade, abrange com
caracterstica o fato que estes dados no apresentam uma verdade absoluta, ou seja, certa
incerteza onde deve-se observ-los com muita parcimnia para que os mesmos possam
gerar informaes teis e oportunas.
Isto posto, o massivo crescimento de dados na internet traz consigo grandes bices no
que tange a disponibilizao da informao. Ao digitarmos a palavra identidade no
Google, por exemplo, encontramos aproximadamente 834.000.000 resultados3, dificultando
o processo de seleo e interpretao das informaes por parte do usurio. Outro grande
problema, segundo Sprink, Wolfram et al (2001) a dificuldade encontrada pelos usurios
em expressar a necessidade de informao por meio de palavras chaves, visto que
aproximadamente cinquenta e dois por cento das buscas realizadas nas mquinas so
reformuladas.
Dentro dessa nova perspectiva de utilizao das bases de dados, Machado e Palacios
(2007), em estudo sobre as competncias dos profissionais de Comunicao, citam a
existncia de pesquisas que tratam sobre a prtica dos profissionais da rea, em especial a
necessidade destes se adaptarem s novas exigncias do mercado, tendo o domnio dos
processos de digitalizao da informao.
Dentre as competncias digitais compiladas no estudo citado, eis algumas: uso bsico
do computador como ferramenta para busca, avaliao e classificao de informaes;
cultura de internet (MACHADO e PALACIOS, 2007, p.79); conhecimentos bsicos e
utilizao de programas de edio de texto, tratamento de imagem, udio, programao
visual; conhecimento terico sobre redes e seu funcionamento e alta capacidade de
aprendizagem de uso de novos programas.
Para Lima Junior (2011), a capacidade e facilidade em reunir e armazenar informaes
em um banco de dados, assim como sua utilizao, cresce a cada dia e na mesma proporo
que novas tecnologias so desenvolvidas e propagadas para facilitar o trabalho do
consumidor. Com a popularizao da rede mundial de computadores, quase todo e qualquer
contedo produzido passa a ser colocado em um espao considerado at ento infinito,
recente pesquisa elaborada pela Nielsen5, no Brasil, a classe C consome mais internet que a
classe A e B, enquanto na classe A e B o consumo de mdio por pessoa de pginas era no
mximo 821, a classe C abriu, em mdia, 972 pginas no ms. Trata-se assim de
transformaes da prxis social e na forma de produzir e consumir informao. (LEMOS
2005).
Para Lemos (2005), a era da conexo a era da mobilidade, onde visualiza-se uma
densidade mobile, maior inclusive que a quantidade de computadores. Dados da Anatel
(Agncia Nacional de Telecomunicaes) revelam que o Brasil terminou o ms de maro de
2014 com 273,6 milhes de celulares, o que representa uma teledensidade de 135,3
dispositivos mveis para cada 100 habitantes. Em linhas gerais, este comportamento
presente em todos as unidades da federao. Apenas o estado do Maranho apresenta uma
densidade de celular menor que 100 aparelhos para cada 100 habitantes, conforme demostra
a figura I.
Dentro desta acepo, Lemos (2005) destaca que a popularizao de celulares e das
redes de acesso a internet vem proporcionado mudanas na produo e consumo de
informao, uma vez que o acesso esta imbricado de uma forma cada vez mais
YOY%
Change
61,0%
48,0%
154,0%
6,1%
7
8
10
Weiss et al. (2007) corrobora com Wiess (2007) quando prope que o data mining
busca por regularidades, padres ou tendncias em textos de linguagem natural. J Hearst
(1999) traz uma definio mais holstica ao pontuar DM como sendo um mtodo de apoiar
pesquisadores a derivar novas e relevantes informaes de uma grande coleo de dados.
Outra definio bastante utilizada sobre DM a proposta trazida na obra From Data Mining
to Knowledge Discovery, na qual o data mining funciona como:
Mesmo no sendo uma tcnica nascida no seio da comunicao, a sua utilizao pode
trazer grandes benefcios para o campo e de forma mais fecunda para o Jornalismo. Neste
contexto, Fidalgo (2007, 161) trs vantagens principais para a aplicabilidade de DM, sendo
elas:
A primeira no exigir tanto tempo de trabalho de jornalistas como uma
11
Ainda dentro desta perceptiva, Fidalgo (2007, 163) acredita que os jornalistas do
futuro sero uma espcie de McGyver, homens ou mulheres de mil e um recursos,
trabalhando sozinhos, equipados com uma cmara de vdeo digital, telefone satlite, porttil
com software de edio vdeo e html, e ligao sem fios Internet.
12
A primeira fase a coleta, onde tem-se o processo de formao de uma base dados,
ferramenta essa indispensvel para elaborao do processo de data mining. A prxima etapa
o pr-processamento, pois sistemas de data mining no submetem aos seus algoritmos de
descoberta de conhecimento colees de textos despreparadas (GOMES, 2008). Uma vez
realizada a coleta de dados, o prximo passo a preparao dos textos para que os mesmos
possam ser manipulados pelos algoritmos de Minerao de Textos.
Aps o pre-processamento inicia-se a fase da indexao, que consiste no processo
responsvel pela criao de estruturas auxiliares denominadas ndices e que garantem a
rapidez e agilidade na recuperao dos dados. De acordo com Soares (2009 p. 99),
13
Finalizado o processo de data mining, temos a etapa de anlise, onde ser realizada
avaliao de todo o conhecimento obtido pelo processo. Enquanto a etapa de anlise,
algumas vezes chamada de Ps-Processamento, abrange o tratamento do conhecimento
obtido na etapa de Minerao, atravs da anlise, visualizao e interpretao deste.
4 CONSIDERAES FINAIS
Em meio a este novo cenrio, onde as pessoas passaram de meras telespectadoras e
assumiram tambm a condio de produtores de informao, temos uma sociedade centrada
na era do big data, onde a quantidade de bytes produzidos na web, e de maneira mais
pontual nas redes sociais, necessitam de filtros cada vez mais dinmicos para transformar
este manancial de dados em informao til e relevante.
Diante desse contexto, o data mining apresenta-se como uma ferramenta que pode
alicerar estes filtros, uma vez que ele configura-se como um instrumento eficiente na busca
de padres de grandes volumes de dados at ento desconhecidos. Isto posto, necessrio
compreender tambm que, como boa parte destes dados esto dispostos de uma forma no
estruturada, uma leitura a olho nu torna o processo de anlise oneroso e muitas vezes
invivel face a premncia na analise destas informaes.
Ademais, em uma conjuntura onde a quantidade de dados passou a ser um bice
tanto para as organizaes quanto para as empresas, o emprego de tcnicas de minerao de
dados passa a ser condio fulcral na busca de insights e na produo de conhecimento.
5 REFERENCIAS
ARANHA, C., Freitas, M. C., Dias, M. C., e Passos, E. (2004). "Um modelo de
desambigizao de palavras e contextos". TIL 2004: Workshop de Tecnologia da
Informao e da Linguagem Humana
Fayyad, U. M.; Piatesky-Shapiro, G.; Smyth, P. From Data Mining to Knowledge
Discovery: An Overview. In: Advances in Knowledge Discovery and Data Mining, AAAI
Press, 1996.
FIDALGO, Antnio. A resoluo semntica no jornalismo online. In: BARBOSA, Suzana
(Org.). Jornalismo digital de terceira gerao. Coleo Estudos em Comunicao.
Covilh, PT: LabcomBooks, 2007b. p. 93-102.
14
16