Sie sind auf Seite 1von 6

Ampliando os Negócios na Web com a Utilização de

Técnicas de Mineração de Dados


Níssius Guilet Ribas

Curso Ciências da Computação – Universidade FEEVALE


Caixa Postal 2.755 – 93.352-000 – Novo Hamburgo – RS – Brasil
nissiusnh@yahoo.com.br

Resumo. A internet é considerada hoje uma fonte rica em informações para


as empresas, mas para que estas informações sejam relevantes, é preciso que
ocorra a utilização de técnicas de mineração de dados na Web. Sendo assim,
este artigo apresenta as fases do processo, categorias em que se divide e suas
vantagens para aplicação em sites comerciais.

1. Introdução
Mais de um bilhão de páginas são indexadas pelos motores de busca [Pal, 2002], e
devido a este grande volume de informações disponíveis na Internet, a Web pode hoje
ser considerada um grande diferencial para empresas que desejam se destacar no
mercado online. Assim, as mesmas devem procurar aplicar técnicas de Web Mining
(mineração de dados na Web) para encontrarem informações relevantes sobre os seus
usuários, que, por fim, podem ser traduzidas em um grande diferencial mercadológico,
uma vez que, de posse destas informações, as empresas podem por sua vez, personalizar
os acessos de seus usuários de acordo com as informações já processadas dos mesmos.
Para que essa extração de informações sobre os usuários possa ser útil, é preciso
a aplicação de algoritmos de mineração de dados na Web, dos quais procuram encontrar
padrões comportamentais entre os usuários que acessam o site de uma determinada
empresa.
A proposta deste artigo é mostrar como a mineração de dados pode nos
disponibilizar informações relevantes sobre os usuários, pois, com estas, é possível
personalizar o acesso ao site de acordo com a visita dos mesmos, fazendo assim com
que este tenha uma percepção maior do que está procurando.
Desta forma, de posse das informações úteis, as empresas ao longo do tempo
poderão gerar lucro, pois, tendo uma relação de diversos produtos comprados por
usuários no site, é possível indicar a futuros compradores sugestões de compras, onde
estes, tem grandes chances de se interessar pelos produtos, uma vez que, determinada
porcentagem de clientes também fez a mesma compra, aperfeiçoando assim a
apresentação do site.
Assim a utilização de mineração de dados na web por uma empresa, é de grande
relevância, pois, na obtenção de informações específicas a mesma pode adaptar seus
conteúdos e páginas de conformidade com o perfil do usuário que a acessa, facilitando
desta forma um acesso maior ao seu site, o que poderá torná-la diferenciada para a
concorrência do mercado online.
Este trabalho está dividido em três seções, sendo na primeira explicado o que é e
como funciona a Web Mining. Na segunda seção, encontra-se informações sobre
empresas e Web Mining, juntamente com exemplos de uso e, por final, na última seção,
serão encontradas as considerações finais sobre o artigo.

2. Web Mining
Web Mining se utiliza de técnicas de Data Mining para extrair e descobrir
automaticamente informações relevantes de documentos e serviços ligados a Internet,
sendo que estas descobertas são realizadas por meio de logs (arquivo que registra
atividades comportamentais realizadas pelo usuário durante sua navegação), que são
gerados no momento em que o usuário acessa um determinado site.
Após o recebimento do arquivo log, este passa a ser enviado a uma Data
Webhouse (Armazém de dados), que consiste em guardar e organizar de forma padrão
todas as informações que estão contidas no log, fazendo assim, com que a Web Mining
possa ser executada de forma correta na procura de informações relevantes sobre a
interação dos usuários dentro de um site específico.

Figura 1. Descoberta do Conhecimento (Níssius Ribas, 2011)


Web Mining pode ser dividida em três subáreas [Kosala and Blockeel, 2000]:
Mineração de Conteúdo da Web, Mineração da Estrutura da Web e Mineração de Uso da
Web, descritas brevemente a seguir.

2.1 Mineração de Conteúdo da Web


A mineração de conteúdo é o processo de extração de informações úteis sobre o
conteúdo, dados e documentos da Web [Lemos, 2010]. Vale informar que grande parte
do conteúdo encontrado na internet, não constitui apenas em texto e hipertexto, uma vez
que é possível encontrar padrões de acesso em dados dos tipos imagens, áudio, vídeo e
até mesmo em links web.
Os dados encontrados na internet podem ser classificados em três tipos:
desestruturados (tais como textos comuns); semiestruturados (tais como documentos
HTML) e estruturados (tais como as tabelas de bancos de dados).

2.2 Mineração da Estrutura da Web


É o processo de inferir conhecimento através da topologia, organização e estrutura de
links da Web entre referências de páginas [Lemos, 2010]. Esta categoria de mineração
na Web pode ser utilizada para se descobrir relacionamentos entre diferentes sites da
Web, podendo assim encontrar a origem de um determinado link de um site.

2.3 Mineração de Uso da Web


É o processo que procura extrair das informações recolhidas, regularidades entre os
caminhos percorridos pelos usuários quando estão navegando na internet. Esta
mineração ocorre através de dados derivados da interação entre o usuário com a Web.
3. Log Personalizado
Todos os servidores Web têm a capacidade de registrar, em um arquivo de log, a sua
interação com os clientes. Toda vez que um servidor responde a uma solicitação HTTP,
ela é registrada no arquivo de log. É importante notar que, apesar de um registro ser
feito para cada requisição, o servidor estará atendendo várias solicitações de usuários
simultaneamente [Oliveira, 2000]. Por isso, as entradas para uma sessão particular
(todas as requisições feitas por um usuário), não são contíguas. Os registros individuais
de uma sessão estarão espalhados por todo o arquivo de log do servidor.
Para que o log seja processado de forma mais rápida e com resultados mais
relevantes, é preciso que o mesmo seja criado seguindo de um padrão especificado pelo
administrador do Site, onde este desenvolverá um algoritmo específico que deve ser
inserido em todas as páginas do site, para que seja feito um acompanhamento total sobre
o usuário que o visita. Como exemplo, meramente ilustrativo, pode-se visualizar na
Figura 2 um exemplo de log personalizado.

Figura 2. Log Personalizado (Níssius Ribas, 2011)


Com o log personalizado já criado e disponível, já é possível aplicar o uso de
técnicas de mineração para encontrar informações relevantes sobre eles. Para isto
existem alguns softwares que se propõem a executar estas funções, os quais exigem que
determinados arquivos sejam padronizados de acordo com seu fabricante, entre eles,
pode-se citar o Weka (http://www.cs.waikato.ac.nz/~ml/) e o RapidMiner
(http://www.rapid-i.com/).

4. Empresas e Web Mining


Hoje, muitas empresas dispõem de informações valiosas e não sabem como trata-las de
forma correta ou, até mesmo, nem sabem que estas informações estão disponíveis o
mais próximo possível delas, por este e outros motivos, os investimentos em mineração
na Web tendem a crescer e ser visto como um grande diferencial.
Para o comércio eletrônico, a Web Mining é vital, devido ao grande número de
visitantes a esse tipo de site, pois, em datas comemorativas o número de visitantes a
sites de comércio eletrônico tendem a aumentar.
Sites de todos os tamanhos já adotam a mineração de Web como um meio
diferencial, onde seus proprietários podem visualizar dados reais sobre os acessos as
páginas de seus sites e usá-los para melhorar o desempenho do sistema, melhorar a
segurança, facilitar tarefas de modificações do site, apoiar nas decisões do mercado,
propiciando maior interatividade e facilitação de acesso aos usuários do mesmo.
Para as empresas de negócios e comércios online, as técnicas de mineração de
dados podem ser usadas para encontrar relações entre os usuários e os produtos
comprados por estes.
Como exemplo, meramente ilustrativo, poderia ser possível fazer uma relação
entre usuários que visitaram uma página de produtos pessoais e aqueles que visitaram
uma página de equipamento para camping, podendo se observar que uma determinada
quantia de clientes que acessaram a página de produtos pessoais, também acessaram a
página de equipamentos para camping. Desta forma, a empresa consegue visualizar uma
relação interessante entre as páginas, fazendo com que isto se torne um diferencial e o
mesmo passe a sugerir a compra de outros produtos como mostra a Figura 3.

Figura 3. Exemplo de Relação de Compra (Níssius Ribas, 2011)


Como exemplo fictício, pode-se observar de forma simples como utilizar os
dados minerados a favor de uma empresa, juntamente com possíveis finalidades de uso:

Figura 4. Dados Minerados (Níssius Ribas, 2011)

 Países de Origem: sabendo o país de origem do usuário é possível adicionar ou


até mesmo mudar o idioma do site de uma empresa para que o visitante se sinta
bem.
 Palavras mais Buscadas: ao descobrir as palavras mais buscadas em um site, é
possível ampliar o foco em um determinado assunto, atraindo assim mais
visitantes.
 Navegador do usuário: de posse do nome e tipo de navegador do usuário, é
possível fazer a manipulação da visualização do site, uma vez que o usuário
pode acessar o mesmo pelo celular e outra do computador, ou seja, a
acessibilidade do usuário tem que ser a mesma, sempre que possível, tanto em
um navegador como em outro.

4.1. Exemplos Reais de Uso


Algumas empresas que já se fixaram na internet, já fazem jus das técnicas de mineração,
segue exemplo das mesmas:
 Amazon: a empresa fornece em seu site uma lista de outros livros anteriormente
comprados pelos adquirentes de um determinado livro. Ao fornecer esta
informação já processada, o site ajuda os seus clientes, reduzindo o tempo que
perderiam em uma pesquisa mais prolongada.
 BBClone: a empresa criou um script que é baseado no registro de logs, onde o
mesmo tem como função a mineração de dados, possuindo diversas
funcionalidades tais como informar o número de visitantes (dia, mês, ano),
páginas mais acessadas, palavras mais buscas, origens dos links que levaram o
visitante ao site, país onde se concentra o visitante, navegador e sistema
operacional utilizado entre outras mais funções (www.bbclone.de).
 Magazine Luiza: ao acessar um determinado produto, a empresa oferece ao
mesmo a opção de comprar outros produtos similares ao produto escolhido
inicialmente.
 Ponto Frio: a empresa vai mais além do que oferecer produtos similares ao
escolhido pelo usuário, ela fornece uma lista com produtos que outros usuários
adquiriram junto com o produto selecionado, verificando assim, a existência de
uma relação entre produtos de diferentes categorias.
 Buscapé, Jacotei e BondFaro: são empresas especializadas na comparação de
preços de produtos entre diversos sites registrados, porém, esta trabalha com
dados estruturados, uma vez que a mesma precisa fazer diversas consultas aos
sites registrados para encontrar o melhor preço.

5. Considerações Finais
A internet, sem nenhuma dúvida, possui um acervo de informações imensuráveis nas
quais se podem visualizar dados associados a um determinado assunto com referência a
fotos, gráficos, dados, vídeos, áudios ou simplesmente textos, dificultando assim a
obtenção de uma informação padronizada, pois, a qualquer momento, são encontrados e
disponibilizados textos sobre diversos assuntos, o que faz com que a mesma se torne um
meio de comunicação muito rico em informações.
Ocorre que, devido a disponibilização em massa de conteúdo, muitas vezes a
internet satura a pesquisa, quando, então, necessário se faz o uso da mineração de dados,
objetivando melhor especificação do assunto, fazendo-se assim a devida filtração.
A área de mineração de dados na Web tende a crescer rapidamente em virtude,
principalmente, da enorme quantidade de textos produzidos na Internet, e pelas grandes
vantagens e interesses que ela propicia, tanto que, muitas empresas já fazem
investimentos e utilizam essas informações como uma vantagem competitiva em relação
aos seus concorrentes.
O uso de técnicas de mineração de dados na Web para empresas e, até mesmo
para uso pessoal, tende a crescer muito e tornar-se um elemento diferencial, uma vez
que, estes podem aproveitar as informações relevantes que foram mineradas para
aperfeiçoar o seu sistema.
Assim, aperfeiçoando o sistema, seus usuários ficarão mais satisfeitos, pois, a
mineração de dados, tem como principal característica facilitar o uso tanto por parte do
proprietário quanto por parte do usuário, a fim de melhoria e implementação de vendas,
tornando-se mais competitiva no mercado online.

Referências
Sankar K. Pal, Varum Talwar, Pabitra Mitra (2002) “Web Mining in Soft Computing
Framework: Relevant, State of the Art and Future Directions”. Disponível em
http://citeseerx.ist.psu.edu/viewdoc/download;jsessionid=DDBEC679FFF2C77CAE
0BD994245DBF58?doi=10.1.1.53.4031&rep=rep1&type=pdf. Acesso em Março de
2011.
Turban, Efraim & Wheterbe, James C. & Mclean, Ephraim (2002) “Tecnologia da
Informação para Gestão”, Bookman , Porto Alegre – RS.
Kosala, R., Blockeel, H (2000) “Web Mining Research : A Survey”. Disponível em
http://www.sigkdd.org/explorations/issues/2-1-2000-06/kosala.pdf. Acesso em Abril
de 2011.
Lemos, Hailton David (2010) “Revista Espírito Livre: Diversão Livre”, Web Mining
Mineração de Dados na Web. v. 10, p. 70-72. Disponível em
http://revista.espiritolivre.org/pdffiles/Revista_EspiritoLivre_010_janeiro10.pdf.
Acesso em Março de 2011.
REZENDE, Solange, O. (2003) “Sistemas Inteligentes: fundamentos e aplicações”,
Manole - São Paulo.
NETO, Quintino Izidio dos Santos (2006) “Web Mining”, Disponível em
http://www.vivaolinux.com.br/artigo/Web-Mining/. Acesso em Março de 2011.
SILVA, Juan D. Velásquez “Mining web data: Techniques for understanding the user
behavior in the Web”. Disponível em http://mate.dm.uba.ar/~pfmislej/web
%20mining/web%20mining.pdf. Acesso em Abril de 2011.
OLIVEIRA, Gorki Starlin Costa (2000) “Segurança complete contra hackers”, Book
Express.

Das könnte Ihnen auch gefallen