Beruflich Dokumente
Kultur Dokumente
net/publication/299508759
CITATIONS READS
2 201
4 authors:
Some of the authors of this publication are also working on these related projects:
Characterization of time series for analyzing of the evolution of time series clusters View project
All content following this page was uploaded by Pedro Henrique Batista Ruas on 15 November 2017.
poster:05
Caracterização do Comportamento dos Usuários da Rede
Social Facebook Utilizando Métricas de Redes Complexas e
Algoritmos de Clusterização
Pedro Henrique B. Ruas, Ana Maria P. Cardoso, Luis E. Zárate, Cristiane N. Nobre
Mestrado em Informática
1
Abstract. This work used K-means clustering algorithms and SOM neural
networks to analyze the behavior of Facebook social network users. To that end,
network records of user interactions and complex networks metrics were consi-
dered. Results indicate that our metrics of choice improved the neural network’s
performance by identifying three main user profiles: participant, spectator and
content creator
1. Introdução
As redes sociais online são estruturas sociais de indivı́duos os quais compartilham
um espaço comum de interesses, necessidades e metas semelhantes para a interação,
comunicação, colaboração e a partilha de conhecimento.
O Facebook é considerado hoje a maior rede social online do mundo, com mais
de 57 milhões de usuários brasileiros ativos1 .
Com essa enorme quantidade de usuários, muitas relações sociais existentes neste
tipo de sistema podem acontecer de modo inteiramente virtual. Fogg e Iizawa (2008)
afirmam que para uma rede social online ter sucesso, a ferramenta deve necessariamente
motivar seus usuários a adotar alguns comportamentos, como por exemplo, conectar com
outros usuários na rede, compartilhar conteúdo dentre outros.
Fogg (2003) afirma que, originalmente, os computadores não foram projetados
para persuadir, mas para manipular informações (calcular, armazenar e recuperar estes
dados). Fogg (2003) cunhou o termo “captology” (acrônimo de computers as persuasive
technology) cujo foco de estudo é o projeto e análise de produtos computacionais interati-
vos criados com a finalidade de modificar as atitudes e/ou comportamentos dos usuários.
1
Disponı́vel em http://www.slideshare.net/GldyJuan/facebook-latin-america-stats-august-2012
39
30th SBBD – Posters – ISSN 2316-5170 October 13-16, 2015 – Petrópolis, RJ, Brazil
2. Referencial Teórico
2.1. Redes Complexas
No contexto da teoria de redes complexas, uma rede corresponde a um grafo represen-
tado por um conjunto de nós ligados por arestas. Este grafo representa relações entre os
indivı́duos que compõem a rede [Easley and Kleinberrg 2010].
As métricas utilizadas neste trabalho foram: Grau, Hub,Authority, Eccentricity,
Clustering coefficient, Local Clustering Coefficient, Closeness Centrality, Betweenness
Centrality, Page Rank.
40
30th SBBD – Posters – ISSN 2316-5170 October 13-16, 2015 – Petrópolis, RJ, Brazil
Percebe-se que, com exceção do atributo “Liker”, há uma diminuição de registro
ao longo do tempo. A quantidade de comentários realizados na rede social alcançou o seu
valor máximo no cenário da coleta no ano de 2012, e a partir deste ano, os registros para
essa interação passou a cair, diminuindo 6,17% se compararmos os anos de 2012 e 2014.
Em contrapartida, para as interações “curtir”, função mais utilizada na rede social, desde
o inı́cio da coleta, os registros a cada ano crescem consideravelmente, como por exemplo,
de 2011 para 2012 o aumento foi de 284,86%.
Na etapa Agrupamento dos dados com algoritmos de Clusterização foram reali-
zadas as clusterizações pela rede neural SOM e K-Means. Nesta fase, duas execuções
foram feitas: 1) utilizando-se os dados coletados diretamente do Facebook, ou seja, ape-
nas os dados referentes às interações (curtir, comentário, marcações de usuários, autor
de conteúdo); 2) dados referentes às interações enriquecidos com as métricas de redes
complexas (descritas na Seção 2.1).
Na etapa Inserção de métricas de Redes Complexas na base, no intuito de en-
riquecer a base de dados das interações coletadas no Facebook, foram inseridos dados
referentes às caraterı́sticas dos nodos do grafo através de métricas de redes complexas.
Nesta etapa, foi utilizado a API Gephi 3 para realizar os cálculos das métricas utilizadas.
2
Disponı́vel em: https://developers.facebook.com/docs/graph-api
3
Disponı́vel em: http://gephi.github.io
41
30th SBBD – Posters – ISSN 2316-5170 October 13-16, 2015 – Petrópolis, RJ, Brazil
3. Resultados e discussões
3.1. Avaliação dos agrupamentos
Considerando-se a base de dados composta apenas pelas interações realizadas na rede
(curtir, comentário, marcações de usuários, autor de conteúdo), o melhor agrupamento
para os dois algoritmos utilizados foi o de 2 grupos, onde o valor total do silhouette é
0,76 e não apresenta nenhum valor negativo nos grupos criados (o que acontece quando
se formam 3 e 4 grupos).
No entanto, observou-se que o enriquecimento da base com métricas de redes
complexas aumentou substancialmente o silhouette index dos clusters criados. O maior
valor obtido para o silhouette total com o algoritmo SOM foi para o agrupamento realizado
com 3 grupos, como o esperado por Ruas et al. (2014), onde o valor total do silhouette
obtido foi 0, 89 com a rede neural contra 0, 54 do K-Means com a mesma quantidade de
grupos.
Desta forma, o valor de silhouette index auxiliou na validação da qualidade dos
grupos criados pela rede neural SOM indicando que o melhor agrupamento para os dados
coletados ocorre com a base enriquecida com métricas de redes complexas e com 3 gru-
pos. A análise da silhouette mostrou também o melhor desempenho para o agrupamento
realizado pela rede neural SOM se comparado com o algoritmo K-Means, justificando,
portanto, o uso desta técnica.
Em todos os agrupamentos, o objetivo foi obter o melhor valor para o silhouette
index dos grupos levando em consideração os perfis identificados por Ruas et al. (2014):
produtor de conteúdo, participante e espectador.
42
30th SBBD – Posters – ISSN 2316-5170 October 13-16, 2015 – Petrópolis, RJ, Brazil
43
30th SBBD – Posters – ISSN 2316-5170 October 13-16, 2015 – Petrópolis, RJ, Brazil
acumulado).
Desta forma, ao contrário do esperado, as pessoas que possuem o papel de parti-
cipante na rede social, apresentam uma alta importância na estrutura da rede, sendo este
grupo responsável, por exemplo, por transmitir de forma mais rápida uma informação no
ambiente virtual, ou seja, os participantes desempenham uma função crucial para a rede
social Facebook. Estes valores eram esperados, inicialmente, para o grupo produtor de
conteúdo.
4. Conclusão
Em vários trabalhos cientı́ficos nos quais o foco é estudar o comportamento dos usuários
de redes sociais online não é comum encontrar publicações em que a estrutura da rede e
as caracterı́sticas ali presentes são utilizadas para analisar o comportamento dos usuários.
Neste trabalho o objetivo foi utilizar estas informações (enriquecendo a base dados) para
melhorar o agrupamento, adicionando informações diferentes daquelas já existentes na
base. Esta estratégia fez com que melhorasse substancialmente o resultado do agrupa-
mento, justificando assim o cálculo destas métricas e a inserção destes valores na base de
dados.
Assim, a metodologia utilizada neste trabalho foi eficiente para identificar os gru-
pos levantados por [Ruas et al. 2014]. Na continuidade deste projeto, deseja-se verificar
se os perfis dos usuários encontrados estão presentes em intervalos de tempo menores ao
longo dos 6 anos de dados coletados. Para isso, deve-se realizar o mesmo estudo com
uma maior granularidade temporal. Além disso, será verificado se os usuários migram de
um perfil para outro ao longo do tempo.
Referências
Berry, M. and Linoff, G. (2004). Data Mining Techniques: For Marketing, Sales, and
Customer Relationship Management. Wiley technology publication. Wiley.
Easley, D. and Kleinberrg, J. (2010). Networks, Crowds and Markets: Reasoning about a
Highly Connected World. Cambridge University Press.
Fogg, B. and Iizawa, D. (2008). Online persuasion in facebook and mixi: A cross-cultural
comparison. In Proceedings of the 3rd International Conference on Persuasive Tech-
nology, PERSUASIVE 08, pages 35–46, Berlin, Heidelberg. Springer-Verlag.
Fogg, B. J. (2003). Persuasive Technology: Using Computers to Change What We Think
and Do. Morgan Kaufmann.
Haykin, S. (1998). Neural Networks: A Comprehensive Foundation. Prentice Hall PTR,
Upper Saddle River, NJ, USA, 2nd edition.
Rousseeuw, P. (1987). Silhouettes: A graphical aid to the interpretation and validation of
cluster analysis. J. Comput. Appl. Math., 20(1):53–65.
Ruas, P. H. B., Nobre, C. N., and Cardoso, A. M. P. (2014). A influência das estratégias
persuasivas no comportamento dos usuários no facebook. In Proceedings of the 13th
Brazilian Symposium on Human Factors in Computing Systems, IHC ’14, pages 255–
264, Porto Alegre, Brazil. Sociedade Brasileira de Computação.
44