Beruflich Dokumente
Kultur Dokumente
Equipe
Anthony Vieira
(anthony_vieira@yahoo.com.br) Emerson Assis de Carvalho (assis.emerson@gmail.com) Lnio Oliveira Prado Jnior (lenio.junior@gmail.com) Vinicius Paes (viniciuspaes@gmail.com) Professor: Larcio Baldochi
Algoritmos e Estruturas de Dados 2
Roteiro
Introduo Fundamentao Terica A Internet como um Grafo Tcnicas Aplicveis a Grafos da Web Concluses Referncias Bibliogrficas
3
Introduo
Objetivo
Exemplificar o estudo da internet com analogia da teoria de grafos. Caracterizao da topologia de sinergia entre as diversas pginas web.
Introduo
Contexto
Internet em constante crescimento, utilizao da teoria de grafos relevante perante sua robustez e aplicaes e estudos previamente elaborados.
Introduo
Justificativa
A internet com certeza a grande aposta no presente e no futuro. totalmente relevante realizar estudos na rea afim de verificar suas caractersticas, verificar modelos de comportamento e at prever tendncias.
Fundamentao
O que um grafo?
Representao Vrtices/Arestas
Fundamentao
Estrutura dos Grafos da Web
Ncleo Bipartido
Fundamentao
Componentes Fortemente Conectados Componentes Fracamente Conectados
Fundamentao
Caractersticas Relevantes aos Grafos Web
Arestas direcionadas so relevantes para estudo de qualidade de contedo Grafo em constante crescimento Necessidade de algoritmos auxiliares para manejar a base de dados: algoritmo de memria secundria (HD).
10
11
12
13
Web
Aproximadamente 2.1 bilhes de pginas;
14
15
16
17
18
19
20
21
22
Maior SCC
O procedimento repetido para um conjunto S de ns escolhidos aleatoriamente.
Algoritmos e Estruturas de Dados 23
OUT
Travessia direcionada a partir de SCC; SCC + OUT; Retira-se SCC.
24
TENDRIL_OUT
Travessia no direcionada a partir de OUT; Retira-se SCC, IN e OUT.
26
27
28
29
30
Intra-Layer:
Links entre camadas usa o modelo Evolving, Copying ou hbrido.
Algoritmos e Estruturas de Dados 31
32
33
34
Meta Busca
Termos muito especficos e difcil de encontrar
Algoritmos e Estruturas de Dados 35
36
37
Concluso
Importncia do Estudo:
Futuro a web.
38
Referncias Bibliogrficas
BRODER et. al. 00. A. BRODER, R. KUMAR, F. MAGHOUL, P. RAGHAVAN, S. RAJAGOPALAN, S. STATA, A. TOMKINS e J. WIENER. Graph structure in the web. In Proceedings of the 9th WWW conference 2000.
DONATO et. al. 07. DONATO D.; LAURA L.; LEONARDI S.; MILLOZZI S. The Web as a Graph: How Far We Are. Universisty of Rome, Italy, 2007. ACM Transactions on Internet Technology (TOIT), Volume 7 Issue 1, February 2007. KLEINBERG et. al. 99. J. KLEINBERG, R. KUMAR, P. RAGHAVAN, S. RAJAGOPALAN, e A. TOMKINS. The web as a graph: measurements, models and methods, In Proc. Intl.Conf. on Combinatorics and Computing, 118 em 1999. DILL et. al. 01. S. DILL, R. KUMAR, K. MCCURLEY, S. RAJAGOPALAN, D. SIVAKUMAR e A. TOMKINS. Selfsimilarity in the web, In Proceedings of the 27th VLDB Conference 2001.
NAJORK, M.; ZARAGOZA, H.; TAYLOR, M.; Article Mining the Web Graph. Microsoft Research SIGIR, 2007.
KANTARDZIC, Mehmed. Data Mining: Concepts, Models, Methods, and Algorithms. John Wiley & Sons, 2003. WITTEN, Ian H. and FRANK, Eibe. Data Mining - Practical Machine Learning Tools and Techniques with Java Implementations, 2nd edition. Morgan Kaufmann Publishers, 2005.
39
Referncias Bibliogrficas
GONZAGA, C. (1973). Estudo de Algoritmos de Busca em Grafos e Sua Aplicao a Problemas de Planejamento. Tese de Doutorado, COPPEUFRJ, Rio de Janeiro.
HART, P.; NILSSON, N. & Raphael, B. (1968). A Formal Basis for the Heuristic Determination of Minimum Cost Paths. IEEE Transactions on Systems Science and Cybernetics, 4(2).
HAY, Birgit, WETS, Geert, VANHOOF, Koen. Web usage mining by means of multidimensional sequence alignment methods. In Osmar R. Zaane, Jaideep Srivastava, Myra Spiliopoulou, and Brij Masand, editors, WEBKDD 2002 Mining Web Data for Discovering Usage Patterns and Profiles, 4th International Workshop, Edmonton, Canada, July 23, 2002, Revised Papers (LNAI 2703), 2003. PERNER, Petra. Data Mining on Multimedia Data, volume 2558. 2002. LINSTEAD, Erik, BAJRACHARYA, Sushil, NGO, Trung, RIGOR, Paul, LOPES, Cristina, BALDI, Pierre. Sourcerer: mining and searching internet-scale software repositories. Data Mining and Knowledge Discovery, 2009. BRIN e PAGE 98. S. BRIN, L. PAGE. The anatomy of a large-scale hypertextual web search engine. Computer Networks and ISDN Systems, 1998.
40
Dvidas
Perguntas?
41
Fim
Obrigado!
42