Sie sind auf Seite 1von 18

Aspectos prcticos de Internet

Tema 6 Web y buscadores


Introduccin Conceptos Bsicos
HTML HTTP URL DNS Servidores web Caches y proxies

Web 2.0 Buscadores

Introduccin
Naci en 1990- Tim Berners-Lee Documentos escritos en HTML: Hipertext Markup Language Hiperenlaces permiten ir de un documento a otro Hiperespacio independiente de la ubicacin fsica Gran enciclopedia de mbito mundial en constante desarrollo y cambio

Conceptos Bsicos
Herramientas de Navegacin o Navegadores o Browsers
Interpretan y muestran en pantalla los documentos de la Web Documentos con texto, formato y elementos multimedia (imgenes, audio, vdeo...) Visualizacin independiente del sistema Pueden lanzar la ejecucin de otras aplicaciones Pueden manejar otros servicios, adems de http (ftp, https, telnet, etc.) Mozilla Firefox, Google Chrome, Internet Explorer, Safari, Lynx, etc

Conceptos Bsicos
Hipertexto e Hipermedia
Hipertexto = Texto + enlaces Formato de los documentos Web Los documentos enlazados pueden estar en cualquier sitio Hipermedia: Imgenes, grficos, sonidos, animacin, video

Conceptos Bsicos
HTML
Lenguaje de marcacin de hipertexto Estndar en continuo desarrollo. HTML 5.0 Continuamente se le van aadiendo nuevas posibilidades (marcos, gif animados, css, canvas, etc)

Enlaces
Tambin denominados links o hiperenlaces Constan de dos partes:
- Referencia (URL) - Ancla (Anchor)

Conceptos Bsicos
URL: Uniform Resource Locator (Localizador uniforme de recursos)
http://www.uji.es/CA/serveis/si/bin/manuals/pdf/per10.pdf

Tres partes:
Siglas de protocolo: http, https, ftp, telnet, gopher, file, news ,mailto, etc Nombre de dominio: www.uji.es, webmail.uji.es Ruta en el servidor: Organizado en carpetas o directorios (/) EJ: /personal/nombre/imagen/galeria.htm http://nuvol.uji.es/~huerta/j11.htm

Algunas URLs utilizan la tilde ~

Conceptos Bsicos
HTTP
Hipertext Transport Protocol o Protocolo de transporte de Hipertexto

Sistemas de Nombres de Dominio (DNS)


http://173.194.34.242/ http://www.google.com/

Clientes y servidores
Arquitectura cliente-servidor Software cliente: Navegadores Software servidor: Apache, Tomcat, IIS
7

Conceptos Bsicos
Servidores Web
Ordenador que est esperando peticiones de clientes Muestra la pgina requerida o un error: 403 Forbiden, 404 Not Found, etc. Apache, IIS, Tomcat, etc. Bases de datos: MySQL, PostgreSQL Tecnologas web: PHP, ASP VB, ASP .NET, etc

Conceptos Bsicos
Cache
Copia local de la pginas que se han visitado En memoria o en disco duro Parmetros configurables Con pginas dinmicas cache obsoleta
- Recargar o actualizar - Vaciar la cache

Los elementos que llevan mas tiempo si utilizarse se eliminan de la cache Niveles de cache Cache engine

Conceptos Bsicos
Proxys
Optimizan el trfico de Internet de un conjunto de mquinas Combinado con el uso de cache Aumenta la seguridad y el control de conexiones Su configuracin puede ser manual o automtica:
http://www.uji.es/proxy.pac

Programas especficos proxy: Wingate

10

Web 2.0
Una nueva forma de utilizar la web de manera interactiva y colaborativa Centrada en el usuario que consume informacin pero tambin la produce: Prosumer Servicios 2.0:
Blogs, Wikis, redes sociales, entornos para compartir (fotos, videos, etc), mash-ups, e-learning, RSS, etc

Web 3.0 o semntica: centrada en las mquinas

11

Buscadores
Dada la cantidad de informacin existente son

fundamentales en Internet Han ido evolucionando : motores de bsqueda Uno de los primeros fue Donde de la UJI
http://donde.uji.es
Actualmente destaca Google, le sigue Bing Otros que en pasado eran ms importantes: Altavista http://www.altavista.com Yahoo http://www.yahoo.es Otros que vienen (baidu.com 9 web ms visitada)
12

Google
Buscador de informacin en (casi) todo Internet Casi cierta informacin no se puede buscar
Datos protegidos por contrasea Intranets inaccesibles

Google para buscar en la Intranet Google para buscar en un PC (Google Desktop) Spinoff dos estudiantes de Stanford 1998 El nombre viene de googol = 10^100

13

Google
Ejecuta web crawlers que recopilan informacin de web:
Pginas, documentos, imgenes, otros ficheros

Los datos se indexan y se almacenan en grandes servidores Redundancia: varias copias de cada elemento Cada elemento es clasificado segn:
Nmero de pginas que apuntan al elemento Numero de bsquedas que lo encuentran

La bsqueda se realiza en paralelo en varios servidores Los almacenes de datos son los ms grandes del mundo

14

Google
Permite bsquedas de muy diversos tipos:
En la web De imgenes Dentro de los grupos de Google De noticias de peridicos digitales De vdeos De documentos acadmicos Dentro de un directorio temtico De mapas De blogs De libros De cdigo fuente De patentes (solo USA)

15

Google
Herramientas dentro del propio buscador:
Calculadora: aritmtica y conversiones de distancias, tiempos.. Conversin de moneda: valor actualizado de las divisa Traduccin de pginas web y de textos Vnculos en cach: permite ver pginas no disponibles Pginas similares: sobre el mismo tema Quin tiene vnculos que apuntan a su sitio? Bsquedas dentro de un dominio Voy a tener suerte: lleva directamente a un resultado Etc, etc

16

Bsqueda avanzada Google

17

Otras directivas
+ para incluir palabras obligatoriamente: star wars episode +v ~ para incluir tambin sinnimos: ~comida * comodn para incluir cualquier secuencia de caracteres: anima* X..Y para buscar en el rango numrico desde X hasta Y site para restringir la bsqueda a un sitio web: site:uji.es filetype para restringir la bsqueda a un tipo de archivos: filetype:pdf weather para buscar sobre meteorologa: weather:Castellon map para buscar mapas: map:Castellon cache para acceder a la copia de Google: cache:www.uji.es Otras: allinanchor:, allintext:, allintitle:, allinurl:, cache:, define:, id:, inanchor:, info:, intext:, intitle:, inurl:, link:, phonebook:, related:

18

Das könnte Ihnen auch gefallen