Beruflich Dokumente
Kultur Dokumente
Internet (2)
FTP, HTTP, SMTP, POP3 o IRC son acrnimos que se han hecho tan populares como la propia Internet. Detrs de ellos se encuentran servicios diferentes, pero todos con el mismo objetivo: mantener comunicados a los internautas.
a comunicacin entre personas y la transmisin de informacin puede establecerse de distintas formas: una conversacin telefnica, una tertulia de bar, la confidencia de un amigo, una conferencia pblica, la televisin, la radio, el peridico, los libros, las enciclopedias, etc. Cada situacin tiene su momento. En Internet tambin es posible usar distintos sistemas de comunicacin, el ms apropiado para cada circunstancia. Al principio el Web llama la atencin, pero sirve de muy poco si el usuario no es capaz de encontrar las pginas que est buscando. Poco a poco la libreta de contactos del gestor de e-mail va aumentando, al mismo tiempo que el correo electrnico se convierte en un medio de comunicacin personal y profesional importantsimo. Despus se descubren las ventajas de la comunicacin inmediata que ofrece el chat, tanto en el entorno laboral como en los momentos de ocio. Y a medida que la informacin y las herramientas digitales adquieren importancia, los sistemas de intercambio de archivos son la forma ideal de mantener al da tanto los programas como la biblioteca de archivos digitales. Todas ellas (Web, correo, chat, P2P), de las que se habla con profundidad en las siguientes pginas, son herramientas imprescindibles para andar bien calzado por la Red.
varios motivos: en primer lugar por su topologa, una maraa de hilos conectados que forman una malla, en este caso mundial; despus porque los documentos de la Web tambin estn conectados entre s a travs de enlaces de hipertexto y, finalmente, es una telaraa porque atrapa (Internet es una red que engancha a millones de personas atradas por los servicios y posibilidades de este nuevo medio de comunicacin). La Web ha triunfado por la posibilidad de incluir grficos, sonido y enlaces, todo ello en archivos muy fciles de crear y colocar en servidores cada vez ms asequibles. La aparicin de la Web supuso que tanto una gran multinacional como un particular estuvieran en igualdad de condiciones a la hora de publicar. Hasta ese momento, crear una publicacin de difusin mundial resultaba caro y complicado; haca falta redactar, maquetar, imprimir en papel y distribuir. Pero con la Web bastaba con redactar, porque del resto se encargaba la tecnologa de la Red: las pginas HTML depositadas en servidores HTTP.
HTML
Las pginas web no son ms que archivos de texto escritos con el lenguaje HTML (HyperText Markup Language, lenguaje de marcas de hipertexto). Los navegadores analizan las rdenes (o tags) HTML y presentan el texto de acuerdo a las mismas. Existen rdenes para incluir imgenes, sonido, enlaces a otras pginas web, especificar el formato del texto (colores, tamaos, tipografas) o el fondo de la pgina web. Pero eso no es todo; adems de facilitar medios para conseguir pginas ms vistosas, el lenguaje HTML tambin contempla marcas para identificar el documento ante los buscadores y conseguir una mejor clasificacin, esto es, conseguir ser encontrado y ledo.
La Web
Uno de los servicios ms populares de Internet es el World Wide Web (o WWW), ms conocido como Web, una palabra inglesa que significa telaraa. Y es que la relacin es clara; Internet recuerda a las redes que tejen las araas por
441
Google y Yahoo! son dos ejemplos de los buscadores ms populares, pioneros en su gnero, que han servido de referencia a otros lugares similares de la Red.
tes de cada pgina web y de la capacidad que tenga para asignarles la importancia correcta. Hay muchos factores implicados en esta decisin: la cantidad de veces que se repite cada palabra en el idioma y contexto; y el lugar donde se encuentra cada palabra: en el texto, en los subttulos o en el ttulo de la pgina. Otros buscadores tambin analizan la regularidad con que se actualiza la pgina, porque se supone que la informacin es ms interesante en un sitio web que se actualiza de forma peridica. Tambin se valora el hecho de que ese sitio est enlazado desde otras pginas (sin ir ms lejos, Google otorga ms importancia a una pgina con enlaces desde otras sedes diferentes a la original, porque es un sntoma de que muchos internautas encontraron informacin suficientemente interesante como para citarla en sus respectivas pginas). Todos estos detalles hacen que el motor de bsqueda sea ms experto y ofrezca resultados ms tiles al introducir las palabras en cuestin. Los algoritmos de bsqueda y clasificacin son el gran secreto y la clave del xito de los diferentes buscadores. El lenguaje HTML contiene algunas marcas (o tags) destinados a informar a los buscadores sobre el contenido de la pgina. Son los tag title y description. Tienen este formato: <META name=description content= descripcin de la pgina> <META name=keywords content= palabras clave separadas por comas> Los spider dan preferencia al contenido de estos tags, siempre y cuando los consideren crebles (no hay que abusar repitiendo la misma palabra varias veces). Algunos motores de bsqueda son capaces de comparar los tags con el contenido real de la pgina, ignorndolos cuando no son capaces de descubrir la relacin entre ambos.
Los buscadores son protagonistas indiscutibles en la Red; sitios de referencia a los que los navegantes acostumbran a dirigir sus navegadores.
442
EXPERTO EN PC
obtengamos restaurantes sevillanos que no son ni japoneses ni italianos, o restaurantes especializados en la cocina de esos dos pases en cualquier otra ciudad espaola. Eso s, los resultados pueden ser ms o menos satisfactorios porque un buen buscador presentar en las primeras opciones las pginas que contienen todas las palabras. La paja estar en los resultados secundarios, donde aparecern pginas que contienen slo una de las palabras tecleadas. Una simplificacin del lgebra de Boole que nos sirva para usarla en la Web o de lo contrario necesitaramos mucho espacio lleva a la conclusin de que funciona exactamente igual que una operacin matemtica. El operador AND equivale a multiplicar, y OR a sumar. Si la palabra existe en la Web, su lugar es sustituido por un 1, mientras que cuando no existe ser un 0. Los parntesis sirven para alterar el orden de los clculos (segn las leyes matemticas el producto tiene prioridad sobre la suma). El sitio web correcto es el que da un resultado mayor. As, una pgina que contiene restaurante, Sevilla, japons, italiano, quedar as en la frmula: restaurante * Sevilla * (japons + italiano) 1 * 1 * (1+1) = 2 En cambio, otro de Barcelona dar el siguiente resultado, a pesar de que sirva comida japonesa e italiana: restaurante * Barcelona * (japons + italiano) 1 * 0 * (1+1) = 0 El web de Barcelona no aparecer en los resultados, siendo mucho ms precisos gracias al lgebra de Boole. Sin parntesis para alterar el orden del clculo a base de agrupar conceptos, el resultado sera muy distinto: 1* 0 * 1 + 1 = 1
tor que sugiera un directorio en el momento de dar de alta el sitio web, se puede dar el caso de que al final aparezca en otro diferente, ms ajustado a los baremos establecidos en el buscador en cuestin. Estos detalles son los que otorgan calidad y fiabilidad a los diferentes buscadores basados en directorios. Los buscadores de palabras triunfan, pero los directorios siguen ah y pueden ser muy tiles cuando se buscan conceptos que no responden a ninguna palabra clave. Incluso al contrario; la palabra clave puede desvirtuar el resultado porque no refleja los matices de aquello que se quiere encontrar. Por ejemplo, la palabra banco puede aparecer en sitios web sobre pesca, mobiliario urbano y financieros. En este caso, un directorio es el sistema ms indicado para localizar las pginas web que realmente interesan. Adems, una vez en el directorio pueden descubrirse nuevas especialidades (subcategoras) desconocidas.
Saba qu?
Para entender mejor la inmensa cantidad de resultados que aparecen cuando no se usa el lgebra de Boole, tenga presente que los buscadores suelen introducir el operador AND entre todas las palabras tecleadas.
Aunque parece que han cedido el protagonismo, los directorios siguen siendo tiles para buscar determinadas conceptos en Internet.
443
optar por el minimalismo electrnico. Y no se trata en absoluto de una idea basada en lo que podra calificarse como fundamentalismo nostlgico, inspirado en los orgenes de la Red, sino ms bien una forma de acostumbrarse a que el interlocutor puede que est leyendo el correo desde la cubierta de su yate, a unos kilmetros de la costa, y en un ordenador de mano que se conecta a Internet mediante un mvil GPRS de ltima generacin.
Cabeceras
Las cabeceras de los mensajes contienen informacin acerca del sistema del remitente, de todos los servidores por los que ha pasado el mensaje y algunos datos cuyo significado puede, en ocasiones, ser interesante. Cada programa cliente de correo tiene un sistema diferente de mostrar esa informacin, pero siempre est presente. Su aspecto es este:
Return-Path: <yo@stuffera.com> Received: from mail3 (mail3.brinkster.com [66.70.10.236]) by bitassa.com (8.10.2/8.10.2) with ESMTP id g3PCRfC20510 for <tu@bitassa.com>; Thu, 25 Apr 2002 14:27:41 +0200 Received: from pc1.stuffera.com [211.65.233.110] by mail3 with ESMTP (SMTPD32-7.05) id A4ADB0200C0; Thu, 25 Apr 2002 05:21:01 -0700 Message-Id: <5.1.0.14.2.20020425142046.02d57360@mail.bitassa.com> X-Sender: yo@stuffera.com@mail.stuffera.com X-Mailer: QUALCOMM Windows Eudora Version 5.1 X-Priority: 3 Date: Thu, 25 Apr 2002 14:21:08 +0200 To: tu@bitassa.com From: yo@stuffera.com <yo@stuffera.com> Subject: Prueba Mime-Version: 1.0 Content-Type: text/plain; charset=iso-8859-1; format=flowed Content-Transfer-Encoding: 8bit
Transferencia de archivos
Cada servidor aade su nombre, direccin IP, programa de correo utilizado y hora de recepcin tras la palabra Received. As, hay que leer las received de abajo arriba para conocer los servidores por los que ha pasado el mensaje y la hora en que lo ha hecho. El ordenador inicial se llamaba pc1, y se trata del PC de la persona que escribi el mensaje. Las cabeceras que empiezan por X contienen informacin adicional, como la cuenta desde la que se envi, el programa de correo utilizado o la urgencia del mensaje (3 es normal). Las X son muy verstiles pues tambin pueden informar del idioma del programa de correo (X-Accept-Language: es-ES, en), la versin de un programa servidor de listas de correo (X-Mailman-Version: 2.0.8), o la forma de darse de baja en una lista (X-Comment: TO UNSUBSCRIBE: email unsubscribe milista-stuff to majordomo@lalista.org). Las cabeceras Mime-Version, Content-Type y Content-Transfer-Encoding indican al cliente de correo qu juego de caracteres debe usar para representar los caracteres regionales (acentos, la , el smbolo del euro 3 etc.) correctamente. Internet se ha convertido en un inmenso almacn de software desde el que es posible descargar todo tipo de programas. El servicio es indispensable para tener al da el sistema operativo y los programas, a base de actualizaciones que slo se encuentran disponi-
444
EXPERTO EN PC
bles en servidores FTP (File Transfer Protocol, protocolo de transferencia de archivos). Es posible acceder a ellos mediante enlaces en pginas web que con un simple clic ponen en marcha automticamente la descarga. Esto es as porque todos los navegadores incorporan el protocolo FTP como una prestacin ms. Adems de los navegadores, otra herramienta til son los programas cliente especficos para FTP. Se trata de aplicaciones que incorporan todos los detalles necesarios para hacer ms cmoda la tarea de descargar esos archivos. La funcin Resume permite interrumpir una descarga (a propsito o por accidente) para continuarla despus justo en el punto en que se produjo la interrupcin. La configuracin avanzada permite sistemas de transmisin ms seguros, como el FTP pasivo. Existen dos formas de acceder a un servidor FTP: como visitante annimo o con un nombre de usuario y contrasea registrados. Los usuarios annimos generalmente usan el nombre anonymous y como contrasea la cuenta de correo. En este caso slo se puede acceder a las partes pblicas del servidor y no es posible dejar en l ningn archivo. En cambio, los usuarios registrados suelen tener acceso a carpetas privadas, y en algunos casos pueden escribir en el servidor, esto es, dejar archivos que otros usuarios podrn recoger. Un FTP bien administrado, con usuarios y carpetas identificados, es un sistema excelente de intercambio de archivos; un sistema de paquetera en Internet, donde todos los usuarios autorizados dejan y recogen archivos. De hecho, el FTP con nombre de usuario autorizado es el mtodo utilizado para actualizar las pginas web. Por el hecho de entrar con un nombre y contrasea, el servidor identifica al visitante y lo dirige automticamente a la carpeta donde se encuentra su sede web, permitindole enviar, recoger y borrar archivos.
tario en fracciones de segundo siempre y cuando no haya problemas; es inmediato, porque el texto es breve y espontneo; no hace falta releer antes de enviar, ni guardar las formas que se observaran en un mensaje de correo electrnico, mucho ms meditado y formal. Por todas esas razones, algunos programas de mensajera instantnea como ICQ, MSN Messenger, AOL Instant Messenger o Yahoo Instant Messenger se estn convirtiendo en un complemento idneo al correo electrnico.
Saba qu?
El correo electrnico tambin sirve para publicar informacin en Internet: noticias, informes, ideas, puntos de vista todo esto es lo que se puede encontrar en las listas de correo o los grupos de noticias (USENET o Newsgroups), cuyo funcionamiento se basa en el correo electrnico.
Un fenmeno en progresin
P2P es el acrnimo de Peer to Peer (de usuario a usuario). Es un servicio de intercambio de archivos que, desde hace un par de aos, est revolucionando la Red. Uno de los pioneros fue Napster, origen de muchos otros servicios de estas caractersticas cada vez ms avanzados. A diferencia de los otros servicios que se han comentado en esta unidad, el P2P no tiene un protocolo estndar. Se trata de empresas o de usuarios que idean un sistema de intercambio que se hace popular con el tiempo, a medida que nuevos usuarios se van incorporando al grupo. Son servicios directos, de usuario a usuario, como si se tratara de una gran cooperativa. Por esta razn, las respectivas redes tienen ms archivos, y por consiguiente ms valor, a medida que se unen a ellas un mayor nmero de personas. Generalmente hace falta un servidor que se encargue de poner en contacto a los diferentes usuarios de una misma red de intercambio y un programa cliente especfico capaz de enviar los archivos compartidos y guardar los que se reciben. En el momento que el usuario se conecta a la red, el servidor obtiene una lista de los archivos disponibles en cada PC y con ella va elaborando una gran base de datos central. Cuando alguien solicita un archivo, el servidor responde con una lista de PCs donde este se encuentra. El siguiente paso es establecer la conexin de usuario a usuario (de ah el trmino P2P) y empezar la transmisin, que es directa, sin ningn servidor que acte de intermediario.
FTP Pasivo
En una sesin normal, el cliente utiliza el puerto TCP 21 (el habitual para el servicio). A continuacin el servidor abre un canal de datos desde el puerto TCP 20. El problema est en el lado del cliente, que no efecta la conexin con el servidor FTP; slo le dice qu puerto est escuchando y es el servidor quien intenta conectar en el puerto especificado por el cliente. En ese momento, el cortafuegos (firewall) interpreta que un sistema exterior est intentando una conexin y la bloquea. El resultado es que el FTP no funciona. En una sesin de FTP pasivo, el visitante enva al servidor el comando PASV para hacerle saber que desea trabajar en modo pasivo. El servidor responde informando de su direccin IP y del puerto al que enviar los datos, que es variable y est por encima del 1.024. Finalmente, es el cliente quien inicia la sesin, lo que evita que se active el cortafuegos.
IRC
Internet Relay Chat (charla en grupo por Internet) es un servicio basado en la tecnologa cliente/servidor. Las bondades del IRC radican en la inmediatez de las comunicaciones. El usuario sabe que la persona con la que quiere hablar est al otro lado de la lnea, igual que en una llamada telefnica. Es instantneo, porque los mensajes llegan al destina-
445