Sie sind auf Seite 1von 5

EXPERTO EN PC

Internet (2)
FTP, HTTP, SMTP, POP3 o IRC son acrnimos que se han hecho tan populares como la propia Internet. Detrs de ellos se encuentran servicios diferentes, pero todos con el mismo objetivo: mantener comunicados a los internautas.

a comunicacin entre personas y la transmisin de informacin puede establecerse de distintas formas: una conversacin telefnica, una tertulia de bar, la confidencia de un amigo, una conferencia pblica, la televisin, la radio, el peridico, los libros, las enciclopedias, etc. Cada situacin tiene su momento. En Internet tambin es posible usar distintos sistemas de comunicacin, el ms apropiado para cada circunstancia. Al principio el Web llama la atencin, pero sirve de muy poco si el usuario no es capaz de encontrar las pginas que est buscando. Poco a poco la libreta de contactos del gestor de e-mail va aumentando, al mismo tiempo que el correo electrnico se convierte en un medio de comunicacin personal y profesional importantsimo. Despus se descubren las ventajas de la comunicacin inmediata que ofrece el chat, tanto en el entorno laboral como en los momentos de ocio. Y a medida que la informacin y las herramientas digitales adquieren importancia, los sistemas de intercambio de archivos son la forma ideal de mantener al da tanto los programas como la biblioteca de archivos digitales. Todas ellas (Web, correo, chat, P2P), de las que se habla con profundidad en las siguientes pginas, son herramientas imprescindibles para andar bien calzado por la Red.

varios motivos: en primer lugar por su topologa, una maraa de hilos conectados que forman una malla, en este caso mundial; despus porque los documentos de la Web tambin estn conectados entre s a travs de enlaces de hipertexto y, finalmente, es una telaraa porque atrapa (Internet es una red que engancha a millones de personas atradas por los servicios y posibilidades de este nuevo medio de comunicacin). La Web ha triunfado por la posibilidad de incluir grficos, sonido y enlaces, todo ello en archivos muy fciles de crear y colocar en servidores cada vez ms asequibles. La aparicin de la Web supuso que tanto una gran multinacional como un particular estuvieran en igualdad de condiciones a la hora de publicar. Hasta ese momento, crear una publicacin de difusin mundial resultaba caro y complicado; haca falta redactar, maquetar, imprimir en papel y distribuir. Pero con la Web bastaba con redactar, porque del resto se encargaba la tecnologa de la Red: las pginas HTML depositadas en servidores HTTP.

HTML
Las pginas web no son ms que archivos de texto escritos con el lenguaje HTML (HyperText Markup Language, lenguaje de marcas de hipertexto). Los navegadores analizan las rdenes (o tags) HTML y presentan el texto de acuerdo a las mismas. Existen rdenes para incluir imgenes, sonido, enlaces a otras pginas web, especificar el formato del texto (colores, tamaos, tipografas) o el fondo de la pgina web. Pero eso no es todo; adems de facilitar medios para conseguir pginas ms vistosas, el lenguaje HTML tambin contempla marcas para identificar el documento ante los buscadores y conseguir una mejor clasificacin, esto es, conseguir ser encontrado y ledo.

La Web
Uno de los servicios ms populares de Internet es el World Wide Web (o WWW), ms conocido como Web, una palabra inglesa que significa telaraa. Y es que la relacin es clara; Internet recuerda a las redes que tejen las araas por

441

HARDWARE INTERNET (2)

Google y Yahoo! son dos ejemplos de los buscadores ms populares, pioneros en su gnero, que han servido de referencia a otros lugares similares de la Red.

Grandes protagonistas HTTP


El protocolo HTTP (HyperText Transfer Protocol, protocolo de transferencia hipertexto) define cmo viaja la informacin de las pginas web (texto, grficos, imgenes, sonido) y trabaja en la capa de aplicaciones del protocolo TCP/IP. HTTP controla el dilogo entre navegadores y servidores web. Por ejemplo, cuando se escribe una direccin en el navegador, este enva al servidor un comando HTTP de peticin de pgina web. No todos los internautas publican pginas web; pero cuando se trata de encontrar en Internet lo que se est buscando, la unanimidad es absoluta: dominar los buscadores es imprescindible para no ir dando tumbos por el ciberespacio hasta quedar hastiado; una de las experiencias ms frustrantes que quien ms quien menos ha experimentado en algn momento. En primer lugar hace falta distinguir entre las dos familias ms importantes de buscadores: directorios, por un lado; y palabras clave, por el otro. La mayora incluyen los dos sistemas, pero normalmente cada buscador est especializado en uno de ellos, siendo el otro un accesorio. Por ejemplo, Google es un buscador especializado en palabras clave que tambin contiene directorios, pero como accesorio; ni siquiera aparece en la portada. Yahoo! es el buscador con el mayor directorio del web, bien visible en la portada. Tambin permite buscar palabras clave, pero no es su especialidad.

tes de cada pgina web y de la capacidad que tenga para asignarles la importancia correcta. Hay muchos factores implicados en esta decisin: la cantidad de veces que se repite cada palabra en el idioma y contexto; y el lugar donde se encuentra cada palabra: en el texto, en los subttulos o en el ttulo de la pgina. Otros buscadores tambin analizan la regularidad con que se actualiza la pgina, porque se supone que la informacin es ms interesante en un sitio web que se actualiza de forma peridica. Tambin se valora el hecho de que ese sitio est enlazado desde otras pginas (sin ir ms lejos, Google otorga ms importancia a una pgina con enlaces desde otras sedes diferentes a la original, porque es un sntoma de que muchos internautas encontraron informacin suficientemente interesante como para citarla en sus respectivas pginas). Todos estos detalles hacen que el motor de bsqueda sea ms experto y ofrezca resultados ms tiles al introducir las palabras en cuestin. Los algoritmos de bsqueda y clasificacin son el gran secreto y la clave del xito de los diferentes buscadores. El lenguaje HTML contiene algunas marcas (o tags) destinados a informar a los buscadores sobre el contenido de la pgina. Son los tag title y description. Tienen este formato: <META name=description content= descripcin de la pgina> <META name=keywords content= palabras clave separadas por comas> Los spider dan preferencia al contenido de estos tags, siempre y cuando los consideren crebles (no hay que abusar repitiendo la misma palabra varias veces). Algunos motores de bsqueda son capaces de comparar los tags con el contenido real de la pgina, ignorndolos cuando no son capaces de descubrir la relacin entre ambos.

Bsquedas avanzadas Buscar mediante palabras clave


Los buscadores por palabras clave cuentan con una base de datos inmensa, que contiene todas las palabras relevantes que encontr en las pginas web visitadas. Por ello, el primer trabajo de un buscador consiste en consultar la pgina y leerla, para lo que usa unos programas que se conocen con el nombre de spiders. La eficacia de un buscador depende de la habilidad que muestre a la hora de seleccionar qu palabras claves son las ms importanAlgunos buscadores basados en palabras clave permiten escribir largas cadenas de bsqueda basadas en el lgebra de Boole (por ejemplo, la bsqueda avanzada de Altavista). Conocerla y usarla puede ser un factor clave para conseguir resultados ms precisos. As, no es lo mismo solicitar la bsqueda de restaurantes italianos o japoneses en Sevilla con este texto, que teclear la orden booleana restaurante AND Sevilla AND (japons OR italiano). En el primer caso, es muy posible que

Los buscadores son protagonistas indiscutibles en la Red; sitios de referencia a los que los navegantes acostumbran a dirigir sus navegadores.

442

EXPERTO EN PC

obtengamos restaurantes sevillanos que no son ni japoneses ni italianos, o restaurantes especializados en la cocina de esos dos pases en cualquier otra ciudad espaola. Eso s, los resultados pueden ser ms o menos satisfactorios porque un buen buscador presentar en las primeras opciones las pginas que contienen todas las palabras. La paja estar en los resultados secundarios, donde aparecern pginas que contienen slo una de las palabras tecleadas. Una simplificacin del lgebra de Boole que nos sirva para usarla en la Web o de lo contrario necesitaramos mucho espacio lleva a la conclusin de que funciona exactamente igual que una operacin matemtica. El operador AND equivale a multiplicar, y OR a sumar. Si la palabra existe en la Web, su lugar es sustituido por un 1, mientras que cuando no existe ser un 0. Los parntesis sirven para alterar el orden de los clculos (segn las leyes matemticas el producto tiene prioridad sobre la suma). El sitio web correcto es el que da un resultado mayor. As, una pgina que contiene restaurante, Sevilla, japons, italiano, quedar as en la frmula: restaurante * Sevilla * (japons + italiano) 1 * 1 * (1+1) = 2 En cambio, otro de Barcelona dar el siguiente resultado, a pesar de que sirva comida japonesa e italiana: restaurante * Barcelona * (japons + italiano) 1 * 0 * (1+1) = 0 El web de Barcelona no aparecer en los resultados, siendo mucho ms precisos gracias al lgebra de Boole. Sin parntesis para alterar el orden del clculo a base de agrupar conceptos, el resultado sera muy distinto: 1* 0 * 1 + 1 = 1

tor que sugiera un directorio en el momento de dar de alta el sitio web, se puede dar el caso de que al final aparezca en otro diferente, ms ajustado a los baremos establecidos en el buscador en cuestin. Estos detalles son los que otorgan calidad y fiabilidad a los diferentes buscadores basados en directorios. Los buscadores de palabras triunfan, pero los directorios siguen ah y pueden ser muy tiles cuando se buscan conceptos que no responden a ninguna palabra clave. Incluso al contrario; la palabra clave puede desvirtuar el resultado porque no refleja los matices de aquello que se quiere encontrar. Por ejemplo, la palabra banco puede aparecer en sitios web sobre pesca, mobiliario urbano y financieros. En este caso, un directorio es el sistema ms indicado para localizar las pginas web que realmente interesan. Adems, una vez en el directorio pueden descubrirse nuevas especialidades (subcategoras) desconocidas.

Saba qu?
Para entender mejor la inmensa cantidad de resultados que aparecen cuando no se usa el lgebra de Boole, tenga presente que los buscadores suelen introducir el operador AND entre todas las palabras tecleadas.

Aunque parece que han cedido el protagonismo, los directorios siguen siendo tiles para buscar determinadas conceptos en Internet.

Correo electrnico Saba qu?


Los internautas ms veteranos tienen dudas a la hora de responder a la siguiente pregunta: es ms importante el correo electrnico que la WWW? Y es que cuando se usa el e-mail a diario, el usuario se acaba dando cuenta de que quiz podra pasar algunos das sin consultar pginas web... pero, en absoluto podra prescindir del correo. Aunque los clientes de correo electrnico permiten que los mensajes tengan el mismo aspecto grfico que una pgina web, el servicio se ide para transmitir texto de la forma ms rpida y breve posible. El objetivo era hacerlo universal, y la sencillez esencial del invento permite que ahora sea posible consultar el correo desde un ordenador de mano, el telfono mvil o los terminales basados en texto en un sistema UNIX o Linux. Por ello, cuando los mensajes estn dirigidos a un grupo de personas, no est de ms tener en cuenta esa diversidad y Uno de los bienes ms preciados para los creadores de pginas web consiste en aparecer en los primeros lugares de los resultados cuando el internauta busca una palabra clave relacionada con el web (las estadsticas dicen que la mayora de visitantes no van ms all de la tercera o cuarta pgina de resultados). Si quiere conocer un estudio del uso que hacen los internautas de los buscadores puede consultar en www. searchenginewatch.com/ reports/mmxi-europe.html.

Buscar mediante directorios


En lugar de spiders, los buscadores basados en directorios emplean a personas para visitar las pginas y colocarlas en el rea correspondiente. Crear y mantener las suficientes categoras y subcategoras jerrquicas, de forma clara y a la vez exhaustiva, es todo un arte y la esencia de este tipo de buscadores. Sin duda, el xito del lugar depende de la fortuna y el criterio que se haya seguido a la hora de organizar el rbol temtico. Aunque la mayora de buscadores piden al au-

443

HARDWARE INTERNET (2)

optar por el minimalismo electrnico. Y no se trata en absoluto de una idea basada en lo que podra calificarse como fundamentalismo nostlgico, inspirado en los orgenes de la Red, sino ms bien una forma de acostumbrarse a que el interlocutor puede que est leyendo el correo desde la cubierta de su yate, a unos kilmetros de la costa, y en un ordenador de mano que se conecta a Internet mediante un mvil GPRS de ltima generacin.

Los agentes de la comunicacin


En la transmisin de correo electrnico intervienen dos tipos de servidor es: SMTP (Simple Mail Transfer Protocol, protocolo simple de transferencia de correo) y POP3 (Postal Office Protocol, protocolo de correos). Para entender su funcionamiento sirve la metfora del correo postal convencional: el SMTP es el equivalente a las furgonetas y camiones de correos, y el POP3 a las personas que van a la oficina postal ms cercana (o al buzn) para recoger la correspondencia. As, en Internet, cuando enviamos un mensaje este viaja con el protocolo SMTP hasta el servidor de destino. El receptor lo recoger del servidor y lo depositar en su PC (en casa) con el protocolo POP. POP3 es un protocolo que abre el buzn y recoge el correo, por lo que necesita un nombre de usuario y una contrasea. En cambio, el SMTP es mucho ms simple (tal como indica la primera de las siglas de su acrnimo) y cualquiera puede ordenar un envo a un servidor SMTP, basta con introducir su nombre en la configuracin del programa cliente de correo electrnico. Justamente por eso, por la disponibilidad absoluta sin preguntar absolutamente nada, ha surgido uno de los fenmenos ms molestos del correo electrnico: los mensajes de publicidad basura (o spam). Cualquiera poda usar un servidor SMTP para repartir millones de mensajes sin pagar nada a cambio. Para solucionar esa problemtica, el servicio SMTP est evolucionando con el objetivo de restringir su uso slo a los usuarios reales, que puedan ser localizados en caso de recibir denuncias por utilizar esta tcnica.

Cabeceras
Las cabeceras de los mensajes contienen informacin acerca del sistema del remitente, de todos los servidores por los que ha pasado el mensaje y algunos datos cuyo significado puede, en ocasiones, ser interesante. Cada programa cliente de correo tiene un sistema diferente de mostrar esa informacin, pero siempre est presente. Su aspecto es este:

Return-Path: <yo@stuffera.com> Received: from mail3 (mail3.brinkster.com [66.70.10.236]) by bitassa.com (8.10.2/8.10.2) with ESMTP id g3PCRfC20510 for <tu@bitassa.com>; Thu, 25 Apr 2002 14:27:41 +0200 Received: from pc1.stuffera.com [211.65.233.110] by mail3 with ESMTP (SMTPD32-7.05) id A4ADB0200C0; Thu, 25 Apr 2002 05:21:01 -0700 Message-Id: <5.1.0.14.2.20020425142046.02d57360@mail.bitassa.com> X-Sender: yo@stuffera.com@mail.stuffera.com X-Mailer: QUALCOMM Windows Eudora Version 5.1 X-Priority: 3 Date: Thu, 25 Apr 2002 14:21:08 +0200 To: tu@bitassa.com From: yo@stuffera.com <yo@stuffera.com> Subject: Prueba Mime-Version: 1.0 Content-Type: text/plain; charset=iso-8859-1; format=flowed Content-Transfer-Encoding: 8bit

Transferencia de archivos
Cada servidor aade su nombre, direccin IP, programa de correo utilizado y hora de recepcin tras la palabra Received. As, hay que leer las received de abajo arriba para conocer los servidores por los que ha pasado el mensaje y la hora en que lo ha hecho. El ordenador inicial se llamaba pc1, y se trata del PC de la persona que escribi el mensaje. Las cabeceras que empiezan por X contienen informacin adicional, como la cuenta desde la que se envi, el programa de correo utilizado o la urgencia del mensaje (3 es normal). Las X son muy verstiles pues tambin pueden informar del idioma del programa de correo (X-Accept-Language: es-ES, en), la versin de un programa servidor de listas de correo (X-Mailman-Version: 2.0.8), o la forma de darse de baja en una lista (X-Comment: TO UNSUBSCRIBE: email unsubscribe milista-stuff to majordomo@lalista.org). Las cabeceras Mime-Version, Content-Type y Content-Transfer-Encoding indican al cliente de correo qu juego de caracteres debe usar para representar los caracteres regionales (acentos, la , el smbolo del euro 3 etc.) correctamente. Internet se ha convertido en un inmenso almacn de software desde el que es posible descargar todo tipo de programas. El servicio es indispensable para tener al da el sistema operativo y los programas, a base de actualizaciones que slo se encuentran disponi-

444

EXPERTO EN PC

bles en servidores FTP (File Transfer Protocol, protocolo de transferencia de archivos). Es posible acceder a ellos mediante enlaces en pginas web que con un simple clic ponen en marcha automticamente la descarga. Esto es as porque todos los navegadores incorporan el protocolo FTP como una prestacin ms. Adems de los navegadores, otra herramienta til son los programas cliente especficos para FTP. Se trata de aplicaciones que incorporan todos los detalles necesarios para hacer ms cmoda la tarea de descargar esos archivos. La funcin Resume permite interrumpir una descarga (a propsito o por accidente) para continuarla despus justo en el punto en que se produjo la interrupcin. La configuracin avanzada permite sistemas de transmisin ms seguros, como el FTP pasivo. Existen dos formas de acceder a un servidor FTP: como visitante annimo o con un nombre de usuario y contrasea registrados. Los usuarios annimos generalmente usan el nombre anonymous y como contrasea la cuenta de correo. En este caso slo se puede acceder a las partes pblicas del servidor y no es posible dejar en l ningn archivo. En cambio, los usuarios registrados suelen tener acceso a carpetas privadas, y en algunos casos pueden escribir en el servidor, esto es, dejar archivos que otros usuarios podrn recoger. Un FTP bien administrado, con usuarios y carpetas identificados, es un sistema excelente de intercambio de archivos; un sistema de paquetera en Internet, donde todos los usuarios autorizados dejan y recogen archivos. De hecho, el FTP con nombre de usuario autorizado es el mtodo utilizado para actualizar las pginas web. Por el hecho de entrar con un nombre y contrasea, el servidor identifica al visitante y lo dirige automticamente a la carpeta donde se encuentra su sede web, permitindole enviar, recoger y borrar archivos.

tario en fracciones de segundo siempre y cuando no haya problemas; es inmediato, porque el texto es breve y espontneo; no hace falta releer antes de enviar, ni guardar las formas que se observaran en un mensaje de correo electrnico, mucho ms meditado y formal. Por todas esas razones, algunos programas de mensajera instantnea como ICQ, MSN Messenger, AOL Instant Messenger o Yahoo Instant Messenger se estn convirtiendo en un complemento idneo al correo electrnico.

Saba qu?
El correo electrnico tambin sirve para publicar informacin en Internet: noticias, informes, ideas, puntos de vista todo esto es lo que se puede encontrar en las listas de correo o los grupos de noticias (USENET o Newsgroups), cuyo funcionamiento se basa en el correo electrnico.

Un fenmeno en progresin
P2P es el acrnimo de Peer to Peer (de usuario a usuario). Es un servicio de intercambio de archivos que, desde hace un par de aos, est revolucionando la Red. Uno de los pioneros fue Napster, origen de muchos otros servicios de estas caractersticas cada vez ms avanzados. A diferencia de los otros servicios que se han comentado en esta unidad, el P2P no tiene un protocolo estndar. Se trata de empresas o de usuarios que idean un sistema de intercambio que se hace popular con el tiempo, a medida que nuevos usuarios se van incorporando al grupo. Son servicios directos, de usuario a usuario, como si se tratara de una gran cooperativa. Por esta razn, las respectivas redes tienen ms archivos, y por consiguiente ms valor, a medida que se unen a ellas un mayor nmero de personas. Generalmente hace falta un servidor que se encargue de poner en contacto a los diferentes usuarios de una misma red de intercambio y un programa cliente especfico capaz de enviar los archivos compartidos y guardar los que se reciben. En el momento que el usuario se conecta a la red, el servidor obtiene una lista de los archivos disponibles en cada PC y con ella va elaborando una gran base de datos central. Cuando alguien solicita un archivo, el servidor responde con una lista de PCs donde este se encuentra. El siguiente paso es establecer la conexin de usuario a usuario (de ah el trmino P2P) y empezar la transmisin, que es directa, sin ningn servidor que acte de intermediario.

FTP Pasivo
En una sesin normal, el cliente utiliza el puerto TCP 21 (el habitual para el servicio). A continuacin el servidor abre un canal de datos desde el puerto TCP 20. El problema est en el lado del cliente, que no efecta la conexin con el servidor FTP; slo le dice qu puerto est escuchando y es el servidor quien intenta conectar en el puerto especificado por el cliente. En ese momento, el cortafuegos (firewall) interpreta que un sistema exterior est intentando una conexin y la bloquea. El resultado es que el FTP no funciona. En una sesin de FTP pasivo, el visitante enva al servidor el comando PASV para hacerle saber que desea trabajar en modo pasivo. El servidor responde informando de su direccin IP y del puerto al que enviar los datos, que es variable y est por encima del 1.024. Finalmente, es el cliente quien inicia la sesin, lo que evita que se active el cortafuegos.

IRC
Internet Relay Chat (charla en grupo por Internet) es un servicio basado en la tecnologa cliente/servidor. Las bondades del IRC radican en la inmediatez de las comunicaciones. El usuario sabe que la persona con la que quiere hablar est al otro lado de la lnea, igual que en una llamada telefnica. Es instantneo, porque los mensajes llegan al destina-

445

Das könnte Ihnen auch gefallen