Sie sind auf Seite 1von 5

SEO: posicionamiento natural en buscadores

5 Cmo funciona la indexacin de los buscadores?

Antes de empezar el SEO lo primero que deberamos hacer es asegurarnos de que


Google o el buscador que sea est leyendo bien nuestra pgina Web.

Cmo funciona esto de leer la pgina Web o qu quiere decir esto


de indexar una pgina Web?

Hace unos 20 aos los buscadores eran bases de datos creadas por humanos, de
hecho eran directorios en los que t tenas que entrar y darte de alta, dabas de alta tu
url (la direccin de tu sitio Web).

Dabas de alta los Keywords por los que queras que te encontrasen: las palabras
clave, el ttulo de tu sitio Web y una breve descripcin.

Cuando alguien entraba en uno de estos directorios, hacia una bsqueda y en funcin
de la palabra clave que buscase se mostraban unos resultados u otros, segn si
encontraba esa palabra clave en uno de los campos, la url, Keyword, title o
description.

Pero todo esto cambi en el ao 98 cuando naci Alta Vista. Alta Vista fue el primer
buscador que utiliz una tecnologa completamente diferente. Empez a utilizar la
tecnologa de indexacin automtica de pginas.

Cmo funciona la tecnologa de indexacin automtica de pginas?

Lo primero que hicieron los tcnicos de Alta Vista fue crear un agente robot o una

araa, la llamamos araa porque en ingls lo llaman spider, porque Web quiere decir
tela de araa, entonces los programas que corren solos por la Web los llaman spiders
y cuando lo traducimos al castellano lo llamamos araa. En realidad el nombre tcnico
es agente robot o robot agent.

Agente, araa, robot y spider es exactamente lo mismo:

http://www.uvic.cat
1
Un pequeo programa que corre slo por Internet y va leyendo todo lo que encuentra.
Cuando entra en un sitio Web lee el contenido y lo enva a la base de datos, vuelve
aqu sigue leyendo y encuentra un enlace, pasa a travs del enlace y sigue leyendo,
vuelve a leer el contenido, base de datos, enlace, pasa, entra, sigue leyendo y lo lleva
a la base de datos; de manera que desde el ao 98 no hace falta ir a los buscadores y
darse de alta, sino que ellos te encuentran, en principio.

El problema es que pueden tardar un tiempo en encontrarte por eso existe la


indexacin express, cmo puedes estar indexado en 48 horas.

Pero sin hacer nada los buscadores deberan, gracias a sus agentes robos, encontrar
nuestro contenido y llevarlo a su base de datos.

Lo que vamos a ver ahora es si estamos en esa base de datos y cuntas pginas de
nuestro Web, de nuestra Web, han sido ya indexadas.

Por qu deberamos comprobar si estamos indexados o no?

1. Pues porque por desgracia las araas no pueden ver segn qu tipo de
programacin; no pueden ver por ejemplo el JavaScript, si nuestro sitio Web lo
ha programado una empresa o un programador acostumbrado a programar
programas de escritorio es posible que haya utilizado JavaScript para hacer
los enlaces. Si este es el caso, las araas no los vern, entonces entrarn en
nuestro sitio Web, leern la pgina de inicio pero no van a ver ninguno de los
enlaces que llevan hacia el interior. As que hay que evitar JavaScript al menos
de la parte de enlaces.
2. Tampoco ven las pop up porque para hacer una pop up, una ventanita que se
abre sin el navegador de arriba, hay que hacerlo en JavaScript, entonces
muchas veces programamos sitios Web en los que vemos todas un listado de
productos, por ejemplo, y que cuando clicas un producto, se abre una ventanita
con la foto del producto y la descripcin del producto pues eso, no va a ser
visto por Google y por lo tanto la descripcin de nuestros productos no se va a
encontrar en este sitio Web.
3. El Flash, por suerte ya casi nadie programa sitios Web en Flash, no se indexa
bien en los buscadores. Google es capaz de leer la pgina de inicio y algo de
contenido, pero no va a ver todo el rbol de contenidos con lo cual todo el
directorio o sea un catlogo de productos o informacin sobre quines somos,
qu hacemos etctera, eso no lo va a ver; hay que evitar los sitios Web en
flash. En la actualidad se utiliza html5 y no hay ningn problema de indexacin.
4. Algunos botones no funcionan, sobre todo cuando tenemos pginas Web con
mucho contenido y tenemos botn en un listado, botn de pgina 1, pgina 2
pgina 3, ver ms; ese ver ms algunas veces no se indexa por qu?
Porque est escrito en JavaScript de nuevo o sea que vigilad con JavaScript.
5. Detrs de un login y password tampoco podemos hacer pasar a una araa,
porque el sitio Web le pregunta el login y ella no sabe qu poner y se va. O sea

http://www.uvic.cat
2
que muchas veces la gente programa extranets, o sea como una intranet
externa, pero sin que sea vea el resto, sin que se vean los productos. Entonces
las araas tampoco van a ver esos productos y por lo tanto esos productos no
van a estar indexados en Google, por eso es importante que vigilemos si algo
se indexa o no.

Cmo podemos saber si nuestro sitio Web est indexado y cuntas


pginas tiene indexadas y cules son?

Vamos a verlo ahora mismo nos vamos a Google y buscaremos lo siguiente:

Primero, para saber si nuestra universidad est indexada teclearamos:

site:uvic.cat

Nota: Es muy importante que no incluyamos espacios entre los dos puntos y el
nombre de la universidad y tampoco las www.

Clicamos y nos dice que tenemos 255.000 resultados aproximadamente y nos sale un
anuncio de Google webmasters, si sale este anuncio es que lo hemos hecho bien pues
Google cree que eres un webmaster y piensa: vamos a ver si se registra en lo que se
llama Google search console, que es como se llamaba antes Google webmasters.

Vamos a interpretar esto, si hemos buscado: site:UVIC.cat

Saldrn 250.000 resultados y nos muestra los resultados.

Estas son las pginas de la Universidad de Vic que Google tiene indexadas, y si quiero
ver la fecha de la ltima vez que una araa la vio:

1. Despliego el triangulito.
2. Clico en cach y aqu me muestra la fecha del ltimo da en el que entr la
araa.

ome de la Universidad de Vic fue indexada el 28 de enero, o sea al


En este caso la h
viernes pasado. Todo perfecto, no hay ningn problema.

Algunas bsquedas ms:

Mi sitio Web.

http://www.uvic.cat
3
Escribo site:montsepenarroya.com (sin las www, sin espacio) y me sale aqu los
resultados, dice: 2.180 pginas. Son muchas menos que la universidad pero claro,
ests se han creado a mano o sea que cuesta crear tantas pginas pues son muchos
aos de ir creando contenidos.

SoloStocks

SoloStocks es una de las pginas Web que yo cre en el ao 98, un marketplace entre
empresas, el mayor de Espaa, y es un sitio Web muy grande. Fjate que tiene
674.000 resultados en Google. Quiere decir que 'la araa' de Google ha navegado por
674.000 pginas de este sitio Web. Eso quiere decir, tambin, que cuando yo busque
oferta de mesas de oficina seguramente encontrara aqu esa oferta.

Para estar segura de si algo est indexado o no, lo que debera hacer es entrar, por
ejemplo, en una de las fichas entro en SoloStocks, clicaria por ejemplo en estas sillas,
copiara la url Control+C, vuelvo a Google y miro si existe en Google est url.

S existe, la encontrara aqu y quiere decir que est indexada, s quiero hacerlo ms
sencillo puedo decirle a Google que lo busque dentro del s ite.

Facebook

Entro en Google y tecleo site:facebook.com y veo que tienen 2.650 millones de


resultados indexados, imagina la capacidad de Google para indexar, si slo de esta
Web ya tiene 2.650 millones de resultados.

Nota: te enseo la de Facebook por dos cosas:

La primera para que tengas claro que todo lo que pasa en Facebook acaba indexado
en Google, excepto si el usuario tiene un nivel de seguridad muy elevado, pero sino
acabar indexado.

Para poder comprobar, por ejemplo, en cuntas pginas de Facebook se habla de


nosotros, lo haramos as:

Escribimos en Google site:facebook.com y escribimos a continuacin por


ejemplo Montse Pearroya, cerramos las comillas entramos, y, me dice que
en 253 pginas de Facebook se habla de Montse Pearroya, tendra que
comprobar cules son.

Esto puede sernos muy til para gestionar lo que es la reputacin de alguien en
Internet, pero tambin a nivel de SEO es importante porque vamos a ver cuando
tratemos el algoritmo que una de las cosas que Google tiene en cuenta una de las
variables es en cuantas pginas de nuestro sitio Web sale una frase clave as que
deberemos comprobar que las frases por las que deseamos salir en primeras

http://www.uvic.cat
4
posiciones las tengamos en el mximo nmero de pginas de nuestro sitio Web, pero
ya lo veremos un poco ms adelante en los vdeos dedicados al algoritmo.

Qu deberas hacer ahora?

Ahora deberas realizar unas cuantas bsquedas por site:nombredelsitioweb.com


que quieras.

Prubalo con sitios pequeos y con sitios grandes, sobre todo no incluyas las www, ni
pongas un espacio. Si incluyeses las www entonces estaras discriminando los
subdominios y te dejaras pginas y si incluyes un espacio directamente Google no
entiende lo que le ests preguntando y te va a dar resultados de pginas en las que
sale la palabra site y en las que sale el nombre de tu sitio Web, as que no servira.

http://www.uvic.cat
5

Das könnte Ihnen auch gefallen