Beruflich Dokumente
Kultur Dokumente
Alumnos:
- Romero Colqui, Lesly Stefany
- Ormeo Vera, Wilber Javier
INDICE
Fundamentos y Estado del Arte .
Introduccin a la Recuperacin de Informacin
1.1. Recuperacin de Informacin.
1.2. Sistemas de Recuperacin de Informacin.
1.3. Modelos para la recuperacin de informacin.
1.4. Sistemas de Recuperacin de Informacin en la Web.
Metodologas para la Evaluacin de Buscadores Web
2.1. Evaluacin de buscadores web.
2.2. Mtricas de evaluacin.
2.3. Metodologas de evaluacin de buscadores.
2.4. Propuesta de la TREC (Text Retrieval Conference).
2.5. Herramientas para la evaluacin.
2.6. Trabajos Relacionados.
Desarrollo de la Metodologa
Diseo de la Metodologa
3.1. Definicin del alcance.
3.2. Diseo de la metodologa.
3.3. Seleccin de resultados por parte del usuario.
Aplicacin de la metodologa
4.1. Introduccin.
4.2. Seleccin de buscadores web. .
4.2.1. Caractersticas de Google.
4.2.2. Caractersticas Bing. .
4.3. Evaluacin de la usabilidad.
4.4. Aplicacin de la metodologa en dos buscadores
generales.
4.5. Aplicacin de la metodologa en dos buscadores
Conclusiones.
Recomendaciones.
Bibliografa
OBJETIVO GENERAL:
Definicin de
PARTE 1
Fundamentos y estado del arte
INTRODUCCIN
Las teoras de informacin han ido mejorando el acceso a pginas
web de muchos usuarios.
Pero antes desconocimiento de algunas personas surgieron los
buscadores web, pero como saber cual utilizar para esto
necesitamos desarrollar una metodologa de evaluacin, esta
consiste en realizar una comparacin del funcionamiento de los
buscadores web desde diversos criterios y as encontrar el mejor
buscador.
CAPTULO 1
Introduccin a la Recuperacin de Informacin
MODELO
DESCRIPCIN
Modelos clsicos
Modelos alternativos
Modelos lgicos
MODELO BOOLEANO
las consultas realizadas con este mtodo se las desarrolla de forma similar a como se las
ejecuta en una base de datos tradicional, es decir con operadores booleanos
.
.[ ]
MODELO PROBABILISTICO
Calcula la probabilidad de que un documento sea relevante para una consulta
debido a que el documento tiene propiedades que facilitan esta operacin.
se utiliza lenguaje natural, la que a travs del uso de la semntica de los textos
facilita la recuperacin de informacin.
1. Motores de bsqueda.
Aplicacin que maneja grandes cantidades de informacin que esta
almacenada en sus servidores y que son recopiladas por medio del uso de
robots encargados de recolectar la informacin de todas las pginas web
existentes en el ciberespacio.
Utiliza una algoritmo de clasificacin que procede a ordenarlas segn su
nmero de enlaces.
2.Directorios
Son aplicaciones controladas por humanos, el principio es similar al
de los motores de bsqueda pero en los directorios se ordena la
informacin recopilada de acuerdo a temticas previamente
establecidas.
CAPTULO 2
Metodologas para la Evaluacin de Buscadores Web
Precisin =
No relevantes
Recuperados
AB
AB
No recuperados
AB
AB
Recall =
Parte 2
Desarrollo de la metodologa
Captulo 3
Diseo de la Metodologa
3.1. Definicin del alcance.
Evaluar dos buscadores web en base a resultados (url) iguales.
Los buscadores califican los resultados de
acuerdo al algoritmo de ranking de cada
uno de ellos, esta puede ser basada en
los enlaces que entran y salen de cada
pgina web
a)La bsqueda:
Es lo primero que el usuario realiza, encontrar el lugar donde va a realizar la
consulta.
Sugerencias de bsqueda.
Este parmetro mide si el buscador le
presenta alguna sugerencia mientras realiza
el ingreso de la consulta.
Control de vocabulario.
Este parmetro mide si el buscador le sugiere
cmo escribir una palabra.
b) La usabilidad:
Consiste en analizar la facilidad de uso que el buscador va a presentar al usuario.
Accesibilidad
Permite evaluar si la arquitectura del buscador es comprensiva y si
buscador le brinda la ayuda al usuario en el proceso de consulta.
Navegacin.
Permite evaluar la facilidad de desplazamiento a travs de cada pgina de
resultados del buscador.
Ayuda en lnea.
Permite evaluar si el buscador ayuda al usuario a travs de una gua de uso del
buscador.
Lenguaje y contenido.
Permite evaluar que los resultados presentados sean claros y que el buscador
tenga claridad textual en su presentacin.
Una limitacin que se ha encontrado es la dificultad al momento de obtener el valor real del ranking de
cada pgina web desde los servicios web del buscador
Tipo de buscador
H/V/S
Tipo de consulta
N/T/I
Algoritmo de
ranking
Aspectos a evaluar
El textbox de bsqueda es fcil de
encontrar?
El buscador es predictivo?
El buscador tiene ayuda en lnea?
El buscador se presenta con lenguaje
claro?
Si
No
Palabra
consultada
Url
Palabra de
enlace
Informacin
de la web
Posicin en
la que
aparece
Consulta
simple o
compleja
Utilizo
operadores
booleanos
Para seleccionar los resultados con los que se va a trabajar se debe filtrar la
informacin para extraer las respuestas que tengan url igual, el propsito
de utilizar las urls para comparar igualdad de resultados es porque las
urls son direcciones y cada pgina web pertenece a una sola direccin, en
caso de utilizar las palabras que las identifican para comparar la similitud
obtendramos resultados de similitud ambiguos .
Una vez que obtenemos nicamente los resultados que coinciden en sus
urls, se proceder a presentar al usuario una tabla de resultados, estos
resultados se los considera como los resultados ms idneos seleccionados
por los buscadores.
Url
Palabra de
enlace
Informacin
de la web
Posicin
en la que
aparece en
el
buscador 1
Posicin
en la que
aparece en
el
buscador 2
Consulta
simple o
compleja
Utilizo
operadores
booleanos
Intencin de la
bsqueda
Palabra buscada
Buscador
Tipo de
respuesta
Promedio
de
posiciones
en que
aparecen
Para el recall es
R=
Captulo 4
APLICACIN DE LA METODOLOGA
4.1 introduccin
Para aplicar esta metodologa es necesario seleccionar los buscadores web, estos deben tener
las caractersticas necesarias expuestas en la tabla 3.6.
Una vez identificadas estas caractersticas y de analizar que los buscadores la renen pasamos a
aplicar la metodologa.
4.3
evaluacin
de
la
usabilidad
La encuesta propuesta para evaluar la facilidad de uso del buscador web, se la debe
llenar con la informacin obtenida en los dos buscadores.
La encuesta realizada fue tomada a una muestra de 20 personas seleccionadas al
azar, obteniendo as los siguientes resultados.
Con estos resultados se concluye que el buscador Google es ms fcil de utilizar que
el buscador Bing de acuerdo a la encuesta realizada.
buscadores especializados se
Anexo 1
DISCUSIN Y ANLISIS DE LOS RESULTADOS
Anexo 2
PROCESO DE EXTRACCIN DE DATOS
Anexo 3
ENCUESTA
Estas preguntas y las dems presentan solo 2 alternativas para hacer ms sencilla la recoleccin de
datos, estas son:
a)
SI
b)
No