Beruflich Dokumente
Kultur Dokumente
1, Mayo 2008
19
I. INTRODUCCIN
20
21
D. Sistemas recomendadores
Los sistemas recomendadores (RS) se aplican
actualmente en muchos sectores del entorno web, entre
estos podemos citar: 1) el e-comercio para ofrecer servicios
personalizados al cliente [26]; 2) en los buscadores de
pginas web para evitar la sobrecarga de informacin [27];
3) en las bibliotecas digitales para ayudar a encontrar los
libros o artculos que se ajustan a las preferencias del
usuario [28]. Otro campo de aplicacin de los RS, que es
muy reciente y est actualmente en auge es el e-learning
[29,30] donde utilizando distintas tcnicas de
recomendacin se le recomienda al alumno una actividad de
aprendizaje on-line o un camino de navegacin ptimo
basado en sus preferencias, conocimientos y el histrico de
navegacin de otros alumnos de caractersticas similares.
Las tcnicas de recomendacin [31] poseen varias
clasificaciones basndose en las fuentes de datos sobre las
cuales se hacen las recomendaciones y el uso que se le da a
estos datos. La aproximacin de filtrado colaborativo (CFS:
Collaborative Filtering System), tambin llamado filtrado
social, depende de una base de datos de productos, as
como datos demogrficos y otras evaluaciones de un
posible consumidor de algunos productos an no
experimentados. Esta tcnica es quizs la ms familiar, la
ms implementada y la ms madura de las tcnicas de
recomendacin [32]. La idea principal de CFS es la
automatizacin del proceso del "boca-a-boca" por el que la
gente recomienda productos o servicios unos a otros. Si el
usuario necesita elegir entre varias opciones de las que no
tiene ninguna experiencia, ste probablemente confiar en
las opiniones de aquellos que s tienen esa experiencia. Por
otra parte, la tcnica de recomendacin basada en el
conocimiento (KBR: Knowledge-Based Recommendation)
intenta sugerir objetos basados en inferencias sobre las
preferencias y necesidades del usuario. Se distingue de las
dems tcnicas en que sta tiene un conocimiento previo
funcional sobre cmo un item en particular puede satisfacer
la necesidad de un usuario y por tanto puede razonar sobre
la relacin entre esta necesidad y una posible
recomendacin. El perfil del usuario puede ser cualquier
estructura de conocimiento que soporte esta inferencia. En
el caso simple de Google, por ejemplo, ser simplemente la
consulta que formula el usuario. En otros, puede ser una
representacin ms detallada de las necesidades del usuario
[33].
III.
22
Wusuarios R =
i
NumVotosUs ( Ri )
m
j =1
NumVotosUs ( R j )
23
Wexpertos R =
i
NumVotosEx p ( Ri )
k
j =1
NumVotosEx p ( R j )
WAcci = WRi
j =1
acc( Ri j )
m
24
25
26
TABLA I
ATRIBUTOS DE DATOS UTILIZADOS EN EL PROCESO DE MINERA
Nivel
V. SECCIN EXPERIMENTAL
Para probar nuestra arquitectura necesitbamos datos
sobre los que aplicar el proceso de minera. Durante el curso
acadmico 2004-2005 se llev a cabo en Crdoba la primera
experiencia piloto en Espaa para la alfabetizacin
tecnolgica de mujeres del entorno rural, denominado
Cordobesas Enredadas. Para la ejecucin del proyecto se
desarrollaron 7 cursos correspondientes a los temarios
ECDL (Licencia Europea para Manejo del Ordenador),
basados en el sistema operativo Guadalinex y el paquete de
ofimtica OpenOffice.
A. Obtencin de datos con INDESAHC
Los cursos se desarrollaron con la herramienta autor
INDESAHC [38], que permite la creacin de cursos
hipermedia adaptativos compatibles con Moodle. La
definicin del curso est basada en un modelo jerrquico
formado por temas divididos en lecciones y donde cada
leccin contiene una serie de conceptos para la explicacin
o evaluacin de los contenidos de la materia a travs de
escenarios o pginas web (Figura 6). Tambin se incluye un
modelo de adaptacin que adapta los contenidos al nivel de
conocimiento del alumno. Dicho modelo est basado en un
esquema de ocultacin de enlaces [4] previa clasificacin de
los contenidos del curso de acuerdo a distintos niveles de
dificultad.
La Tabla I muestra, por una parte, los atributos de datos
relacionados con el curso hipermedia adaptativo, que se han
aadido como tablas nuevas a la base de datos de Moodle y
por otra, otros atributos relacionados con recursos didcticos
tales como foros, chats, cuestionarios y tareas que se
introducen tambin desde la interfaz de la herramienta autor.
Una vez que el curso es generado y publicado en Moodle,
ya estamos en disposicin de utilizar los datos de
seguimiento de los alumnos como datos de entrada del
proceso de minera.
Curso
Tema
Atributo
duration
c_time
c_score
c_attempt
c_quiz_attempt
c_quiz_time
c_quiz_score
c_chat_messages
assignment_score
forum_read
forum_post
doc_view
u-lessons
u_time
u_initial_score
u_final_score
u_attempt
forum_read
forum_post
assignment_score
doc_view
Leccin
Ejercicio
l_concepts
l_time
Descripcin
Duracin estimada para el curso
Tiempo invertido por el alumno
Nota media del curso
N intentos antes de aprobar el
curso
N intentos en el cuestionario
Tiempo total en el cuestionario
Nota obtenida en el cuestionario
N de mensajes enviados al chat
Nota de la tarea
N de mensajes ledos en el foro
N de mensajes puestos en el foro
Si ha consultado el documento
N de lecciones del tema
Tiempo en completar el tema
Nota del alumno en el pre-test
Nota final del alumno en el tema
N intentos antes de aprobar el
tema
N de mensajes ledos en el foro
N de mensajes puestos en el foro
Nota de la tarea
Si ha consultado el documento
l_diffic_level
N de conceptos en la leccin
Tiempo total en completar la
leccin
Grado de dificultad de la leccin
e_time
e_score
B. Preprocesado de datos
Antes de aplicar minera de reglas de asociacin es
necesario preprocesar antes los datos de entrada para
adaptarlos a nuestro modelo de datos. Este preprocesado
incluye una serie de etapas como la limpieza de datos, la
transformacin de variables continuas a discretas y la
integracin de datos cuando estos provienen de distintas
fuentes. En nuestro sistema, la limpieza de datos se realiza
debido a dos causas muy comunes. Por una parte, se
descubri que el atributo tiempo en muchos casos contena
valores demasiados altos debido a que el alumno ha
27
Pt = W1 * C1 + W2 * C 2
donde C1 y C 2 son las medias de las puntuaciones dadas
por los expertos en cada apartado del grupo, para la tupla en
cuestin. En nuestro experimento el valor de ambos pesos
ha sido fijado a un 50%.
28
EfectRec1 =
TotalRec1 TotalRec1,i
(2)
TotalRec1
Nuevas
Repetidas
Total
EfectRecom (%)
1
2
21
5
0
6
21
11
72,7
TABLA III
RESULTADOS DESDE EL PUNTO DE VISTA DEL ALUMNO
Grupo
No Rep.
Nota
p-value 1-2
1
2
0
15
6,55 +0,30
6,95 +0,56
< 0,0001
[2]
[4]
[5]
[6]
[7]
[8]
[9]
[10]
[1]
[3]
[11]
[12]
[13]
[14]
[15]
[16]
[17]
[18]
[19]
[20]
[21]
[22]
[23]
[24]
[25]
[26]
29
30