Proyecto Redes Neuronales

1
SISTEMA DE INFORMACIN DE GESTIN DE PROCESOS ACADMICOS APOYADO CON REDES NEURONALES ARTIFICIALES
HOLMES ELIAS PINTO AVILA ANDRES FELIPE GONZALEZ GALEANO
UNIVERSIDAD POPULAR DEL CESAR FACULTAD DE INGENIERAS Y TECNOLOGAS PROGRAMA DE INGENIERA DE SISTEMAS VALLEDUPAR 2011-1
SISTEMA DE INFORMACIN DE GESTIN DE PROCESOS
ACADMICOS
APOYADO CON REDES NEURONALES ARTIFICIALES
HOLMES ELIAS PINTO AVILA ANDRES FELIPE GONZALEZ GALEANO
Director Ing. Norberto Daz
UNIVERSIDAD POPULAR DEL CESAR FACULTAD DE INGENIERAS Y TECNOLOGAS PROGRAMA DE INGENIERA DE SISTEMAS VALLEDUPAR 2011-1
1. INTRODUCCIN La utilizacin de las redes neuronales para el manejo y posterior estudio de los procesos de informacin desarrollado en entorno web como una herramienta
interactiva de un Sistema de gestin de procesos acadmicos y financieros en ambiente web para las instituciones de educacin bsica y media del municipio de Valledupar, nace con la intencin de innovar los mtodos de almacenamiento de registros utilizados de forma tradicional. Se pretende demostrar que la implementacin de estos modelos en las instituciones educativas ha de facilitar la socializacin de conocimientos. Por otra parte, se ha producido un fuerte incremento en el conocimiento y la aplicacin de modernas tcnicas economtricas y estadsticas que tiempo atrs eran consideradas como sofisticadas y slo al alcance de unos pocos. Nos estamos refiriendo a las regresiones no lineales, el anlisis estadstico multivariante y en particular a las tcnicas de minera de datos o data mining. La aplicacin de estas tcnicas, utilizando las redes neuronales artificiales, est contribuyendo a una significativa mejora de los trabajos y los resultados que se desarrollan en el amplio campo de la investigacin y, en muchos casos, han supuesto nuevas formas de enfrentarse a problemas econmicos tradicionales. Sin embargo, cuando se trata de redes neuronales artificiales aplicado a la educacin se encuentran pocos trabajos realizados, por lo cual, este proyecto, se convierten en un herramienta indispensables para promover un aporte cientfico a la educacin de hoy. De igual forma, la creacin de un software interactivo de administracin de informacin que permita la unificacin de criterios de los docentes e incorporar en
el proyecto educativo institucional los procesos y procedimientos de evaluacin estrategias para la superacin de debilidades y promocin de los estudiantes, definidos por estos y/o el consejo directivo, despus del anlisis de la informacin como referente principal de los procesos acadmicos diseados y aplicados por los docentes, que son los primeros en tomar las medidas para realizar actividades acadmicas en la institucin. Mediante este proyecto, se har un seguimiento estratgico por parte de la Institucin, el Docente, Los Padres de Familia a la informacin completa
generada por los estudiantes para consolidar o reorientar los procesos educativos relacionados con el desarrollo integral. Esta experiencia de desarrollo es una alternativa positiva, pues, permitir integrar tecnologa y conocimiento, en inteligencia artificial utilizando las redes neuronales como apoyo a los modelos de conocimiento e inferencia lgica. As, en los objetivos sociales del mundo educativo comprenden una amplia gama, que persigue la reduccin del fracaso escolar; el aumento del rendimiento
acadmico; la mejora en la calidad de la enseanza (entendida como el acceso a las nuevas tecnologas; instalaciones educativas; educacin ms personalizada y mtodos pedaggicos exitosos) y la igualdad de oportunidades educativas para todos los alumnos. El objetivo fundamental de esta Tesis es el de aportar nueva luz en torno a la funcin de produccin y la medicin de la eficiencia escolar a partir del anlisis no lineal de una realidad tan compleja como la educativa. Este anlisis no lineal ser llevado a cabo mediante un modelo basado en redes neuronales artificiales (RNAs). El propsito de este proyecto va encaminado a facilitar el aprendizaje y la
captacin total de la informacin con el fin de tener un mejor desempeo en la prctica profesional, contribuyendo al mejoramiento del aprendizaje en los procesos cognitivos que se realizan en la educacin Bsica y Media. 1.1. PLANTEAMIENTO DEL PROBLEMA 1.1.1 Descripcin del problema Los procesos de administracin de la informacin en la educacin han ido evolucionando a lo largo del tiempo. Si bien, en la Universidad Popular del Cesar se han presentado muchos proyectos con este perfil y ninguno de estos ha optado por tomar las redes neuronales como aporte estructural y significativo que se podra innovar al incorporarse un mdulo dentro del sistema de gestin de informacin acadmica apoyado por medio de redes neuronales artificiales que permita conocer de primera mano los estados acadmicos, sociales y financieros de los estudiantes, para resolver los problemas de desercin y bajo desempeo en la institucin educativa, como tambin un mdulo de consulta psicolgico que permita el estudio de comportamiento del estudiante; adems el estudio en lnea de los nuevos estudiantes con el fin de detectar sintomatologas de desercin escolar, son inconvenientes que se pueden solucionar a la hora de desarrollar este software. En el pasado, los docentes, se apoyaban en informes peridicamente muy limitados, y por otra parte el estudiante en obtener calificaciones cuantitativas; con la llegada de las tecnologas digitales, la educacin ha sufrido cambios en los mtodos y procesos de enseanza dando paso a la masificacin y uso de recursos tecnolgicos para el aprendizaje y el manejo de la informacin. En consecuencia, el uso de la tecnologa debe ser un factor fundamental en el desarrollo del aprendizaje y una herramienta que ayude a construir e implementar
un modelo de enseanza ms flexible. Sin embargo, los modelos actuales de calificacin son muy rgidos y no permiten tomar decisiones inteligentes, hacer proyecciones estadsticas de alto nivel acadmico institucional, donde prime la investigacin y la construccin del conocimiento mediante unos recursos tecnolgicos. Igualmente, las Instituciones no cuentan con herramientas tecnolgicas adecuadas acordes al contexto global de los sistemas educativos de hoy da, esto impide integrar nuevos recursos de aplicacin libre, disponibles en la red de Internet, tiles para la implementacin de nuevas estrategias pedaggicas. As mismo, la falta de proyectos de innovacin tecnolgica en las instituciones de educacin bsica y media, no ha permitido la transformacin de nuevos ambientes de aprendizaje, conservando el viejo modelo tradicional de clase en el aula. De igual manera, el incremento en la poblacin estudiantil en estas instituciones dificulta el control y acompaamiento por parte del personal encargado de hacer seguimiento al comportamiento de manera individual de cada estudiante, lo que se traduce en actos de violencia, drogadiccin, alcoholismo y otros ms, que repercuten negativamente en el mismo estudiante, en su ncleo familiar y desde luego en la institucin como ente responsable del proceso de formacin. Por otra parte, los estudiantes que han obtenido bajas calificaciones no cuentan con sistemas de informacin automtica que les alerte, les de orientaciones y a la vez les brinde recursos didcticos tales como: ejercicios, talleres, autoevaluaciones, que apunten a reforzar el rea de deficiencia identificada a travs del mismo sistema. Igualmente, los padres de familia no conocen de manera actualizada, los estados acadmicos, sociales y financieros de su(s) hijo(s) en la institucin. Por ltimo, existe el problema de adaptacin del software en las instituciones
oficiales y no oficiales, ya que el Artculo 1290 estandariza para las instituciones oficiales ciertos modelos educativos diferentes a los no oficiales, el desarrollo de un software que permita adecuarse a estos modelos sin tener que realizar grandes cambios en la plataforma suelen ser difcil de encontrar. Todos estos inconvenientes dieron paso al querer desarrollar una plataforma integral educativa que tiene como reto superar todos estos problemas presentados en el mencionado proyecto. 1.1.2. Formulacin del Problema Para la formulacin del proyecto se han planteado las siguientes preguntas: Con la implementacin de una plataforma en ambiente web de un sistema de gestin de procesos acadmicos apoyado en las redes neuronales, mejorar el nivel de aprendizaje de los estudiantes y a su vez ayudar al control acadmico, social y financiero de las instituciones de educacin bsica y media del municipio de Valledupar? Son las redes neuronales artificiales una herramienta til para un Sistema de gestin de procesos acadmicos en ambiente web para instituciones de
educacin bsica y media del municipio de Valledupar? 1.2. OBJETIVOS 1.2.1. Objetivos Generales Implementar un Sistema de Informacin de Gestin de Procesos Acadmicos apoyado con Redes Neuronales Artificiales como estrategias pedaggicas de
evaluacin y prediccin para el desempeo acadmico de los estudiantes de las instituciones educativa de Bsica y Media de Valledupar. 1.2.2. Objetivos Especficos Desarrollar una plataforma educativa que permita mediante la gestin de una Base de Datos, proporcionar informacin acadmica, social y financiera de los estudiantes. Generar por medio de las Redes Neuronales Artificiales, informacin que permita implementar estrategias pedaggicas para la prediccin y prevencin en el desempeo acadmico de los estudiantes. Desarrollar un mdulo que permita a la Institucin diagnosticar sintomatologas de desercin escolar por estudiante, apoyada en Redes Neuronales. Implementar un mdulo para el manejo estadstico que refleje el desempeo acadmico para reorientar los procesos educativos relacionados con el desarrollo integral en la Institucin. 1.3. JUSTIFICACIN La elaboracin de un Sistema de Informacin de Gestin de Procesos Acadmicos apoyado con bsica y Redes Neuronales Artificiales para instituciones de educacin
media del municipio de Valledupar, contribuye con el desarrollo de
experiencias y proyectos interdisciplinarios e innovadores apoyados en el uso de herramientas tecnolgicas y pedaggicas, para la formacin integral del estudiante. Por ello, este proyecto propone implementar los siguientes procesos para el desarrollo integral del mismo:
Realizar los procesos de inscripcin, matricula, entrevistas psicolgica a travs de la plataforma web.
Ingresar a la plataforma los logros cualitativos, calificaciones, asistencias, estado de comportamiento.
Poder consular las notas, notificaciones, estados de pagos por parte de los estudiantes y padres de familia.
Realizar procesos de carga acadmica para los docentes.
Identificar por medio del sistema las caractersticas personales, intereses, ritmos de desarrollo y estilos de aprendizaje del estudiante para valorar sus avances.
Proporcionar informacin bsica para consolidar o reorientar los procesos educativos relacionados con el desarrollo integral del estudiante a travs de la plataforma.
Suministrar informacin por medio de datos estadsticos que permita implementar estrategias pedaggicas para apoyar a los estudiantes que presenten debilidades y desempeos inferiores en su proceso formativo.
Determinar la promocin de estudiantes al final del ao escolar.
Aportar informacin para el ajuste e implementacin del plan de mejoramiento institucional por medio de las proyecciones estadsticas utilizando las redes neuronales.
10
Los procesos anteriores permiten mejorar las condiciones acadmicas y financieras de una entidad educativa, acompaada en algunos casos por la
inteligencia artificial como una alternativa innovadora para el proceso acadmico. La implementacin de las redes neuronales est implcita en la estructura interna del software permitiendo mayor robustez a esta aplicacin logrando de forma inteligente administrar, analizar y sugerir mejores mtodos para futuros trabajos acadmicos. La Inteligencia Artificial se ha aplicado considerablemente en la medicina y la psicologa, pero poco se ha hecho por evaluar sus efectos en la educacin , permitiendo asegurar la calidad de un producto que est al servicio de las
instituciones educativas en el municipio de Valledupar, entendiendo sta como un proceso sinrgico en que el alumno no slo crece en conocimiento, sino como persona integral, por ello la informacin se debe tratar como un ente prioritario para el estudio de comportamiento y conductas acadmicas que permitan prever factores como la desercin escolar, estilos de aprendizajes, entre otros. 1.4. DELIMITACION 1.4.1. Delimitacin Espacio Temporal Este proyecto se ejecutar en el territorio municipal, ms especficamente en el Colegio Gimnasio del Saber, Colegio Juvenil, Colegio Osvaldo Vergara, Colegio San Antonio, cabe destacar que por ser un sistema basado en ambiente Web se puede visualizar desde cualquier parte del mundo la informacin pblica en el Sitio. 1.4.2. Delimitacin Conceptual
11
La
ejecucin
de este proyecto se limitar a la creacin de un sistema que
administre los procesos acadmicos y administrativos de la institucin as como tambin la implementacin de Redes Neuronales para el tratamiento de la Base de Dato, el contenido ser publicado en el Sitio Web, que permitir la fcil y rpida administracin de dichos procesos, minimizando el tiempo de trabajo de cada uno de los empleados en la Institucin y tambin mejorando la calidad de servicio a los estudiantes y padres de familia. 2. MARCO REFERENCIAL 2.1 ANTECEDENTES La Implementacin de un Sistema de Informacin de Gestin de Procesos Acadmicos apoyado con Redes Neuronales Artificiales es un proyecto con un enfoque innovador y de un contexto no explorado hasta el momento en la Universidad Popular del Cesar ya que se conocen trabajos realizado para el
diseo e implementacin de plataformas acadmicas en entorno web, que no incluyen en sus estudios las redes neuronales artificiales, como por ejemplo: Desarrollo e Implementacin de un Sistema Va Web Para Los Procesos Acadmicos Del Colegio Bilinge Fisher Kids de los autores: Diana Gutirrez Mercado, Lenin Nuez Reales Construccin de Sitio Web Y Sistema De Informacin para el Control de la Carga Acadmica en El Instituto Tcnico Del Norte Sede Valledupar de los autores: Jaidy Laizaat Botello Rocha, John Harold Daz Gonzlez; Desarrollo e Implementacin de un Portal Web Educativo como Apoyo a los Procesos Educativos y Servicios de Seguimiento Acadmico y Estudiantil En La Institucin Educativa Tcnica Agropecuaria y de Participacin Comunitaria Julio Cesar Turbay del Municipio de el Carmen de Bolvar, Bolvar Colombia. de los autores: Monica Patricia Rodriguez Rada, Yuly Milena Amorocho Hernandez. Estos trabajo no
12
contienen seguimientos detallados aplicados a la poblacin estudiantil, por la naturaleza compleja de la informacin, de la parte socioeconmica (sexo, edad, estudios del padre, estudios de la madre, trabajo del padre, trabajo de la madre) y acadmica, es por ello que, sin desmeritar los trabajos anteriores, nuestro proyecto trasciende ms all de las fronteras del seguimiento acadmico y enfoca sus estudios en las redes neuronales como aplicacin para resolver soluciones que otros autores se haban planteado pero que no se haban a atrevido a desarrollar. A nivel nacional no se conocen trabajo que aplique el estudio de las redes neuronales a los objetivos propuesto en nuestra investigacin. Por otra parte, a nivel internacional se han presentados investigaciones como Prediccin del xito en Estudios Universitarios Mediante Redes Neuronales, de los autores: Lourdes Molera M Victoria Caballero, con este trabajo se pretende estudiar la posibilidad que tiene un alumno matriculado en la Universidad de Murcia (en la licenciatura de Economa o ADE, o en la diplomatura de Ciencias Empresariales) de finalizar con xito sus estudios en un determinado periodo de tiempo. Para ello, se construye una red neuronal a partir de informacin acerca de sus caractersticas socioeconmicas y sus resultados acadmicos, y otros para tener en cuenta es Prediccin del Rendimiento de los Estudiantes y Diagnstico Usando Redes Neuronales de los autores: Zulma Cataldi, Fernando Salgueiro, Fernando Javier Lage de la Universidad Tecnolgica Nacional. Facultad Regional Buenos Aires, este proyecto es aplicado a los estudiantes que comienzan una carrera universitaria en sus evaluaciones parciales y finales. Se toman los datos de las evaluaciones parciales y a partir del anlisis de los mismos se busca efectuar un diagnstico con base en los errores cometidos. De este modo, en funcin de los datos de los primeros exmenes se podrn predecir errores futuros y dar sugerencias para realizar una ejercitacin
13
correctiva a fin de mejorar la produccin. Para efectuar la prediccin de los prximos errores se usa una red neuronal y sobre esta base se le sugiere al estudiante una secuencia de ejercicios y problemas a fin de mejorar su produccin y por lo tanto sus calificaciones. Deteccin de alumnos de riesgo y medicin de la eficiencia de centros escolares mediante redes neuronales. En este trabajo, de aproximacin a la tesis doctoral que el autor Daniel Santn Gonzlez de la Universidad Complutense de Madrid estaba elaborando en 1999, se utilizan las redes neuronales para intentar solucionar empricamente tres problemas habituales en el campo de la economa de la educacin: Deteccin de alumnos con alto riesgo de fracaso escolar, evaluacin de la eficiencia relativa de centros educativos y evaluacin de la eficiencia relativa de diferentes planes de estudio en datos individuales de 7454 alumnos de enseanzas medias de octubre de 1984 (1985) en 256 centros pblicos y privados. Por lo anterior, en la actualidad, no se encuentran estudios realizados en la
educacin bsica y media en Colombia que permitan aplicar las redes neuronales artificiales como lo describen los objetivos del presente proyecto. 3. MARCO TEORICO Debido a que es de vital importancia implementar una herramienta tecnolgica que permita identificar las caractersticas personales, intereses, ritmos de desarrollo y estilos de aprendizaje, comportamientos financieros del Estudiante para as valorar sus avances acadmicos y que le facilite a las instituciones educativas la informacin necesaria para consolidar o reorientar los procesos educativos relacionados con el desarrollo integral del Estudiante y la Institucin educativa, permitiendo de esta manera dar un aporte al plan de mejoramiento institucional, para esto el estudio pretende desarrollar en dos etapas el presente proyecto, describiendo en su orden, estas etapas de la siguiente manera:
14
Desarrollo y puesta en marcha de los mdulos Acadmicos y Financieros de la Plataforma Educativa. Implementacin de las Redes Neuronales Artificiales a la Base de Datos de la Plataforma Educativa.
3.1. Componentes que integran la Plataforma Educativa El diseo del Sistema se basa en la premisa de disponer de una estructura combinada de elementos de almacenamiento, acceso y anlisis de la informacin necesarios para dar solucin a las necesidades planteadas. El proceso de implementacin ha consistido en cinco grandes fases (figura 1):
Anlisis
de
las
necesidades:
Estudio
de
necesidades, usuarios
posibilidades existentes para poner en marcha el Sistema de Informacin.
Diseo: Seleccin del hardware y herramientas necesarias.
15
Diseo lgico: Transformacin del modelo de Sistema a alto nivel interno; define el sistema y soluciones a emplear en funcin del esquema seleccionado anteriormente.
Implantacin fsica: Implementacin del diseo en la realidad.
Testeo: Realizacin de pruebas y uso en proyectos de investigacin educativa en desarrollo.
Estrategias de actuacin: Acciones a emprender para mejorar el Sistema de Informacin Acadmica y Financiera.
3.1.1. Anlisis de las necesidades. En este apartado del diseo es donde se dimensiona el Sistema de Informacin a implantar, en funcin de las necesidades de los usuarios potenciales (las Instituciones Educativas) y el cumplimiento de los objetivos a alcanzar durante la realizacin del proyecto. Para constituir de estudio presentado se han analizado los requerimientos y necesidades en funcin de los usuarios potenciales y necesidades de gestin y procesamiento de informacin. Usuarios potenciales: Usuarios internos del sistema: Administrativos y estudiantes de las instituciones educativas. De la estimacin del nmero de usuarios potenciales y sus necesidades ha sido posible presuponer la potencia requerida por el Sistema y el costo final a abordar, as como la normalizacin de usuarios internos en los servidores y terminales. Necesidades de gestin y procesamiento: Introduccin, almacenamiento y actualizacin de la informacin de forma rpida, coherente y eficiente a
16
partir del estudio de las necesidades informativas, acceso, gestin y anlisis de los datos a partir de aplicaciones servidas.
Extraccin de informacin a partir de la explotacin de los datos almacenados mediante salidas graficas, tabulares, etc. 3.1.2. Anlisis de la informacin susceptible de ser introducida Uno de los aspectos fundamentales a considerar en la Implementacin un Sistema de Informacin de Gestin de Procesos Acadmicos apoyado con Neuronales Artificiales es: El anlisis de los datos de inters Disponibilidad de acceso Estrategias de almacenamiento en funcin del modelo lgico de almacenamiento Debido al elevado nmero de datos que generan informacin espacial, este Redes
apartado debe considerarse como un estudio preliminar de lo que ser el ncleo de la base de datos, abierto y susceptible de ser ampliado con nueva informacin. Para ello se ha creado una Plataforma Educativa en entorno web basada en MYSQL, PHP y utilizando tcnicas de programacin en AJAX, la implementacin de los aplicativos para las Redes Neuronales Artificiales aun son objetos de estudios. 3.1.3. Diseo conceptual y lgico del Sistema. Se ha optado por disear un Plataforma Educativa en entorno web a partir de una
17
arquitectura cliente-servidor distribuida basada en un servidor de datos y aplicaciones (uno con sistema operativo Linux y otro con Windows) a los que los usuarios acceden a travs de estaciones de trabajo Windows o Linux (equipos para acceso al servidor pero con capacidad para trabajar de forma autnoma a travs de Internet Explore, Mozilla y otros exploradores) o terminales, equipos con poca potencia utilizados para acceso mediante escritorios remotos al sistema. 3.1.4. Implementacin fsica del Sistema El Sistema propuesto se basa en un servidor (tabla 1), el cual se ha configurado para una serie de tareas concretas: Almacenamiento, gestin y servidor de los datos (desde los datos propios de la Plataforma Educativa hasta copias de seguridad de los usuarios) Gestin de los usuarios. Servidor de aplicacin de acceso a la informacin
Servidor
S.O
Procesador Memoria RAM Procesador Intel Xeon X3440, 2.4 GHz, 8M Cache, Turbo
Capacidad
PowerEdge T110
Sistema Operativo Windows Server 2008 R2, Foundation
4GB de Uno de 500GB 7.2k memoria RPM Serial ATA 3Gbps (2x2GB), 3.5-in Cabled Hard Drive 1066MHz, Dual Ranked UDIMM
18
Tabla 1: Caractersticas tcnicas del servidor
Figura 2: Servidor en torre PowerEdge T110 Dichos servidor, localizado bajo el dominio https://www.sinted.com es el ncleo del Sistema implementado, dando cobertura a la totalidad de usuarios creados a partir de un grupo de trabajo para Windows y Linux, considerado como la base de datos espacial mas el conjunto de programas para gestin, visualizacin y explotacin de la informacin Acadmica. siguientes servicios: Esta Plataforma Educativa Proporciona los
Sistema: Responde a parmetros que previamente el Administrador le ingresa, contiene una interface visual indicando a los dems autores las tareas que corresponde a cada uno de ellos.
Rector/Personal Administrativo: El Sistema le permite tener acceso a todo los roles del aplicacin.
19
Administrador: Tiene acceso a toda la informacin, altera parmetros del Sistemas. Psicloga: interacta con el Sistema alimentando las fichas psicolgicas del los actores como el Estudiante e Inscritos, dando su aprobacin para el ingresos de estos a la institucin.
Docente: aplica su modelo pedaggico e ingresa las notas al sistema, asigna tareas a los Estudiantes, enva notificaciones a Padre de Familia, corrobora con los datos estadsticos del Sistema su mtodo de enseanza, consulta en forma grafica los datos estadsticos generados por el Sistema.
Auxiliar Administrativo: imprime todo tipo de certificados en formato PDF, genera fichas de matriculas. Estudiante: consulta sus notas, realiza encuestas, autoevaluaciones, ve notificaciones. Padre de Familia: recibe notificaciones de los Docentes, consulta saldo de pensiones, verifica las notas del Alumno. Inscritos: Realiza procesos de inscripcin para el ingreso a la Institucin. Docentes y Estudiantes Antiguos. Se ingresan las referencias del estudiante en cuanto sus datos personales, datos de los padres, informacin laboral; como tambin se registran los docentes asignndoles la carga acadmica esta incluye curso, aula y asignaturas que solo a l le corresponden. A estos el Sistema le asigna un nombre de usuario y contrasea para poder ingresar a la plataforma ubicada en la web.
Proceso de ingreso de desempeos y valorativos. Se describen a continuacin: o Se asignan el rango cuantitativo a cada desempeo de los logros. o Se ingresan periodos, el conceptos, valorativo de Logros, el Sistema genera los cdigos.
20
o El docente ingresa las notas a los estudiantes correspondientes, El sistema calcula los porcentajes y de acuerdo a la definitiva muestra los logros de ese valorativo. Asignacin de Roles a los usuarios. A continuacin en la figura No. 3 se muestra los roles que cumplen cada usuarios.
Figura 3: Esquema del Asignacin de Roles a los Usuarios del SINTED 3.1.5. Testeo Realizacin de pruebas y uso en proyectos de investigacin educativa en desarrollo, con el fin de mejorar la Plataforma educativa y entregar un excelente producto se hace necesario realizar pruebas al Sistema hasta lograr un nivel ptimo.
21
3.1.6. Estrategias de actuacin Acciones a emprender para mejorar el Sistema de Informacin Acadmica, teniendo en cuenta la opinin de los usuario se tomaran las medidas pertinentes al diseo para ello se pretende mejorar en lo posible el diseo de la interfaz de usuario, la programacin, y en algunos casos la entidad relacional de la base de datos. 4. MARCO CONCEPTUAL En el presente anteproyecto se darn a conocer los conceptos que los trminos involucrados en nuestro estudio: 4.1 Qu es una Red Neuronal? Una red neuronal artificial es un modelo interconectado cuyos elementos o nodos simulan las funciones desempeadas por las clulas cerebrales denominadas neuronas, siendo capaces de aprender, memorizar un conjunto de patrones,
clasificarlos, inferir o generalizar a qu clase pertenece un nuevo objeto a partir de la experiencia acumulada durante un previo entrenamiento, puede establecer asociaciones entre objetos, siendo por tanto capaces de reconocer smbolos, tales como letras, nmeros o cualquier otro patrn u objeto. En consecuencia, el reconocimiento de patrones es su principal aplicacin. Adems, las redes neuronales artificiales muestran un comportamiento robusto como los circuitos neuronales reales. Esto significa que una red neuronal es capaz de reconocer un objeto previamente memorizado, incluso si dicho objeto se le presenta a la red neuronal ligeramente distorsionado o acompaado de un cierto nivel de ruido.[1], por ello, se pens en la implementacin de un Sistema que sea capaz de reconocer y clasificar patrones conformados por desempeos cualitativos
22
formadas por oraciones complejas y resumidas a valores de 1 o 0 en presencia o ausencias de estos logros, esta clasificacin se logra gracias a un valor cuantitativo ingresado por el docente y de acuerdo a una escala valorativa la RNA reconoce que logros debe asignar al estudiante, y a continuacin llamar las tareas o talleres si en realidad lo requiere el alumno. A pesar, que en este artculo se toma solo un ejemplo puntual de la investigacin y desarrollo de este, en su contexto el Sistema es mucho ms amplio en cuanto a sus niveles de aplicaciones para todo el Sistema de Gestin de Procesos Acadmicos.
4.2. Un Poco de Historia La inteligencia artificial (IA), entendida como el modelado y la simulacin de las actividades cognitivas complejas; percepcin, memoria, solucin de problemas, etc. Que caracterizan a los organismos avanzados, y en particular a los seres humanos se separ, tal y como sealan Waltz et al. (1988), casi desde su inicio en dos ramas bien diferenciadas: Por un lado, se trat de modelar la actividad racional compleja mediante sistemas formales de reglas y manipulacin simblica. Esta es la rama ms conocida de la IA, que se puede denominar simblicodeductiva, en donde se postulan una serie de reglas y el sistema resuelve los problemas realizando deducciones sobre las reglas programadas. Las reglas SiEntonces le dicen al sistema cmo se debe reaccionar ante distintos estados. De esta forma, un sistema experto es un mtodo de representacin y procesamiento del conocimiento, mucho ms rico y poderoso que un programa clsico de ordenador. Sin embargo, con respecto al cerebro humano las limitaciones son mltiples. Los problemas planteados en trminos difusos o ambiguos son difciles de analizar con sistemas de procesamiento simblico.
23
Por otro lado, se desarrollaron modelos computacionales conexionistas inspirados en las redes neuronales biolgicas. Su principal caracterstica es su inductividad, ya que extraen la informacin necesaria para resolver un problema a partir de un conjunto de ejemplos, sin necesidad de indicarle las reglas necesarias para resolver dicho problema. Si bien es mucho ms conocida la aproximacin simblico-deductiva y su principal aplicacin: los sistemas expertos, (en general, sistemas basados en el conocimiento), existe un considerable y renacido inters por los modelos conexionistas. Los avances tecnolgicos ofrecen, como ya ha sido apuntado, recursos cada vez mayores para representar estructuras muy complejas y realizar clculos a gran velocidad y en paralelo, apoyando y fomentando la investigacin en este campo y sus aplicaciones a distintas reas del conocimiento. En la tabla 3 se puede observar un resumen de las principales diferencias entre ambos enfoques. 4.3 Organizacin del Cerebro humano y la Neurona Las neuronas son clulas que forman el cerebro humano y animal. Con un tamao variable y comprendido entre 3 y 1.000 con clulas excitables al exhibir la propiedad de transmisin de seales de una neurona a otra, ver tabla 3. Una de las caractersticas ms llamativa de una neurona es su organizacin, distinguindose el soma o cuerpo celular, el axn y las dendritas. Si consideramos un modelo general de neurona que incluya las caractersticas input y output de un modelo, entonces las dendritas representan en la neurona las estructuras responsables de la percepcin de la seales de entrada u input. Una vez procesada por la neurona las seales de entrada, la neurona producir o no una seal muy particular denominada potencial de accin. El potencial de accin, cuyo
24
origen se sita en la unin entre el soma y el axn, es el resultado de un fenmeno conocido como despolarizacin de membrana. Ver Fig. 4.
Fig. 4: Modelo general de una neurona. Cada una clula individual que se relaciona, y por tanto se conecta con otras neuronas, a travs de una conexin muy particular llamada sinapsis. Por consiguiente, una neurona de una clula en que el conjunto de sus actividades estn orientadas al procesamiento de las seales de entrada as como al mantenimiento y modificacin de las sinapsis. Esta ultima propiedad de la
sinapsis, la posibilidad de su modificacin, es uno de los conceptos centrales del presente artculo, ya que es precisamente el mecanismo celular en que se basa el aprendizaje de nuestras redes neuronales. Si modificamos la sinapsis, es decir si cambiamos la calidad de las conexiones entre neuronas, entonces la facilidad o dificultad con la que se transmiten las seales entre neuronas cambian, y por tanto la respuesta o output de un circuito neuronal a las seales de entrada.
25
Actualmente, salvo en operaciones simples de clculo aritmtico, el cerebro humano es superior a cualquier ordenador. Las principales caractersticas del cerebro son su robustez y paralelismo masivo, ya que su funcionamiento no se ve alterado ante cambios de pequea importancia, y su flexibilidad, ya que se adapta con rapidez a entornos cambiantes y, adems, puede tratar con informacin ambiga o incompleta. Como se ver ms adelante, la propiedad del cerebro humano ms buscada en las RNAs es la capacidad de aprender de la experiencia y generalizar a partir de ella. 4.4 Las Redes Neuronales Biolgicas Se estima que el cerebro humano est compuesto por ms de cien mil millones de neuronas interconectadas de forma variable y compleja. Su especial forma de trabajo le convierte en el dispositivo ms verstil y eficaz para procesar todo tipo de informacin procedente del mundo real. En la figura 4 se puede ver la representacin esquemtica de dos neuronas biolgicas. En el cuerpo de la clula o soma se localiza el ncleo de la misma. De este soma se extienden fibras en forma de rbol llamadas dentritas, que son receptoras de impulsos procedentes de otras neuronas. Tambin del soma sale una nica y muy larga fibra llamada axn, que transporta la seal procesada por la neurona al exterior. El axn se subdivide arborizndose en ms fibras denominadas ramificaciones axionales. Al final de stas se encuentran las uniones sinpticas o sinapsis, que constituyen los puntos de conexin con las dentritas de otras neuronas. Una neurona recibe informacin de miles de otras neuronas y a su vez enva informacin a miles de neuronas ms. La transmisin de una seal de una neurona a otra en la sinapsis es un proceso qumico altamente complejo (figura 4).
26
El proceso comienza cuando la neurona transmisora libera neurotransmisores, especialmente iones de sodio y potasio, en la sinapsis. Su misin es incrementar, (si la neurona es excitadora), o decrementar (si es inhibidora), el potencial elctrico del soma de la neurona receptora y su efecto puede ser ms o menos intenso en funcin de la cantidad de neurotransmisores liberados. Las seales excitadoras e inhibidoras recibidas por una neurona se combinan en el soma y, en funcin de la estimulacin total recibida, la neurona toma un cierto nivel de activacin. Si esta activacin supera un determinado nivel umbral, se traduce enviando breves pulsos, o potencial de accin, de una determinada fuerza y duracin a lo largo del axn. Se dice entonces que la neurona se ha activado. Estos pulsos viajan por el axn hasta alcanzar las sinapsis con otras neuronas desde donde el proceso se repite otra vez. No todas las sinapsis son iguales y por tanto, no todas tienen el mismo efecto sobre la neurona receptora ya que algunas seales son ms fuertes que otras. Otro factor que importa a la hora de activar una neurona es el nmero de conexiones que recibe. Aunque todava se desconoce mucho sobre la forma en que el cerebro aprende a procesar la informacin, las teoras actuales sobre el aprendizaje nos dicen que su efecto en el cerebro resulta de la modificacin de las conexiones o sinapsis entre neuronas, lo que unido al procesamiento de informacin de la neurona determinan el mecanismo bsico de la memoria, [Arbib, 1995]. Este mecanismo de modificacin de los pesos sinpticos se produce en el tiempo por medio de la experiencia del sujeto y se realiza aumentando o disminuyendo el nmero de neurotransmisores liberados en determinadas sinapsis ante un mismo estmulo. As, una neurona cuyo potencial antes no lograba alcanzar el umbral, ahora s lo hace y se activa, y viceversa, otra que antes se activaba ahora puede que no lo haga y as la respuesta que el individuo da ante una misma situacin real sea bien distinta, decimos entonces que hemos aprendido. Normalmente el aprendizaje
27
requiere adems de un maestro que indique como realizar bien una tarea. Tras un proceso de ensayo-error el individuo es capaz de realizar correctamente una tarea que antes no era capaz de resolver. 4.5. Elementos y Organizacin de una red Neuronal Artificial Las neuronas artificiales o como comnmente se llaman nodos o elementos procesadores, se renen en capas. En una red neuronal artificial hay al menos dos capas. En primer lugar, y en contacto con el mundo exterior; se encuentra la capa de entrada, esta recibe informacin de entrada: las caractersticas de un objeto, una letra, un nmero, un perfil sicolgico con ciertos rasgos, unas caractersticas acadmico, familiar. En segundo lugar una vez concluido el procesamiento de la informacin de entrada en la red neuronal, el resultado es enviado hacia la capa de salida, tambin en contacto con el mudo exterior, y cuyas neuronas suministran la informacin de salida. 4.6. Algunas ventajas e inconvenientes de las redes neuronales. Tras esta aproximacin al mundo de las redes de neuronas parece conveniente resaltar someramente algunas de sus ventajas e inconvenientes respecto a otras tcnicas estadsticas y economtricas:
No necesitan ser programadas; son capaces de aprender a partir de ejemplos reales mediante la adaptacin de los pesos. No hace supuestos acerca de la distribucin de las variables
independientes y por tanto permite la introduccin de variables continuas y categricas lo cual resulta una importante ventaja frente al anlisis discriminante que supone distribucin normal multivariante.
28
La red permite realizar transformaciones no lineales lo que es una ventaja frente a los modelos de regresin y anlisis discriminante mltiple tradicionales a la hora de llevar a cabo clasificaciones ya que puede generar superficies de decisin arbitrariamente complejas.
La principal desventaja de las redes de neuronas son por un lado la imposibilidad de determinar cmo se procesa internamente la informacin y por otro su incapacidad para contrastar el modelo.
A continuacin se muestra una tabla comparativa del cerebro humano y un computador:
CEREBRO
COMPUTADOR
Unos 100.000 millones de unidades de Una unidad de proceso. proceso. Cientos de operaciones por segundo. Precisin aritmtica muy escasa. Paralelismo masivo. Lgica difusa. Memoria de tipo asociativo almacenada de forma dispersa. Millones de operaciones por segundo. Precisin aritmtica absoluta. Operaciones en serie. Lgica rgida. y La informacin se guarda en posiciones de Memoria de acceso directo.
Tolera fallos (muerte de neuronas).
Los pequeos crticos.
fallos
(averas)
son
Maneja todo tipo de informacin, Sistemas altamente especializados con incluso sujeta a incertidumbre, en poco capacidad para procesar informacin
29
tiempo pero no necesariamente con muy concreta, siguiendo instrucciones exactitud. dadas. Tabla No. 2 Comparaciones entre el Cerebro y un Computador 4.7 Aplicabilidad propuestos El ejercicio emprico que desarrollamos a continuacin aplica la tcnica de las redes neuronales a los problemas propuestos. Estos problemas podran ser afrontados con las tcnicas de clasificacin estadsticas y economtricas tradicionales (anlisis discriminante y regresin logstica). No es el objetivo de este estudio llevar a cabo comparaciones entre las distintas tcnicas capaces de aportar soluciones; existen distintos estudios empricos que ratifican la mayor fuerza predictiva de las redes (vase Bonilla, M. y Puerta, R. (1997). En general pensamos que para aplicaciones prcticas lo ideal sera aplicar varias tcnicas y complementar los resultados de unas y otras de forma que las predicciones resulten lo ms eficientes posibles. Como se mencion anteriormente, el reconocimiento de las RNA es adquirido por medio de un aprendizaje. Se distinguen tres tipos de aprendizajes: supervisado, no supervisado y por refuerzo. El primero, y en el que se basa nuestro estudio, consiste en aprender una funcin a partir de ejemplos de sus entradas y sus salidas. Para ello se enumeran tres componentes: Una proyeccin directa de las condiciones del estado actual a las acciones. Un mtodo para inferir las propiedades relevantes del mundo a partir de una secuencia de percepciones. tcnica de las redes neuronales a los problemas
30
Informacin sobre de cmo evoluciona el entorno y sobre los resultados de las posibles acciones que el sistema pude llevar a cabo. Cada uno de estos componentes puede aprenderse con una realimentacin apropiada. Consideremos, por ejemplo, un Sistema entrenndose para convertirse en supervisor de bajas calificaciones. Cada vez que perciba una calificacin por debajo de un rango menor que x, x es igual a un nmero menor o igual a 10, el Sistema puede aprender una regla condicional-accin que le indique cuando asignar conceptos pertenecientes al rango, esto es indicado en el componente 1. Informando que ciertos patrones lgicos pude reconocerlos como sntomas bsico de un bajo, medio o alto desempeo acadmico, aprendiendo a reconocer esos patrones (componente 2). Realizando acciones y observando sus resultados puede aprender las consecuencias de sus acciones (componente 3). En el caso (componente 1) del ejemplo anterior, el Sistema aprende la regla condicin - accin para asignar conceptos, esto es, una funcin que a partir del estado genera una salida booleana (asignar o no un concepto). En el caso (componente 2), el sistema aprende una funcin que a partir de un patrn genera una salida booleana (enviar una tarea al alumno o no). En el caso (componente 3), aprende una funcin que a partir del estado y las acciones de asignar tareas genera una labor pedaggica de ayuda acadmica. Ntese que tanto en los casos (componente 1) y (componente 2), el docente suministra el valor correcto de la salida de cada ejemplo; en el tercero, el valor de salida proviene de lo que el Sistema percibe. En entornos totalmente observables, como es este caso, el Sistema siempre puede observar los efectos de sus acciones, y por lo tanto, puede utilizar mtodos de aprendizaje supervisado para aprender a percibirlos. Por el contrario, en entornos que son parcialmente observables, el problema es ms difcil, ya que los efectos ms inmediatos pueden ser invisibles.
31
4.8 Definicin y conceptos bsicos de las Redes Bayesianas Una red bayesiana es un grafo a cclico dirigido y anotado que describe las distribucin de probabilidad conjunta que gobierna un conjunto de variables aleatorias. Sea U ={X1,X2, ...,Xn } un conjunto de variables aleatorias .Formalmente,
una red Bayesiana para U es un para B = <G, T > en el que: G es un grafo a cclico dirigido en el que cada nodo representa una de las variables X1, X2, ...,Xn, y cada arco representa relaciones de dependencia directas entre las variables. La direccin de los arcos indica que la variable apuntada por el arco depende de la variable situada en su origen. T es un conjunto de parmetros que cuantifica la red. Contiene las probabilidades PB(xi|xi) para cada posible valor xi de cada variable Xi y cada posible valor xi de Xi, donde ste ltimo denota al conjunto de padres de Xi en G. As, una red bayesiana B define una distribucin de probabilidad conjunta nica sobre U dada por:
1 ,2 ,, = | =1
Es importante observar que la topologa o estructura de la red no slo proporciona informacin sobre las dependencias probabilsticas entre las variables, sino tambin sobre las independencias condicionales de una variable o conjunto de ellas dada otra u otras variables. Cada variable es independiente de las variables
32
que no son descendientes suyas en el grafo, dado el estado de sus variables padre. La inclusin de las relaciones de independencia en la propia estructura del grafo hace de las redes bayesianas una buena herramienta para representar conocimiento de forma compacta (se reduce el nmero de parmetros necesarios). Adems, proporcionan mtodos flexibles de razonamiento basados en la propagacin de las probabilidades a lo largo de la red de acuerdo con las leyes de la teora de la probabilidad. La figura5 muestra cmo representar un clasificador Naive Bayes en forma de red bayesiana.
Figura 5: Grafo de un clasificador de Naiv e Baye s Esta red captura la suposicin fundamental de Naive Bayes: todos los atributos A i (hojas del rbol) son independientes entre s conocida la clase C, por lo que no existen arcos entre los atributos s y existe un arco del nodo raz a cada uno de los atributos.
La figura 6 presenta un ejemplo concreto de una red bayesiana que representa un cierto conocimiento sobre Educacin. En este caso los nodos representan
33
sntomas de desercin escolar y factores que la causan. Como ya se ha mencionado, la variable a la que apunta un arco es dependiente de la que est en el origen de ste. Por ejemplo, desconcentracin depende de desercin y embarazo.
Figura 6: Ejemplo de red bayesiana con algunos de sus parmetros Pueden observarse las suposiciones de independencia acertadas por la red, por ejemplo, reacciones es condicionalmente independiente de econmico, embarazo, desconcentracin y Falta de Inters (nodos no descendientes de reacciones) dado desercin (su nico nodo padre).Es decir, se observa en la red que: P(R|E,DESER,EMBA,DESC,F)=P(R|DESER) donde R es reacciones, E es economa, DESER es desercin, EMB es embarazo, DESC es desconcentracin, y F es falta de Inters.
34
Se han representado tambin
los parmetros
de probabilidad condicional
asociados a algunos de los nodos de la red. La tabla P (Econ) guarda los valores de probabilidad desercin dada a-priori de economa; P (DESER|Econ) la probabilidad de economa; y P (desc|deser,emba) la probabilidad de
desconcentracin dados desercin y embarazo. Ntese que, en este caso, para guardar los parmetros no es necesario mantener las tablas completas, ya que las variables estudiadas son binarias, por lo que para cada una slo sera necesario conservar los valores de una fila. Teniendo en cuenta que el tamao de las tablas de parmetros crece exponencialmente con el nmero de padres de un nodo, es conveniente observar distintas tcnicas para reducir el nmero de parmetros necesarios. Una forma de reducirlos es empleando los denominados modelos cannicos, entre los que pueden mencionarse:
Modelo de interaccin disyuntiva (Noisy OR). Modelo de interaccin conjuntiva (Noisy AND). Compuerta Max (Noisy Max gat e). Compuerta Min (Noisy Min gat e).
Los modelos no pueden aplicarse indiscriminadamente, sino que dependen de la naturaleza de las relaciones, y por tanto del dominio. El ms comn es el Noisy OR, que se aplica cuando varias causas pueden ocasionar un efecto cada una por s sola, y la probabilidad del efecto no disminuye si se presentan varias de ellas. Por ejemplo, en el modelo de la figura se puede aplicar cuando varios casos de desercin pueden producir el mismo sntoma. En este caso slo se especificara un parmetro por cada nodo padre (por ser los padres binarios), en vez de 2n, siendo n el nmero de padres. En el caso de la figura 5, en lugar de la tabla P(desc|deser,emba) podra aplicarse Noisy OR y guardar nicamente las probabilidades correspondientes a P (desc | deser =Si) y P(deser | emba =Si).
35
4.9 Inferencia A partir de una red ya construida, y dados los valores concretos de algunas variables de una instancia, podran tratar de estimarse los valores de otras variables de la misma instancia aplicando razonamiento probabilstico. El razonamiento probabilstico sobre las redes bayesianas consiste en propagarlos efectos de las evidencias (variables conocidas) a travs de la red para conocer las probabilidades a posteriori de las variables desconocidas. De esta forma se puede determinar un valor estimado para dichas variables en funcin de los valores de probabilidad obtenidos. Cuando se conocen los valores observados para todas las variables de la red excepto para una, obtener una estimacin para sta es inmediato a partir de la frmula de la distribucin de probabilidad conjunta de la red. En un caso ms general interesara obtener una estimacin del valor de alguna variable dados valores observados para un subconjunto de todas las restantes. En general, una red puede usarse para calcular la distribucin de probabilidad para cualquier subconjunto de variables dados los valores de cualquier subconjunto de las restantes. La solucin exacta de esta forma de inferencia es, en general, un problema NPduro Incluso el uso de soluciones aproximadas resulta ser en ciertos casos NPduro, aun que en la prctica estos ltimos resultan eficientes en muchos casos. Existen diferentes tipos de algoritmos propuestos, que se aplican dependiendo de la topologa del grafo y de si obtienen la probabilidad de una sola variable objetivo o de todas las desconocidas. No es objetivo de este anteproyecto entrar en
36
detalles sobre los distintos algoritmos. Una breve taxonoma de los algoritmos ms conocidos sera la siguiente: Un variable, cualquier grafo:
Algoritmo de eliminacin. Cualquier variable, sencillamente conectadas (rboles, poli rboles). Algoritmo de propagacin de Pearl.
estructuras
Cualquier variable, cualquier grafo:
Agrupamiento (junction tree), simulacin estocstica, acondicionamiento.
El mecanismo de inferencia sobre redes bayesianas permite utilizarlas para construir clasificadores. Para ello, se ha de construir una red bayesiana en la que clase y atributos sean las variables interrelacionadas en el grafo. La clase corresponder a la variable desconocida, objetivo de la inferencia. Dada una instancia cual quiera para la que se conozcan todos sus atributos, la clasificacin se efectuar infiriendo sobre el grafo la probabilidad posterior de cada uno de los valores de la clase, y seleccionando aqul valor c que maximice dicha probabilidad. Ntese que si se emplea una red no restringida se elimina el bias introducido por la suposicin de independencia del clasificador Naive Bayes. 4.10 Aprendizaje de redes bayesianas Durante mucho tiempo las redes bayesianas se construyeron a mano a partir del conocimiento de expertos. La pregunta a plantearse a continuacin es la siguiente: pueden inducirse a partir de conjuntos de datos clasificadores basados en redes
37
bayesianas? Si no se restringe la topologa de las redes inducidas, pueden obtenerse clasificadores mejores que Naive Bayes? El problema del aprendizaje bayesiano puede describirse informalmente como: dado un conjunto de entrenamiento D ={u1,u2,...,uN} de instancias de U, encuntrese la red B que se ajuste mejor a D. Tpicamente, este problema se divide en dos partes: Aprendizaje estructural: obtener la estructura de la red. Aprendizaje paramtrico: conocida la estructura del grafo, obtener las probabilidades correspondientes a cada nodo. 4.10.1. Aprendizaje paramtrico 4.10.1.1 Datos completos El aprendizaje de los parmetros es simple cuando todas las variables son completamente observables en el conjunto de entrenamiento. El mtodo ms comn es el llamado estimador de mxima verosimilitud, que consiste
sencillamente en estimar las probabilidades deseadas a partir de la frecuencia de los valores de los datos de entrenamiento, de forma anloga a como se hace en NaiveBayes. La calidad de estas estimaciones de pender de que exista un nmero suficiente de datos en la muestra. Cuando esto no es posible se puede cuantificar la incertidumbre existente representando la mediante una distribucin de
probabilidad, para as considerar la explcitamente en la definicin de las probabilidades. Habitualmente se emplean distribuciones Beta en el caso de
38
variables binarias, y distribuciones Dirichlet para variables multi valuadas. Esta aproximacin es til cuando se cuenta con el apoyo de expertos en el dominio de la aplicacin para concretar los valores de los parmetros de las distribuciones. Si existen variables de tipo continuo la estrategia ms habitual es aplicar discretizarlas antes de construir el modelo estructural. Existen algunos modelos de redes bayesianas con variables continuas, pero estn limitados a variables gaussianas relacionadas linealmente. Es posible tambin efectuarla discretizacin mientras se construye el grafo de la red, si ste se aprende utilizando el principio MDL como medida de ajuste. 4.10.1.2. Datos incompletos A parecen mayores dificultades cuando los datos de entrenamiento no estn completos. Pueden plantearse dos tipos de informacin incompleta:
Valores faltantes: faltan algunos valores de uno o varias variables en algunos ejemplos. Nodo oculto: faltan todos los valores de una variable.
El primer caso es ms sencillo, y existen varias alternativas, entre estas:
Eliminar los ejemplos con valores ausentes. Considerar un nuevo valor adicional para la variable: desconocido. Considerar el valor ms probable a partir de los datos de la misma en las de ms instancias. Considerar el valor ms probable en base a las dems variables.
39
Las dos primeras opciones son habituales en problemas de aprendizaje, y vlidas siempre y cuando se cuente con un nmero elevado de datos completos. La tercera opcin viene a ignorar las posibles de pendencias de la variable con las de ms, cuando ya se cuenta con la estructura que las describe en el grafo; no siempre proporcionar los mejores resultados. La cuarta tcnica se sirve de la red ya conocida para inferir los valores desconocidos. Primero se rellenan las tablas de parmetros usando todos los
ejemplos completos. Despus, para cada instancia incompleta, se asignan los valores conocidos a las variables correspondientes en la red y se propaga su efecto para obtener las probabilidades a posteriori de las no observadas. Entonces se toma como valor observado el ms probable y se actualizan todas las probabilidades del modelo antes de procesar la siguiente instancia incompleta. La aparicin de nodos ocultos requiere un tratamiento ms complejo. Existen diferentes tcnicas para estima las probabilidades faltantes en este caso. Una habitual es la aplicacin del algoritmo EM (Expectation Maximization), cuya aplicacin ya se ha estudiado en la asignatura en el contexto de las tcnicas de agrupamiento. Su aplicacin al aprendizaje de parmetros se traduce en lo siguiente: Asignar valores aleatorios(o basados en conocimiento experto, si se dispone de l) a las probabilidades desconocidas de la red. Utilizar los datos conocidos para estimar desconocidos infirindolos sobre el modelo con las probabilidades actuales. Completar el conjunto de datos con los valores estimados y volver a calcular las probabilidades de la red a partir de ellos. Repetir los dos pasos anteriores hasta que no hay a cambios significativos en las probabilidades.
40
Se destaca que existe cierta similitud entre el aprendizaje de la red bayesiana cuando existen nodos ocultos y el aprendizaje de pesos en las capas ocultas de un perceptrn multicapa en el que se conocen los valores de entrada y salida para cada ejemplo, pero ningn valor para los elementos de proceso intermedios. Basndose en esta idea se propone una tcnica de gradiente similar a la usada en el algoritmo de retro propagacin. La tcnica trata de maximizar la probabilidad
de los datos de entrenamiento conocida la hiptesis P(D | h),considerando como espacio de hiptesis el conjunto de todas las posibles combinaciones de valores para las probabilidades que parametriza la red. Para ello, sigue el gradiente de lnP(D|h) con respecto a las probabilidades de la red, actualizando cada parmetro Wijk desconocido de forma iterativa con el incremento:
= + .
(2)
Donde Wijk es el parmetro desconocido correspondiente a la probabilidad condicional de que la variable Xi tome el valor X ij cuando sus padres i toman los valores ik, y k es una tasa de aprendizaje. En cada iteracin las probabilidades W ijk se renormalizan tras el incremento. Tanto el algoritmo EM como el de gradiente ascendente encuentran soluciones que son slo ptimas localmente, por lo que en ambos casos la calidad del resultado de pender de la asignacin inicial de las probabilidades desconocidas. 4.10.3. Aprendizaje estructural El aprendizaje estructural conlleva explorar un espacio de grafos. Esta tarea es muy compleja. A poco que se incrementa el nmero de variables (nodos), el
41
nmero de posibles grafos a construir con ellas se dispara. Por eso en muchos ocasiones se restringe el espacio de bsqueda a grafos con caractersticas concretas. Existen muchos algoritmos especficos para el aprendizaje de redes donde G se limita a un rbol, o aun poli rbol, o a otras estructuras menos generales. No obstante, existen tcnicas para aprender redes con estructuras generales. Trabajar sin restricciones debera permitir, idealmente, construir redes que ajusten mejor al conjunto de entrenamiento, por complejas que sean las dependencias entre los atributos.
Hay dos aproximaciones bsicas al aprendizaje de redes sin restricciones. La primera de ellas rene mtodos que exploran las relaciones de dependencia existentes entre pares, tripletas u otros subconjuntos de variables para elegir la forma en que deben conectarlas. El estudio de esas relaciones requiere establecer un a criterio cuantitativo para medir la de pendencia entre variables, y es dicho criterio el que gua la construccin de la red. Un ejemplo de algoritmo que se engloba en esta familia de tcnicas es el de construccin de TAN de Friedman y Goldz Smith. Dicho algoritmo crea una red con una topologa restringida, pero el principio que gua la construccin es el mismo, una medida de informacin mutua que cuantifica la relacin entre las variables. La otra aproximacin habitual al aprendizaje de redes consiste en realizar una bsqueda guiada por una medida global de calidad. Ntese que en la
aproximacin anterior el criterio gua es local, se aplica a subconjuntos reducidos de variables, no a toda la red. En esta otra aproximacin, la operacin general
42
consiste en generar distintos grafos mediante un algoritmo de bsqueda y aplicar a cada uno de ellos una funcin de medida de calidad para decidir qu grafo conservar en cada paso. Existen muchos algoritmos que siguen esta tcnica, definidos a partir de la combinacin de dos elementos:
Algoritmo de bsqueda Medida global de ajuste
Es habitual emplear algoritmos de bsqueda heurstica. Intentar una bsqueda exhaustiva por todo el espacio de grafos es sencillamente intratable. Algunas posibilidades son las tcnicas de ascenso de colinas (hillclimbing), algoritmos genticos, bsquedas bidireccionales, etc...Otra opciones aplicar una bsqueda voraz. Se comienza con una red vaca y se aplican sucesivas operaciones locales mejorando de forma maximalla medida de ajuste hasta que se encuentra un ptimo local. Las operaciones aplicadas incluyen la adicin, borrado e inversin de arcos. Tambin hay muchas medidas de ajuste. Dos habituales son la medida bayesiana y el principio de mnima longitud de descripcin. La medida bayesiana trata de maximizar la probabilidad de la estructura dados los datos de entrenamiento P(Bs|D).Como el objetivo de la medida es comparar el valor obtenido para distintas estructuras i y j , es habitual recurrir al cociente: P(BSi|D)/P(BSj|D)=P(BSi,D)/P(BSj,D)
43
Considerando variables discretas y datos independientes, las probabilidades conjuntas del segundo cociente se pueden estimar utilizando las predicciones hechas por cada estructura ante los datos de entrenamiento. Por su parte, el principio MDL caracteriza el aprendizaje en trminos de compresin de los datos. El objetivo del aprendiz es encontrar un modelo que facilite la obtencin de la descripcin ms corta posible de los datos originales. La longitud de esta descripcin toma en cuenta:
La descripcin del propio modelo, penalizando la complejidad del mismo. La descripcin de los datos que usan el modelo, alentando su verosimilitud.
En el contexto de las redes bayesianas, el modelo es la red. Dicha red B describe la probabilidad condicional PB sobre las instancias que aparecen en los datos. Usando esta distribucin, puede construirse y codificarse un esquema que asigne palabras de cdigo ms cortas a las instancias ms probables. De acuerdo con el principio MDL, debera escogerse una red B tal que la longitud combinada de la descripcin de la red y los datos codificados (con respecto a PB) sea mnima. A partir de este punto, distintos autores definen diferentes formas de medir cada elemento de la descripcin a partir del esquema general: MDL (B|D)=complejidad (B)verosimilitud (D) ,en el que un valor menor MDL(B|D) de es mejor. Por ejemplo, se define:
. = . 2

=1
44
El primer trmino (complejidad (B)) representa la longitud de una descripcin de la red en la que se emplean
2
bits para cada parmetro (N es el tamao de D),
siendo |B| el nmero total de stos. El segundo trmino mide cuntos bits se necesitan para describir todos los elementos di en D asignando las longitudes de cdigo en funcin de la distribucin de probabilidad PB. Tanto la medida bayesiana como MDL son bien conocidas y estn bien estudiadas. Ambas funciones son asintticamente equivalentes cuando aumenta el tamao de la muestra, y adems asintticamente correctas: con probabilidad igual a uno la distribucin aprendida converge a la distribucin medida que el nmero de muestras aumenta. 4.11. Clasificador Naive Bayes Aumentado con un rbol (TAN) A la hora de construir un clasificador bayesiano teniendo en cuenta las dependencias existentes existen alternativas ms sencillas que enfrentarse a la construccin de una red bayesiana sin restricciones. Dichas alternativas consisten en extender el clasificador Naive Bayes con modificaciones estructurales. La idea general es construir una estructura que refleje algunas relaciones de dependencia entre los atributos, manteniendo separada la variable clase. Una vez construida dicha estructura, se aade un arco desde el nodo correspondiente a la clase a cada uno de los atributos, tal y como ocurre en Naive Bayes. Cuando no se imponen restricciones sobre la estructura de dependencias entre atributos se habla de un clasificador BANNaive Bayes aumentado con una red. Esta opcin es exactamente igual de compleja que construir una red bayesiana sin tener en cuenta el carcter especial del nodo clase. Sin embargo, si se imponen subyacentea
45
restricciones razonables en la estructura que se crear entre los atributos se pueden construir clasificadores en tiempo polinmico. En este apartado se considerar la restriccin de que los nodos atributos formen tan solo un rbol, construyendo as un clasificador TAN (Tree Augmented Naive Bayes). La figura 7 muestra un ejemplo de clasificador TAN.
Figura 7: Ejemplo de estructura Naive Bayes aumentada con un rbol Puede observarse que cada nodo atributo un solo un nodo padre (aparte del nodo clase C) con la excepcin de A1, que es el nodo raz del subrbol de atributos. 4.11.1. Algoritmo de Friedman-Goldszmidt (1996) Se presenta un algoritmo para la construccin de estructuras TAN. Este algoritmo se inspira directamente en uno propuesto por [CHOW] para construir redes bayesianas conforma de rbol. En el algoritmo original se usa la cantidad de informacin mutua entre pares de variables como criterio para determinar entre cules de ellas se incluyen arcos de dependencia. En el algoritmo para construir TAN se emplea la informacin mutua condicionada a la variable clase, dado que
46
sta se incorpora posteriormente al grafo. Dadas dos variables discretas X, Y la cantidad de informacin mutua entre ellas condicionada a la variable Z se define como: , ,
; =

, , .
La informacin mutua, por definicin, proporciona una medida de la dependencia entre las variables que relaciona. La informacin mutua condicionada hace la propio, teniendo en cuenta que se conoce el valor de una tercera. El algoritmo para la construccin del TAN consta de 5 pasos: Paso F1.Calcular I(Xi; Xj|C)con i< j;i, j=1,2,...,n. Los valores se estiman a partir de la frecuencia de los datos de entrenamiento. Paso F2. Construir un grafo no dirigido completo cuyos nodos correspondan a los atributos X1,X2,...,Xn. Asignar a cada arco entre nodos Xi y Xj un peso dado por I(Xi,Xj|C). Paso F3. Aplica r el algoritmo de Kruskal al grafo anterior para construir un rbol expandido mximo. Paso F4. Transformar el rbol no dirigido resultante en uno dirigido, escogiendo un nodo cualquier como raz y asignando direcciones a todas las aristas a partir de l. Paso F5.Construir un modelo TAN aadiendo un nodo etiquetado como C y posteriormente un arco desde C a cada atributo Xi.
47
El algoritmo de Kruskal parte de los n(n1)/2 pesos del grafo completo para construir un rbol que incluya todos sus nodos y en el que la suma de los pesos de todos los arcos sea mxima. Kruskal opera escogiendo arcos del grafo original a travs de los siguientes pasos: PasoK1.Asignar las dos aristas de mayor peso al rbol a construir. PasoK2. Examinar la siguiente arista de mayor peso y aadirla al rbol a no ser que forme un ciclo, en cuyo caso se descarta y se examina la siguiente arista de mayor peso. PasoK3.Repetir K2 hasta que se hayan seleccionado n1 aristas. Consideremos un ejemplo de uso del algoritmo para ver paso a paso la forma en que opera. Supngase un dominio en el que los ejemplos se describen con cinco atributos X, Y, Z, V, W, y se clasifican en valores de C. Los resultados en cada paso del algoritmo sern los siguientes: PasoF1.Se calculan todos los valores de informacin mutua condicionada por C para cada par de variables. Sea el orden de los valores obtenidos el siguiente: I(X,Z|C)>I(Y,V|C)>I(X,Y|C)>I(Z,V|C)>I(X,V|C)> >I(Z,W|C)>I(X,Y|C)>I(X,W|C)>I(Y,Z|C)> >I(Y,W|C)>I(V,W|C) Paso F2. Se construye el grafo no dirigido completo. Basta concrear los nodos correspondientes a todos los atributos y mantener los valores de informacin
48
mutua accesibles como pesos de los arcos no es necesario construir explcitamente los arcos en memoria. Vase ms adelante la figura 7a. Paso F3. Aplicacin de Kruskal para mximo. obtener un rbol expandido de peso
PasoK1.Se aaden los dos arcos de mayor peso (figura 7b).
- Paso K2. Se aade el siguiente arco de mayor peso: X-Y (figura 7c). -Paso K2.Se aade el siguiente arco de mayor peso: Z-V (figura 4d).Sin embargo, se comprueba que forma un ciclo, por lo que se descarta y se aade el siguiente: X-V(figura 4e). De nuevo X-V forma un ciclo, as que se descarta tambin y se aade Z-W (figura 7f). -Paso K3. Ya existen tantos arcos como nodos menos uno. Finaliza Kruskal. Paso F4.Se selecciona el nodo X como origen del rbol. A partir de l, se asignan direcciones a los arcos recorriendo todas las ramas alejndose se X (figura 7g). Paso F5. Se aade un nodo para la clase C y se conecta cada nodo atributo con C mediante un arco (figura 7h).
49
Figura 7: TAN paso a paso con el algoritmo de Friedman y Goldszmidt Se demuestra que el algoritmo propuesto construye un TAN qu maximiza el valor de LL(BT|D),siendo D el conjunto de datos de entrenamiento. Tambin se asevera que la complejidad temporal del algoritmo es O(n2
N), siendo n el nmero de atributos y N el tamao del conjunto de entrenamiento. El anlisis propuesto es el siguiente: El paso F1 tiene complejidad O(n 2 N). El paso F3 tiene complejidad O(n2logn)alalgoritmo de Kruskal es un algoritmo clsico bien conocido. Los pasos F2 (slo requiere construir complejidad O(n). los nodos), F4 y F5 tienen
50
Usualmente se cumple que N > log n, por lo que se toma como complejidad global O(n 2 N). En un contexto en el que los datos de entrenamiento hubieran sido generados por una estructura TAN, el algoritmo visto es asintticamente correcto, en el sentido de que si la muestra de casos es suficientem ente grande, recuperar exactamente la estructura que gener los datos. 4.11.2 Algoritmo de Keogh y Pazzani Keoghy Pazzani (1999) proponen un algoritmo voraz que va aadiendo arcos a una estructura Nave Bayes. En cada paso se aade el arco que manteniendo la condicin de que en la estructura final cada variable no tenga ms de un padre, mejore en mayor medida el porcentaje de bien clasificados obtenidos mediante el mismo. 5. Diseo del Sistema de Redes Neuronales El diseo del Sistema se basa en la premisa de disponer de una estructura combinada de elementos de almacenamiento, acceso y anlisis de la informacin necesarios para dar solucin a las necesidades planteadas. 5.1. Diseo Cualitativo: Estudio de necesidades, usuarios y posibilidades existentes para poner en marcha el Sistema de Informacin. A continuacin se presenta un diagrama de Contexto para un Sistema de Informacin para la gestin de los procesos acadmicos y financieros.
51
Figura 8. Diagrama de Contexto Diseo de la Plataforma Educativa: La interface grafica permitir interactuar con los Docentes, padres de familia, estudiantes, entre otros. Diseo de los modelos de Red Neuronal Artificial: Transformacin del modelo de RNA interno; define soluciones del Sistema a emplear en funcin del esquema seleccionado anteriormente. 5.2 Diseo Cuantitativo Para este anlisis se tomaron muestras de diferentes instituciones educativa, se realizaron los estudios correspondientes a la implementacin de una plataforma educativa que cumpliera con el decreto 1290 del Ministerio de Educacin el cual fija las pautas para el correcto ingreso de las notas a la plataforma, como tambin verificar si exista en el mercado laborar un software que cumpliera con estos
52
objetivos. Adems, se ejecut investigacin cualitativa empleando el mtodo de estudio de caso a travs de una investigacin, cuya estrategia metodolgica se baso en los valorativos de desempeos fueron facilitados por los docentes quienes tomaron sus conclusiones de cada captulos de los libros que utilizan para las enseanza de cada asignaturas. Para el desarrollo de la aplicacin se tendr en cuanta, el siguiente algoritmo de entrenamiento aplicado a una red neuronal backpropagation, ver Fig. 9 en la que a se definen las siguientes fases: 1. Inicializar pesos 2. Definir la Matriz de Entrenamiento 3. Calcular los estados de activacin 4. Calcular el error en cada una de las capas de salidas 5. Calcular el error en cada una de las neuronas de la capa oculta o intermedia 6. Modificar Cada uno de los pesos 7. Repetir el paso anterior hasta que el error total E cometido por la red neuronal sea igual o inferior a cero
53
Fig. 9: Diagrama de flujo de una Backpropagation. A continuacin se describe cada proceso teniendo en cuenta las referencias bibliogrficas [1], y sin olvidar el enfoque pedaggico de los objetivos de la investigacin presente. 1. Inicializar los pesos wjk de las conexiones entre las neuronas de la capa de salida e intermedia y los pesos wij de las conexiones entre las neuronas de la capa intermedia y de entrada asignndoles, por ejemplo, valores aleatorios por medio de una funcin de nmeros aleatorios. 2. Definir la matriz de entrenamiento y en las que este representados para cada vector de entrada el valor de salida deseado. Supngase que deseamos clasificar objetos, identificados como los desempeos cualitativos de las evaluaciones, en las categoras A 1, A2,An, ya que estaremos definiendo la red neuronal como un clasificador, entonces los componentes Ii de los vectores de entrada representaran las caractersticas
54
de los objetos, asignndole a cada componente un valor de 1 o 0 en funcin de su presencia o ausencia, respectivamente. En la tabla No.3 se describen para cada caso los conceptos que corresponden, indicando si la caracterstica esta o no presente.
CASO 1 CASO 2 CASO 3
Reconoce los elementos y propiedades de la multiplicacin. Distingue analticamente en una serie de ejercicios prcticos. Realiza multiplicaciones de hasta dos cifras y multiplicaciones abreviadas. Aplica correctamente estas operaciones en la solucin de problemas matemticos sencillos.
CASO 4
Tabla 3: Casos de conceptos para las Fortalezas, Debilidades de la asignatura Matemticas y Geometra del Grado primero hasta quinto.
En la tabla No. 4 a cada vector de entrada le asociaremos una salida S con componentes de estudios correctamente elegidos para cada rango de calificacin ingresado por el docente.
DESEMPEO SUPERIOR
C1 1
C2 1
C3 1
C4 1
S 16
NOTA 10.0
55
SUPERIOR SUPERIOR SUPERIOR SUPERIOR ALTO ALTO ALTO ALTO ALTO BAJO BAJO BAJO BAJO BAJO BAJO
1 1 1 1 1 1 1 0 0 0 0 0 0 0 0
1 1 1 0 0 0 0 1 1 1 1 0 0 0 0
1 0 0 1 1 0 0 1 1 0 0 1 1 0 0
0 1 0 1 0 1 0 1 0 1 0 1 0 1 0
15 14 13 12 11 10 9 8 7 6 5 4 3 2 1
9.0-9.9 8.0-8.9 7.5-7.9 7.0-7.4 6.6-6.9 6.0-6.5 5.0-5.9 4.6-4.9 4.0-4.5 3.0-3.9 2.6-2.9 2.0-2.5 1.6-1.9 1.3-1.5 1.0-1.2
Tabla 4: Matriz de entrenamiento corresponde a los valores c1, c2, c3, c4 de
56
La Red Neuronal El valor de salida deseado ser el que identifique a la clase o categora a la que pertenece cierto objeto. Cada salida contiene el concepto que se presentan en la siguiente tabla (tabla no. 5).
SALIDA S1
Concepto Mejore ms sus hbitos de estudio y cumpla con sus compromisos acadmicos en la asignatura. Procure cumplir con sus compromisos acadmicos. Debe retomar las temticas desarrolladas durante el bimestre y resolver ejercicios de aplicacin. Debe repasar los conceptos y las ecuaciones para la solucin de ejercicios. Se recomienda retomar la lectura y anlisis del texto. Procure ser ms constante en sus participaciones y retome las temticas vistas. Usted puede lograr mejores resultado, cuente con mi apoyo! Se recomienda repasar los procedimientos de las sesiones bimestre B. del
S2 S3
S4
S5 S6
S7 S8
S9
Debe participar ms en clase y aumentar su inters por el ingls.
57
S10 S11 S12
Con un poco ms de dedicacin su desempeo mejorar. Con un pequeo esfuerzo alcanzars el nivel superior. Procure analizar con ms detenimiento las situaciones y esquemas que se le plantean. Contine con el mismo entusiasmo y dedicacin al estudio. Siga con el mismo entusiasmo y desempeo. Figura disciplinariamente, como un(a) estudiante modelo para sus compaeros felicitaciones. Contine as! Su desempeo es superior. Felicitaciones!
S13 S14 S15
S16
Tabla 5: Conceptos de Recomendaciones segn el nmero de salida identificado por la RN.
3. Calcular el estado de activacin Ok de las neuronas de la capa de salida y el estado de activacin Oj de las neuronas de la capa intermedia, es decir obtener los valores net para las neuronas de la capa de salida e intermedia:
(5)
(6)
58
Obteniendo a continuacin: = ( ) = ( )
Los valores net se obtienen considerando que por requerimiento del modelo la funcin de activacin es continua, por ejemplo la funcin sigmoidal. 4. Calcular el error o valor en la capa de salida aplicando la expresin que se muestra en la ecuacin 7:

(7)
Obsrvese que el trmino
representa el error de una neurona k siendo
similar al trmino de error utilizado en la regla del perceptrn. Ahora bien, en la regla de aprendizaje de una red backpropagation ya no slo consideramos si una neurona de salida se encuentra o no en error, tal y como ocurre si I y D solo toman valores 0 o 1. Asimismo, tampoco consideramos nicamente la magnitud del error, como ocurre en algunas aplicaciones prcticas en las que se requieren componentes I y D en los vectores de entrada y salida definidas por vectores reales, por ejemplo 0,126. En una red backpropagation adems de calcular el error escalamos su valor al estar este multiplicado por la derivada:
(8)
59
Si se utiliza la funcin de activacin sigmoidal, sustituyendo la derivada por su valor tendremos que: = 1 (9)
ya que 1
es la derivada de la funcin sigmoidal. en cada una de las neuronas de la capa oculta o si no es posible comparar la
Calcular el error o valor
intermedia. Ahora bien, cmo calcular Dj Oj salida Oj
de las neuronas de la capa intermedia con un valor deseado para dicha Dj . La solucin adoptada creadores de esta la principal contribucin de la regla de
capa? Obsrvese que en el caso de la capa intermedia no disponemos de un vector deseado con componentes red constituye por su originalidad
aprendizaje. Delegando la responsabilidad del clculo de error en la capa intermedia a la capa de salida de la red. El error j en cada una de las neuronas de la capa de salida se calcula aplicando la expresin que se muestra a continuacin:
j =
k wjk
O j net j
(10)
Leyendo la expresin deducimos que el error en una neurona j es proporcional a la suma ponderada de los errores en la k neuronas de la capa de salida, siendo la derivada el factor de proporcionalidad. Si observamos detenidamente el trmino
60
entre parntesis concluiremos que los pesos wjk
de las conexiones entre las
neuronas j de la capa oculta y las k neurona de salida, representa los factores de ponderacin. En consecuencia cuanto mayor sea el peso, y por tanto la fuerza sinptica, entre alguna de las k neuronas de salida y una neurona j mayor ser la responsabilidad de la neurona k en el error de la neurona. Finalmente, y asumiendo que utilizamos la funcin de activacin sigmoidal, sustituyendo en la derivada que aparece en la expresin obtendremos:
j =
k
k wjk
Oj O (Oj ) net j j
(11)
5. Modificar el valor de los pesos aplicando la expresin general en la que se recoge la regla de aprendizaje. La actualizacin del valor de los pesos debe ser efectuada tanto en los pesos wjk de las conexiones entre las neuronas de la capa de salida e intermedia, ver ecuacin (). wjk t + 1 = wjk t + wjk (12)
Como en los pesos wij de las conexiones entre las neuronas de la capa intermedia y de entrada: wij t + 1 = wij t + wij (13)
La regla de aprendizaje de una red backpropagation establece que el cambio
61
experimentado por un peso es proporcional al error
y a la seal de entrada,
siendo la tasa de aprendizaje el factor de proporcionalidad. Por consiguiente, tendremos que el cambio experimentado por los pesos de las conexiones entre la j neuronas de la capa oculta y las k neuronas de salida ser igual a: wij = k Oj (14)
Mientras que para los pesos asociados a las conexiones entre las j neuronas de la capa oculta y las i neuronas de la capa de entrada: wij = j Oi (15)
Si finalmente sustituimos en las expresiones para los pesos el cambio experimentado, es decir el valor w, sustituyendo a su vez el valor por la expresin correspondiente representada en los pasos 4 y 5, tendremos las expresiones con las modificaciones una y otra vez los pesos durante la fase de entrenamiento de la red. En el caso particular de los pesos asociados a las conexiones entre las neuronas de la capa de salida e intermedia, obtendremos la expresin general siguiente: wjk t + 1 = wjk t + Dk Ok Ok 1 Ok Oj (16)
Siendo la expresin que corresponde a los pesos de las conexiones entre las neuronas de la capa oculta y de entrada la que se muestra a continuacin, en la
62
ecuacin (13):
wij t 1 = wij t +
k
k wjk
Oj 1 Oj Ii (17)
6. Repetir el paso anterior hasta
que el error total E cometido por la red
neuronal sea igual a cero o inferior a un cierto valor o cota preestablecido previamente. El valor del error E es una medida de aprendizaje en la red, y por tanto de su ejecucin durante la fase de entrenamiento, calculndose de acuerdo con la siguiente expresin:
E=
2 k
(18)
Obsrvese que sustituyndose en la expresin el valor k sin tener en cuenta la derivada, tendremos que E es igual a: E=
1 2 k (Dk
Ok )2
(19)
Una vez la red neuronal haya alcanzado sus valores ptimos estos valores son guardados en una base de datos de conocimiento para luego presentarlos como un banco del saber y identificar de acuerdo a los valores de entrada los desempeos cualitativos, a los que pertenece para as poder dar sus consideraciones de trabajos asignada a estos valores relacionados. La implementacin de las redes neuronales artificiales en los sistemas de gestin
63
educativa representan una excelente herramienta para evitar tareas rutinarias al docente, clasificar conceptos, permitindole a este poder obtener mejoras los modelos acadmicos de evaluaciones, tambin la sistematizacin de sus labores representa una avance al plan de mejoramiento institucional. Un sistema basado en RNA de tipo backpropagation resulto practico para la implementacin de este ejemplo prctico descrito en el presente artculo debido a que se utilizaron un vector de cuatro entradas, ocho neuronas ocultas y una neurona de salida, los datos de entrada que inicialmente eran valores numrico debieron ser transformado, segn su escala correspondiente en binarios para poder presentrselos a la Red Neuronal y de esta forma poder clasificar las salidas deseadas. Sin embargo, para futuros trabajos pensando en un clasificador de soporte para asignar tareas y aprendizaje de conceptos de temas ya vistos en clase de un sistema de notas, por ejemplo, seria recomendado utilizar las redes bayesianas, u otras RNA que permitan la implementacin del mismo. Para los resultados de la investigacin se guardaron los patrones de entradas, se emple la utilizacin de los conceptos para las Fortalezas, Debilidades de la
asignatura Matemticas y Geometra del Grado primero hasta quinto contenidos al final de cada captulo y para la informacin de las recomendaciones se tuvo en cuenta las opiniones de los docentes de cada grado. De esta manera se clasificaron todo un banco de perfiles para que mas adelantes estos se pudieran identificar al ser presentados como patrones de entradas para cada clase o categora en particular y de este modo regstralos en el sistema. La clasificacin, identificacin y anlisis de esos patrones obtuvieron un rendimiento en las consultas del 90 % ya que para los docentes se le facilit la asignacin de calificaciones utilizando el modelo estudiado.
64
6. MARCO LEGAL Este proyecto est enmarcado en el artculo 1290 de 2009 del MINISTERIO DE EDUCACIN NACIONAL, por el cual se reglamenta la evaluacin del aprendizaje y promocin de los estudiantes de los niveles de educacin bsica y media, y en cuyos artculos describe lo siguiente: ARTCULO 1. Evaluacin de los estudiantes. La evaluacin de los aprendizajes de los estudiantes se realiza en los siguientes mbitos: 1. Institucional. La evaluacin del aprendizaje de los estudiantes realizada en los establecimientos de educacin bsica y media, es el proceso permanente y objetivo para valorar el nivel de desempeo de los estudiantes. ARTCULO 3. Propsitos de la evaluacin institucional de los estudiantes. Son propsitos de la evaluacin de los estudiantes en el mbito institucional: 1. Identificar las caractersticas personales, intereses, ritmos de desarrollo y estilos de aprendizaje del estudiante para valorar sus avances. 2. Proporcionar informacin bsica para consolidar o reorientar los procesos educativos relacionados con el desarrollo integral del estudiante. 3. Suministrar informacin que permita implementar estrategias pedaggicas para apoyar a los estudiantes que presenten debilidades y desempeos superiores en su proceso formativo. 4. Determinar la promocin de estudiantes. 5. Aportar informacin para el ajuste e implementacin del plan de mejoramiento institucional.
65
ARTCULO 4. Definicin del sistema institucional de evaluacin de los estudiantes. El sistema de evaluacin institucional de los estudiantes que hace parte del proyecto educativo institucional debe contener: 1. Los criterios de evaluacin y promocin. 2. La escala de valoracin institucional y su respectiva equivalencia con la escala nacional 3. Las estrategias de valoracin integral de los desempeos de los estudiantes. 4. Las acciones de seguimiento para el mejoramiento de los desempeos de los estudiantes durante el ao escolar. 5. Los procesos de autoevaluacin de los estudiantes. 6. Las estrategias de apoyo necesarias para resolver situaciones pedaggicas pendientes de los estudiantes. 7. Las acciones para garantizar que los directivos docentes y docentes del establecimiento educativo cumplan con los procesos evaluativos estipulados en el sistema institucional de evaluacin. 8. La periodicidad de entrega de informes a los padres de familia. 9. La estructura de los informes de los estudiantes, para que sean claros, comprensibles y den informacin integral del avance en la formacin. 10. Las instancias, procedimientos y mecanismos de atencin y resolucin de reclamaciones de padres de familia y estudiantes sobre la evaluacin y promocin. 11. Los mecanismos de participacin de la comunidad educativa en la construccin del sistema institucional de evaluacin de los estudiantes. ARTICULO 5. Escala de valoracin nacional: Cada establecimiento educativo definir y adoptar su escala de valoracin de los desempeos de los estudiantes en su sistema de evaluacin. Para facilitar la movilidad de los estudiantes entre
66
establecimientos educativos, cada escala deber expresar su equivalencia con la escala de valoracin nacional:
Desempeo Superior Desempeo Alto Desempeo Bsico Desempeo Bajo
La denominacin desempeo bsico se entiende como la superacin de los desempeos necesarios en relacin con las reas obligatorias y fundamentales, teniendo como referente los estndares bsicos, las orientaciones y lineamientos expedidos por el Ministerio de Educacin Nacional y lo establecido en el proyecto educativo institucional. El desempeo bajo se entiende como la no superacin de los mismos. ARTCULO 14. Derechos de los padres de familia. En el proceso formativo de sus hijos, los padres de familia tienen los siguientes derechos: 1. Conocer el sistema institucional de evaluacin de los estudiantes: criterios, procedimientos e instrumentos de evaluacin y promocin desde el inicio de ao escolar. 2. Acompaar el proceso evaluativo de los estudiantes. 3. Recibir los informes peridicos de evaluacin. 4. Recibir oportunamente respuestas a las inquietudes y solicitudes presentadas sobre el proceso de evaluacin de sus hijos. ARTCULO 16. Registro escolar. Los establecimientos educativos deben llevar un registro actualizado de los estudiantes que contenga, adems de los datos de
67
identificacin personal, el informe de valoracin por grados y el estado de la evaluacin, que incluya las novedades acadmicas que surjan. ARTCULO 17. Constancias de desempeo. El establecimiento educativo, a solicitud del padre de familia, debe emitir constancias de desempeo de cada grado cursado, en las que se consignarn los resultados de los informes peridicos. Cuando la constancia de desempeo reporte que el estudiante ha sido promovido al siguiente grado y se traslade de un establecimiento educativo a otro, ser matriculado en el grado al que fue promovido segn el reporte. Si el establecimiento educativo receptor, a travs de una evaluacin diagnstica, considera que el estudiante necesita procesos de apoyo para estar acorde con las exigencias acadmicas del nuevo curso, debe implementarlos. 7. METODOLOGIA 7.1 Poblacin Y Muestra La Implementacin de un Sistema de Informacin de Gestin de Procesos Acadmicos apoyado con muestra Redes Neuronales Artificiales se ha tomado como
los estudiantes de las instituciones educativa de Bsica y Media de
Valledupar, ver tabla 5, para esta forma tener en cuenta el nivel socioeconmico, acadmico, pues, existen diferencias en estos tres colegios que pueden presentar resultados interesantes al momento de la investigacin.
68
No. INSTITUCION POBLACIONAL
PORCENT AJE DE LA MUESTRA
NIVEL SOCIOECONOMICO ESTRATO
Gimnasio Del Saber Juvenil San Antonio Osvaldo Vergara Fernndez
1400
10%
ALTO
210 260 260
10% 10% 10%
MEDIO MEDIO-BAJO MEDIO-BAJO
3 1 2
Tabla No.5 relacin de Niveles socioeconmicos y medida poblacional Para esto, se tomarn muestras de tipo de opinin, encuestas, formularios de datos, las escalas de mediciones son de tipo cualitativo y cuantitativo, utilizando para la obtencin o recoleccin de informacin la Plataforma Educativa. 7.2 Tipo de Estudio Teniendo en cuenta los objetivos plateado de la investigacin y desde el marco epistemolgico nuestro estudio es de tipo Analtico (comparativo), ya que se pretende aplicar a un nmero poblacional de estudiantes un aplicativo basado en redes neuronales para determinar sus comportamientos. 7.3 Tcnicas y Recoleccin de informacin
69
A continuacin se describen las actividades en las diferentes fases, los requerimientos de personal, hardware y software, para que la instalacin y puesta en marcha se desarrolle con xito en los tiempos estimados y para que las
Instituciones asimilen con beneficio el cambio tecnolgico al que se enfrenta.
Figura 10. Actividades y sus fases de implementacin del software En la fase de asimilacin, se expone la metodologa a los integrantes del proyecto, se definen los diferentes roles y las responsabilidades de cada rol; adicionalmente, se preparan los recursos logsticos necesarios para iniciar la actividades propias del proyecto. La fase de experimentacin o afinamiento del diseo, inicia con la
conceptualizacin de sistema y termina con la aprobacin del documento de alcance funcional. Durante esta fase, el usuario entra en contacto con el sistema para entender la globalidad del mismo. Facilitando la toma de decisiones frente a alternativas de parametrizacin. Durante esta fase el recurso humano del
contratista asimila las propiedades y necesidades del usuario final y las directivas del Colegio insumo requerido para el ajuste para el ajuste del diseo de la solucin y para delinear etapas restantes del proyecto. En la Fase de construccin, se realizan todos los ajustes requeridos al diseo de la solucin a nivel de desarrollo de software, las labores de parametrizacin,
70
migracin de informacin y cargue de los saldos inciales en aquellos mdulos que as lo requieran. Adicionalmente, se efectan pruebas de funcionalidad. Finalmente en la fase de entrega, se verifica el cumplimiento de los compromisos adquiridos para firmar el acta de recibo a satisfaccin del sistema. Fases de la metodologa
Figura 11. Metodologa del tiempo y sus niveles de actividad Interaccin Fases de la metodologa
Figura 12 Interaccin Fases de la metodologa del tiempo y sus niveles de actividad 7.3.1. Revisin de requerimientos Tcnicos (Hardware y software)
71
En el proceso de implantacin del sistema es requisito indispensable la instalacin y puesta en marcha de la plataforma computacional con todas las pruebas y ajustes necesarios. Para el funcionamiento del sistema se requiere como mnimo: Un servidor de base de datos descrito en la seccin 3.1.4. Implementacin fsica del Sistema. La configuracin recomendada para el servidor se estima para poner con 100 usuarios concurrentes. De antemano no puede proyectarse el crecimiento de servidores y canales de comunicacin por cuanto no se conoce el volumen de transacciones, el nmero de usuarios del sistema y los tiempos de respuesta requeridos por el cliente. El departamento de tecnologa del Colegio deber hacer las mediciones del caso para determinar este crecimiento. El sistema puede operar instalado el servidor de aplicaciones y servidor de base de datos en un solo computador. El sistema permite, si el cliente lo estima conveniente, distribuir los componentes del sistema en diferentes servidores (uno o ms servidores de aplicaciones, servidor de bases de datos, servidor web, servidor de reportes). Todos los requeridos en hardware deben estar instalados y funcionando. 7.3.2. Plan de trabajo de la implementacin (tiempo de ejecucin) El plan de trabajo del proyecto se llevara a cabo en nueve (11) meses calendario, contados a partir de la fecha del acta de inicio, con la participacin del equipo del proyecto ser definido ms adelante y con el cronograma propuesto (ver Anexo No.1 CRONOGRAMA DEL PROYECTO).
72
7.4. Fuentes Primarias Las principales fuentes de informacin que se utilizan como punto de referencia para la elaboracin, diseo, e implementacin del Sistema 7.5 Fuentes Secundarias Para la realizacin de este proyecto se toman en cuenta otros sistemas
73
ANEXOS CRONOGRAMA DE ACTIVIDADES El cronograma de las actividades a realizar se muestra a continuacin:
Paralelo a estas actividades,
los procesos financieros que se pretende
implementar en la aplicacin con un tiempo estipulado de once meses, descritos de la siguiente manera:
74
75
PRESUPUESTO El capital que se necesita para la realizacin del proyecto se resume en la siguiente tabla:
FUENTES PERSONAL EQUIPO Y ACCESORIOS PAPELERIA LIBROS INTERNET CD Y DISQUETES SERVIDOR TOTAL
TOTAL 35200.000 5000.000 400.000 1000.000 2100.000 50.000 23750.000 63750.000
Tabla 1. Presupuesto general del proyecto (en $).
76
BIBLIOGRAFIA
Andina de la Fuente, D. "Tutorial de redes neuronales". Dpto. de Seales, Sistemas y Radiocomunicaciones. Grupo de circuitos. Universidad Politcnica de Madrid. Arbib, M.A. (1995): "The Handbook of Brain Theory and Neural Networks". The MIT Press. Beltratti, A.; Margarita, S.; Terna, P. (1996): "Neural Networks for economic and financial modelling". International Thomson. Computer Press. Bonilla Musoles, M.; Puerta Medina, R.(1997): "Anlisis de las redes neuronales: Aplicacin a problemas de prediccin y clasificacin financiera". Documento de Trabajo. Departamento de Economa Financiera y Matemtica. Universidad de valencia. Hanushek, E. (1986): "The economics of Schooling". Journal of Economic Literature. Vol 24, n3, pp. 1141-1171. Hebb, D.O. (1949): "The organization of behavior". Science Editions, New York, NY. Hornik, K., Stinchcombe, M. and White, H. (1989): "Multilayer Feed-forward Networks are Universal Approximators". Neural networks 2, pp. 359-66.
77
Hornik, K., Stinchcombe, M. and White, H. (1990). "Universal Approximation of an Unknown Mapping and its Derivatives using Multilayer Feed-forward Networks". Neural Networks 3, pp. 551-60. Le Cun, Y. (1985): "Une Procdure d Apprentissage pour Rseau Seuil Asymtrique", in Proceedings of Cognitiva. Martnez de Lejarza, I. (1996): "Redes Neuronales Auto-Organizadas y Clustering: Una Aplicacin a la Agrupacin Econmico-Funcional de Entidades de Poblacin". Documento de Trabajo. Facultat de CC. Econmiques i Empresarials.
Departamento de Economa Aplicada. Universitat de Valncia. Mc Culloch, W.S. y Pitts, W.A. (1943): "A logical Calculus of the Ideas Immanent in Nervous Activity". Boulletin of Mathematics and Biophysics, 5, pgs. 115-133. Minsky, M. y Papert, S. (1969): "Perceptrons: An introduction to Computacional Geometry". The MIT Press. Cambridge, MA. Modrego, A.; San Segundo, M.J. (1988): "Ecuaciones de rendimiento escolar para la evaluacin de las enseanzas medias". Revista de Educacin. SeptiembreDiciembre 1988. pp 147-179 Parker, D.B. (1985): "Learning Logic". MIT Center for Computational Research in Economics and Management science, T.R. 47. Pedraja, F. y Salinas, J. (1996): "Eficiencia del gasto pblico en educacin secundaria: una aplicacin de la tcnica envolvente de datos". Hacienda Pblica Espaola N138, pp. 87-96.
78
Rosemblatt, F. (1958): "The Perceptron: A probabilistic model for information storage and organization in the brain". Psychological Review 65, pgs 386-408. Rosemblatt, F. (1959): "Principles of Neurodynamics". Spartan Books, New York. Rumelhart, D. E.; Mc Clelland, J.L.; and the PDP Research Group (Eds.) (1986): "Parallel Distributed Processing: Explorations on the Microstructure of Cognition, vol.I. Foundations", MIT Press, Cambridge, MA. San Segundo, M.J. (1991): "Evaluacin del Sistema Educativo a Partir de Datos Individuales". Economa Industrial. Marzo - Abril 1991, pp. 23-37. San Segundo, M.J. (1998): "Igualdad de oportunidades educativas". Ekonomiaz N 40 1.er Cuatrimestre. Santn, Daniel (1998) "Eficiencia relativa de las Comunidades Autnomas en Enseanza Secundaria: un enfoque socioeconmico" Documento de Trabajo Facultad de Ciencias Econmicas y Empresariales. UCM, n 9822. Tejedor, F. J.; Caride, J. A. (1988): "Influencia de las variables contextuales en el rendimiento acadmico". Revista de Educacin. Septiembre-Diciembre 1988. pp 112-146. VV.AA. (1994): "Acerca de la produccin eductiva: Estudio de los Centros Educativos de la Comunidad Autnoma del Pas Vasco". Coleccin estudios y documentos N 20. Gobierno Vasco. Departamento de educacin, universidades e investigacin.
79
Werbos, P.J. (1974): "Beyond Regression: New tools for Prediction and Analysis in the Behavioral Sciences". Unpublished Ph.D. Dissertation, Harvard University. Department of Applied Mathematics. White, H. (1992): "Artificial Neural Networks: Approximation and Learning Theory". Blackwell, Oxford.

Proyecto Redes Neuronales

Hochgeladen von

Dokumentinformationen

Originaltitel

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Proyecto Redes Neuronales

Hochgeladen von

Copyright:

Verfügbare Formate

1

HOLMES ELIAS PINTO AVILA ANDRES FELIPE GONZALEZ GALEANO

SISTEMA DE INFORMACIN DE GESTIN DE PROCESOS

APOYADO CON REDES NEURONALES ARTIFICIALES

HOLMES ELIAS PINTO AVILA ANDRES FELIPE GONZALEZ GALEANO

Director Ing. Norberto Daz

media del municipio de Valledupar, contribuye con el desarrollo de

Ingresar a la plataforma los logros cualitativos, calificaciones, asistencias, estado de comportamiento.

Realizar procesos de carga acadmica para los docentes.

Determinar la promocin de estudiantes al final del ao escolar.

de este proyecto se limitar a la creacin de un sistema que

posibilidades existentes para poner en marcha el Sistema de Informacin.

Diseo: Seleccin del hardware y herramientas necesarias.

Implantacin fsica: Implementacin del diseo en la realidad.

Testeo: Realizacin de pruebas y uso en proyectos de investigacin educativa en desarrollo.

Sistema Operativo Windows Server 2008 R2, Foundation

Tabla 1: Caractersticas tcnicas del servidor

A continuacin se muestra una tabla comparativa del cerebro humano y un computador:

Tolera fallos (muerte de neuronas).

Los pequeos crticos.

Se han representado tambin

Cualquier variable, cualquier grafo:

Agrupamiento (junction tree), simulacin estocstica, acondicionamiento.

El primer caso es ms sencillo, y existen varias alternativas, entre estas:

Algoritmo de bsqueda Medida global de ajuste

bits para cada parmetro (N es el tamao de D),

PasoK1.Se aaden los dos arcos de mayor peso (figura 7b).

CASO 1 CASO 2 CASO 3

Tabla 4: Matriz de entrenamiento corresponde a los valores c1, c2, c3, c4 de

Debe participar ms en clase y aumentar su inters por el ingls.

S10 S11 S12

S13 S14 S15

Tabla 5: Conceptos de Recomendaciones segn el nmero de salida identificado por la RN.

Obsrvese que el trmino

representa el error de una neurona k siendo

Calcular el error o valor

intermedia. Ahora bien, cmo calcular Dj Oj salida Oj

entre parntesis concluiremos que los pesos wjk

de las conexiones entre las

La regla de aprendizaje de una red backpropagation establece que el cambio

experimentado por un peso es proporcional al error

6. Repetir el paso anterior hasta

que el error total E cometido por la red

Desempeo Superior Desempeo Alto Desempeo Bsico Desempeo Bajo

los estudiantes de las instituciones educativa de Bsica y Media de

No. INSTITUCION POBLACIONAL

PORCENT AJE DE LA MUESTRA

NIVEL SOCIOECONOMICO ESTRATO

Gimnasio Del Saber Juvenil San Antonio Osvaldo Vergara Fernndez

210 260 260

10% 10% 10%

MEDIO MEDIO-BAJO MEDIO-BAJO

Instituciones asimilen con beneficio el cambio tecnolgico al que se enfrenta.

ANEXOS CRONOGRAMA DE ACTIVIDADES El cronograma de las actividades a realizar se muestra a continuacin:

Paralelo a estas actividades,

los procesos financieros que se pretende

TOTAL 35200.000 5000.000 400.000 1000.000 2100.000 50.000 23750.000 63750.000

Tabla 1. Presupuesto general del proyecto (en $).

Das könnte Ihnen auch gefallen