Beruflich Dokumente
Kultur Dokumente
El propósito de este trabajo es estudiar las distintas herramientas que se han desa-
rrollado en el análisis de datos y su efectividad para la predicción oportuna sobre la
probabilidad de éxito de un estudiante de educación superior a su ingreso en la
universidad y definir qué herramienta es la más apropiada para una implementación.
Entender qué variables a nivel general son más críticas que otras es importante a
nivel de política pública, pero a nivel de políticas locales es necesario llevar a la
instrumentalización del conocimiento. De nada sirve conocer qué niveles socioeco-
nómicos tienen mayor riesgo de deserción sino se realizan acciones concretas para
estas poblaciones.
Las preguntas de investigación que se desean resolver son las siguientes: ¿Qué
información es almacenada de cada estudiante y qué información podría ser útil
para la estimación de la probabilidad de deserción? ¿Qué fuentes de información
exógena a las bases de datos de la universidad están disponibles y pueden ser
utilizadas? ¿Qué modelos de analítica se requieren para predecir con mayor efecti-
vidad la posibilidad de que un estudiante de educación superior deserte? ¿Son es-
tas técnicas compatibles para la implementación de herramientas que soporten pro-
cesos de prevención?
Objetivos Específicos
• Identificar que variables pueden ser explicativas del fenómeno de deserción
a partir del acercamiento a la población que ocasiona el fenómeno.
• Analizar la información que es almacenada por la institución académica caso
de estudio acerca de los estudiantes, así como la estructura de la información
que es almacenada.
• Identificar qué fuentes de información exógena pueden ser integradas en el
estudio.
• Analizar que estructuras de datos son compatible con los modelos estadísti-
cos clásicos y con los distintos modelos de analítica a evaluar.
• Evaluar distintos modelos estadísticos y de analítica para la predicción del
riesgo de deserción de un estudiante a su ingreso a una institución de edu-
cación superior.
• Desarrollar una herramienta útil para la implementación del modelo desarro-
llado.
Los modelos de analítica para el análisis del fenómeno de deserción estudiantil em-
piezan a aparecer a mediados del 2000. Como se manifestó anteriormente S. B.
Kotsiantis (2003) indica que no encuentra referencias anteriores a él para abordar
el problema desde esta clase de herramientas. La diferencia fundamental entre el
enfoque clásico (supervivencia y riesgo) y el de analítica, es que los últimos permi-
ten el análisis de gran cantidad de factores y no únicamente el tiempo y permiten
además realizar predicciones que no obedezcan a correlaciones necesariamente
lineales, que son la principal limitación de los enfoques clásicos.
También se encuentran estudios que siguen utilizando los métodos clásicos de es-
tadística descriptiva e inferencial para determinar factores principales, como se ob-
serva en Martinis-Mercado (2016) para un estudio realizado en Argentina.
MARCO TEÓRICO
Por otro lado, Christensen & Spackman (2017) buscan desarrollar una herramienta
analítica que permita a los diseñadores de los cursos on-line identificar en que mo-
mento del tiempo los estudiantes son más propensos a retirarse y teniendo en
cuenta esto analizar qué sucede y generar planes de acción. En este caso no se
pretende entender por qué razón están abandonando lo estudios, ni cuales son las
características de los estudiantes que abandonan ni tampoco las características de
cada uno de los cursos que hacen que el fenómeno ocurra, sino, a partir de una
herramienta analítica identificar el comportamiento del fenómeno de la deserción a
lo largo del tiempo. En este estudio se encuentra de manera interesante que la grá-
fica de la medida “Momento de estudiantes”, definida como la proporción de estu-
diantes que logran culminar sus estudios luego de aprobar una lección, tiene una
forma particular para cada uno de los programas analizados y que era posible agru-
parlos según su forma, identificando con claridad diferencias entre programas que
tenían lo que llaman “paredes”, que son lecciones dentro del curso donde se retira
gran cantidad de estudiantes, o por ejemplo otro de forma convexa, dónde no hay
una “pared” definida como tal, sino una tasa casi constante de deserción a lo largo
de las materias. Para ilustrar se muestran en la figura 2 un par de ejemplos (a la
izquierda programa con “Pared”, a la derecha, programa con forma convexa).
González C., Galvis S., & Hurtado T. (2014), al igual que Christensen & Spackman
(2017), proponen una metodología analítica para el cálculo del tiempo que un estu-
diante le toma desertar, realizando un ajuste la función Beta generalizada. Nueva-
mente sus pretensiones no son explicar causalidades, sino lograr una descripción
analítica de parámetros importantes que soporten la toma de decisiones.
González C., Galvis S., & Hurtado T., argumentan que las función de riesgo utilizada
generalmente, no muestra un ajuste tan flexible como si lo hace la función beta
generalizada, y por ello propone su utilización para la caracterización del fenónemo.
𝑃(𝑇 ≥ 𝑡) = 𝑓(𝛽, 𝑥)
𝑓(𝑡)
𝜆(𝑡) =
𝑆(𝑥)
𝑡
𝑆(𝑡) = 𝑒 − ∫0 𝜆(𝑥)𝑑𝑥
Los estudios que se han realizado por parte del gobierno Nacional ( (Nacional,
2009), (CEDE, 2014), (MEN, 2008)) utilizan los modelos de supervivencia
asumiento que la función de riesgo λ(t) es una función lineal que depende de los
factores. Es decir λ(t)=f(β,x). Realizando el ajuste haciendo a los factores variables
explicativas de la función de riesgo es posible cuantificar la medida en qué cada una
de estas influye sobre el abandono a lo largo del tiempo. Los resultados de estos
trabajos muestran que factores como la cantidad de hermanos, el estar trabajando
durante la presentación del exámen Icfes (cómo variable socio económica), nivel
alcanzado en e puntage del icfes, son parametros que explican en gran medida el
fenómeno de la deserción. A pesar de que este modelo permite conectar de manera
robusta la variable temporal con los factores, las conclusiones de este modelo si
bien permiten entender que estas variables son importantes, no permiten
instrumentalizar ni crear planes de acción sobre poblaciones concretas.
METODOLÓGIA
Para consultar con detalle los pasos de la metodología se puede hacer referencia
al Manual CRISP-DM de IBM SPSS Modeler que se encuentra con licencia abierta
y es consultable desde la red.
• Fuentes de Información
Por otro lado la información proveniente del ICFES será analizada con cuidado y se
harán visitas a las oficinas de dicha institución para obtener ayuda acerca de su
depuración. Es importante resaltar que la base de datos contiene un instructivo
detallado del significado de cada uno de los cientos de campos que contiene la
base.
• Procedimiento de trabajo
CRONOGRAMA DE ACTIVIDADES
Mes
Actividad 1 2 3 4 5 6 7 8 9 10 11
Diseño de encuestas
Desarrollo de encuestas
Análisis de las Encuestas
CRISP-DM
Business Understanding
Data Understanding
Modeling
Evaluation
Deployment
Redacción Informe Final
Presupuesto de inversión
PRODUCTOS ESPERADOS
• Herramienta de software que sea fácilmente adaptable a sistemas de
información en instituciones de educación superior.
• Articulo para publicar en revista científica.
• Ponencia a nivel nacional o internacional.
EQUIPO INVESTIGADOR
Fidel Andrés Olarte Bustos Ingeniero Industrial con con énfasis en optimización
en gerencia de operaciones. Maestrante en Ingeniería Industrial,
especializado principalemten en el área de la investigación de operaciones,
estadística aplicada, machine learning, analitica e inteligencia de negocios,
con experiencia en proyectos de modelaje de sistemas en el sector
educación. Empresario, fundador y gerente de Tu Profe S.A.S.
Referencias
Bernal Torres, C. (2010). Metodología De La Investigación: Administración,
Economía, Humanidades Y Ciencias Sociales. Bogotá: Pearson.
Christensen, S., & Spackman, J. (2017). Dropout Rates, Student Momentum, And
Course Walls: A New Tool For Distance Education Designers. Journal Of
Educators Online.
González C., J., Galvis S., D., & Hurtado T., L. (2014). Beta Generalized
Distribution As Survival Model For The Analysis Of University Dropouts.
Estudios Pedagógicos,, 133-144.
Montes Gutiérrez, I. C., Almonacid Hurtado, P. M., Gómez Cardona, S., Zuluaga
Díaz, F. I., & Tamayo Zea, E. (2010). Análisis De La Deserción Estudiantil.
Medellín: Grupo De Investigación Estudios En Economía Y Empresa
Departamento De Economía Escuela De Administración.
Oded , M., & Lior , R. (2010). Data Mining And Knowledge Discovery Handbook.
New York: Springer.
Quadri, M., & Kalyankar, N. (2010). Drop Out Feature Of Student Data For
Academic Performance Using Decision Tree Techniques. Global Journal Of
Computer Science And Technology, 2-5.