Beruflich Dokumente
Kultur Dokumente
Resumen
La presente investigacin tiene por objetivo determinar un Modelo de rboles de decisin que permite
el pronstico de las caractersticas de morosidad de los alumnos de la Universidad Peruana Unin. La
metodologa utilizada es CRISP-DM, creada por especialistas para proyectos de minera de datos. Al
aplicar el modelo de rboles de decisin se logr identificar las caractersticas de un alumno moroso;
distribuidas en cinco variables predominantes: Ayuda Institucional, Ingreso de los padres, Monto de
Crdito, Tarjetas de crdito y la Situacin laboral del padre.
Classification Trees Model for Identifying the Students Profile according to Credit Risk of
Universidad Peruana Unin
Abstract
Present investigation aims to determine a decision tree model that allows prediction of the
characteristics of late payment by students of the Universidad Peruana Union. The methodology used
is CRISP-DM, created by specialists for mining projects. In applying the decision tree model was able
to identify the characteristics of a delinquent student, divided into five predominant variables:
Institutional Support, Income of parents, amount of credit, credit cards and the Father's work status.
Con esta investigacin se contribuir a establecer (Crossland M.D, 1995), menciona que los rboles
la automatizacin de las actividades relacionadas de decisin son herramientas excelentes para
con la morosidad de la universidad, ayudara a ayudar a realizar elecciones adecuadas entre
definir el comportamiento crediticio de los alumnos muchas posibilidades. Su estructura permite
de la universidad. Los datos detallados de los seleccionar una y otra vez diferentes opciones,
alumnos morosos permitirn tomar un mejor que pueden tener diferentes alternativas que al ser
control del problema de la morosidad y aplicar las exploradas pueden ser una posible decisin.
precauciones para evitarlas en el futuro.
El algoritmo de rboles de decisin de Microsoft es
II. MODELO DE PREDICCION un algoritmo de clasificacin y regresin
Para el pronstico de morosidad de los alumnos proporcionada por Microsoft SQL Server Analysis
de la Universidad Peruana Unin se construy y Services para el modelado de prediccin de
valid una encuesta para la recoleccin de datos, atributos discretos y continuos.
la cual fue tomada a los alumnos de las diferentes
El algoritmo genera un modelo de minera de
escuelas de la Universidad.
datos mediante la creacin de una serie de
El modelo fue construido con 800 datos divisiones en el rbol. Estas divisiones se
recolectados mediante la encuesta, teniendo representan como nodos. El algoritmo agrega un
diferentes variables que permitieron identificar las nodo al modelo cada vez que una columna de
caractersticas de morosidad de los alumnos. La entrada tiene una correlacin significativa con la
columna de prediccin. La forma en que el
Ganancia(S, A) = Entropa(S) -
Dbil Fuer-
[6+,2- [3+,3-
] ]
IV. CONCLUSION
REFERENCIAS
Referencias electrnicas