Beruflich Dokumente
Kultur Dokumente
Resumen
nivel nacional e internacional se ha convertido en un factor determinante. La seleccin de un programa profesional a travs
de las diferentes ofertas y demandas de formacin representa,
a menudo, un problema en el momento de elegir una carrera
profesional. As mismo, dentro del proceso de aprendizaje interfieren mltiples variables externas que pueden conducir a la
no culminacin de una carrera profesional.
I + D
Abstract
Introduccin
44
Anlisis de cociente tridico para procesos de admisin de estudiantes en la fundacin Insutec mediante minera de datos
V N C U L O S
JULIO-DICIEMBRE DE 2010
NMERO 2
VOLUMEN 7
I + D
El Test Revelador del Cociente Mental Tradico (Rcmt) fue diseado y validado por Waldemar de Gregory para diagnosticar las manifestaciones del cerebro triuno (tridico).
ste, a su vez, se caracteriza por poseer ciertas manifestaciones, en el comportamiento
proporcional o desproporcional, que inciden
en el desempeo educativo y social del estudiante identificadas mediante el uso del
Rcmt. As mismo, la aplicacin de este test
puede incidir conscientemente en el desarrollo de las operaciones, habilidades y facultades mentales (en especial las relacionadas
con el pensar: crear-imaginar-sentir y concretar-actuar) [5].
Fuente de datos
Tabla 1. Manifestaciones
del cerebro triuno.
CEREBRO
Izquierdo
Central
Derecho
Verbal,
Instintivo,
Proverbial,
numrico,
vegetativo,
magntico,
analtico,
motor,
intuitivo,
lgico
concreto,
sinttico,
descompositor,
administra-
reintegrador,
racional,
dor, regulador,
holstico,
abstracto,
trabajador,
emocional,
alerta,
profesional,
sensorial,
vigilante,
negociante,
espacial,
articulador,
apropiador,
espontneo,
crtico,
planificador,
relajado, libre,
investigador,
econmico,
asociativo,
visual y lineal.
poltico,
artstico,
mercader y
contemplativo,
ecosistmico.
sonoro y
no lineal.
66
Por su parte, la siguiente tabla contiene la cantidad de estudiantes por periodo acadmico:
Tabla 2. Estudiantes
por periodo acadmico.
Periodo
Nmero de estudiantes
matriculados
2008-II
483
2009-I
607
2009-II
497
2010-I
668
Anlisis de cociente tridico para procesos de admisin de estudiantes en la fundacin Insutec mediante minera de datos
V N C U L O S
JULIO-DICIEMBRE DE 2010
NMERO 2
VOLUMEN 7
Figura 3. Clase-estrato
Figura 2. Clase-sexo.
Sexo
Cantidad
Estrato
Cantidad
Masculino
1152
739
Femenino
1103
754
762
A continuacin se ilustra el anlisis de la claseedad, el cual se caracteriza por ser una variable
de tipo entero:
Figura 4. Clase-edad.
7
John Petearson Anzola Anzola
I + D
Figura 6. Clase-programa.
Valor
Mnimo
16
Mximo
27
Promedio
21.514
Desviacin Estndar
3.539
Jornada
Cantidad
Diurna
1124
Nocturna
1131
Programa
Cantidad
Produccin
272
Administracin
352
Seguridad
320
Modas
346
Electrnica
325
Sistemas
330
Diseo grfico
311
88
Anlisis de cociente tridico para procesos de admisin de estudiantes en la fundacin Insutec mediante minera de datos
V N C U L O S
JULIO-DICIEMBRE DE 2010
NMERO 2
VOLUMEN 7
A0
Cantidad
487
NO
1768
A2
Cantidad
163
NO
2092
A1
Cantidad
2109
NO
146
Cantidad
Mnimo
Mximo
Promedio
0.106
Des. Estndar
0.401
Aplicacin de filtros
Weka contiene filtros integrados que permiten realizar manipulaciones sobre los datos
en dos niveles: atributos e instancias. Las operaciones de filtrado pueden aplicarse <<en
cascada>>, de manera que cada filtro tome
como entrada el conjunto de datos resultante de uno anterior y guarde los resultados
9
John Petearson Anzola Anzola
I + D
Filtros de atributos
A continuacin se indica entre todas las
posibilidades implementadas la utilizacin
de filtros para eliminar atributos, discretizar
atributos numricos y aadir nuevos atributos con expresiones segn por la frecuencia
con la que se realizan estas operaciones.
Al aplicar el filtro Remove se eliminan los
atributos correspondientes a id, epistemologa, act_cientifica, clasificaciones, comunicacin,
administracin, planeacin, pro_empresa, imp_
sobrevivencia, espiritualidad, estado_alfa, creatividad y afectividad. Por tal motivo, slo se
trabajarn los atributos: p_academico, sexo,
estrato, edad, jornada, programa, A0, A1, A2,
A3, cerebro_izq, cerebro_der y cerebro_cen.
Visualizacin
La herramienta de visualizacin de Weka
se utiliza para representar grficas 2D que
relacionan pares de atributos. La figura 11 representa el rango del atributo cerebro_der con
la totalidad de los estudiantes que presentaron la prueba de admisin en el lapso 2008II 2010-I.
1010
Anlisis de cociente tridico para procesos de admisin de estudiantes en la fundacin Insutec mediante minera de datos
V N C U L O S
JULIO-DICIEMBRE DE 2010
NMERO 2
VOLUMEN 7
11
11
John Petearson Anzola Anzola
I + D
1212
Anlisis de cociente tridico para procesos de admisin de estudiantes en la fundacin Insutec mediante minera de datos
V N C U L O S
JULIO-DICIEMBRE DE 2010
NMERO 2
VOLUMEN 7
Agrupamiento
Los algoritmos de agrupamiento buscan grupos de instancias con caractersticas similares segn un criterio de comparacin entre
valores de atributos de las instancias definidos en los algoritmos.
13
13
John Petearson Anzola Anzola
I + D
Agrupamiento numrico
Algoritmo K-Medias::k-means es un mtodo
de anlisis de conglomerados que apunta a
la particin de n observaciones en k grupos;
en la que cada observacin pertenece al grupo ms cercano con la media. Es similar a la
expectativa de algoritmo de optimizacin de
mezclas de gaussianas porque ambos intentan encontrar los centros de las agrupaciones
naturales en los datos [9].
Dado
conjunto de observaciones
, donde cada una es un d-vector
real dimensin, a continuacin, k-means tiene
por objeto dividir las n observaciones en
series K (K < N) S = (S1, S2, S3, ..., SK) con el fin
de reducir al mnimo la suma de los cuadrados:
Donde
un
es el punto medio en
1414
Anlisis de cociente tridico para procesos de admisin de estudiantes en la fundacin Insutec mediante minera de datos
V N C U L O S
JULIO-DICIEMBRE DE 2010
NMERO 2
VOLUMEN 7
similares, para lo cual se seleccionar el algoritmo SimpleKMeans con un nmero de clusters igual a cinco. A continuacin, aparecern
los cinco grupos de ejemplos ms similares
y sus centroides (promedios para atributos
numricos y valores ms repetidos en cada
grupo para atributos simblicos). Por ejemplo, para tres de los cinco clusters, el programa ms repetido es TP.Administracion y, para
los otros dos, son TP.Seguridad y TP.Diseno.
En todos los clusters, el periodo de mayor
afluencia de estudiantes fue el 2010-I. El nmero de instancias agrupadas en cada cluster
se observa en la figura 17.
La implementacin de este algoritmo de
agrupamiento permiti clasificar los programas ms relevantes y sirvi como filtro
puesto que la primera instancia que se obtuvo en los cinco grupos fue:
No seleccion el periodo acadmico
2009-II.
Los periodos acadmicos en los que se
agruparon mayor cantidad de hombres
fueron 2008-II y 2009-I.
El estrato socioeconmico 1 no fue relevante en la agrupacin.
15
15
John Petearson Anzola Anzola
I + D
1616
Anlisis de cociente tridico para procesos de admisin de estudiantes en la fundacin Insutec mediante minera de datos
V N C U L O S
JULIO-DICIEMBRE DE 2010
NMERO 2
VOLUMEN 7
17
17
John Petearson Anzola Anzola
I + D
COBWEB [7] es un algoritmo de clustering jerrquico que se caracteriza por utilizar aprendizaje incremental; en otras palabras, realiza
las agrupaciones <<instancia a instancia>>.
As mismo, durante la ejecucin del algoritmo se forma un rbol (de clasificacin) en
el que las hojas representan los segmentos y el
nodo-raz engloba, por completo, el conjunto
de datos de entrada.
Cut-off: valor empleado para evitar el crecimiento desmesurado del nmero de segmentos. Indica el grado de mejora que se debe
producir en la utilidad de categora para que
la instancia sea tenida en cuenta de manera
individual.
Sexo.
Estrato.
Programa.
Cerebro_izq
Cerebro_der
Cerebro_cen
1818
Anlisis de cociente tridico para procesos de admisin de estudiantes en la fundacin Insutec mediante minera de datos
V N C U L O S
JULIO-DICIEMBRE DE 2010
NMERO 2
VOLUMEN 7
19
19
John Petearson Anzola Anzola
I + D
Conclusiones
La aplicacin del proceso de KDD posibilit determinar la existencia de un alto grado
de homogeneidad en la poblacin estudiantil
promedio que integra la Fundacin Insutec.
As mismo, mediante el anlisis por cluster,
se identific el estilo dominante de la poblacin: en el 72% predomina el uso del lbulo
derecho. Este resultado se comprob aplicando el Algoritmo EM.
Por otra parte, en este trabajo tambin se
plantearon lineamientos generales para adecuar las pruebas de admisin y seleccin del
programa acadmico respecto al estilo dominante que caracteriza a la poblacin de estudiantes. Cabe resaltar que dichos lineamientos debern ser particularizados dentro del
marco de cada programa acadmico.
El algoritmo COBWEB, perteneciente a la
familia clustering jerrquico, no result adecuado para la segmentacin de los datos trabajados en este artculo; tiende a agrupar
a la mayora en un slo segmento, accin
poco efectiva si se pretende la mejora en la
estimacin de la caracterizacin estudiantil.
No obstante, EM y k-medias algoritmos de
particionado y recolocacin ofrecen mejores resultados que COBWEB, pues indican tareas de segmentacin y clasificacin
en estudiantes, ya sea por programa acadmico, tendencia cerebral o caracterizacin
socioeconmica.
2020
Luego de comparar EM con k-medias pudieron apreciarse varias diferencias entre sus
segmentos: k-medias agrupa en un slo cluster los mismos programas acadmicos que
EM divide en varios; es decir, EM realiza
una divisin ms especfica que k-medias. Entonces EM, siendo un algoritmo que realiza
clustering probabilstico, es ms adecuado que
k-medias para segmentar poblaciones de datos
Referencias
[1] Felder, R.M. y Silverman, L.K. (1988),
Learning Styles and Teaching Styles in
Engineering Education, en Engr. Education, vol. 78, nm. 7, pp. 674-681.
[2] Durn E. y Costaguta R. (2007), Minera de Datos para Descubrir Estilos de
Aprendizaje, en Revista Iberoamericana
de Educacin, VOL. NM. PP.
[3] Felder, F.M. y Soloman, B.A. (1991), Index of Learning Styles.North Carolina
State University.Disponibleon-line, [en
lnea], disponible en: <http://sn.umdnj.
edu/studentsonly/cas/IndexofLearningStyles.pdf
[4] http://www.cs.waikato.ac.nz/ml
weka/
[5] Waldemar, D.G. (1999), En busca de
una nueva noologia, en Estudio pedaggico, nm. 25, pp. 71-82.
[6] Fundacin de Educacin Superior. INSUTEC. (2010). Departamento de Bienestar Institucional. Bases de datos
Admisiones.
[7] Alonso, C. (AO), Waitako Environment for Knowledge Analysis. Introduccin bsica, [en lnea], disponible en:
http://www.infor.uva.es/~calonso/
IAII/Aprendizaje/weka/IntroduccionWeka.pdf
[8] Merlino, H., et. al. (2005), Un Mtodo
de Transformacin de Datos Orientado
al Uso de Explotacin de Informacin.
XI Congreso Argentino de Ciencias de la
Computacin, Buenos Aires, Argentina.
[9] Sez Olivito, E., et. al. (1999), Caracterizacin estructural de explotaciones ovinas
aragonesas mediante mtodos estadsticos
multivariantes, SEOC XXII,
Anlisis de cociente tridico para procesos de admisin de estudiantes en la fundacin Insutec mediante minera de datos
V N C U L O S
JULIO-DICIEMBRE DE 2010
NMERO 2
VOLUMEN 7
21
21
John Petearson Anzola Anzola