Beruflich Dokumente
Kultur Dokumente
ISSN: 0122-1701
scientia@utp.edu.co
Universidad Tecnológica de Pereira
Colombia
En éste artículo se presentan los resultados del intento de Di es la puntuación discriminante correspondiente a la
observación i-ésima. Expresando las variables
generar a través del Análisis Discriminante una función
explicativas en desviaciones respecto a la media, la
de discriminación que permita predecir si un estudiante
relación anterior se puede expresar en forma matricial
que ingresa a las ingenierías de la U.T.P, tendrá éxito o
como sigue en la ecuación (3):
no en la asignatura Álgebra Lineal. La validez de la
función discriminante dependerá de su efectividad a la D1 X 11 X 21 ... X k 1 u
D X X ... X 1
hora de clasificar a un estudiante de forma correcta en 2 12 22 k2
(3)
uno de los dos grupos (los que ganarán o los que . = u 2
perderán Álgebra Lineal). Para lo cual habrá que esperar
hasta que el estudiante haya efectivamente cursado la .
Dn X 1n X 2 n ... X kn u k
asignatura.
La sección 2, El Análisis Discriminante, presenta un
resumen de los elementos teóricos básicos del análisis En notación compacta se puede escribir como en la
discriminante, basado en [4]. La sección 3, Obtención de ecuación matricial (4) .
la Función Discriminante, presenta los datos y el
procedimiento seguido al intentar obtener una función D=Xu (4)
discriminante usando el paquete estadístico SPPS
(versión 11.5) La variabilidad de la función discriminante (suma de
Finalmente, la sección 4, Resultados y Conclusiones, cuadrados de las variables discriminantes respecto a su
evalúa y analiza los resultados obtenidos. media) se expresa en la ecuación (5) como:
El análisis discriminante parte de una tabla de datos de n La matriz X'X es una matriz simétrica expresada en
individuos a los que se les ha medido p variables desviaciones respecto a la media, por lo que puede
cuantitativas independientes, que actúan como perfil de considerarse como la matriz T de suma de cuadrados
características de cada uno de ellos. Una variable total de las variables explicativas de la matriz X. Según la
cualitativa adicional, dependiente o clasificatoria, con teoría del análisis multivariante de la varianza, X'X se
dos ó más categorías, define el grupo al que cada puede descomponer en la suma de la matriz entre grupos
individuo pertenece. Es pues una tabla nx(p+1) en que F y la matriz intragrupos V (o residual), como se muestra
cada caso figura con un perfil y una asignación a grupo. en la ecuación (6).
Cuando la clasificación de individuos se pueda asignar Los ejes discriminantes vendrán dados por los vectores
solamente a dos grupos a partir de k variables propios asociados a los valores propios de la matriz W-1F
clasificadoras, solo se requiere una función ordenados de mayor a menor. Las puntuaciones
discriminante. discriminantes se corresponden con los valores obtenidos
La función discriminante de Fisher D, que aparece en la al proyectar cada punto del espacio k-dimensional de las
ecuación (1), se obtiene como función lineal de k variables originales sobre el eje discriminante.
variables explicativas como:
D = u1 X 1 + u 2 X 2 + ... + u k X k (1) Los centros de gravedad o centroides (vector de medias)
son los estadísticos básicos que resumen la información
Las puntuaciones discriminantes son los valores que se
obtienen al dar valores a X1, X2, …, Xk en la ecuación
Scientia et Technica Año X, No 25, Agosto 2004. UTP 193
sobre los grupos. Los centroides de los grupos I y II se semestre de la carrera se conocerá la nota de álgebra
muestran en la ecuación (8) lineal, la cual permitirá ubicar al estudiante en uno de
dos grupos: ganadores o perdedores de la asignatura
X 1, I X 1, II Álgebra Lineal. La variable de ubicación en los grupos es
la variable dependiente o clasificatoria mencionada en la
X X sección 2 y es de tipo cualitativa dicotómica por que
X I = 2, I X II = 2 , II (8) tiene dos categorías mutuamente excluyentes. Con base
en la información descrita anteriormente sería importante
conocer lo siguiente:
X k , I X k , II ¿Se puede usar el conjunto de las nueve variables
independientes y la variable dependiente de carácter
cualitativa, para construir una función matemática y
Así, para los grupos I y II se obtienen los puntajes estadística que permita clasificar los nuevos estudiantes
promedios de la función discriminante en cada grupo en uno de los dos grupos establecidos por la variable
dados por la ecuación (9) : cualitativa?
¿Que forma tiene la función – cuáles son sus parámetros
D I = u1 X 1, I + u 2 X 2 , I + ... + u k X k ; I (9) – puede utilizarse esta función para clasificar nuevos
estudiantes?
DII = u1 X 1,II + u2 X 2,II + ... + uk X k ;II ¿Cuáles son las posibilidades de no cometer error al
El punto de corte discriminante C se calcula mediante la aplicar la regla o función de decisión?
ecuación (10) y para terminar la aplicación del análisis discriminante a
manera de ejemplo se analizarán los resultados restantes
DI + DII del procesamiento:
C= (10)
2
3.1. Programa de SPSS para ejecutar el análisis
El criterio para clasificar el individuo i es el siguiente: discriminante
Si Di<C, se clasifica al individuo i en el grupo I Con la base de datos mencionada, que contiene 15
Si Di>C, se clasifica al individuo i en el grupo II variables de tipo académico para todos los estudiantes de
ingeniería en el período 2000-2003. Se ejecutaron los
En general, cuando se aplica el análisis discriminante se comandos del programa SPSS necesarios para ejecutar
le resta el valor de C a la función discriminante, como se [3] el procedimiento discriminante, así:
expresa en la ecuación (11).
ANÁLISIS – CLASIFICAR – DISCRIMINANTE
D − C = u1 X 1 + u2 X 2 + ... + uk X k − C (11) VARIABLE DE AGRUPACION REPITIO ALGEBRA
En este caso, se clasifica a un individuo en el grupo I si LINEAL (0-1)
D-C>0, y en grupo II de otra manera. INDEPENDIENTES: Icfes Total, Icfes matemática, Icfes
Biología, Icfes filosofía, Icfes física, Icfes Historia, Icfes
Existen otros criterios de clasificación, entre los que se Química, Icfes Lenguaje, Icfes geografía
destacan el análisis de regresión y la distancia de
Mahalanobis3. USAR Método de inclusión por pasos
CLASIFICAR
3. OBTENCION DE LA FUNCIÓN
DISCRIMINANTE PROBABILIDADES PREVIAS: calcular según tamaño
de grupo
Al momento de ingresar a la UTP a un estudiante de MOSTRAR: resultados para los primeros 20 casos
ingenierías, se le conocen algunas variables numéricas, TABLA DE RESUMEN CONTINUAR
de carácter académico como son: resultados del ICFES SELECCIONAR VARIABLE DE SELECCIÓN
total y resultados para las áreas de biología, FILTRO=1, ACEPTAR
matemáticas, filosofía, historia, química, lenguaje,
geografía. De acuerdo con el modelo de la sección 2,
este conjunto de nueve variables corresponden a las 3.2 Estadísticas Descriptivas Para Las Variables
variables independientes del modelo. Al cabo del 3er o 4º Independientes
Como se observa en la Tabla 2, en el paso 1 no se tiene De la ecuación (16), queda claro que un autovalor grande
en cuenta para el análisis la variable (Puntaje ICFES implica que la suma de cuadrados entre grupos es grande
total) ya que fue extraída en el paso 0. En el paso 1 la comparado con la suma de cuadrados intragrupos. Lo
variable de menor Lambda de Wilks es el puntaje de anterior significa que la función estaría discriminando los
ICFES en Historia y en Química (0.973 para ambas) pero grupos.
no obstante no deben incluirse en la función
discriminante por no cumplir el criterio de inclusión dado b) Minimice Lambda de Wilks (ë) como se
por el estadístico F definido anteriormente. describe en la ecuación (17)
Se tiene n=529 estudiantes en la población y p variables c) Maximice la correlación canónica (Þ) como se
independientes (p=9), cada estudiante puede ser describe en la ecuación (18)
considerado como un punto en un espacio p dimensional. S .C.entre grupos
η= (18)
Las coordenadas de cada punto se obtendrán a partir de S .C. totales
las nueve variables independientes (puntajes ICFES).
El estadístico de Lambda Wilks también puede ser
A partir de la representación de los n=529 estudiantes, en
utilizado para escoger las mejores funciones
R9, se trata de extraer un nuevo espacio de menor
discriminantes.
dimensión [2] (Þ) tal que, al proyectar la nube de puntos
sobre dicho espacio los puntos correspondientes a
Scientia et Technica Año X, No 25, Agosto 2004. UTP
196
En la Tabla 3, se presentan la información para probar la
significancia ("calidad") de la función discriminante Entre las variables independientes ICFES total, Icfes en
obtenida: biología, matemáticas, filosofía, física, historia, química,
Lambda de Wilks lenguaje, geografía; la menos mala (según los criterios de
Lambda de Wilks , autovalores, y la correlación canónica
Número de F exacta
Paso variables Lambda gl1 gl2 gl3 Estadístico gl1 gl2 Sig. (Þ)) es el Puntaje ICFES total, la que aunque es
1 1 ,979 1 1 527 11,338 1 527,0 ,001 estadísticamente significativa para la clasificación tiene
Tabla 3. Prueba estadística de la función canónica poca significancia práctica de acuerdo con los resultados
discriminante del criterio de Lambda Wilks.
Donde gl1=1, es el número de funciones discriminantes, El análisis estadístico multivariado desarrollado en éste
gl2=1, es número de variables en la función artículo permite concluir que los puntajes obtenidos en
discriminante, en éste caso corresponde a la variable- las pruebas del ICFES, como único criterio de ingreso a
Puntaje Icfes total y gl3=527, corresponde es el tamaño la UTP, dejan serios cuestionamientos sobre su capacidad
de la muestra (529) menos el número de grupos, 2.. de prever el desempeño futuro del estudiante en los
programas de ingeniería. Dado que el análisis se centró
La Tabla 4, muestra la información que permite medir la en el desempeño en Álgebra Lineal, queda para futuros
calidad de la función discriminante estudios establecer la generalidad del cuestionamiento
Autovalores anteriormente mencionado.
Correlación
Función Autovalor % de varianza % acumulado canónica En caso de corroborarse en futuros estudios la poca
1 ,022a 100,0 100,0 ,145 efectividad de los puntajes del ICFES para predecir el
a. Se han empleado las 1 primeras funciones discriminantes rendimiento académico del postulante a ingresar a la
canónicas en el análisis.
UTP, no debería ser utilizado como único criterio de
Tabla 4. Autovalores y Correlación Canónica selección.
En la Tabla 4 aparecen los autovalores (0.022) y la De seguir con este criterio podría estarse negando talvez
correlación canónica (0.145) que se encuentran próximos la posibilidad de ingreso de algunos postulantes con
a cero, estos son síntomas claros que la función bajos puntajes en el ICFES y que podrían tener un buen
discriminante no logra diferenciar la media de los dos rendimiento al no estar este último asociado con los
grupos (estudiantes que perdieron o ganaron álgebra puntajes del ICFES
lineal), y ello indica que los datos están poco
diferenciados en los dos grupos de acuerdo con las
puntuaciones discriminantes. 5. BIBLIOGRAFÍA
Aun así en la Tabla 5, se presenta los coeficientes [1] Dallas E. Johnson, Métodos multivariados aplicados
estimados para la función discriminante. al análisis de datos. Thompson 1998
Âo = -13.704 y â1 = 0.269