Beruflich Dokumente
Kultur Dokumente
1. Sexo
La variable sexo se presenta como variable cualitativa, la cual tiene dos posibles
resultados: M(masculino) o F(femenino).
Se ha puesto como factor a la variable, categorizándola, ahora el número 2 representa
masculino, y 1 femenino.
Se verá como está distribuida en la data esta variable, podemos ver del cuadro anterior
que el 42% de la data son mujeres, y el 58% son varones.
2. Edad
En el histograma se puede ver que la distribución de los datos presenta una asimetría
positiva.
Esta tabla de datos, está representada en el diagrama de caja, se ve que la mínima edad en
esta data es de 19 años, el promedio de edades de las personas que han solicitado un crédito
es de 44 años, y la máxima edad está en 84 años.
3. Línea de crédito
El histograma de los datos representa una distribución asimétrica positiva, hay una alta
frecuencia de líneas de bajo nivel. Esto quiere decir que la entidad financiera presta en
mayor cantidad montos menores. Esto puede indicar que tiene dos tipos de clientes.
Como se ve en el cuadro, la máxima línea fue de S/. 184 300. Mientras que la mínima
fue de sólo S/. 500. El promedio de línea de los clientes es de S/. 7348, pero cabe aclarar
que se presentan datos vacíos un total de 42042. Al no contar estos datos, los cálculos
variarán.
4. Porcentaje de utilización de la tarjeta
La media de la muestra es de 10.37 meses, pero este es debido a la alta frecuencia en el mes 12.
Se tiene que el mínimo tiempo que han tenido deuda es de 1 mes.
Según el histograma se trata de una variable discreta. Se logra ver que la mayor frecuencia se
presenta entre las primeras tres barras, esto quiere decir que la mayoría de clientes han tenido
una deuda en el mes anterior con un máximo de 3 entidades, y un mínimo de 1 entidad.
El promedio es de 1.72 entidades, y algunos clientes han tenido deuda con 8 entidades.
7. Variación de número de entidades con deuda entre t-1 y t-12
Según el histograma es una variable discreta. La mayor frecuencia se da entre [0 - 1]. Esto quiere
decir que la mayoría de clientes que el mes anterior tenia deuda con x entidades, hace un año
también tenía deuda con la misma cantidad de entidades; o sino ha aumentado una deuda con
otra entidad.
El mínimo es 4, es decir que hay cierta cantidad de personas que el mes anterior tiene deuda con
4 entidades menos de lo que tuvo hace un año. El promedio es de 0.3449; y el máximo 4.
El histograma nos muestra que es una variable discreta. La mayor frecuencia se presenta en el
rango de [4 - 12].
Esto quiere decir que la mayoria de clientes han venido reduciendo su deuda entre 4 y 12 meses
anteriores.
Hay clientes que no han reducido su deuda, y hay una cierta cantidad de clientes que viene
reduciendo hace 11 meses su deuda. El promedio es de 6.695 meses.
9. Clasif
En el histograma se ve que es una variable discreta, con valores de 0,1 y 2. Donde significa:
Hay unos clientes que presenta más de 30 días de atraso en los últimos 12 meses.
10. Default
Según el histograma se ve que es una variable discreta. La cual tiene dos categorías:
Se ve que la mayor frecuencia está en 0, es decir que la mayoría de clientes no presentan default.
Siendo más exactos un 85.7% de la data.