Beruflich Dokumente
Kultur Dokumente
Introducción
En este documento se presenta un caso donde se utiliza el Análisis de Correlación entre precio de
venta de una propiedad en Venice, Florida y otras variables como: número de habitaciones, tamaño
de la propiedad, existencia de piscina, distancia al centro de la ciudad, municipio, existencia de
cochera, número de baños.
Caso Práctico
D = Dependiente
Variable Significado
I = Independiente
Price Precio de venta de la propiedad D
Bedrooms Número de habitaciones en la propiedad I
Size Extensión de la casa en pies2 I
Pool Existencia de piscina en la propiedad; 1 = si, 0 = no I
Distance Distancia desde el centro de la ciudad I
Twnship Municipio donde se ubica la propiedad en Venice, Florida I
Garage Existencia de cochera en la propiedad; 1 = si, 0 = no I
Baths Número de baños en la propiedad I
Tabla 1. Descripción de las Variables
Al aplicar el modelo de predicción en espiral de IBM Cognos Analytics para la variable Price, se obtiene
el siguiente informe:
También se puede observar en la figura 2 que las propiedades sin cochera usualmente poseen
precios más altos cuando tienen de 3 a 5 habitaciones.
• Las variables Bedrooms y Twnship presentan una correlación del 39% de capacidad de
pronóstico para la variable Price. La figura 3 presenta una distribución del precio promedio
según el municipio y el número de habitaciones que permite visualizar un incremento notable
de precios en las propiedades con muchas habitaciones. Otra información visible en la figura 3
es que las propiedades más grandes y costosas están en el Municipio 4, no obstante existen
propiedades en este municipio, con 4 habitaciones que tienen un precio promedio más bajo que
otras propiedades en este municipio, y en esta misma categoría (4 habitaciones) en los
municipios 3 y 5.
• Otro resultado relevante de la figura 1, es que las variables Garaje y Bedrooms se encuentran
implicadas en los análisis de mayor confiabilidad.
Algunos resultados asociados a estos datos que no son visibles desde la perspectiva de la figura 1
pero que apoyan los resultados de esta, se presentaran a través de las figuras 4 y 5. La figura 4
muestra la distribución del promedio de la distancia al centro para las propiedades de cada municipio.
Además se puede observar que las propiedades del municipio 4 son las que en promedio quedan más
cerca del centro.
La figura 5 muestra la relación que existe entre el tamaño de la propiedad y el número de habitaciones,
además de presentar el precio promedio para propiedades de diferente número de habitaciones.
De las figuras 3, 4 y 5 podemos concluir que las propiedades más costosas, más grandes y con más
habitaciones se encuentran en promedio más cerca del centro. De este conocimiento nace la
suposición de que el Municipio 4 es un Suburbio.
Figura 5. Distribución del Tamaño y del Precio Promedio de las propiedades según el Número de Habitaciones
Distance no presenta una relación fuerte con Price. Además, si bien no es la variable con menos
relaciones (posee 3 y Twnship solo posee 2) es la última que aparece en la lista de controladores que
presentan relaciones. Cuando se analiza la relación directa con precio se encuentra que solo presenta
11% de confianza. Según IBM Cognos Analytics en la figura 6, la relación es negativa y débil, pero no
se nota claramente (lo que es entendible dado que solo tiene 11% de confiabilidad).
Si se genera un modelo predictivo de espiral (figura 7) para la variable Distance, se puede apreciar
que esta variable no tiene controladores que la pronostiquen fuertemente, esto es debido a que su
combinación más confiable solo alcanza el 27% (las variables Garaje y Twnship representan esta
relación).
Según la pregunta “¿Es importante para el valor del precio que la casa tenga piscina o una cochera?”
la respuesta se presenta en la figura 9, donde se puede observar que sin importar si la propiedad tiene
o no piscina, el hecho de tener una cochera incrementa notablemente el valor. Ahora si la propiedad
tiene cochera, el hecho de que tenga piscina también incrementará notablemente el precio
De toda la información presentada se debe aclarar, que la mejor decisión depende de los criterios de
la persona, debido a que la elección óptima depende de las necesidades de cada comprador.