Beruflich Dokumente
Kultur Dokumente
TEMA 1
1
Para qué sirve?
• Determinar la ecuación de regresión sirve
para:
2
Aplicaciones: Administración
• En la administración, las decisiones suelen
basarse en la relación entre dos o más
variables.
3
Aplicaciones: Administración
• Ejemplo:
Observar la relación entre el gasto en publicidad y las ventas
puede permitir a un gerente de mercadotecnia tratar de predecir
las ventas correspondientes a un determinado gasto en
publicidad.
4
Aplicaciones: Inteligencia Artificial
• En Machine Learning y Pattern Recognition, se
distinguen dos paradigmas:
5
Aplicaciones: Inteligencia Artificial
• Test de hipótesis: Dentro de la inferencia
estadística, un contraste de hipótesis (también
denominado test de hipótesis o prueba de
significación) es un procedimiento para juzgar
si una propiedad que se supone en una
población estadística es compatible con lo
observado en una muestra de dicha población.
6
Aplicaciones: Inteligencia Artificial
• Bondad de Ajuste: La bondad de ajuste de un
modelo estadístico describe lo bien que se
ajusta un conjunto de observaciones.
7
Aplicaciones: Inteligencia Artificial
8
Aplicaciones: Inteligencia Artificial
9
Clustering:
-K-Means
-DBSCAN
10
Clustering: Cuáles?
¿Cuál es la forma natural de agrupar los personajes?
Hombres
vs.
Mujeres
11
Clustering: Cuáles?
Simpsons
vs.
Empleados de la escuela
de Springfield
12
Clustering: Cuáles?
13
Clustering: Cuántos?
¿Cuántos ¿Dos?
agrupamientos?
¿Seis? ¿Cuatro?
14
Aplicaciones: Inteligencia Artificial
15
Clasificación Vs. Regresión:
16
Clasificación y Regresión:
17
Clasificación:
Si la variable de salida es categórica o nominal.
-Redes Neuronales
-Redes Bayesianas
-Árboles de Decisión
-Máquinas de
Soporte Vectorial
-Estimar el error:
*Precission/Recall
*Curva ROC
*Curva de Coste, etc
18
Regresión:
Si la variable de salida es numérica.
19
Regresión:
-Estimar el error:
*Error cuadrático
medio.
*Error absoluto medio.
20
Casos de Uso:
21
Casos de Uso:
22
Premisas
23
Alcance:
• Veremos EXCLUSIVAMENTE relaciones
lineales.
24
Ecuación de la Recta:
25
Ecuación de la Recta:
26
Tipos de Variables
27
DIAGRAMA DE DISPERSIÓN
A grandes rasgos, permite
vislumbrar si:
–Existe relación entre variables.
–La relación es lineal o de otro tipo.
– Intensidad de la relación (por la
estrechez de la nube de puntos).
– Valores anómalos (outliers)
distorsionan la relación.
–La dispersión de los datos es o no
uniforme (homocedasticidad vs.
heterocedasticidad).
28
Modelo de Regresión Lineal
Ejemplo:
Armand’s Pizza es una cadena de restaurantes. Sus
mejores ubicaciones son las que se encuentran
cerca de los campus de las universidades.
+ =
29
Modelo de Regresión Lineal
Los gerentes creen que:
• Pendiente
• Media o Valor
Esperado
• Corte con el Eje y
Líneas de Regresión Lineal
Se desconocen los
parámetros poblacionales
TEMA 2
38
Método de Mínimos Cuadrados
• Uso los datos muestrales para hallar la
ecuación de regresión estimada
y: Variable
Dependiente
x: Variable Independiente
Método de Mínimos Cuadrados
• Ecuación de Regresión Simple Estimada:
Importante:
y i Ventas Reales
ŷi Ventas Estimadas min( yi , yˆ i )
Método de Mínimos Cuadrados
“El método de mínimos cuadrados usa los
datos muestrales para obtener los valores de
b0 y b1 que minimice la:
Y Y
n
'
i i sea mínimo
i 1
(X)
Método de Mínimos Cuadrados
• También llamda: Similaridad basada en el
Error Cuadrático Medio (Gauss):
Método de Mínimos Cuadrados
Ecuación de Regresión Estimada
1.-
2.-
3.-
4.-
5.-
6.- 7.- 8.-
Ecuación de Regresión Estimada
Ecuación de Regresión Estimada con R
Suposiciones del Modelo
Coeficientes de Determinación
"In God we trust; all others must bring data."
TEMA 3
51
Coeficientes de Determinación
• Que tan bueno es el ajuste a los datos de la
ecuación de regresión estimada?