Beruflich Dokumente
Kultur Dokumente
Modelos Predictivos
20/10/2011
Independiente de la meta
Siempre necesitamos:
Tener una buena pregunta de investigacin, en una poblacin que nos puede dar una respuesta til con el diseo correcto, y recoger bien la informacin de inters Tener informacin previa (nuestros estudios y/o literatura existente) que nos puede ayudar a entender el problema y la relacin entre los variables
DAGs tambin pueden ser til para este proceso
20/10/2011
20/10/2011
En estas modelos es importante recordar que tu variable de inters siempre debe estar presente
AUN si no es significativo! Es tu variable de inters, entonces aun si termina no siendo significativo necesitas incluirlo
20/10/2011
Sobre otros, podemos usar mtodos para determinar cuales realmente deben entrar en el modelo final
LRT Un cambio de 10% en la medida de asociacin de inters
20/10/2011
A. Modelos predictivos
Que son modelos predictivos? http://www.mayoclinic.com/health/heartdisease-risk/HB00047 Usamos los resultados de una base de datos para otra poblacin o para un individuo (como en la calculadora del mayo clnica)
A. Modelos predictivos
Son distintos porque la meta es minimizar error de prediccin Error de prediccin es: una medida que dice que tan bien un modelo puede predecir un desenlace para un grupo de datos nuevos que no fueron utilizados para armar el modelo de prediccin
Tambin llamado precisin de prediccin
20/10/2011
A. Modelos predictivos
Que usamos para ver error de prediccin?
Depende del modelo/desenlace
Modelos continuos/Lineales: R2 ajustado, Mallows Cp Modelo Binario/Logstico: ROC, C-estadstica, PPV/NPV Tiempo-a-evento/Sobrevivencia: D-estadstica
A. Modelos predictivos
Usamos datos para hacer un modelo de regresin
Los datos usados se llaman conjunto de entrenamiento
Guardamos los s del modelo usando el set de entrenamiento Usamos los s en otro grupo de datos y medimos el error de prediccin
Los datos usados se llaman conjunto de validacin
20/10/2011
A. Modelos predictivos
El conjunto de validacion puede ser parte del mismo base de datos que el conjunto de entrenamiento (validacion cruzada)
La mitad O quitando una observacion a la vez