Beruflich Dokumente
Kultur Dokumente
salazarcjo@gmail.com www.salazar.sisamec.com
Trujillo - 2013
Todo proceso
Base de Datos
2
Clasificacin
Jerrquicas Relacionales Orientadas a Objetos
Control de datos
Modelo
Datos
Manuales Automatizadas
TRABAJADOR *
registra
ASISTENCIA
tiene
1 UBICACIN
Componentes
Fsico:
Dependencia SGBDR. Complementamos Tipos de Datos.
Comandos:
DDL. Lenguaje de definicin de datos. Create, drop, alter. DML. Lenguaje de manipulacin de datos. Select, insert, update, delete.
Qu es Minera de Datos?
- Es un mecanismo de explotacin, consistente en la bsqueda de informacin valiosa en grandes volmenes de datos. - La minera de datos se centra en llenar la necesidad de descubrir el por que, para luego predecir y pronosticar las posibles acciones con cierto factor de confianza para cada prediccin. - Es el anlisis de archivos y bitcoras de transacciones, trabaja a nivel del conocimiento con el fin de descubrir patrones, relaciones, reglas, asociaciones o incluso excepciones tiles para la toma de decisiones.
Minera de Datos
La minera de Datos es un campo
Minera de Datos
La Minera de Datos puede ser dividida en: Minera de datos predictiva (MDP) Usa primordialmente tcnicas estadsticas. Minera de datos para descubrimiento de conocimiento (MDDC) Usa principalmente tcnicas de Inteligencia Artificial.
Minera de Datos
Un proceso de apoyo a la toma de decisiones de negocio debe incluir 2 componentes: Descubrimiento. Nos ayuda a obtener informacin rpida de las Bases de Datos.
- Las herramientas de Minera de Datos barren las bases de datos e identifican modelos previamente escondidos en un slo paso. - Cuando las herramientas de Minera de Datos son implementadas en Sist. de Proc. paralelo de alta performance, pueden analizar BD masivas en minutos.
- Procesamiento ms rpido significa que los usuarios pueden automticamente experimentar con ms modelos para entender datos complejos.
Nos permite consolidar y limpiar los datos identificados en el paso de Definir el Problema, para poder tener datos consistentes en la futura evaluacin.
Debemos comprender los datos para tomar las decisiones adecuadas al crear los modelos. Entre las tcnicas de exploracin se incluyen calcular los valores mnimos y mximos, calcular la media y las desviaciones estndar y examinar la distribucin de los datos.
No se debe implementar un modelo en un entorno de produccin sin comprobar primero si el modelo funciona correctamente.
Si ninguno de los modelos que se ha creado en el paso anterior funciona correctamente, puede que deba volver a un paso anterior del proceso o volver a definir el problema e incluso volver a investigar los datos del conjunto de datos original.
Ejemplo
Se desea conocer la tendencia de los pedidos de calamar segn los clientes.
SPSS
Ejemplo
Seleccionar los datos y prepararlos. (limpiarlos, estandarizarlos)
Ejemplo
Unidades de la cantidad no nos ayudan, hay que transformarlas
Ejemplo
Unidades de la cantidad no nos ayudan, hay que transformarlas
Ejemplo
Existen valores nulos, vacos, ruidos, descartarlos, reemplazarlos o uniformizarlos. hay que
Ejemplo
Evaluar si existe una correlacin entre lo datos a analizar
Ejemplo
Como el coeficiente de correlacin de Pearson entre la cantidad de pedidos y los usuarios que realizan los mismos de 82.8%, entonces la relacin existente entre estas dos variables es elevada.
Ejemplo
Como la fase evaluacin de datos me arroj una relacin entre ellos podemos intentar formalizar esta relacin existente mediante un modelo, en este caso un modelo matemtico basado en Regresin Lineal.
Para lo cual hay que definir dos variables: Variable Independiente: Cantidades Pedidas. Variable Dependiente: Usuario
Ejemplo
Ejemplo
Ejemplo
Una vez formalizado el modelo, hacemos las pruebas para la verificacin respectiva: Datos Pruebas. Desarrollar una aplicacin Informtica que permita tener el proceso descrito anteriormente en un SOLO CLIC, actualizndose constantemente.
Conclusiones
El desarrollo de la tecnologa de Minera de Datos est en un momento Importante. Existen elementos que la hacen operable, pero por otra parte, hay factores que pueden crear una desventaja a esta tecnologa, como pueden ser: Los productos a comercializar son, actualmente costosos, y los consumidores pueden hallar una relacin costo/beneficio improductiva. Se requiere de experiencia para utilizar herramientas de la tecnologa, puede ser muy fcil hallar patrones equvocos, triviales o no interesantes.
Conclusiones
Hoy en da, las corporaciones comercializan con millones de perfiles personales, sin que aquellos a los que se refieren los datos intercambiados, estn en posibilidad de intervenir, entonces, se llega a pensar que presenta un peligro o riesgo para la privacidad de los clientes