Beruflich Dokumente
Kultur Dokumente
Aprendizaje
Este tutorial le ensea a crear diferentes tipos de mtodos de aprendizaje automtico y a
trabajar con ellos. Tambin aprender a crear una copia de un modelo de minera de
datos y aplicar un filtro a los datos de entrada para obtener resultados diferentes.
Despus, puede comparar los resultados de ambos modelos mediante un grfico de
elevacin. Por ltimo, utilizar la obtencin de detalles para recuperar datos adicionales
de la estructura de minera de datos subyacente.
Leccin 4: Explorar los modelos de correo directo (tutorial bsico de minera de datos)
En esta leccin obtendr informacin sobre cmo explorar e interpretar los hallazgos de
cada modelo usando los visores.
Leccin 5: Probar los modelos (Tutorial bsico de minera de datos)
En esta leccin, realiza una copia de uno de los modelos de distribucin de correo
directo, agrega un filtro de modelo de minera de datos para restringir los datos de
Requisitos
Asegrese de que los siguientes componentes estn instalados:
Con objeto de mejorar la seguridad, las bases de datos de ejemplo no se instalan con
SQL Server. Para instalar las bases de datos oficiales para Microsoft SQL Server, visite
la pgina Bases de datos de ejemplo de Microsoft SQL y seleccione SQL Server 2014.
Cada proyecto de Microsoft SQL Server Analysis Services define los objetos de una
sola base de datos de Analysis Services. Una base de datos de Analysis Services puede
contener muchos tipos diferentes de objetos
Tenga en cuenta que no se necesita un cubo para realizar tareas de minera de datos. Si
necesita realizar minera de datos en un cubo existente, debe agregar los modelos de
minera de datos al mismo proyecto que utiliz para generar el cubo. Sin embargo, para
la mayora de los fines se pueden generar los modelos en orgenes de datos relacionales,
como un almacenamiento de datos, y obtener mejor rendimiento si no se emplea un
cubo.
En este tutorial utilizar un almacenamiento de datos relacional,
AdventureWorksDW2012 , como origen de datos. Implementar todos los objetos de
de datos contiene los nombres del servidor y la base de datos donde residen los datos de
origen, adems de otras propiedades de conexin necesarias.
Importante
Crear una vista del origen de datos (Tutorial bsico de minera de datos)
SQL Server 2014
Otras versiones
Una vista del origen de datos se genera en un origen de datos y define un subconjunto
de los datos, que puede usar en las estructuras de minera de datos. Tambin puede usar
la vista del origen de datos para agregar columnas, crear columnas calculadas y
agregados, y agregar vistas con nombre. Mediante el uso de vistas del origen de datos,
puede seleccionar los datos relacionados con un proyecto, establecer relaciones entre
tablas y modificar la estructura de los datos sin modificar el origen de datos original.
Para obtener ms informacin, vea Vistas del origen de datos en modelos
multidimensionales.
Para crear una vista del origen de datos
1. En el Explorador de soluciones, haga clic con el botn secundario en Vistas del
origen de datos y seleccione Nueva vista del origen de datos.
2. En la pgina Asistente para vistas del origen de datos, haga clic en Siguiente.
3. En la pgina Seleccionar un origen de datos, en Orgenes de datos relacionales,
seleccione el origen de datos Adventure Works DW 2012 que cre en la ltima
tarea. Haga clic en Siguiente.
Nota
Si desea crear un nuevo origen de datos, haga clic con el botn secundario en Orgenes
de datos y, a continuacin, haga clic en Nuevo origen de datos para iniciar el Asistente
para orgenes de datos.
4. En la pgina Seleccionar tablas y vistas, seleccione los objetos siguientes y, a
continuacin, haga clic en la flecha derecha para incluirlos en la nueva vista del
origen de datos:
El primer paso para crear un escenario de correo directo (Targeted Mailing) consiste en
usar el Asistente para minera de datos de SQL Server Data Tools (SSDT) con el fin de
crear una estructura de minera de datos y un modelo de minera de datos de rbol de
decisin.
En esta tarea configurar una nueva estructura de minera de datos y agregar un
modelo de minera de datos inicial basndose en el algoritmo de rboles de decisin de
Microsoft. Para crear la estructura, primero seleccionar las tablas y las vistas, y a
continuacin identificar qu columnas se usarn para el entrenamiento y cules para las
pruebas.
Para crear una estructura de minera de datos para un escenario de
distribucin de correo directo
1. En el Explorador de soluciones, haga clic con el botn secundario en Estructuras
de minera de datos y seleccione Nueva estructura de minera de datos para
iniciar el Asistente para minera de datos.
2. En la pgina de inicio del Asistente para minera de datos, haga clic en
Siguiente.
3. En la pgina Seleccionar el mtodo de definicin, compruebe que la opcin A
partir de una base de datos relacional o del almacenamiento de datos se ha
seleccionado y, a continuacin, haga clic en Siguiente.
4. En la pgina Crear la estructura de minera de datos, en Qu tcnica de minera
de datos desea utilizar?, seleccione rboles de decisin de Microsoft.
Nota
Si hace clic en Aceptar, todas las sugerencias enumeradas se marcarn como columnas
de entrada en el asistente. Si est de acuerdo con solamente algunas de las sugerencias,
debe cambiar los valores manualmente.
11. Compruebe que la casilla de la columna Key est seleccionada en la fila
CustomerKey.
Nota
Si la tabla de origen de la vista del origen de datos muestra una clave, el Asistente para
minera de datos elegir automticamente esa columna como clave para el modelo.
12. Active las casillas de la columna Entrada en las filas siguientes. Puede activar
varias columnas resaltando un rango de celdas y presionando CTRL mientras
activa una casilla.
o
Age
CommuteDistance
EnglishEducation
EnglishOccupation
Gender
GeographyKey
HouseOwnerFlag
MaritalStatus
NumberCarsOwned
NumberChildrenAtHome
Region
TotalChildren
YearlyIncome
13. En la columna izquierda de la pgina, active las casillas de las filas siguientes.
o
AddressLine1
AddressLine2
DateFirstPurchase
EmailAddress
FirstName
LastName
Asegrese de que estas filas solo tienen marcas en la columna izquierda. Estas
columnas se agregarn a la estructura, pero no se incluirn en el modelo. Sin
embargo, una vez generado el modelo, estarn disponibles para la obtencin de
Tipo de contenido
Tipo de datos
Address Line1
Discreto
Text
Address Line2
Discreto
Text
Age
Continuo
Long
Bike Buyer
Discreto
Long
Commute Distance
Discreto
Text
CustomerKey
Clave
Long
DateLastPurchase
Continuo
Date
Email Address
Discreto
Text
English Education
Discreto
Text
English Occupation
Discreto
Text
FirstName
Discreto
Text
Gender
Discreto
Text
Geography Key
Discreto
Text
Discreto
Text
Last Name
Discreto
Text
Marital Status
Discreto
Text
Discreto
Long
Discreto
Long
Region
Discreto
Text
Total Children
Discreto
Long
Yearly Income
Continuo
Double
En las pantallas finales del Asistente para minera de datos dividir los datos en un
conjunto de pruebas y en un conjunto de entrenamiento. Despus, asignar nombre a la
estructura y habilitar la obtencin de detalles en el modelo.
Especificar un conjunto de pruebas
En esta tarea, definir dos modelos adicionales mediante la pestaa Modelos de minera
de datos del Diseador de minera de datos. Para crear los modelos, se usarn el
algoritmo Bayes naive y el algoritmo de clsteres de Microsoft. Estos dos algoritmos se
han seleccionado debido a su capacidad de predecir un valor discreto (por ejemplo, la
compra de una bicicleta). Para obtener ms informacin sobre estos algoritmos, vea
Algoritmo de clsteres de Microsoft y Algoritmo Bayes naive de Microsoft.
Para crear un modelo de minera de datos de agrupacin en clsteres
1. Cambie a la pestaa Modelos de minera de datos del Diseador de minera de
datos en SQL Server Data Tools (SSDT).
Otras versiones
Para poder examinar o trabajar con los modelos de minera de datos que ha creado, se
debe implementar el proyecto de Analysis Services y procesar la estructura y los
modelos de minera de datos.
4. Escriba 12 en HoldoutSeed.
Implementar y procesar los modelos