Sie sind auf Seite 1von 31

Universidad CAECE Sede Av.

De Mayo
Trabajo presentado por requerimiento de la asignatura Administracin
del Conocimiento
TP Productos
ro!esores" Hugo Castro
Mercedes Castro
Carrera" Licenciatura en Sistemas
#ec$a" 17/11/2009
%ntegrantes"
Martiniano Aizaga
Marina Gallegos
Guillermo leinlein
!miliano Sc"iano di Cola
Resumen
La cla#e de $LAP% se trata de tra&a'ar con datos en t(rminos de negocio% sin tener )ue
entender el mecanismo interno de almacenamiento de esos datos * tener la ca+acidad de
dar so+orte de ,orma inteligente * trans+arente a los distintos ti+os de reglas de negocio
)ue e-isten dentro de las organizaciones. Con $racle /ata&ase 11g% todos los datos 0tanto
relacionales como multidimensionales1 est2n almacenados en una sola &ase de datos
$racle. Solo $racle $LAP +ro#ee ti+os de datos multidimensionales nati#os dentro de la
&ase de datos. $racle $LAP +resenta una gran #ariedad de "erramientas +ara el mane'o *
la creaci3n de los /ata 4are"ouse * +ara la na#egaci3n% an2lisis de datos * /ataMining.
alabras clave" &racle &'A Data(are$ouse DataMining
Abstract
$LAP is a&out 5or6ing 5it" data in &usiness terms 5it"out "a#ing to understand t"e
underl*ing storage mec"anism and "a#ing t"e a&ilit* to intelligentl* and trans+arentl*
su++ort t"e man* di,,erent t*+es o, &usiness rules t"at al5a*s e-ist 5it"in an organization.
4it" $racle /ata&ase 11g% all data 0relational and multidimensional1 is stored in one $racle
data&ase. $nl* $racle $LAP +ro#ides nati#e multidimensional data t*+es 5it"in t"e
data&ase. $racle $LAP su++orts a great #ariet* o, tools ,or /ata 4are"ouse creation and
mani+ulation% ,or data Anal*sis and /ata Mining.
)ey *ords" &racle &'A Data(are$ouse DataMining
P2gina 2 de 71
Tabla de contenidos
8esumen...............................................................................................................................2
A&stract................................................................................................................................2
9:u( es $LAP;....................................................................................................................<
Ar)uitectura de $racle $LAP............................................................................................10
Com+onentes de $racle $LAP..........................................................................................1=
Anal*tic 4or6s+ace.......................................................................................................1=
$racle >? S+reads"eet Add@?n.......................................................................................1A
$racle>? /isco#erer......................................................................................................1B
Herramientas +ara construir un A4...................................................................................19
Anal*tic 4or6s+ace Manager 0A4M1...........................................................................20
$racle>? 4are"ouse >uilder 0$4>1............................................................................21
/ata Mining.......................................................................................................................27
/ata Mining Su+er#isado...............................................................................................2A
/ata Mining Co Su+er#isado.........................................................................................2A
Algunos casos de (-itoD......................................................................................................27
Conclusi3nD........................................................................................................................2B
>i&liogra,EaD.......................................................................................................................70
P2gina 7 de 71
Qu es OLAP?
!ntendemos +or $LAP 0del ingl(s &nline analytical processing1 a)uellos sistemas
in,orm2ticos diseFados * o+timizados +ara el an2lisis. !s decir% +oder tra&a'ar con los datos
en t(rminos del negocio% sin +reocu+arse del mecanismo de almacenamiento utilizado. La
#enta'a de estas "erramientas es )ue +ermiten detectar situaciones * tomar decisiones en
,unci3n de reglas im+lementadas en la organizaci3n% de+endiendo siem+re del +roceso de
negocio cu*os datos se est(n analizando.
Analizando el signi,icado e-acto de $LAP% lo +odemos di#idir enD
&nline" Aun)ue los re+ortes utilizados +ueden ser guardados e im+resos% el
o&'eti#o de la "erramienta es +oder tener re+ortes din2micos% con datos
constantemente actualizados% de manera de +oder e'ecutar una consulta * o&tener
los resultados sin demoras% en contra+osici3n de tener re+ortes est2ticos% sin
#ariaciones en sus ,ormas ni en su contenido.
Analytical rocessing" !ste es el conce+to cla#e de $LAP. Los usuarios +odr2nD
o Ca#egar ,2cilmente +or in,ormaci3n multidimensional * mostrar los
resultados en distintas dis+osiciones.
o Poder im+lementar reglas de negocios en ,orma trans+arente% utilizando
#arias dimensiones * cu&os% en caso de ser necesario.
o Su&ir o &a'ar los ni#eles de detalle de manera de descu&rir as+ectos
signi,icati#os de los datos.
o $&tener resultados *a +rocesados */o calculados de ,orma r2+ida *
e,iciente.
P2gina < de 71
!n conclusi3n% las "erramientas $LAP +ermiten res+onder a +reguntas com+le'as% de
contenido analEtico% donde usualmente la res+uesta a una +regunta suele desencadenar otra
+regunta% sin necesidad de tener conocimientos t(cnicos% como +uede ser c3mo e'ecutar una
consulta.
!n el modelo $LAP% los o&'etos +rinci+ales sonD
Medidas" 8e+resentan los datos a analizar. !'em+los tE+icos son #entas% costos%
ganancias% entre otros. Las medidas son organizadas +or las dimensiones% sin "a&er
una restricci3n en la cantidad de las dimensiones. !n +articular% $racle +ermite
diseFar * mane'ar cu&os con distintas dimensionalidad% es decir con distintas
cantidades de dimensiones )ue los a,ectan. Las medidas% en $racle% +ueden ser de
distintos ti+os 0"aciendo re,erencia al ti+o de dato en S:L1D num(ricas% decimales%
enteras% te-to% ,ec"a * &ooleano.
A su #ez las medidas +ueden ser di#ididas en dos categorEasD las almacenadas * las
deri#adas 0o calculadas1% siendo siem+re trans+arente +ara el usuario ,inal. La
di,erencia radica en si las medidas son almacenadas en las ta&las o &ien si son
calculadas en ,orma din2mica con cada consulta. !n este segundo caso% Gnicamente
las reglas de c2lculo son almacenadas en la &ase de datos. !n el caso de $racle
$LAP e-iste una li&rerEa de #arios c2lculos multidimensionales +ara utilizar con
medidas deri#adas. /e todas maneras% $racle $LAP +ermite )ue el e-+erto +ueda
de,inir sus +ro+ias ,unciones% de manera de e-tender el modelo.
Ha&iendo de,inido las medidas% surge el conce+to de cubo como un contenedor%
in#isi&le +ara el usuario% de ,orma de +oder agru+ar medidas )ue com+arten la
misma dimensionalidad% +udiendo asE mane'ar m2s ,2cilmente un gru+o de
medidas.
P2gina = de 71
Dimensiones" Permiten identi,icar * categorizar los #alores de las medidas.
Algunos e'em+los son Productos% Hec"a% Geogra,Ea% etc.
!n $racle $LAP cada dimensi3n es creada una #ez% +ara luego utilizarla
re+etidamente. AsE% +ermite )ue las dimensiones sean com+artidas entre las
medidas.

Fig. 1. Una nica dimensin para varias medidas
!n el e'em+lo indicado en la Hig. 1% #emos 7 #eces la dimensi3n Tiem+o. Sin
em&argo% es una Gnica dimensi3n. Por otro lado% +odemos #er como los distintos
cu&os +ueden tener distintas dimensiones relacionadas% como asE tam&i(n distinta
cantidad de las mismas.
P2gina A de 71
Fig. 2. Distintos DataMarts, unidos por dimensiones compartidas Aplicacin del concepto de
DataMart de Kimball
Las dimensiones tienen tres com+onentes +rinci+alesD
o +erarqu,as" Son o+cionales% +ero son de uso corriente en los sistemas
$LAP. Ina 'erar)uEa es una estructura l3gica )ue agru+a registros similares
de una dimensi3n ,acilitando el an2lisis. AsE% la dimensi3n Tiem+o +uede
tener una 'erar)uEa )ue de,ina c3mo agru+ar los meses +ara de,inir un
cuatrimestre% * c3mo se agru+an los cuatrimestres +ara ,ormar un aFo.
Cada dimensi3n +uede tener m2s de una 'erar)uEa en caso de resultar
necesario.
P2gina 7 de 71

Fig. . Modelo de una !erar"u#a
!sta organizaci3n 'er2r)uica est2 &asada en relaciones +adre@"i'o%
+ermitiendo na#egar entre los distintos ni#eles% +ermitiendo "acer drill
do5n o drill u+% a*udando al usuario na#egar grandes #olGmenes de datos
multidimensionales. Adem2s esto +ermite consolidar la in,ormaci3n a
medida )ue se su&e el ni#el% de manera de +oder mani+ular la in,ormaci3n
en ,orma e,iciente +ara el an2lisis. /e la misma ,orma% se +ueden #er los
datos en ,orma m2s detallada a medida )ue se &a'a el ni#el de la 'erar)uEa
utilizado +ara mostrar los datos.
o -iveles" cada ni#el re+resenta una +osici3n en la 'erar)uEa. A e-ce+ci3n del
ni#el in,erior% el resto contiene in,ormaci3n consolidada de los ni#eles
in,eriores. Si llegara a ocurrir )ue una dimensi3n tiene de,inida m2s de una
'erar)uEa% +uede ocurrir )ue un ni#el este de,inido +ara m2s de una
'erar)uEa.
P2gina B de 71

Fig. $. %iveles en distintas !erar"u#as de una misma dimensin.
o Atributos" Pro#een in,ormaci3n so&re los elementos miem&ros de una
dimensi3n% resultando Gtiles al momento de elegir elementos +ara el
an2lisis. $racle $LAP +ermite crear una gran cantidad de atri&utos en caso
de ser necesario. Puede ocurrir )ue "a*a atri&utos #2lidos +ara todos los
ni#eles de una 'erar)uEa% o &ien s3lo +ara algunos de la misma. Por e'em+loD
P2gina 9 de 71

Fig. &. Atributos v'lidos nicamente para el nivel in(erior de la !erar"u#a
P2gina 10 de 71
Arquitectura de Oracle OLAP
Fig. ). Ar"uitectura de *racle *+A,
Las "erramientas de generaci3n de in,ormes * consultas ad"oc generalmente se des+liegan
utilizando data5are"ouses * "erramientas &asadas en S:L% mientras )ue a+licaciones m2s
so,isticadas de an2lisis * +lani,icaci3n se des+liegan utilizando otras &ases de datos *
"erramientas. !s decir% usualmente se utilizan distintas +lata,ormas +ara las distintas
necesidades de la organizaci3n.
Sin em&argo esta se+araci3n entre data 5are"ouses * &ases de datos analEticas resulta
costosa. !sto se de&e +rinci+almente al aumento del coste de mantenimiento de&ido a tener
&ases de datos se+aradas% *a )ue se necesitar2n recursos adicionales "ard5are *
administradores.
$racle elimina estas &arreras +ro+orcionando una &ase de datos +re+arada +ara el an2lisis%
+ro#e*endo una Gnica &ase de datos +ara el modelo relacional * el multidimensional..
P2gina 11 de 71
$racle $LAP% +arte de la &ase de datos $racle% +ro+orciona la ,uncionalidad analEtica de
una &ase de datos es+ecializada a la #ez )ue elimina la necesidad de gestionar &ases de datos
se+aradas.
$racle o,rece% como mencionamos anteriormente% una &ase de datos integrada relacional@
multidimensional. $racle 8/>MS@M//S 0las siglas .D/MS +ro#ienen de 8elational
/ata>ase Management S*stem% mientras )ue las siglas MDDS +ro#ienen de
Multi/imensional /ata&ase S*stem1 elimina la decisi3n entre gestiona&ilidad *
rendimiento@+oder analEtico. $racle sim+li,ica el +roceso% reduciendo adem2s el coste de
mantenimiento de los datos% a la #ez )ue se mantiene la "a&ilidad de "acer com+le'as
consultas analEticas * +ro+orciona un rendimiento e-celente.
Con res+ecto al almacenamiento% todos los datos J relacional * multidimensional J se
almacenan en los ,ic"eros de datos $racle% es decir% no "a* ,ic"eros multidimensionales
se+arados. Los ti+os de datos relacional * multidimensional +ueden coe-istir en los mismos
,ic"eros de datos. Los datos multidimensionales se almacenan en la &ase de datos en lo )ue
se llaman anal*tic 5or6s+aces.
P2gina 12 de 71
Fig. -. .s"uema de almacenamiento en *racle Database.
$racle $LAP es +arte de una +lata,orma integrada de /ata 4are"ousing * >usiness
?ntelligence )ue contiene ,uncionalidad !TL% $LAP * /ata Mining en la &ase de datos%
&asado en un modelo de datos multidimensional.
Al estar &asado en un modelo multidimensional% se o&tienen #arios &ene,icios +ara el
usuario% como serD
!s ,2cilmente entendi&le +or los usuarios no e-+ertos.
Pro+orciona el conte-to +ara la selecci3n de datos.
Sim+li,ica el +roceso de de,inici3n de c2lculos "asta )ue usuarios no e-+ertos
+ueden usar el lengua'e de c2lculo.
Por otro lado% el tener una &ase de datos 8/>MS@M//S com+letamente integrada en
com+araci3n con &ases de datos multidimensionales * se+aradas% trae los siguiente
&ene,iciosD
P2gina 17 de 71
Gesti3n m2s sim+le
Alta dis+oni&ilidad
Seguridad me'orada
Acceso a&ierto desde clientes S:L * $LAP AP?
Ciclo de in,ormaci3n reducido
Ma*or ,ia&ilidad de la in,ormaci3n
La &ase de datos $racle se com+one de tres tecnologEasD
La tecnologEa relacional gestiona los o&'etos de &ase de datos% +ro+orcionando una
inter,az S:L a los datos.
La tecnologEa de o&'etos +ermite a la &ase de datos gestionar datos no relacionales
La tecnologEa $LAP +ro+orciona ,uncionalidad analEtica +or medio de la
a+licaci3n del modelo multidimensional.
P2gina 1< de 71
Fig. /. 0eparacin de tecnolog#as de la base de datos *racle
S:L +uede acceder a datos multidimensionales a tra#(s de ,unciones de ta&la o #istas
relacionales. Isando a+licaciones PL/S:L% S:L +ueden interactuar directamente con el
motor multidimensional.
Todas las tecnologEas 0relacional% o&'etos * $LAP1 est2n contenidas en un solo +rocesoK
resultando en )ue la &ase de datos se trate como una sola instancia integrada.
A +rimera #ista +odemos se+arar a $racle $LAP en 7 +artesD
1. &pcin &'A de la /ase de Datos &racle% la cual contiene ti+os de datos
multidimensionales% el motor $LAP e inter,aces de acceso li&reK
2. 0erramientas de usuario1 )ue +ro#een acceso a los datos $LAP +ara satis,acer
am+lias necesidades de an2lisisK
7. 0erramientas administrativas% utilizadas +ara crear * administrar los datos
multidimensionales. !n +articular% $racle +ro#ee dos "erramientasD
a. $racle 4are"ouse >uilder
&. Anal*tic 4or6s+ace Manager
P2gina 1= de 71
Componentes de Oracle OLAP
Se su&di#ide en dos grandes 2reasD
La $LAP AP? * el 5or6s+ace analEtico 0anal*tic 5or6s+ace% A41
La ,uncionalidad de la $LAP AP?.
Analytic (or2space
!ste es+acio de tra&a'o resulta ser un contenedor +ara los datos multidimensionales% como
tam&i(n +ro#ee una inter,az S:L al modelo multidimensional. /e esta manera% se +ro#ee de
una ca+a de acceso uni#ersal +ara cual)uier "erramienta de re+orte de >? )ue genere
comandos S:L% como +uede ser S:L /e#elo+er% o A++lication !-+ress% entre otros.
A4 tam&i(n +ro#ee una LML AP? +ara administraci3n * un lengua'e de +rogramaci3n%
$LAP /ML.
Ca&e mencionar )ue% aGn com+artiendo la misma &ase de datos con los datos relacionales%
los datos multidimensionales se almacenan en ta&las es+eciales llamadas Anal*tic
4or6s+aces.
!l motor de c2lculo del modelo dimensional +ro#ee una Ma#a AP?% +ermitiendo )ue los
desarrolladores +uedan e-+lotan las ,uncionalidades de $racle $LAP. !sta misma AP? es
utilizada +or "erramientas de >?% como ser $racle>? >eans% $racle>? /isco#erer% $racle>?
S+reads"eet Add@?n% * $racle 8e+orts $LAP Plug@in.
$racle $LAP usa un modelo multidimensional como &ase +ara el modelo ,Esico en los
anal*tic 5or6s+aces. !ste modelo +ro+orciona &ene,icios im+ortantesD
!l modelo ,uerza la integridad re,erencial. Por e'em+lo% no es +osi&le )ue las
medidas contengan cla#es )ue no re,erencien #alores #2lidos en una dimensi3n.
P2gina 1A de 71
!l modelo ,a#orece la consistencia de datos al ,acilitar la reutilizaci3n de
dimensiones con mGlti+les medidas.
!l orden de los miem&ros de las dimensiones se mantiene. !sto sim+li,ica los
c2lculos como +or e'em+lo el an2lisis de series tem+orales. Cuando el orden de los
miem&ros de las dimensiones se mantiene% las ,unciones +ueden usar la +osici3n de
un miem&ro de una dimensi3n% +or lo )ue se sim+li,ica la de,inici3n de los c2lculos
* se reduce la necesidad de atri&utos dimensionales.
Por e'em+lo% Nun aFo antesO se +uede e-+resar como Plag0time 12 time1Q% asE se
elimina la necesidad de atri&utos Pun aFo antesQ calculados * )ue ,ormen +arte del
+roceso !TL.
Toda la &ase de datos se +resenta como +recalculada% sin tener en cuenta si los
datos se "an +recalculado o se calculan en tiem+o e'ecuci3n. Las a+licaciones no
necesitan es+eci,icar reglas de agregaci3n o 'oins cuando consultan la &ase de
datos. Las a+licaciones S:L no se +reocu+an de c3mo los datos est2n
+recalculados% sim+lemente consultan los datos.
&racle /% Spreads$eet Add3%n
La "erramienta $racle >? S+reads"eet Add@?n ,acilita acceder a los datos $LAP a tra#(s de
+lanillas de c2lculo% como ser Microso,t !-cel. !sta "erramienta +ermite un acceso seguro a
la ,uente de datos $LAP * utilizar !-cel como "erramienta de acceso a los datos de la >ase
de /atos.
P2gina 17 de 71
Fig. 1. .!emplo de reporte en .2cel
Fig. 13. *tro e!emplo de reporte de *racle *+A, en .2cel
!sta integraci3n con !-cel +ermite )ue los usuarios integren las ,uncionalidades de $racle
$LAP con las ,unciones +ro+ias de !-cel.
P2gina 1B de 71
&racle/% Discoverer
$tra "erramienta de an2lisis es $racle>? /isco#erer. Adem2s de +ermitir el acceso a los
datos de $racle $LAP% +ermiteD
8ealizar consultas% re+ortes * an2lisis so&re los modelos dimensionales 0anal*tical
5or6s+aces1 * so&re los modelos relacionales 0es)uemas de co+o de nie#e R star o
sno5,la6e sc"emas1
Acceder * analizar los datos dimensionales de la &ase de datos sin la necesidad de
com+render conce+tos a#anzados de &ase de datos.
Con esta "erramienta% se +ueden ,ormular consultas utilizando el mismo lengua'e de
negocios% es decir utilizar dimensiones% 'erar)uEas% ni#eles * medidas a tra#(s de una sim+le
inter,az.
Fig. 11. .!emplo de pantalla de *racle45 Discoverer
P2gina 19 de 71
Herramientas para construir un AW
!-isten dos "erramientas +ara los usuarios +ara la construcci3n de A5s * cargarlos con
datos% +ara +osteriores an2lisis con las "erramientas corres+ondientes% como las #istas
anteriormente.
!stas dos utilidades sonD
Anal*tic 4or6s+ace Manager 0A4M1
$racle>? 4are"ouse >uilder 0$4>1
Fig. 12. 6iclos de vida por utilidad
Am&as utilidades com+arten una AP?% la cual es la A4 LML AP? +ara construir *
mantener los A4. Por consiguiente% un modelo A4 creado con A4M +uede ser reutilizado
en el re+ositorio $4> +ara mantener control de #ersi3n * an2lisis de im+acto si son
re)ueridos cam&ios en los sistemas ,uentes.e
P2gina 20 de 71
Ca&e destacar )ue am&as utilidades generan scri+ts )ue +ueden ser in#ocados *
+rogramados% en caso de re)uerirlo% desde scri+ts PL/S:L u otras "erramientas +ara
+rogramar e#entos.
Analytic (or2space Manager 4A(M5
!sta "erramienta +ermite construir * mantener A4s desde una ,uente de datos lim+ia. !sto
)uiere decir )ue A4M es utilizada en datos ,uente *a lim+iados en el +roceso de !TL.
!sta lim+ieza de datos +uede "a&er sido realizada +or $racle 4are"ouse >uilder o &ien +or
otro +roceso !TL.
A4M esta ,ocalizado sim+lemente en crear los A4s% +or medio de guEas +aso a +aso
05izards1 mu* intuiti#as% +ermitiendo )ue sea utiliza&le tanto +or usuarios con o sin
conocimientos t(cnicos 0usuarios de ?T o +o5er users1.
!l +roceso de creaci3n est2 con,ormado +or 7 +asosD
1. /iseFar el modelo dimensional.
2. Ma+ear el modelo dimensional con los datos ,uente.
7. Cargar los datos en el A4.
P2gina 21 de 71
Fig. 1. .!emplo de mapeo de una dimensin con los datos originales, luego del .7+
Luego de "a&er realizado estos +asos% el es+acio de tra&a'o 0A41 )ueda listo +ara su
an2lisis con las distintas "erramientas.
&racle/% (are$ouse /uilder 4&(/5
A di,erencia de A4M% $4> +ermite administrar A4s * es una "erramienta !TL% utilizada
+or desarrolladores * administradores de &ases de datos +ara construir * mantener la
in,ormaci3n en la &ase de datos $racle. $4> +ermite administrar el +roceso com+leto de
'untar * lim+iar los datos.
+untar datos" $4> o&tiene los datos de distintos sistemas ,uentes )ue alimentan
al /ata 4are"ouse.
P2gina 22 de 71
'impiar los datos" $4> realiza acti#idades de trans,ormaci3n * lim+ieza de los
datos% como +uede ser actuar so&re los mismos +ara e#itar inconsistencias entre los
distintas ,uentes de in,ormaci3n% +ara luego com+aginar los datos.
!l resultado es un con'unto de ta&las con datos lim+ios en la &ase de datos $racle.

P2gina 27 de 71
Seccin !" #ata $inin%
$tro ser#icio im+lementado en $racle es /ata Mining% +ermitiendo al usuario e-traer
in,ormaci3n +or medio del an2lisis de todos los datos almacenados en el /ata 4are"ouse. La
&ase de datos $racle +ro#ee #arios elementos +ara este an2lisisD
In gran con'unto de ,unciones estadEsticas% inclu*endo estadEsticas descri+ti#as%
test de "i+3tesis% an2lisis de correlaci3n% +rue&a de &ondad de a'uste% ta&las
cruzadas con estadEsticas de C"i cuadrado% * an2lisis de la #ariancia 0AC$SA1.
$LAP
/ata Mining.
!n +articular% /ata Mining utiliza grandes cantidades de datos +ara crear modelos% los
cuales +ueden +ro#eer de detalles re#eladores% signi,icantes * #aliosos. Por e'em+lo% data
mining +uede ser utilizado +araD
Predecir los clientes )ue tender2n a cam&iar de +ro#eedores de ser#icioK
/escu&rir los ,actores relacionados con una cierta en,ermedadK
?denti,icar com+ortamientos ,raudulentos.
$racle /ata Mining realiza el +roceso de data mining en la &ase de datos $racle% +or lo
)ue no necesita traslado de datos entre la &ase de datos * un ser#idor e-terno de data mining%
eliminando de esta ,orma redundancia de datos * resultando en un almacenamiento *
+rocesado de la in,ormaci3n e,iciente. /e esta ,orma asegura )ue los datos utilizados est(n
actualizados * mantiene seguridad de la in,ormaci3n.
$racle /ata Mining so+orta la ma*orEa de las ,unciones de data mining. Ha* al menos un
algoritmo +ara cada una de las ,uncionesD
P2gina 2< de 71
Clasi,icaci3nD Agru+ar Etems en clases discretas * +redecir a )u( clase +ertenece un
determinado item. Algunos de los algoritmos im+lementados sonD Tr&oles de
decisi3n% Cai#e >a*es% M2)uinas de Sectores de So+orte 0Su++ort Sector
Mac"ines% SSM1% entre otros.
8egresi3nD A+ro-imar * +redecir #alores num(ricos continuosK los algoritmos son
SSM * Modelos Lineales Generalizados 0Generalized Linear Models1.
/etecci3n de AnomalEasD /etectar casos an3malos% tales como ,raudes o intrusi3nK
el algoritmo es SSM de una clase.
?m+ortancia de atri&utosD ?denti,icar los atri&utos )ue tienen las relaciones m2s
,uertes con el atri&uto a analizarK el algoritmo es /escri+tor de MEnima Longitud
0Minimun /escri+tor Lengt"1.
Segmentaci3nD !ncontrar agru+amientos naturales de los datos de modo de
encontrar segmentos +ara identi,icar a los clientesK los algoritmos son @Secinos *
$@Cluster.
Asociaci3nD An2lisis de canasta% encontrando los Etems )ue son +ro&a&lemente
com+rados en con'untoK el algoritmo es A Priori.
!-tracci3n de caracterEsticasD Crear nue#os atri&utos 0caracterEsticas1 como
com&inaci3n de los atri&utos originalesK el algoritmo utilizado es Hactorizaci3n de
Matriz Co Cegati#a 0Con@Cegati#e Matri- Hactorization1.
!l AP? de $/M 0$racle /ata Mining1 +ro#ee so+orte +ara la construcci3n de a+licaciones
)ue automatizan la e-tracci3n de estos an2lisis.
Las acti#idades% tales como construcci3n de modelos% +rue&a * +unta'e son lle#adas a ca&o
a tra#(s de una PL/S:L AP?% una Ma#a AP?% * ,unciones de /ata Mining S:L.
P2gina 2= de 71
$/M +ermite la creaci3n de un su+ermodelo% es decir% un modelo )ue contiene
instrucciones +ara la +re+araci3n de los datos )ue contenga.
!l an2lisis +redicti#o automatiza el +roceso de /ata Mining. Sin la inter#enci3n del
usuario% las rutinas del an2lisis +redicti#o mane'a la +re+araci3n de los datos% la selecci3n del
algoritmo% la construcci3n del modelo * el +unta'e del mismo% de modo )ue el usuario se
+ueda &ene,iciar del +roceso de /ata Mining sin ser un e-+erto en el tema.
Fig. 1$. ,roceso de Data Mining
La ,igura anterior ilustra las ,ases de un +ro*ecto de /ata Mining% demostrando su
naturaleza iterati#a. /emuestra )ue un +ro*ecto de este ti+o no se detiene cuando se alcanza
una determinada soluci3n. Los resultados dis+aran nue#as +reguntas de negocio% lo cual
genera la necesidad de desarrollar nue#os modelos.
Las ,unciones mencionadas de /ata Mining es+eci,ican un ti+o de +ro&lema )ue +uede ser
modelado * resuelto. Generalmente estas ,unciones caen en dos categorEasD su+er#isados *
no su+er#isados. !stos conce+tos se deri#an de la +arte de inteligencia arti,icial )ue de,ine el
a+rendiza'e de las m2)uinas.
P2gina 2A de 71
Data Mining Supervisado
!l a+rendiza'e su+er#isado tam&i(n es conocido como a+rendiza'e dirigido. !l +roceso de
a+rendiza'e es dirigido +or un atri&uto +re#iamente conocido. !ste ti+o de /ata Mining
intenta e-+licar el com+ortamiento de un atri&uto en ,unci3n de un con'unto de atri&utos
inde+endientes.
Generalmente% este ti+o genera modelos +redicti#os% en contraste con los no su+er#isados%
cu*o o&'eti#o es generar +atrones de detecci3n.
La construcci3n de modelo su+er#isado im+lica entrenamiento% siendo un +roceso +or el
cual el so,t5are analiza mGlti+les causas% donde el atri&uto a o&tener es *a conocido.
Entrenamiento supervisado" ruebas
Se re)uieren con'untos se+arados de datos +ara la construcci3n% o entrenamiento% * +rue&a
de algunos modelos +redicti#os. Los datos de construcci3n * de +rue&a de&en tener la misma
estructura. Generalmente% una misma ta&la o #ista se su&di#ide en dos sets de datosD uno
+ara la construcci3n * otro +ara la +rue&a.
!l +roceso de a+licar el modelo a los datos de +rue&a determinar2 si el modelo es a+lica&le
a otro con'unto de datos.
Data Mining -o Supervisado
!l a+rendiza'e no su+er#isado es el no dirigido. Co "a* distinci3n entre atri&utos
de+endientes e inde+endientes. Co e-iste un conocimiento +re#io )ue +ueda guiar al
algoritmo en la construcci3n del modelo.
!ste ti+o de /ata Mining se +uede utilizar con +ro+3sitos descri+ti#o% al igual )ue +ara
realizar +redicciones.
P2gina 27 de 71
Al%unos casos de &ito'
Adeco Agro+ecuaria
o Permiti3 la entrega en tiem+o * ,orma de datos ,inancieros consolidados a
directores * accionistas
La Ca'a de A"orro * Seguro S.A.
o ?ntegraron di,erentes a+licaciones
o Me'ora de acceso a datos +ara toda la com+aFEa
Multicanal
o Se ,ortaleci3 el call center * el 2rea t(cnica
o Se consolid3 la centralizaci3n de las o+eraciones desde una misma
+lata,orma
$,,iceCet
o Alcanz3 un me'or mane'o de la ca+acidad de in#entario
Hos+ital Alem2n
o Centralizaci3n de in,ormaci3n m(dica
o /igitalizaci3n de in,ormaci3n clEnica de +acientes
Hos+ital ?taliano% entre otros.
o Centralizaci3n de in,ormaci3n
P2gina 2B de 71
Conclusin'
$racle $LAP re+resenta un cam&io ,undamental en la tecnologEa $LAP. Al unir las &ases
de datos relacionales * multidimensionales% se +ro+orcionan ca+acidades analEticas +ro+ias
de una &ase de datos multidimensional en el conte-to de la &ase de datos $racle.
Las #enta'as de un 8/>MS@M//S% como lo es $racle% sonD
Gesti3n m2s sim+le
Pro+orciona la alta dis+oni&ilidad de un ser#idor cor+orati#o
Ma*or seguridad
$,rece el acceso m2s a&ierto
!l ciclo de in,ormaci3n se reduce
Se elimina la sincronizaci3n de los datos
Se o&tienen todas estas #enta'as% mientras se mantiene la +otencia de un ser#idor $LAP
dedicado. $racle $LAP +ro+orciona un con'unto de ,unciones analEticas a tra#(s de la
$LAP AP?% un motor multidimensional * un lengua'e de mani+ulaci3n de datos $LAP. !l
resultado es un sistema de menor coste% m2s seguro * ,ia&le% )ue da so+orte a a+licaciones
analEticas% de consulta * de generaci3n de in,ormes.
Semos )ue estas #enta'as +ro#ienen del "ec"o de )ue $racle $LAP im+lementa un modelo
H$LAP% es decir% es un "E&rido de 8$LAP * M$LAP. /ecimos )ue im+lementa 8$LAP *a
)ue +ermite la consulta a las ta&las directamente +or medio de consultas S:L% adem2s de
almacenar los datos en un es)uema de co+o de nie#e% +or e'em+lo% de modo )ue utiliza el
+aradigma relacional. Por otro lado% decimos )ue im+lementa M$LAP *a )ue +ermite
tam&i(n la consulta * creaci3n de dimensiones * ta&las de "ec"os en ,orma inde+endiente a
P2gina 29 de 71
c3mo se almacenan en la &ase de datos. Adem2s% $racle $LAP +ermite de,inir com+resi3n
de las dimensiones al momento de crearlas% +or el cual utiliza el algoritmo de matrices
dis+erar.
Podemos decir entonces )ue resulta una "erramienta mu* +oderosa% *a )ue +ermite )ue
cual)uier ti+o de usuario +ueda construir sus +ro+ios re+ortes% de modo de +oder analizar la
in,ormaci3n de la manera )ue le resulte m2s c3moda al usuario.
Por otro lado% el m3dulo de /ata Mining +ermite la construcci3n de cual)uier ti+o de
modelo +ara encontrar o e-+licar com+ortamientos Gtiles +ara el negocio.
?m+lementa todos los algoritmos #istos en clase% o,reciendo un gran a&anico tanto +ara los
su+er#isados% como +ara los no su+er#isados.
P2gina 70 de 71
(iblio%ra)*a'
Sitio de ?nternetD "tt+D//&log.neozeratul.com/
Sitio de ?nternetD "tt+D//oracleola+.&logs+ot.com/
Sitio de ?nternetD
"tt+D//5i6i.oracle.com/+age/GettingUStartedU4it"U$racleU$LAPU$+tion
Sitio de ?nternetD
"tt+D//555.oracle.com/glo&al/lad/customers/countries/countries."tmlVArgentina
Sitio de ?nternetD
"tt+D//do5nload.oracle.com/docs/cd/>2B7=9W01/datamine.111/&2B129/toc."tm
P2gina 71 de 71

Das könnte Ihnen auch gefallen