You are on page 1of 36

Consecutivo: INF-INV-035-FI-2009/2 Consecutivo: INF-INV-035-FI-2009/2

Esta obra esta bajo una licencia reconocimiento-no comercial 2.5 Colombia de
creativecommons. Para ver una copia de esta licencia, visite TÍTULO INVESTIGACIÓN
http://creativecommons.org/licenses/by/2.5/co/ o envié una carta a creative
commons, 171second street, suite 30 San Francisco, California 94105, USA Director Unidad Informática: Henry Martínez Sarmiento

Tutor Investigación: Álvaro Schneider Guevara


PENTAHO – BI Auxiliares de Investigación:

ALEJANDRO NIETO RAMOS JORGE ALBERTO TORRES VALLEJO


ANDREA ELIANA BARRERA ARDILA JORGE LEONARDO LEMUS CASTIBLANCO
ÁNGEL LEONARDO JEREZ CARVAJAL JORGE LUIS FANDIÑO GIRALDO
ÁNGELA PATRICIA VEGA CABRA JOSÉ SANTIAGO APARICIO CASTRO
BENJAMÍN EDUARDO VENEGAS VENEGAS JUAN CARLOS TARAPUEZ ROA
CAMILO ALBERTO ZAPATA MARTÍNEZ JULIE ANDREA PADILLA GONZÁLEZ
Autores: CINDY LORENA PABÓN GÓMEZ LAURA VANESSA HERNÁNDEZ CRUZ
DANIEL ALEXANDER LINARES PUERTO LILIANA CAROLINA HERRERA PRIETO
SANDRA MIREYA AGUILAR MAYORGA DAVID CAMILO SÁNCHEZ ZAMBRANO LUIS ALEJANDRO PICO SILVA
JORGE LEONARDO LEMUS CASTIBLANCO DAVID FELIPE BELTRÁN GOMES LUIS FERNANDO ALFONSO MUÑOZ
DIANA MARCELA ROJAS TÉLLEZ MÓNICA YOLANDA MOGOLLÓN PLAZAS
Director Unidad Informática: Henry Martínez Sarmiento DIEGO ARMANDO POVEDA ZAMORA MYRIAM JASMIN GUERRA CÁRDENAS
EDGAR ANDRÉS GARCÍA HERNÁNDEZ NUBIA ALEJANDRA SEGURA TENJICA
Tutor Investigación: Álvaro Schneider Guevara IVÁN ALBEIRO CABEZAS MARTÍNEZ NURY BIBIAN BEJARANO CÁRDENAS
IVÁN DARÍO BARRETO BERNAL RAÚL ANDRÉS CAMACHO CRUZ
Coordinadores: Álvaro Schneider Guevara JISSETH TATIANA ÁNGEL RODRÍGUEZ SANDRA MIREYA AGUILAR MAYORGA
Juan Felipe Reyes Rodríguez
Este trabajo es resultado del esfuerzo de todo el
Coordinador Servicios Web: Miguel Ibáñez equipo perteneciente a la Unidad de Informática.

Analista de Infraestructura Se prohíbe la reproducción parcial o total de este


Y Comunicaciones: Alejandro Bolívar documento, por cualquier tipo de método fotomecánico
y/o electrónico, sin previa autorización de la
Analista de Sistemas de Universidad Nacional de Colombia.
Información: Mesías Anacona Obando
UNIVERSIDAD NACIONAL COLOMBIA
UNIVERSIDAD NACIONAL COLOMBIA FACULTAD DE CIENCIAS ECONÓMICAS
FACULTAD DE CIENCIAS ECONÓMICAS UNIDAD DE INFORMÁTICA Y COMUNICACIONES
UNIDAD DE INFORMÁTICA Y COMUNICACIONES BOGOTÁ D.C.
BOGOTÁ D.C. DICIEMBRE 2009
DICIEMBRE 2009

INF-FO-12 V 1.0 INF-FO-12 V 1.0


PENTAHO -BI PENTAHO -BI

6.1.3.1. Qué es Eclipse ......................................................................................... 25


TABLA DE CONTENIDO 6.1.3.2. Eclipse en Pentaho- Bi (Design Studio) ................................................... 25

6.1.3.3. Iniciando en Design Studio (Guía)........................................................... 25

TABLA DE CONTENIDO..................................................................................................... 3 6.1.4. Pentaho Metadata Editor ................................................................................ 44

1. RESUMEN ....................................................................................................................... 5 6.1.5. Report Designer ............................................................................................ 48

2. ABSTRACT..................................................................................................................... 7 6.2. CONSOLA DE USUARIOS .................................................................................. 59

3. CONCEPTUALIZACIÓN.............................................................................................. 9 6.2.1. New Report.................................................................................................... 60

3.1. ¿Qué es Business Intelligence?................................................................................. 9 6.2.2. New Analysis View ......................................................................................... 64

3.2. ¿Cuáles son los componentes del Software?......................................................... 11 6.2.3. New Dashboard ............................................................................................. 67

3.2.1. ¿Qué es Tablero de Control?......................................................................... 11 7. COSTOS DE INSTALACIÓN ..................................................................................... 69

3.2.2. ¿Qué es Análisis de Datos?............................................................................. 12 8. EXPERIENCIAS ............................................................................................................ 70

3.2.3. ¿Qué es Minería de Datos?............................................................................. 13 9. CONCLUSIONES ........................................................................................................ 71

3.2.4. Casos de uso común para Pentaho para minería de datos incluyen: ............ 13 10. BIBLIOGRAFIA ......................................................................................................... 72

3.2.5. ¿Qué son los Reportes de Datos?.................................................................. 14

4. FICHA TÉCNICA DE PENTAHO-BI........................................................................... 15

4.1.1. Ficha Técnica. ................................................................................................. 15

5. LISTA SINTÉTICA DE PENTAHO-BI.......................................................................... 16

6. HERRAMIENTAS.......................................................................................................... 17

6.1. MÓDULOS PENTAHO – BI ................................................................................. 17

6.1.1. Aggregation Designer ..................................................................................... 17

6.1.2. Pentaho Data Integration ............................................................................... 23

6.1.3. Eclipse En Pentaho Bi (Design Studio) ........................................................... 24

UNIVERSIDAD NACIONAL COLOMBIA UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONÓMICAS FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES UNIDAD DE INFORMÁTICA Y COMUNICACIONES
3 4
UNI-FO-02 V 1.0 UNI-FO-02 V 1.0
PENTAHO -BI PENTAHO -BI

y los portales web (portlets). Además, con el Microsoft Excel Analysis Services, se
1. RESUMEN puede analizar los datos dinámicos en Microsoft Excel (usando la conexión a OLAP
server Mondrian).
Dashboards - todos los componentes del modulo Pentaho Reporting y Pentaho
Análisis pueden formar parte de un Dashboard. En Pentaho Dashboards es muy
Pentaho-BI es un software libre que cumple el objetivo de análisis de datos y sirve como fácil incorporar una gran variedad en tipos de gráficos, tablas y velocímetros
base para toma de decisiones empresariales, una de sus grandes ventajas, se debe a su (dashboard widgets) e integrarlos con los Portlets JSP, en donde podrá visualizar
versatibilidad y compatibilidad en la generación de informes en HTML, Excel entre otros, informes, gráficos y análisis OLAP.
de igual forma esta también puede obtener información de otros sistemas de información. Data Mining - análisis en Pentaho se realiza con una herramienta WeKa.
Integración de Datos - se realiza con una herramienta Kettle ETL (Pentaho Data
Partiendo de lo anteriormente mencionado, en el mundo actual es de vital importancia Integration) que permite implementar los procesos ETL. Últimamente Pentaho
que los sistemas de información sean integrales, para reducir costos de transacción y de lanzó una nueva versión - PDI 3.0 – que marcó un gran paso adelante en OSBI ETL
tiempo, que son importantes para la generación de actividades internas y poder crear y que hizo Pentaho Data Integration una alternativa interesante para las
estrategias externas y al interior de la organización. herramientas comerciales.
Los componentes que conforman la plataforma de Pentaho BI son: Reporting, Analysis,
Dashboard, Data mining e Integración de datos.

Al ver las áreas que componen el Software, podemos decir que es necesario una base
clara con permisos definidos que permitan la buena utilización de la herramienta a favor
de la empresa.

La plataforma Open Source Pentaho Business Intelligence cubre muy amplias necesidades
de Análisis de los Datos y de los Informes empresariales. Las soluciones de Pentaho están
escritas en Java y tienen un ambiente de implementación también basado en Java. Eso hace
que Pentaho es una solución muy flexible para cubrir una amplia gama de necesidades
empresariales – tanto las típicas como las sofisticadas y especificas al negocio.

Los módulos de la plataforma Pentaho BI son:

Reporting - un modulo de los informes ofrece la solución adecuada a las


necesidades de los usuarios. Pentaho Reporting es una solución basada en el
proyecto JFreeReport y permite generar informes ágil y de gran capacidad.
Pentaho Reporting permite la distribución de los resultados del análisis en
múltiples formatos - todos los informes incluyen la opción de imprimir o exportar
a formato PDF, XLS, HTML y texto. Los reportes Pentaho permiten también
programación de tareas y ejecución automática de informes con una determinada
periodicidad.
Análisis - Pentaho Análisis suministra a los usuarios un sistema avanzado de análisis
de información. Con uso de las tablas dinámicas (pivot tables, crosstabs),
generadas por Mondrian y JPivot, el usuario puede navegar por los datos, ajustando
la visión de los datos, los filtros de visualización, añadiendo o quitando los campos
de agregación. Los datos pueden ser representados en una forma de SVG o Flash,
los dashboards widgets, o también integrados con los sistemas de minería de datos
UNIVERSIDAD NACIONAL COLOMBIA UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES UNIDAD DE INFORMÁTICA Y COMUNICACIONES
5 6
UNI-FO-02 V 1.0 UNI-FO-02 V 1.0
PENTAHO -BI PENTAHO -BI

widgets, or even integrated with data mining systems and web portals (portlets). And with
2. ABSTRACT the Microsoft Excel Analysis Services, you can analyze the dynamic data in Microsoft Excel
(using the connection to OLAP server Mondrian).

Pentaho-BI is a free software that meets the objective of data analysis and provides a basis • Dashboards - all components of the module Pentaho Reporting and Pentaho Analysis
for making business decisions, one of its great advantages due to its versatility and Plug-in can be part of a Dashboard. In Pentaho Dashboards is very easy to incorporate a wide
card to generate reports in HTML, Excel, among others; likewise this can also obtain variety in types of graphs, charts and speedometers (Dashboard widgets) and integrate
information from other information systems. with JSP Portlets, where you can view reports, OLAP graphing and analysis.

Based on the above, in today's world is of vital importance that information systems are • Data Mining - Pentaho analysis is performed with a tool Weka.
complementary, to reduce transaction costs and time, which are important for the
generation of internal activities and external strategies to create.
• Data Integration - is performed with an ETL tool Kettle (Pentaho Data Integration) that
allows implementing the ETL processes. Pentaho recently launched a new version - PDI
The components inside the Pentaho BI platform are: Reporting, Analysis, Dashboard, Data 3.0 - which marked a great step forward and OSBI ETL Pentaho Data Integration was an
mining and data integration. interesting alternative to commercial tools.

Upon seeing the areas that are part of the Software, we can say that it is necessary to
permit a clear basis defined that allow good utilización tool to the company.

The platform Pentaho Open Source Business Intelligence covers very broad needs of the
Data Analysis and Business reports. Pentaho's solutions are written in Java and have a
deployment environment, also based in Java. This makes Pentaho is a very flexible solution
to meet a wide range of business needs - both typical and sophisticated and specific to the
business.

The modules of the Pentaho BI platform are:

• Reporting - a reporting module offers the right solution to the needs of users. Pentaho
Reporting is a solution based on the JFreeReport project and the reports are fast and
large capacity. Pentaho Reporting allows the distribution of analysis results in multiple
formats - all reports include the option to print or export to PDF, XLS, HTML and text.
Pentaho reports also allow scheduling and automatic execution of reports with a certain
periodicity.

• Analysis - Pentaho Analysis provides users an advanced system of analysis. With use of
PivotTables (pivot tables, crosstabs), generated by Mondrian and JPivot, the user can
navigate through the data, adjusting the view of data, display filters, adding or removing
fields aggregation. The data can be represented in a form of SVG or Flash, the dashboard
UNIVERSIDAD NACIONAL COLOMBIA UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES UNIDAD DE INFORMÁTICA Y COMUNICACIONES
7 8
UNI-FO-02 V 1.0 UNI-FO-02 V 1.0
PENTAHO -BI PENTAHO -BI

Para obtener TODA la información se basa en una metodología denominada ETL (Extract,
3. CONCEPTUALIZACIÓN Transform and Load) para ser más exacto cada parte se puede interpretar de la siguiente
forma:

La extracción: Se encarga de la búsqueda de la información, obteniendo los datos de las


3.1. ¿Qué es Business Intelligence? diferentes fuentes disponibles

la transformación: se caracteriza por depurar y preparar la información suministrada por la


etapa de la extracción
En General el concepto Bussines intelligence (Nehace parte del gran sistema de
información gerencial (SIG) este grupo está compuesto entre otros por (Market Cargar: Esta última etapa almacena la información y la deja preparada para la utilización por
Intelligence, Competitive Intelligence), de una forma más clara podemos remitirnos al parte del usuario final.
esquema 1.
Existen diferentes organizaciones que ofrecen este servicio; algunos criterios que un
usuario o administrador deben tener en cuenta al momento de elegir alguno de ellos son:

La Plataforma en la cual se está utilizando la compañía (algunas compañías proveedoras de


BI son restrictivitas al momento de utilizarlas).
Business El curriculum del vendedor es imprescindible pues conocer la reputación del mismo nos
Inteligen intelligence
cia en la hace una idea de la asesoría que vamos a tener durante la implementación del software
Empresa
Market
(SIG) El Tamaño del cubo: Se interpreta como la capacidad de almacenamiento, algunas
intelligence aplicaciones suelen conservar una cantidad de datos y luego explotan

La velocidad de consulta: entre mas rápida sea la consulta el programa es mejor, si la


consulta es mayor a 20 segundos quizás hay que buscar otra herramienta

Servicios de soporte y ayuda a nivel mundial: Se Debe tener la seguridad que si algo falla
Competitive
intelligence en la aplicación (y fallara esto es seguro podamos resolverlo en el menor tiempo posible

Esquema 1 El ecosistema del vendedor (consultores, partners, acuerdos, comunidad de


desarrolladores…).

Base instalada de usuarios: Si hay de mi sector mucho mejor. Si puedo hablar con ellos y
ver la herramienta en vivo, todavía mejor.
El termino Bussines Intelligence tiene como fin, ir más allá que una simple presentación de
Al ser un herramienta destinada para usuarios finales es aconsejable que la misma tenga
informes pues lo que realmente busca es ofrecer información útil y oportuna para el
una interfaz grafica amigable al usuario de lo contrario los resultados no serán muy
usuario final y así respaldar sus decisiones al interior de la empresa; la anterior premisa
amenos; Graphical User Interface (GUI).
abarca cualquier rango o área que se encuentre al interior de la empresa, para esto tiene
como medio la utilización de TODOS los datos disponibles (tanto internos como
El precio un factor que es obvio al momento de elegir… esto no implica que entre mas
externos de la empresa).
barato sea mejor, lo que quiere decir es que entre mas económico y COMPLETO es
mejor.
UNIVERSIDAD NACIONAL COLOMBIA UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES UNIDAD DE INFORMÁTICA Y COMUNICACIONES
9 10
UNI-FO-02 V 1.0 UNI-FO-02 V 1.0
PENTAHO -BI PENTAHO -BI

Integración con otras herramientas, si trabaja como una isla el programa generara La integración con Pentaho Reportes y Pentaho Análisis de modo que los usuarios
problemas en el futuro. 1 pueden perforar a los informes y el análisis subyacente a entender qué factores
están contribuyendo al buen o mal desempeño
Algunas de las características por parte de BI, son la consultas e informes (Querys y Portal de integración para hacer más fácil la entrega de las métricas de negocios
Reports) Cubos Olap (On-Line Analityc Proccesing) Minería de Datos (Data Minning), según el interés de los Stakeholders, integrados sin fisuras en su aplicación
Sistemas de Previsión Temporal Integrado de alerta para vigilar continuamente las excepciones y notificar a los
usuarios a tomar medidas.

3.2. ¿Cuáles son los componentes del Software?


3.2.2. ¿Qué es Análisis de Datos?

La Pentaho BI ofrece una gama completa de Business Intelligence (BI), incluyendo las
capacidades de consulta y presentación de informes, análisis interactivo, cuadros de Pentaho Analysis pone ricos, analítico poder en manos de sus usuarios - ayudando a
mando, integración de datos ETL, minería de datos y una plataforma de BI que ha hecho obtener los conocimientos y la comprensión que necesitan para tomar decisiones de
más popular del mundo Open Source BI Suite. negocio óptimo. Por ejemplo, si un informe demuestra que las ventas se tiende a la baja
de lo esperado, los usuarios empresariales tienen que ser capaces de descubrir fácilmente
Para cumplir los requisitos empresariales específicos. Pentaho BI incluye: El Tablero de el problema subyacente de obtener respuestas a preguntas tales como:
Control, Análisis de Datos, Minería de Datos y los Reportes de Datos.
Es el problema con una línea de productos, o de determinadas regiones?
3.2.1. ¿Qué es Tablero de Control? ¿Cuál es la diferencia entre los productos o regiones de bajo rendimiento frente a
otras combinaciones que son un buen rendimiento?
¿Existe un problema relacionado con las ventas de recuento? Las campañas de
marketing? O algo más?
El Tablero de Control (Desbordas) de Pentaho ofrece una visión de los resultados
empresariales. Mediante la entrega de indicadores en una interfaz visual atractiva e Pentaho Análisis de Datos ayuda a responder este tipo de preguntas las empresas:
intuitiva; los tableros de control Pentaho proporciona a los usuarios de negocios la
información que necesitan para comprender y mejorar el desempeño organizacional. Lo que facilita a los usuarios explorar libremente la información empresarial de
forma interactiva en la perforación y tabulación cruzada de datos de
El tablero de Control ofrece esta visibilidad mediante: Proporcionar la velocidad del pensamiento tiempos de respuesta a las complejas
consultas analíticas
Pantallas interactivas, incluyendo Adobe Flash basado en que los usuarios de La presentación de datos de múltiples dimensiones y permite a los usuarios
negocio puedan ver inmediatamente que el negocio valla por buen camino, o que seleccionar qué dimensiones y medidas para explorar.
necesita atención.
Diseñador de paneles auto-servicio que permite a los usuarios del negocio crear
fácilmente cuadros de mando personalizados sin información.

1
http://www.monografias.com/trabajos29/sistema-business-intelligence/sistema-business-intelligence.shtml

UNIVERSIDAD NACIONAL COLOMBIA UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONÓMICAS FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES UNIDAD DE INFORMÁTICA Y COMUNICACIONES
11 12
UNI-FO-02 V 1.0 UNI-FO-02 V 1.0
PENTAHO -BI PENTAHO -BI

3.2.3. ¿Qué es Minería de Datos? Pentaho cuenta para la inteligencia de negocios de origen (BI) con capacidades adicionales
de software y servicios diseñados para ayudarle a usted ya su organización:
Los datos estan en todas partes. Ofrecer una respuesta coherente, única versión de la
verdad de todas las fuentes de información es uno de los mayores desafíos que enfrentan Lograr el éxito de BI
las organizaciones de TI de hoy. Pentaho ofrece integración de datos de gran alcance de
extracción, transformación y carga (ETL) de las capacidades mediante un enfoque Ahorrar tiempo, recursos y dinero
innovador, impulsado por los metadatos. Con una interfaz intuitiva y gráfica de arrastrar y
soltar entorno de diseño, y una probada y escalable, basada en las normas, Pentaho Data Mitigar el riesgo
Integration es cada vez más la elección de las organizaciones más tradicionales, ETL de
propiedad o las herramientas de integración de datos.

Metadatos Pentaho Data Integration está basado en los medios simplemente indicar qué 3.2.5. ¿Qué son los Reportes de Datos?
quiere hacer, pero no cómo quiere hacerlo. Ahora los administradores pueden crear
complejas transformaciones y empleo en una gráfica de arrastrar-y-medio ambiente caída
sin tener que generar cualquier código personalizado. Pentaho Data Integration es una
solución completa para ETL, incluyendo: Todas las organizaciones el uso de información de una forma u otra. Como resultado, la
información se considera necesario). Pentaho Reporting permite a las organizaciones
La colección de transformación Rico con más de 100-of-the-objetos de asignación acceder fácilmente, el formato y distribuir información a empleados, clientes y socios.
de caja
Los datos generales de fuente de apoyo paquetes de aplicaciones, incluyendo, más Flexibles de despliegue de la presentación de informes de escritorio independiente,
de 30 plataformas de código abierto y de base de datos de propiedad, archivos a la web interactiva basada en informes de inteligencia de negocios empresarial
planos, documentos de Excel, y mucho más Datos generales como fuente de apoyo relacional, OLAP, o datos basados en XML
Soporte avanzado de almacenamiento de datos de variación lenta y dimensiones fuentes de
no deseado de Las opciones de salida flexibles, incluyendo Adobe PDF, HTML, Microsoft Excel,
Probado rendimiento y escalabilidad de clase empresarial formato de texto enriquecido, texto simple o
La integración con la suite de BI de Pentaho para la Integración de Información Asistente de diseño de informes impulsado para la creación rápida, fácil informe de
Empresarial (EII), la programación de avanzada, y el proceso de integración de Basado en la Web ad hoc de consulta y de información para los usuarios de
negocios
Con todas las funciones del Diseñador de informes gráficos para los
desarrolladores de informe de
3.2.4. Casos de uso común para Pentaho para minería de datos Enterprise Edition ofrece funcionalidad de software mejorada, un completo
incluyen: soporte técnico profesional, conocimiento de los productos de software
certificado y mantenimiento de software, y más
De la población de almacenamiento de datos
El enriquecimiento de la información mediante la integración de datos de diversas
fuentes
De migración de datos entre las aplicaciones de
La importación de datos en bases de datos de archivos de texto, hojas de cálculo
Excel, los sistemas relacionales y más
La exportación de datos a otras bases de datos o archivos de texto
de datos mediante la aplicación de las complejas condiciones en las
transformaciones de datos
Exploración de datos en bases de datos existentes (tablas, vistas, etc)

UNIVERSIDAD NACIONAL COLOMBIA UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONÓMICAS FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES UNIDAD DE INFORMÁTICA Y COMUNICACIONES
13 14
UNI-FO-02 V 1.0 UNI-FO-02 V 1.0
PENTAHO -BI PENTAHO -BI

4. FICHA TÉCNICA DE PENTAHO-BI 5. LISTA SINTÉTICA DE PENTAHO-BI

4.1.1. Ficha Técnica. Pentaho-BI se compone de 5 áreas, dos de estas tienen una división interna como se
observa en la siguiente figura.

PRODUCCIÓN

REPORTING OPERACIONAL

AD-HOC

KPIs

PENTAHO ANALISIS
BUSINESS
INTELLEGENCE ALERTAS
DASHBOARD

DATA MINING
Manual Pentaho BI2

INTEGRACIÓN
DE DATOS

2
Pentaho BI, Open Sourse, 2009, p.6

UNIVERSIDAD NACIONAL COLOMBIA UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONÓMICAS FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES UNIDAD DE INFORMÁTICA Y COMUNICACIONES
15 16
UNI-FO-02 V 1.0 UNI-FO-02 V 1.0
PENTAHO -BI PENTAHO -BI

6. HERRAMIENTAS

6.1. MÓDULOS PENTAHO – BI

6.1.1. Aggregation Designer


Si como usuario no está familiarizado con el diseño total de la tabla; no se preocupe el
asesor global realizara un listado de recomendaciones ya que Pentaho Aggregation Designer
En el transcurso de aprendizaje es necesario tener una claridad conceptual, a continuación
utiliza los datos y el esquema del archivo .XML para crear estos consejos
se mostraran conceptos claves para el entendimiento del modulo de Aggregation
Designer.

Key Words

Olap: Siglas de On-Line Analytical Process. Esta es una forma de almacenar información
en una base de datos que permite realizar consultas e informes de una forma más efectiva;
existen diferentes tipos de OLAP como los son:

Molap: Multidimensional OLAP. Tanto los datos fuente como los datos agregados o pre
calculados residen en el mismo formato multidimensional, optimiza los informes y
consultas pero requiere más espacio en el disco y diferente software.

Rolap: Relational OLAP. Tanto los datos pre calculados y agregados como los datos
fuente residen en la misma base de datos relacional.

Holap: Hybrid OLAP: Es una combinación de los dos anteriores. Los datos agregados y
pre calculados se almacenan en estructuras multidimensionales y los de menor nivel de
detalle en el relacional.

Algunas características del OLAP

- Debe ser rápido. No debe transcurrir mucho tiempo entre la necesidad de información
y el resultado. 1) En la barra de herramientas de que Pentaho Aggregation Designer haga clic en asesor
“advisor” y especifique sus datos de entrada.
- Debe tener un lenguaje funcional y de negocio. 2) Existen dos tipos de datos que tenemos que almacenar
a. La cantidad máxima de tablas a tratar en el agregado
- Debe ser de manejo sencillo, con wizards y templates. 3) El tiempo en que se demora Pentaho Aggregation Designer para realizar su análisis y
su respectivo consejo acerca de la base de datos.
- Debe tener potentes posibilidades gráficas.
4) Entre más tiempo corra el asesor es mucho mejor pues permite unas
- Deber generar respuestas medibles para la toma de decisiones. recomendaciones más precisas y un potencial en sus observaciones más concretas.
UNIVERSIDAD NACIONAL COLOMBIA UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES UNIDAD DE INFORMÁTICA Y COMUNICACIONES
17 18
UNI-FO-02 V 1.0 UNI-FO-02 V 1.0
PENTAHO -BI PENTAHO -BI

5) En caso que el proceso sea interrumpido se tendrá la certeza que el asesor Teniendo establecido el módulo de Aggregation Designer, es necesario configurar algunos
entregara la mejor opción encontrada hasta ese momento. recursos del módulo para poder agilizar la relación de información, y disminuir tiempo de
transferencia y definir números de usuarios en línea.

De esta forma lo primero es la sincronización del modelo OLAP, mediante este se puede
Es un módulo que es necesario instalarlo dentro de Pentaho. Necesitamos para esto: lograr conectar a cualquier tipo de base de datos a través del motor Modrian.

Una versión de JAVA SE runtime 1.5 o versiones mayores Para la configuración de este modelo lo primero que tenemos que hacer es dar clic en
Al menos un (1) gigabyte de memoria física libre. conexión, de aquí emergerá una nueva ventana hecha en lenguaje java.

La Versión mínima de Pentaho BI para que funcione el módulo es la 1.7, este no es un


requisito difícil de cumplir debido que el software ha tenido grandes avances y ya está e n
versión 3.5.

De esta forma para que funcione debe cumplir con intervalos de funcionamiento de
requerimiento técnico del equipo, así:

Disco: 1 GB – 10GB

CPU: 1 GHz (Single Core) – 1.5 + (Multi-Core)


RAM: 1 GB – 2 GB.

Una vez instalada se ve de la siguiente manera:

Hacemos clic en Configure y Emergerá una nueva ventana:

UNIVERSIDAD NACIONAL COLOMBIA UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONÓMICAS FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES UNIDAD DE INFORMÁTICA Y COMUNICACIONES
19 20
UNI-FO-02 V 1.0 UNI-FO-02 V 1.0
PENTAHO -BI PENTAHO -BI

En esta se encuentra los siguientes campos:


7. Haga clic en Probar. Si usted escribe en la configuración es correcta, aparece un
Conection Name Æ Este campo lo podemos nombrar a libre albedrio sin generar ningún mensaje de éxito.
inconveniente

HostName: Es el nombre del servidor o el lugar donde se encuentra nuestra base de 8. Haga clic en Aceptar.
datos.

DataBaseName Æ Nombre de la base de datos a la cual vamos a consultar.


Selección De El Modelo a Optimizar
PortNumberÆEl número del puerto aparece por defecto.

UserName y PasswordsÆ es opcional, aunque es recomendable para salvaguardar Después de definir la fuente de datos, debe seleccionar el cubo que desea utilizar para la
información. definición y la creación de tablas agregadas.

AccessÆ Es aconsejable dejar la opción Native.


Para seleccionar el modelo y darle función:
Entonces recopilando toda la información tenemos:

Para definir una conexión de origen de datos:

1. En la barra de herramientas de agregación de diseño Pentaho, haga clic en Conexión a


abrir la conexión a los datos.

2. Haga clic en Configurar. El cuadro de diálogo Propiedades de conexión aparece.

3. En el campo Nombre de conexión, escriba un nombre para su conexión, este es un


campo de texto libre. Un nombre de la conexión define una única conexión.

4. En la lista Tipo de conexión, seleccione una base de datos. 1. En el cuadro de diálogo Conectar a orígenes de datos, bajo el modelo OLAP,
seleccione la base.

5. En la lista de acceso, mantenga la opción predeterminada, que debe ser nativo (JDBC). 2. Haga clic en los puntos suspensivos (...) para mostrar un cuadro de diálogo Archivo.
3. Examinar para buscar y seleccionar el archivo de esquema de Mondrian, a continuación,
haga clic en Aceptar.
6. En la sección Configuración, escriba el nombre de host del servidor de base de datos e 4. Haga clic en Aplicar. La lista de cubo se llena con una lista de los cubos se definen en el
en el campo Nombre de base de datos, escriba el nombre de la base de datos que está esquema.
conectando. En el Puerto Número de campo, introduzca el número de puerto TCP. 5. Selecciona el cubo Mondrian que desea optimizar, a continuación, haga clic en
Opcionalmente, en el nombre de usuario y contraseña campos, Conectar.
escriba el nombre de usuario y contraseña que se utiliza para conectarse a la base de Cuando el Diseñador de Pentaho Aggregation Designer establece una conexión, se
datos. ejecuta la validación de varias pruebas para asegurar que la estructura de su base de datos
UNIVERSIDAD NACIONAL COLOMBIA UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES UNIDAD DE INFORMÁTICA Y COMUNICACIONES
21 22
UNI-FO-02 V 1.0 UNI-FO-02 V 1.0
PENTAHO -BI PENTAHO -BI

está dispuesta a apoyar las tablas agregadas. La validación cuadro de diálogo de resumen
aparece con una lista de resultados de la prueba. Si ve un mensaje de error, póngase en
contacto el administrador de base de datos.

6.1.2. Pentaho Data Integration


En la ventana emergente escogemos la cantidad de datos a ver.

Esta es la vista previa de los datos se encuentra en la base.

Esta base posee los mismos recursos que se mencionaron de reportes anteriormente y
Este análisis lo hace con la intención de optimizar la base de datos, evitar malgastar la puede ser exportada a Excel, HTML, entre otras.
capacidad de la memoria física en datos que tal vez nunca se vayan a necesitar. Esta sería la
interfaz como encontraríamos nuestra tabla

6.1.3. Eclipse En Pentaho Bi (Design Studio)

Finalmente podemos Pre visualizar los datos dando clic en pre visualizar

UNIVERSIDAD NACIONAL COLOMBIA UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONÓMICAS FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES UNIDAD DE INFORMÁTICA Y COMUNICACIONES
23 24
UNI-FO-02 V 1.0 UNI-FO-02 V 1.0
PENTAHO -BI PENTAHO -BI

6.1.3.1. Qué es Eclipse

Eclipse Es una plataforma destinada a la programación, desarrollo y compilación de


diferentes entornos, entre ellos encontramos java, C++, o sitios web. Este software trata
de un entorno de desarrollo integrado (IDE); en ingles IDE es el acrónimo de integrated
development environment.

Eclipse se caracteriza por tener una interfaz amigable donde se puede ver el contenido de
la lista de tareas, el fichero donde se está trabajando entre otros módulos, a pesar que
esta herramienta es de libre acceso, es un arma de doble filo pues este tipo de programa,
se puede ampliar a través de plug-ins. (Librerías); dependiendo en lo que se desea trabajar
se descargan gratuitamente pero al tiempo estas librerías hacen más lento el A continuación encontrara la ventana de bienvenida de Eclipse SDK.
procesamiento y el programa más pesado.

6.1.3.2. Eclipse en Pentaho- Bi (Design Studio)

Este documento nace ante la necesidad de explicar un modulo que pertenece al software
Pentaho BI, para ser más específicos, nos referimos a Design Studio; Eclipse se encuentra
al interior de dicho modulo, para ser más específicos Eclipse es Design Studio en Pentaho
BI; este modulo está destinado a programadores especializados en lenguaje java, quienes
crearan nuevos módulos “personalizados”, para optimizar el uso de Pentaho BI al interior
de la organización.

6.1.3.3. Iniciando en Design Studio (Guía)

En primer lugar vamos a inicio>todos los programas>PENTAHO BI>Design Tools>Design


Studio.

Se hace clic en Workbench

Emerge la ventana de bienvenida de Pentaho BI Design Studio

UNIVERSIDAD NACIONAL COLOMBIA UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONÓMICAS FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES UNIDAD DE INFORMÁTICA Y COMUNICACIONES
25 26
UNI-FO-02 V 1.0 UNI-FO-02 V 1.0
PENTAHO -BI PENTAHO -BI

Ahora se encontrara en pantalla el área de trabajo

Características de un objeto en programación:

Encapsulamiento: La información hace alusión que un objeto es una entidad compleja


compuesta por varios fragmentos de datos e información que le pertenecen y le permiten
identificarlo, gracias a esto el objeto se comporta como una unidad

Ocultamiento: Hace referencia a la protección de la información en aras de mantener


intacta su totalidad, dejando únicamente una pequeña salida controlada para enviar, recibir
o captar cualquier información.

Mensajes: Es una llamada a un objeto para que responda adecuadamente, se compone de


tres partes la persona que recibe, el mensajero, y el contenido del mensaje.

Objeto receptor
Método invocado
Valor del contenido

Clase: Define la estructura de todos los objetos de un mismo tipo.


Antes de continuar con la descripción de la plataforma es necesario introducir ciertos
conceptos básicos e indispensables para la posterior comprensión de las órdenes a Un programa que es un objeto se caracteriza por:
realizar.

Definición de objeto: un objeto es un elemento una cuestión que existe en la realidad que
puede ser identificado por un conjunto de características que lo diferencian de los demás

Desde el punto de vista de programación: Un objeto es un modelo abstracto de un


elemento real que al implementarlo utilizando estructuras computacionales permite imitar
su comportamiento en una situación dada.

Un programa tiene herencias las cuales se pueden interpretar como:

UNIVERSIDAD NACIONAL COLOMBIA UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONÓMICAS FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES UNIDAD DE INFORMÁTICA Y COMUNICACIONES
27 28
UNI-FO-02 V 1.0 UNI-FO-02 V 1.0
PENTAHO -BI PENTAHO -BI

Un mecanismo de reutilización (diseño a software) Total (public): mensaje a los atributos (eficiencia)
Facilita el mantenimiento y el desarrollo
Ninguno: (prívate) método de la superclase (mantenimiento)
Aprovechar semejanzas de los elementos del mundo
Aprovechar elementos parecidos de las librerías Controlado (protected) solo desde subclase, superclase y métodos que estén en el mismo
Programación por extensión paquete.
Forma de modelar el mundo natural.

Cuando hablamos de herencias simples nos referimos a jerarquías de clases, una clase en
función de otra, especialización, adición de atributos (nuevos caracteres), adicionar
métodos (nuevos procesos).
Este documento explica grosso modo la lógica de la creación de un programa ahora
vamos a crear nuestro primer proyecto; a lo largo de la creación se explicaran otros
términos que no se vieron necesarios para esta primera parte.

En primer lugar vamos a file > new > project

Emerge una ventana preguntado el tipo de proyecto que vamos a ejecutar, en esta
oportunidad vamos a escoger java Project, hacemos clic en next

Cuando hablamos de una herencia múltiple hacemos referencia a la visibilidad o al acceso


de los métodos de una clase tienen a los atributos heredados

UNIVERSIDAD NACIONAL COLOMBIA UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONÓMICAS FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES UNIDAD DE INFORMÁTICA Y COMUNICACIONES
29 30
UNI-FO-02 V 1.0 UNI-FO-02 V 1.0
PENTAHO -BI PENTAHO -BI

Ahora veremos en nuestra pantalla principal al lado izquierdo todos los proyectos que
En la siguiente ventana solo mencionaremos el nombre de nuestro proyecto para este tenemos creados u hemos importado.
caso se llamara proyecto1, si hacemos clic en next (no es de obligatoriedad).

Nuestro siguiente paso radica en crear una clase, una clase como lo mencionamos
anteriormente hace parte de un objeto y utilizando las analogías un paquete es a una clase
como un continente es a un país. Para crear una clase existen varias opciones entre ellas
podemos hacer clic en el botón verde con una c, podemos hacer clic derecho en
proyecto new class

Primera opción:

Podremos definir más particularidades de nuestro proyecto, podremos escoger las


librerías que vamos a utilizar (las librerías son objetos creados por default), los paquetes a
manejar (los paquetes se pueden definir de una forma análoga como el mundo es a un
continente el proyecto es al paquete), hacemos clic en finalizar.

UNIVERSIDAD NACIONAL COLOMBIA UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONÓMICAS FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES UNIDAD DE INFORMÁTICA Y COMUNICACIONES
31 32
UNI-FO-02 V 1.0 UNI-FO-02 V 1.0
PENTAHO -BI PENTAHO -BI

Segunda opción:

Una vez hacemos clic en finalizar encontraremos en nuestra pantalla la programación por
default de la clase primeraclase

Una vez hacemos clic en class emergerá una nueva ventana en donde bautizaremos la
nueva clase para este caso su nombre será primeraclase (sin espacio), es muy aconsejable,
dado que somos principiantes en este tipo de programación habilitar las opciones que se
presentan en el intermedio de la ventana. Hacemos clic en finalizar.

Vamos a programar dos mensajes súper sencillos y a la par explicaremos la existencia de


los tipos de mensajes que se pueden programar uno que es interno y otro que se asemeja
UNIVERSIDAD NACIONAL COLOMBIA UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES UNIDAD DE INFORMÁTICA Y COMUNICACIONES
33 34
UNI-FO-02 V 1.0 UNI-FO-02 V 1.0
PENTAHO -BI PENTAHO -BI

a un MsgBOx de Excel. Vamos a digitar debajo de public static void escribimos debajo el siguiente comando:

System.out.println ("Hola Mundo Soy Nuevo En Este Medio"); JOptionPane.showMessageDialog (null,"Hola Mundo");

Es muy importante utilizar el punto y coma después de cada orden o renglón un tip para Recordamos, utilizando control+ barra espaciadora se agilizara el proceso, y una vez
ahorrarse y escribir todo el código podemos utilizar control+ barra espaciadora terminado el comando encontraremos un punto y coma; si corremos el programa
(aparecerá una ayuda con el comando que posiblemente estamos deseando escribir) encontraremos un mensaje que dice Hola Mundo.

Esta es una orden interna que no la veremos nosotros como usuarios, esta orden solo la
vera el procesador; para correr la programación una vez escrito nuestro comando
podemos hacer clic derecho sobre la programación>run as> java aplication. O podemos
hacer clic en el icono verde q dice run primera clase.

Ahora vamos a aprender cómo crear una ventana para eso vamos a public class
primeraclase y vamos a digitar extends Jframe; este comando nos indica que se creara una
aplicación que tiene como fin un uso local.

Vamos a digitar:

Al correr el código encontramos un mensaje en la parte inferior de la pantalla. Private JPanel panelPrincipal; Æ estamos creando un objeto privado (solo sirve para este
proyecto), para ser más explícitos se creó la ventana principal

Ahora vamos a generar un nuevo mensaje que sea observable por el usuario, para eso

UNIVERSIDAD NACIONAL COLOMBIA UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONÓMICAS FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES UNIDAD DE INFORMÁTICA Y COMUNICACIONES
35 36
UNI-FO-02 V 1.0 UNI-FO-02 V 1.0
PENTAHO -BI PENTAHO -BI

Ahora vamos a crear una variable cadena que contendrá los atributos de nuestra ventana this.setLayout (null);
para eso digitamos:
this.setDefaultCloseOperation (JFrame.EXIT_ON_CLOSE);
Public primeraclase (String nombre) {
this.setContentPane (panelPrincipal);

this.setVisible (true);

A continuación digitaremos súper (nombre); esto tiene como fin crear las características
de nuestra ventana.

Una vez creadas las características del objeto ahora tenemos que crear el objeto mediante
la programación para eso se digita debajo de public static void.
Definiremos las variables, nuestro panel principal será nuestro panel de trabajo actual y
elegiremos el color de fondo de nuestra ventana; para eso digitamos. primeraclase a;

PanelPrincipal = new JPanel (new BorderLayout ()); a = new primeraclase ("mi primera ventana");

panelPrincipal.setBackground (Color.BLACK);

Estos dos últimos renglones me están indicando que la clase primeraclase será un objeto
con el nombre mi primera ventana.
Una vez definido el objeto vamos a generar los atributos de dicho elemento
Toda la programación se consolida en:
Para eso se define ubicación, tamaño, división de la pantalla, clase de operaciones que se
puede hacer con ella (maximizar, tenerla al frente siempre, minimizar, cerrar entre otras)
y si es visible o no; para eso el código a digitar es:

this.setSize (300, 200);

UNIVERSIDAD NACIONAL COLOMBIA UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONÓMICAS FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES UNIDAD DE INFORMÁTICA Y COMUNICACIONES
37 38
UNI-FO-02 V 1.0 UNI-FO-02 V 1.0
PENTAHO -BI PENTAHO -BI

Ahora creamos el nombre de los botones

b1 = new JButton("norte");

b2 = new JButton("este");

b3 = new JButton("centro");

b4 = new JButton("oeste");

b5 = new JButton ("sur");

Y al hacer clic derecho y ejecutar la programación tendremos en nuestra pantalla la


siguiente ventana.

A continuación se generara la ubicación de cada botón digitando

this.panelPrincipal.add (b1, BorderLayout.NORTH);

this.panelPrincipal.add (b2, BorderLayout.EAST);

Ahora vamos a conocer cómo crear divisiones en la pantalla, en primer lugar se dejara this.panelPrincipal.add (b3, BorderLayout.CENTER);
claro que normalmente las divisiones se conocen como los puntos cardinales (norte, sur,
este, oeste y centro) this.panelPrincipal.add (b4, BorderLayout.WEST);

Para eso tenemos que crear cinco botones nuevos con los comandos prívate this.panelPrincipal.add (b5, BorderLayout.SOUTH);

Private JButton b1,b2,b3,b4,b5;

UNIVERSIDAD NACIONAL COLOMBIA UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONÓMICAS FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES UNIDAD DE INFORMÁTICA Y COMUNICACIONES
39 40
UNI-FO-02 V 1.0 UNI-FO-02 V 1.0
PENTAHO -BI PENTAHO -BI

b3 = new JButton (new ImageIcon ("nombredelaimagen.jpg"));

Es importante para este caso que la imagen este contenida en la carpeta donde ubicada el
proyecto

Es importante que al finalizar se diga que las nuevas propiedades son visibles.

El total de la programación seria:

Por último veremos cómo se ejecuta una acción sencilla al hacer clic en cualquiera de los
botones, para eso se implementa un action listener

Public class Leo extends JFrame implements ActionListener

Y en la parte inferior del programa escribimos

Public void actionPerformed (Action Event arg0) {

JOptionPane.showMessageDialog (null,"Hola Mundo");

Al ejecutar tendremos la siguiente ventana Por lo tanto nuestro lenguaje en java queda de la siguiente forma.

Ahora vamos a generar una imagen en la ventana que estamos creando para eso vamos a
modificar el nombre de la ventana del centro y le vamos a dar el siguiente comando

UNIVERSIDAD NACIONAL COLOMBIA UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONÓMICAS FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES UNIDAD DE INFORMÁTICA Y COMUNICACIONES
41 42
UNI-FO-02 V 1.0 UNI-FO-02 V 1.0
PENTAHO -BI PENTAHO -BI

6.1.4. Pentaho Metadata Editor

El Metadata Editor, en su componente cuenta con modelos de diseños y las conexiones


posibles que hay entre ellos.

Para iniciar esta es la Interfax grafica del Metadata.

Al ejecutar este programa tendremos la ventana y al hacer clic emergerá una ventana que
dice hola mundo.

Para iniciar el análisis del Metadata Editor, es necesario crear un modelo de negocios
definido, para esto se va dar click derecho sobre Business Models. Aquí aparece una
pestaña que dice New Business Report.

UNIVERSIDAD NACIONAL COLOMBIA UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONÓMICAS FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES UNIDAD DE INFORMÁTICA Y COMUNICACIONES
43 44
UNI-FO-02 V 1.0 UNI-FO-02 V 1.0
PENTAHO -BI PENTAHO -BI

Se da click izquierdo sobre la pestaña New Business Report, en este momento aparece
una ventana de propiedades de reporte de negocios, con las generalidades como lo es el
nombre, descripción y que restricciones tendrían (estas restricciones hacen referencia a
que roles se restringirán).

Esta ventana se desplega de la barra de herramientas dando click en el concepto editor.

Aquí se elige un concepto y se empiezan a cambiar las propiedades correspondientes.

En este se especifica la variable y se le da un nombre a esta para identificarla en el


proceso.

Se da click en base y al tiempo sale una ventana emergente para cambiar algunos aspectos
de la presentación, como lo es la fuente, el tipo de letra y la alineación.

Esta es la parte que le compete al componente Metadata Segurity, este ítem se caracteriza En esta instancia se ve evidenciado las tablas, columnas, condiciones y orden de la
por la adaptabilidad dependiendo de los que necesita, en un segundo lugar también es información.
visible el servicio, en donde se encuentra la URL, los usuarios o administradores que
tienes permisos y las contraseñas correspondientes. Y en tercer lugar el código que
consta que todo está, hay que tener que en caso de error Pentaho envía un mensaje de
alerta y adicionalmente lo guarda en su repositorio.

UNIVERSIDAD NACIONAL COLOMBIA UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONÓMICAS FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES UNIDAD DE INFORMÁTICA Y COMUNICACIONES
45 46
UNI-FO-02 V 1.0 UNI-FO-02 V 1.0
PENTAHO -BI PENTAHO -BI

Y por último se tiene la base de conexión con la cual se trabaja en la herramienta de


negocios. Es importante no olvidar el lenguaje operacional y por defecto escoger el acceso
nativo (JDBC).

6.1.5. Report Designer

Para crear la Relationships propieties, y desde una tabla se dispone una lista para empezar
un relación de negocios.

Teniendo en cuenta las tablas y columnas destinadas, se podría interconectar una relación
con cada una de las tablas. Entonces se da click en Guess Matching Fields y determinar la
columna para la relación. Se da Ok para cerrar la ventana. Y luego se podrá dibujar las
relaciones y si se desea adicionar las que se consideren necesarias.

La siguiente pestaña es de Locales y en lista todas las variables involucradas en los


modelos de negocios.

UNIVERSIDAD NACIONAL COLOMBIA UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONÓMICAS FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES UNIDAD DE INFORMÁTICA Y COMUNICACIONES
47 48
UNI-FO-02 V 1.0 UNI-FO-02 V 1.0
PENTAHO -BI PENTAHO -BI

Report Designer es una herramienta que cuenta con reportes flexibles y con estilos
empresariales, de escritorios o basados en Web. PENAHO permite comenzar desde
sencillos reportes hasta formar complejos reportes ajustados a las necesidades de En esta primera etapa, se pide elegir un tema de presentación del informe, después de
esto se da siguiente (next).

negocio.

Pentaho Report Designer, tiene dos métodos de generar reportes, uno de ellos es
Pentaho Report Designer y Pentaho Report Desing Wizard, estos se detallaran en el
transcurso del documento. Por defecto PENTAHO trae una base ejemplo en formato JDBC y del cual se escoge la
ultima del nivel (sample query).
Se inicia con la selección de Pentaho Report Desing Wizard

Es una herramienta de diseño de informes, que facilita el trabajo y permite a los usuarios
obtener resultados de forma inmediata. Está destinada a usuarios con menos
conocimientos técnicos.
A través de pasos sencillos permite:

Conectarse a todo tipo de bases relacionales


Integrar el resultado dentro del portal Pentaho

En la siguiente, después de haber seleccionado la base se da sobre y se elige la


opción de My SQL se da sobre verificar y si no tiene ningún error da permiso de uso de la
base de ejemplo.

Al iniciar sale una ventana que cuenta con cuatro pasos para la generación de un reporte.
UNIVERSIDAD NACIONAL COLOMBIA UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES UNIDAD DE INFORMÁTICA Y COMUNICACIONES
49 50
UNI-FO-02 V 1.0 UNI-FO-02 V 1.0
PENTAHO -BI PENTAHO -BI

después de tener ubicado los datos dentro de su concepto.

Es esta ya habiendo escogido el formato de la base de ejemplo aparecen las variables que
tiene la base ejemplo y sencillamente, en la parte inferior, da click al cuadro del máximo
de datos previos, esto depende de la base que se tenga y que se quiera obtener. Este es el reporte previo que se da de acuerdo a las condiciones especificadas
anteriormente.

Se cierra el reporte y se da siguiente y se encuentra en la parte superior de la ventana,


Dando OK en la ventana anteriormente descrita se tiene la relación de los variables y sus
tiene unos ítems a cambiar.
datos, que son compatibles con EXCEL.

Se cierra el reporte en Excel y se da siguiente, y este es el tercer paso, en donde se hace


un selección por grupo y las variables que posiblemente pertenecerían, se da vista previa
UNIVERSIDAD NACIONAL COLOMBIA UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES UNIDAD DE INFORMÁTICA Y COMUNICACIONES
51 52
UNI-FO-02 V 1.0 UNI-FO-02 V 1.0
PENTAHO -BI PENTAHO -BI

Pero si se encuentra en la parte inferior tiene más condiciones que cambiar como la
variable en función del reporte, la alineación del reporte, y otros elementos que se
tendrían en cuenta en el análisis.

Este es el informe después de los ajustes anteriores.

De esta forma, en este caso se ve la selección del formato de la variable a mostrar, si es


numérica, si es moneda o es una fecha.

Al igual que todo documento se puede configurar su página para impresión o para guardar
como archivo, el documento es compatible con varios programas que normalmente se
utilizan.

Y esta es la variable de agregación, que se desea adicional al reporte realizado, puede ser
el promedio, el máximo, el mínimo entre otros datos estadísticos que se consideren
relevantes.

Al dar aceptar y aceptar el proceso de formación del informe, aparece la división del
informe y que datos se pondrían allí.

UNIVERSIDAD NACIONAL COLOMBIA UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONÓMICAS FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES UNIDAD DE INFORMÁTICA Y COMUNICACIONES
53 54
UNI-FO-02 V 1.0 UNI-FO-02 V 1.0
PENTAHO -BI PENTAHO -BI

Lo anterior por parte del proceso de realizar un reporte, pero adicionalmente al panel de
ayuda, Pentaho cuenta su parte derecha con un panel en donde tiene la estructura y los
datos. De igual forma el hecho de insertarla también permite otras opciones como copiado,
pegado, eliminar etc. Comunes de toda operación.
En los datos cuenta con la creación de más bases de datos con las tipologías de JDBC,
Metadata, OLAP, XML, Tablas entre otros.

En este caso se crearon las tablas dentro de DATA SETS, en donde una era de productos Teniendo en cuenta que Pentaho permite incorporar bases de datos, mediante esta
y la otra de precios. herramienta permite incorporar mas funciones, no solo matemáticas, sino de esencia.

Dentro de la plataforma inicialmente es muy frecuente cometer errores de instalación o


O simplemente en vez de realizar una tabla que dentro del sistema, lo puede crear en de manejo, para lo cual Pentaho ha diseñado un reporte de errores cometidos por el
Excel y buscarla e incorporarla, como este caso.
UNIVERSIDAD NACIONAL COLOMBIA UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES UNIDAD DE INFORMÁTICA Y COMUNICACIONES
55 56
UNI-FO-02 V 1.0 UNI-FO-02 V 1.0
PENTAHO -BI PENTAHO -BI

usuario, que se localiza en el fin de la página.

Como se sabe Pentaho es un administrador de información y genera análisis para la ayuda


de toma de decisiones, por tal motivo en la parte de archivo hay una herramienta que
permite publicar el informe vía web y dar permiso a los usuarios que tienen derecho a ver
y analizar sobre ella.

Anteriormente se dieron a conocer la parte de los datos, en esta ventana de estructura


se da a conocer la jerarquización y variables están dentro de otras y cuales son
dependiente y cuales independientes, hay que tener claro que esto son bases de datos de
lo cual se puede concluir que tiene una llave primaria que se conecta una con otra.

Y para terminar el recorrido de cómo realizar un reporte en Pentaho, como ya se había


mencionado con anterioridad, los reportes se pueden observar en varios formatos (PDF,
HTML, RTF, CSV entre otros) que facilitan la tarea de divulgación.

En esta imagen se muestra lo diversidad de herramientas que Pentaho proporciona para la


realización del los informes, entre imágenes, gráficos de diferentes formas, líneas de
tendencias y cajas de dialogo cada una con una especificad.

UNIVERSIDAD NACIONAL COLOMBIA UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONÓMICAS FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES UNIDAD DE INFORMÁTICA Y COMUNICACIONES
57 58
UNI-FO-02 V 1.0 UNI-FO-02 V 1.0
PENTAHO -BI PENTAHO -BI

6.2. CONSOLA DE USUARIOS

Para iniciar la descripción de las herramientas de Pentaho-BI, se debe entender en cuenta


con el software se compone de dos consolas: la primera, la consola “Enterprise Console”
y la segunda “Pentaho User Console”.

Al igual que en la consola, es necesario activar los mismas consolas de comandos de


consola y la database y se da inicio escribiendo la URL http://s5uifce-
06:18080/pentaho/Home .

Esta cuenta con 3 módulos New Reports, New Analysis, y New Dashboard.

En el navegador la ventana a la izquierda superior se encuentra una carpeta llamada Steel


Wheels, la cual contiene análisis, reportes, tablero de herramientas, y tablas. El contenido
de cada una de ellas se observa en la parte inferior de la ventana de la izquierda.

6.2.1. New Report


La Consola de Pentaho funciona después de la instalación se activa desde: el inicio, luego
Pentaho Enterprise Edition, y en Server Management se inicia Star Enterprise Console y
Star database, y posteriormente se utiliza escribiendo la URL http://s5uifce-06:18088/ en
Firefox, y se da inicio escribiendo el login y la contraseña, que en el proceso de instalación
se visualizo es admin, admin en los dos casos.

Para dar inicio a la explicación desde la consola se configuran los roles y los usuarios que
tienen acceso a la plataforma.

La consola cuenta con la Administration, Home, Status, Configuration, utilities, support y


Pentaho Data Integration.

UNIVERSIDAD NACIONAL COLOMBIA UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONÓMICAS FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES UNIDAD DE INFORMÁTICA Y COMUNICACIONES
59 60
UNI-FO-02 V 1.0 UNI-FO-02 V 1.0
PENTAHO -BI PENTAHO -BI

Dentro de la base de datos cuenta con Recurso Humano, Inventarios y Órdenes. Al igual
Y en la parte inferior tiene cuenta con una modificación de formato de presentación entre
que con una secuencia para generar los informes de la siguiente forma:
las que están: HTML, PDF, Excel (2003), RTF y CSV.

En la siguiente pestaña se hace la selección del grupo por Niveles, Detalles y Filtros. Aquí
dependiendo de lo que queremos obtener se escogen, no hay una forma predeterminada.

En este primer instante se selecciona la base con la que se va a trabajar para obtener el
resumen, se tiene la opción de añadir, eliminar o modificar, adicionalmente cuenta con una
ventana conjunta que muestra los detalles, o sea los elementos que contiene la base
seleccionada.

En esta misma pantalla en la parte inferior se encuentra los estilos de plantilla, con una
serie de combinación de colores y formas.

La siguiente ventana es de confirmación de datos en donde muestra las variables para cada
UNIVERSIDAD NACIONAL COLOMBIA UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES UNIDAD DE INFORMÁTICA Y COMUNICACIONES
61 62
UNI-FO-02 V 1.0 UNI-FO-02 V 1.0
PENTAHO -BI PENTAHO -BI

componente del informe, en donde se pueden hacer configuraciones.

En la última pestaña de este componente se encuentra de qué forma se quiere la 6.2.2. New Analysis View
presentación, orientación de la página, tipo y tamaño del informe.

Inicialmente aparece una ventana para seleccionar el esquema del análisis y el cuadrante de
desarrollo de este.
Como se menciono anteriormente puede arrojar informes en Excel.

UNIVERSIDAD NACIONAL COLOMBIA UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONÓMICAS FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES UNIDAD DE INFORMÁTICA Y COMUNICACIONES
63 64
UNI-FO-02 V 1.0 UNI-FO-02 V 1.0
PENTAHO -BI PENTAHO -BI

El software ofrece una base estándar y cuenta con una barra de herramientas, entre las
cuales se encuentra: El Navegador OLAP, el Editor MDX, Tabla OLAP, Mostrar Padres,
Ocultar Repeticiones, Mostrar Propiedades, Suprimir filas y columnas vacías, Intercambiar
Ejes, Detallar Miembro, Abrir Detalle, Entrar en Detalle, Mostrar Datos de Origen,
Mostrar Gráfico, Configurar Gráfico, Configurar Impresión, Exportar a PDF, Exportar a
Excel.

A continuación se observa algunas de estas.

UNIVERSIDAD NACIONAL COLOMBIA UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONÓMICAS FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES UNIDAD DE INFORMÁTICA Y COMUNICACIONES
65 66
UNI-FO-02 V 1.0 UNI-FO-02 V 1.0
PENTAHO -BI PENTAHO -BI

6.2.3. New Dashboard

Cuenta adicionalmente con 6 temas de visualización dentro de la plataforma.

En su última pestaña tiene propiedades que pueden ser añadidas o personificadas.

El Dashboard es el tablero de herramientas, en esta parte se puede se pueden obtener


informes mediante tablas, gráficos, archivos o URL.

En la parte inferior se puede modificar cuantas ventanas de comparación o de información


quiero dentro de la vista, tiene 11 modelos diferentes, entre los modelo disponibles.

UNIVERSIDAD NACIONAL COLOMBIA UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONÓMICAS FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES UNIDAD DE INFORMÁTICA Y COMUNICACIONES
67 68
UNI-FO-02 V 1.0 UNI-FO-02 V 1.0
PENTAHO -BI PENTAHO -BI

7. COSTOS DE INSTALACIÓN 8. EXPERIENCIAS

Pentaho BI es un software libre, por tal motivo no tiene costos de licencias, pero dentro
de la unidad se registran algunos de los componentes que hacen parte de este costo. En el
mundo empresarial los costos registrados son de capacitación y de soporte del software. Requisitos de conocimientos, es necesario tener conocimiento o estar
familiarizado con la administración de sistemas y de operaciones asociadas con
servicios de red.
UNIDAD COMERCIAL Es necesario establecer el nombre de usuario y contraseña para la cuenta de
Precio: Cursos que se dictan: administrador; que Pentaho proporciona para administrar usuarios, las funciones,
las fuentes de datos entre otros.
Computador: $3.200.000 Introducción a Pentaho: $250 USD
El proceso de instalación es demorado, se necesita un computador con capacidad
Personal Investigación: $2.380.000 (9 horas)
mínima de 2 Gb de RAM, libres y disponible para esta función.
Total: $5.580.000 Introducción al análisis Pentaho-BI:
Hubo inconvenientes para el trabajo con la base de información dispuesta por la
$500 USD (9 horas)
plataforma.
Sesión de Pentaho Report Desing.
Se identifico que dentro de las opciones de lenguaje del programa, no está el
$300 USD (4 Sesiones)
idioma español, y se maneja francés, inglés o alemán, lo cual implicaría una
9 Introducción
restricción a personas que desconocen estos idiomas.
9 Diseño de Informes
A pesar que el Pentaho- BI es software libre no significa que sea gratis la licencia y
9 Informes de Parametrización
en el transcurso de la investigación nos dimos cuenta de esto, la licencia caduco a
9 Creación Dinámica de
los 30 días de su instalación inhabilitando el manejo de los módulos. Aunque los
Informes
módulos del servidor siguen en funcionamiento.
Para poder adquirir la licencia se escribió un correo a los distribuidores de
Pentaho-BI, para que nos faciliten la licencia por un tiempo de tres meses, se está
esperando licencia.
Es importante destacar el canal de solución en línea de Pentaho-BI por la
comunidad, este es #pentaho.
Del canal mencionado anteriormente se desprendió el conocimiento de la
Community Edition, que al instalarla presento inconvenientes y errores de
instalación.
A pesar que actué similar a un ERP es necesario tener en cuenta que hay que
configurarse algunos parámetros en las bases de datos, para que funcione de
manera adecuada.

UNIVERSIDAD NACIONAL COLOMBIA UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONÓMICAS FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES UNIDAD DE INFORMÁTICA Y COMUNICACIONES
69 70
UNI-FO-02 V 1.0 UNI-FO-02 V 1.0
PENTAHO -BI PENTAHO -BI

9. CONCLUSIONES

1. Es necesario contar con perfiles dentro del software, para no permitir el uso libre 10. BIBLIOGRAFIA
de la información.

2. Es importante manejar las bases claras para realizar los procesos más rápidos.
1. http://es.wikipedia.org/wiki/Inteligencia_empresarial
2. http://www.ibermatica.com/publicaciones/BusinessIntelligence.pdf
3. Es visible identificar que mediante la utilización del Software, se reducen los costos 3. http://www.monografias.com/trabajos29/sistema-business-intelligence/sistema-
de transacción, de movilización y para obtener resultados en la parte de análisis de business-intelligence.shtml
información. 4. http://www.pentaho.com/services/training/

4. Un semestre es muy poco tiempo para concluir el análisis de la misma. 5. http://eclipse-sdk.softonic.com/


5. El Software en una herramienta para la toma activa de decisiones al interior de la
organización.
6. Es necesario contar con bases de datos, cuentas de seguridad de estas con su
correspondiente contraseña.

7. Es visible que es necesario contar con un buen nivel de manejo de bases de datos
para facilitar el trabajo.

8. Encontramos que Pentaho- BI, es una plataforma extensa, ya que esta compuesta
por 4 módulos que están soportados en la plataforma Business Intelligence.
9. El Software en una herramienta para la toma activa de decisiones al interior de la
organización.
10. El modulo Wiki es uno de los mas prometedores dentro del software, por este
pertenece a la comunidad abierta.
11. Un semestre es muy poco tiempo para concluir el análisis de la misma.

UNIVERSIDAD NACIONAL COLOMBIA UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONÓMICAS FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES UNIDAD DE INFORMÁTICA Y COMUNICACIONES
71 72
UNI-FO-02 V 1.0 UNI-FO-02 V 1.0