Sie sind auf Seite 1von 5

UNIVERSIDAD NACIONAL JORGE BASADRE GROHMANN | FACULTAD DE INGENIERÍA

ESCUELA PROFESIONAL DE INGENIERÍA EN INFORMÁTICA Y SISTEMAS


CURSO: ANALÍTICA DE DATOS
CICLO DE ESTUDIOS: DECIMO | SEMESTRE ACADÉMICO: 2018 - II

PRÁCTICA N° 01: PROCESO ETL


I. CONTENIDO

En la presente práctica se revisa las diferentes opciones que nos brinda la herramienta Kettle para el proceso
de Extracción, Transformación y Carga de Datos para realizar un proyecto de Inteligencia de Negocios.

II. MATERIALES Y EQUIPO

 Herramienta Kettle (Data Integration versión 8.1).


 Distribución Linux o Windows.

III. OBJETIVOS

 Explorar la herramienta Kettle para el proceso ETL en un entorno de Inteligencia de Negocios.


 Complementar la base teórica sobre el proceso ETL como fase para realizar un proyecto de Inteligencia
de Negocios.

IV. DESARROLLO

En clase se desarrolla un ejemplo básico de un proceso ETL.

1. Primero ingresamos al software y creamos un archivo nuevo de tipo Transformation.

2. Seleccionamos la opción Input, y buscamos Microsoft Excel Input.

Docentes: Ing. Arnold Loaiza F.| Ing. Rolando Alvarez C. Página 1 de 5


UNIVERSIDAD NACIONAL JORGE BASADRE GROHMANN | FACULTAD DE INGENIERÍA
ESCUELA PROFESIONAL DE INGENIERÍA EN INFORMÁTICA Y SISTEMAS
CURSO: ANALÍTICA DE DATOS
CICLO DE ESTUDIOS: DECIMO | SEMESTRE ACADÉMICO: 2018 - II

3. Ingresaremos las opciones para seleccionar el tipo de archivo Excel, las hojas del libro Excel que se
desea seleccionar y otros parámetros más.

Docentes: Ing. Arnold Loaiza F.| Ing. Rolando Alvarez C. Página 2 de 5


UNIVERSIDAD NACIONAL JORGE BASADRE GROHMANN | FACULTAD DE INGENIERÍA
ESCUELA PROFESIONAL DE INGENIERÍA EN INFORMÁTICA Y SISTEMAS
CURSO: ANALÍTICA DE DATOS
CICLO DE ESTUDIOS: DECIMO | SEMESTRE ACADÉMICO: 2018 - II

4. Regresamos al menú del lado izquierdo y buscamos Transform, en este caso usaremos la opción Split
Fields para poder dividir un campo del archivo Excel en dos. Rellenamos las opciones de acuerdo a lo
que deseemos.

Docentes: Ing. Arnold Loaiza F.| Ing. Rolando Alvarez C. Página 3 de 5


UNIVERSIDAD NACIONAL JORGE BASADRE GROHMANN | FACULTAD DE INGENIERÍA
ESCUELA PROFESIONAL DE INGENIERÍA EN INFORMÁTICA Y SISTEMAS
CURSO: ANALÍTICA DE DATOS
CICLO DE ESTUDIOS: DECIMO | SEMESTRE ACADÉMICO: 2018 - II

5. Regresamos al menú del lado izquierdo y buscamos Output, en este caso usaremos la opción Table
Ouput. En esta opción nos brinda exportar los datos transformados en varias opciones de
almacenamiento como Sql Server o Mysql.

6. Al final tendremos creado los 3 pasos y unirlos mediante flechas, debemos guardar el archivo con
extensión .ktr

7. Para finalizar hay que ejecutar los pasos, dándole click al botón Run y si todo sale ok, debería indicar
un check de color verde.

Docentes: Ing. Arnold Loaiza F.| Ing. Rolando Alvarez C. Página 4 de 5


UNIVERSIDAD NACIONAL JORGE BASADRE GROHMANN | FACULTAD DE INGENIERÍA
ESCUELA PROFESIONAL DE INGENIERÍA EN INFORMÁTICA Y SISTEMAS
CURSO: ANALÍTICA DE DATOS
CICLO DE ESTUDIOS: DECIMO | SEMESTRE ACADÉMICO: 2018 - II

V. ACTIVIDADES PROPUESTAS (DESARROLLO)

 Realizar un proceso ETL en Kettle. Las opciones de Input, Transform y Output que se utilicen deben ser
diferentes a las usadas en esta práctica.

 En la sección de Fundamento Teórico deben colocar información sobre el proceso ETL que se realiza
para un proyecto de Inteligencia de Negocios.

 Se debe brindar una descripción de los pasos que van realizar para el proceso ETL y también de los
datos que usen.

 Hay una gran cantidad de opciones para seleccionar un origen de datos, mientras más interesante y
tablas tengan mayor puntaje. No se puede usar Archivos Excel o formato csv.

 Hay una gran cantidad de opciones para seleccionar algún Output, en este caso se deben usar las más
conocidas opciones como Mysql, SqlServer , MariaDB, Oracle. Y se puede verificar el funcionamiento
cuando se verifique que al ejecutar los pasos salga el check color verde.

 Todos estos pasos se deben mostrar en el informe con capturas de pantalla y adjuntando archivo
respectivo de kettle con formato .ktr y el archivo de origen de datos (si es grande para el correo un link
externo).

Docentes: Ing. Arnold Loaiza F.| Ing. Rolando Alvarez C. Página 5 de 5