Sie sind auf Seite 1von 6

INFORME DE RED NEURONAL PARA PREDECIR LA CALIDAD DE VINO

Alberca Cubas, Kevin (Código Universitario: 140480-F)


Linares Casas, Kevin Abel (Código Universitario: 140495-C)
Millones Isique, Elvis Eugenio (Código Universitario: 140498-B)
Zorrila Segura, Joel (Código Universitario: 140517-G)
Estudiantes de ingeniería de sistemas – UNPRG – Lambayeque
Curso: Inteligencia Artificial
Docente: Ing. Juan Villegas Cubas

RESUMEN
En el presente informe se muestra la implementación de una red neuronal para predecir la calidad de
vino teniendo como entrada catorce atributos los cuales de manera aleatoria entraran un proceso de
entrenamiento para poder sacar los pesos de cada uno de ellos.

ABSTRACT

In this report we show the implementation of a neural network to predict the quality of wine, with
fourteen attributes as input, which will randomly enter a training process in order to remove the
weights of each of them.

PALABRAS CLAVE
Red Neuronal, Calidad de vino
Inteligencia Artificial. Alberca Kevin, Linares Kevin, Millones Elvis, Zorrilla Joel. UNPRG

1. INTRODUCCIÓN

En este informe, explicamos los pasos que seguimos para construir nuestros modelos para predecir la
calidad del vino tinto en una forma simple no técnica. Estamos tratando solo con vino tinto. Seguiríamos
un proceso similar para el vino blanco o incluso podría mezclarlos e incluir un atributo binario rojo /
blanco, pero nuestro conocimiento del dominio sobre los vinos sugiere que no deberíamos. Obtener
una sensación del conjunto de datos

El primer paso es ver qué tipo de datos tiene a mano: cuántos atributos están disponibles por
instancia, si los atributos están en formato numérico, si se requiere preprocesamiento y más importante
si faltan algunos atributos. El conjunto de datos de vino tinto solo tiene datos numéricos y no hay
atributos faltantes, lo que significa que no hay datos especiales se requiere preprocesamiento.
Explorando nuestros atributos Al explorar los atributos notamos que la mayoría de ellos tienen valores
positivos y los valores de cada atributo tienen una pocos valores en valores positivos extremos altos en
comparación con su media. Esto se trata aplicando el logaritmo función en cada atributo.

Tratamos especialmente la medición de Ácido cítrico porque tiene valores de cero absoluto
primero agregando uno antes de aplicar la función logarítmica. Se espera que estas transformaciones
ayuden a nuestro modelos para aprender más fácilmente. También después de aplicar estas
transformaciones podemos hacer la suposición de gaussiano distribución de nuestros atributos y así
poder normalizarlos eliminando sesgos y escalas. Detección de valores atípicos Incluso después de
nuestro preprocesamiento hay algunos valores que son altamente inesperados en comparación con el
resto del valores del mismo atributo en el conjunto de datos. Llamamos a estos valores atípicos. Estamos
usando una prueba de Tukey que es comúnmente utilizado para detectar valores atípicos.

Observamos tales valores extremos principalmente en azúcar residual y cloruros y solo muy
pocos en pH y sulfatos. Las instancias que tienen valores tan extremos en sus atributos son <5% del
conjunto de datos completo. Decidimos sacrificar y eliminar por completo estas instancias, ya que se
espera que dificulten el aprendizaje. y la puntuación menos precisa.

2. OBJETIVO

El objetivo principal de este trabajo es desarrollar una herramienta basada en redes neuronales que permita
identificar la calidad de vino en base a los catorce atributos de entrada

Explorando nuestro objetivo, la calidad del vino tinto

Tenemos calidad siendo uno de estos valores: [3, 4, 5, 6, 7, 8]. Cuanto mayor sea el valor, mejor será la
calidad. Nuestro conjunto de datos es altamente desequilibrado, ya que tenemos muchos vinos
clasificados con calidades de 5 o 6, mientras que solo muy algunos vinos clasificados son muy malos (3)
o extremadamente buenos (8), lo que se espera. Para compensar En el tiempo de capacitación, estamos
aumentando el número de instancias repitiendo las instancias que corresponden a la minoría. ¿Es esto
una tarea de regresión o una tarea de clasificación?

Prototipo Control Temperatura e iluminación 2 31 de julio del 2018


Inteligencia Artificial. Alberca Kevin, Linares Kevin, Millones Elvis, Zorrilla Joel. UNPRG

Hay modelos que tratarán cada clase del vino por separado y su objetivo es poder y encontrar la decisión
límites que funcionan bien para nuevos datos no vistos. Estos son los clasificadores. Por otro lado,
tenemos modelos que son capaces de predecir los números intermedios y así tener como salida 5.4 o
7.1 en lugar de clases puras. Estas son los regresores. En este proyecto, estamos explorando estos dos
modelos. Además, estamos tomando la suposición que nuestro usuario final está interesado en el
número puro de calidad del vino, por lo que es 5 o 6 o 3. Esto significa que si nuestro regresor produce
3.7 redondearemos al entero más cercano y clasificaremos esta calidad como 4. Cómo evaluar nuestros
modelos Para tomar decisiones automatizadas sobre la selección de modelos, necesitamos cuantificar
el rendimiento de nuestro modelo y otorgarle una puntuacion.

3. DATOS DE ENTRADA
a. Fuente de Datos:
Los datos fueron obtenidos de “The UCI Machine Learning Repository”.

b. Resumen de Datos:

Características del
Multivariado
conjunto de datos:

Características del
Real
atributo:

Tareas asociadas: Clasificación, Regresión

Cantidad de
4898
instancias:

Número de atributos: 12

Tabla N° 1 “Datos de Entrada”


Fuente: Elaboración propia

Prototipo Control Temperatura e iluminación 3 31 de julio del 2018


Inteligencia Artificial. Alberca Kevin, Linares Kevin, Millones Elvis, Zorrilla Joel. UNPRG

c. Información Detallada de Datos:

ATRIBUTO DESCRIPCIÓN
Acidez fija Cifra convencional obtenida por diferencia entre la acidez total y la acidez volátil.
Acidez volátil Se compone de distintos ácidos, en estado libre o compuesto, unos derivados de la uva
(málico, tartárico y cítrico) y otros de los distintos procesos de fermentación (succínico,
acético y láctico).
Ácido cítrico Un ácido orgánico tricarboxílico, presente en la mayoría de las frutas, sobre todo en cítricos
como el limón y la naranja.
Azúcar residual El azúcar de uva se obtiene exclusivamente a partir del mosto de uva. Su adición
Cloruros Son compuestos que llevan un átomo de cloro en estado de oxidación formal -1. Por lo tanto
corresponden al estado de oxidación más bajo
Dióxido de azufre La concentración de SO2 libre y total de SO2 son parámetros importantes para la
libre conservación del vino.
Dióxido de azufre En la elaboración del vino, es importante añadir SO2 es evitar la oxidación. Cuando hay
total oxígeno alrededor, el propio SO2 se oxida antes que los compuestos de fenol presente, y por
lo tanto actúa como consumidor de oxígeno.
Densidad Relación entre la masa y el volumen de una sustancia, o entre la masa de una sustancia y la
masa de un volumen igual de otra sustancia tomada como patrón.
PH Coeficiente que indica el grado de acidez o basicidad de una solución acuosa.
Sulfatos Son las sales o los ésteres del ácido sulfúrico. Contienen como unidad común un átomo de
azufre en el centro de un tetraedro
Alcohol Es un líquido incoloro, de olor característico, soluble tanto en agua como en grasas; se
caracteriza por ser una sustancia psicoactiva
Calidad (puntaje Conjunto de propiedades inherentes a una cosa que permite caracterizarla
entre 0 y 10)
Tabla N° 2 “Descripción Datos”
Fuente: Elaboración propia

Prototipo Control Temperatura e iluminación 4 31 de julio del 2018


Inteligencia Artificial. Alberca Kevin, Linares Kevin, Millones Elvis, Zorrilla Joel. UNPRG

4. ESTRUCTURA RED NEURONAL

a. Capas de Red Neuronal

Grafica N°1 “Red Neuronal”


Fuente: Elaboración propia

b. Neuronas por capas

Capa1: 11 Neuronas

Capa2: 10 Neuronas

Capa3: 10 Neuronas

Capa4: 1 Neurona

c. Conexiones

El número de conexiones entre las neuronas de las capas de entrada y salida, que atraviesan por las dos capas
ocultas

Prototipo Control Temperatura e iluminación 5 31 de julio del 2018


Inteligencia Artificial. Alberca Kevin, Linares Kevin, Millones Elvis, Zorrilla Joel. UNPRG

5. ENTRENAMIENTO

Se hizo el entrenamiento de la red de aprendizaje con un conjunto de datos 319 de un total de 4000 datos
registrados en la data

6. VALIDACIÓN

Se verifico la validación de predicción de la red neuronal con los 101 datos restantes de la data obtenida

Grafica N°2 “Validación Red Neuronal”


Fuente: Elaboración propia

Prototipo Control Temperatura e iluminación 6 31 de julio del 2018

Das könnte Ihnen auch gefallen