Sie sind auf Seite 1von 13

Propuesta de Práctica Académica

Modalidad Trabajo de grado

Identificación del estudiante 1

Nombres y apellidos Marco Tulio Flórez Flórez

Documento de identidad 8363497

Teléfono 321 835 0779

Semestre académico 10

Fecha de entrega de la propuesta

E-mail marcoflorez120@yahoo.es

Identificación del estudiante 2

Nombres y apellidos Julián Esteban Zapata Osorio

Documento de identidad 1.042.770.635

Teléfono 320 714 9135

Semestre académico 10

Fecha de entrega de la propuesta

E-mail juliane.zapata1.@gmail.com

Identificación del asesor interno (U. de A.)

Nombres y apellidos

Teléfono
Oficina

E-mail

• Reconocimiento de la enfermedad de monilia en el fruto del cacao por


medio del aprendizaje profundo y visión por computadora.

1. Introducción

El cacao es una planta cultivada en los campos colombianos, aunque la


implementación del tratado de paz ha significado la introducción de al menos 4
millones más de plantas como parte de los programas de sustitución de cultivos
ilícitos [12], esto se traduce en un gran riesgo ante los agentes patógenos que
atacan al fruto. Como caso específico el hongo de la Moniliophthora que puede
significar un riesgo para el éxito de los programas y de los cultivos dada su
naturaleza fungi; esta infección se contagia por esporas, por lo que se hace
necesario detectar y eliminar los frutos contaminados antes de que el ciclo
reproductivo del hongo se complete y se involucren más frutos [11].

En el presente documento se propone un método para mitigar este riesgo, mediante


la detección de los signos visibles de infección en un fruto enfermo, para brindar un
balance del estado de salud del cultivo y a partir de dicho informe los agricultores
puedan proceder a eliminar los focos de infección manualmente[11], esta
caracterización se pretende hacer mediante el análisis de imágenes y la
implementación de algoritmos con redes neuronales convolucionales(CNN), que,
mediante la conexión de componentes singulares a modo de red, proporcionen una
máquina capaz de ser entrenada y lograr los resultados al comparar los array de
datos que representan las imágenes de frutos en busca de características propias de
la infección.[1][2]. Se implementará la red neuronal convolucional de acuerdo a los
modelos planteados y algunos proporcionados por desarrolladores como Google con
darknet que a partir de una base de datos de imágenes de los frutos, genera un
archivo con los pesos adecuados de los tensores, que posteriormente será
empleado en el análisis de una nueva imagen; posteriormente se harán pruebas
para corroborar que el nivel de efectividad del sistema corresponda al deseado, al
tiempo que se hacen los ajustes pertinentes para optimizar el funcionamiento.[3]

2. Objetivo General

Identificar la enfermedad del monilia en el cacao, por medio de redes neuronales


convolucionales y técnicas de procesamiento de imágenes.

▪ 2.1 Objetivos Específicos

● Reconocer el fruto del cacao en una imagen por medio de redes neuronales
convolucionales, generando una zona de interés para el estudio de la enfermedad
del monilia en la planta.
● Identificar la enfermedad de la molina por diferentes técnicas de
procesamiento de imágenes, generando una alerta que se almacene en un servidor.
● Diseñar plataforma en el servidor por medio de un software libre que permita
la presentación de la información al usuario final.
● Evaluar el dispositivo final por medio de estadística descriptivas que generen
en una prueba controlada.

3. Marco Teórico

◦ 3.1 Cultivo del cacao y sus agentes patógenos

[Caracterización de la enfermedad y cómo se manifiesta en las imágenes]

El manejo adecuado de los cultivos es la garantía de un buen producto, es por esto


que se hace necesario implementar la tecnología que esté el alcance para lograrlo;
la planta es sembrada en el suelo después de una etapa de germinación de 2 o 3
meses, con un traspaso a los 6 u 8 meses de vida en áreas sombreadas que
protejan el suelo y la planta de los efectos de la radiación solar directa, y con
canalizaciones que permitan el flujo del agua a través del cultivo[13]; el valor
adquirido depende del peso de los frutos, siendo estos los que contienen la carga
nutricional de valor.

uno de los agentes patógenos al que deben hacer frente los agricultores es el hongo
de la moniliasis, ante el cual se implementa bien sea tratamiento biológico que
representa agentes contaminantes y el desarrollo de resistencia del hongo, o el otro
método es la remoción de frutos enfermos de manera manual, lo que ha demostrado
que aumenta los rendimientos de las plantaciones al pasar de hacer la purga
mensualmente al realizarlo semanalmente, para ello se hace necesario localizar la
infección en sus etapas tempranas en el individuo y a su vez en el cultivo, buscando
zonas de interés en los límites con zonas donde se encuentra la infección;
normalmente esto significa el aumento de mano de obra, pero al automatizar este
proceso, se hace posible aumentar los rendimientos sin dicho incremento.

Figura 1: manifestación del hongo moniliasis en distintas etapas [15].


◦ 3.2 Detección del fruto del cacao en la planta

Existen técnicas permiten clasificar el contenido de una imagen dándole a la misma


una etiqueta que clasifica su información en diferentes categorías, creando así un
clasificador de imágenes de acuerdo a sus características. Sin embargo, el hecho de
que podamos informar que contenido tiene una imagen no significa que podamos
informar exactamente en qué parte de la imagen se encuentra la zona de interés
(ROI). Los algoritmos simples de clasificación de imágenes solo pueden
proporcionarnos un etiquetado global y una categorización de una imagen, mientras
que las técnicas de aprendizaje profundo pueden proporcionar etiquetas locales de
la imagen, generando así un punto que permita crear una caja contenedora del fruto
del cacao para analizar la enfermedad. Estos métodos de aprendizaje profundo son
especialmente eficaces a la hora de reconocer patrones como los generados por la
infección. [Sustentación de la técnica de aprendizaje profundo]

Para el proceso de segmentación del fruto del cacao, será nuestra ROI, se utilizará
redes neuronales convolucionales (CNN) las cuales cumplen con el esquema de la
figura 2, que se compone de la capa de entrada, la capa convolucional, capa de
agrupación, capa flattening y capa full-connected a la red neuronal, esta conexión
permitirá determinar la posición del fruto del cacao dentro de la imagen digital, por
medio de patrones que presenta este fruto en específico. Las CNN están diseñadas
suponiendo que la entrada a la red es una imagen, lo cual permite codificar ciertas
propiedades en la arquitectura, permitiendo ganar eficiencia y reducir la cantidad de
parámetros usados en la red [4], basándose en tres ideas arquitectónicas para
asegurar cierto grado de aprendizaje que son campos receptivos locales, pesos
compartidos y submuestreo espacial o temporal.

Figura 2: Esquema de una CNN

▪ 3.2.1 Capa de entrada

Esta capa es usada para la especificación de los datos de entrenamiento, donde se


usará imágenes digitales, compuestas por un espacio de color rojo, verde y azul
(RGB), cada uno de los tres colores están representados por un número entero en el
rango de 0 a 255, que indica la cantidad de color que hay. Dado que el valor de píxel
solo necesita estar en el rango [0, 255], normalmente se usa un entero sin signo de
8 bits para representar la intensidad de cada color, luego combinamos estos valores
en una tupla RGB en la forma (rojo, verde, azul) que representan el color en el pixel.
En la figura 3 se representa el espacio RGB y sus umbrales máximos alcanzables en
este espacio.

Normalmente en la capa de entrada se clasifica por categorías, que le permite a la


red neuronal convolucional, aprender de patrones de datos de un objeto específico a
identificar.

Figura 3: Representación del espacio de color RGB [5]

▪ 3.2.2 Capa convolucional

La capa convolucional es una de las capas más importantes de la CNN ya que


reduce la carga computacional del sistema, por medio de campos receptivos locales
que pueden extraer características de la imagen de entrada como bordes orientados,
puntos finales, esquinas o características similares por medio de la convolución de
dos señales [6]. De esta manera, cada neurona oculta solo estará conectada con un
pequeño subconjunto de elementos de la imagen total. Por ejemplo, si hay una
imagen de color donde la altura es 32, el ancho es de 32 y 3 canales se deben
conectar la capa de entrada de una sola neurona, debe haber conexiones de peso
32 × 32 × 3, si agregamos una neurona más en la capa oculta, necesitaremos otra
conexión de peso de 32 × 32 × 3, que se convertirá en un total de 32 × 32 × 3 × 2
parámetros. En este punto se lleva 6144 parámetros de entrar a la red neuronal con
solo dos neuronas que no logran predecir un comportamiento no lineal que presenta
este modelo de entrada. Si se sigue agregando neuronas el costo computacional
será demasiado alto, lo cual hace el modelo sea poco factible para hacer
aplicaciones prácticas. Haciendo la convolución entre imágenes un proceso
obligatorio para el modelo de predicción.

Convolución de dos imágenes: La entrada de una capa convolucional es una


imagen m x m x r, para aplicar un proceso de convolución a esta imagen se le aplica
un filtro de dimensiones n x n x q, generando un resultado que tiene tamaño
(m−n+1) x (m−n+1)x p. Cuando le llega la imagen de entrada a la red, se
superponen el filtro y ésta y se calcula la convolución de dos dimensiones entre los
respectivos elementos de la imagen y el kernel. Una vez se obtiene el resultado de
la operación anterior, se almacena en una posición de la matriz, que se conocerá
como la matriz de activación [4].

El siguiente paso en este proceso es desplazar el filtro una posición a la derecha


sobre la imagen calculando una vez más la convolución, almacenando el resultado
en la siguiente posición de la matriz de activación. Haciendo este proceso de forma
interactiva a lo largo y ancho bajando una unidad a lo largo del borde. Una vez se ha
recorrido toda la imagen se obtiene la matriz de activación completa que contiene las
características que se buscan en la imagen para cada filtro. Este proceso se ilustra
con la figura 4.

Figura 4: Proceso de convolución [7].

Un ejemplo de la descripción de características por medio de un filtro, se puede


ilustrar por medio de la figura 5, la cual posee 4 incisos. En inciso A de la figura 5 se
muestra una figura binaria donde la intensidad de color en cada pixel describe por
medio de blanco o negro, en inciso B de la figura 3 se describe el color blanco por
medio del número 0 y el color negro por medio de un número 1, en el inciso C
describe el kernel que pertenece al espacio de la imagen de entrada y por último en
el inciso D se obtiene el resultado de la convolución donde se resalta con un número
2 las coordenadas donde se encuentra la característica de entrada.

Figura 5: Convolución de una imagen con un filtro de características.

Para determinar el tamaño de salida de una imagen después de hacer el proceso de


convolución con un filtro se utiliza la ecuación (1) [8].

N−F
Q=1+ (1)
S

Donde N es el tamaño de entrada, F es el tamaño del filtro y S es el tamaño del salto


en cada interacción.

Uno de los inconvenientes del paso de la convolución es la pérdida de información


que podría existir en el borde de la imagen, debido a que cuando se desliza el filtro,
nunca tienen la oportunidad de ser vistos. Un método muy simple pero eficiente para
resolver el problema es utilizar relleno cero, haciendo que se pueda utilizar toda la
información de la imagen, pero cuando se aplica este método la ecuación 1 se
convierte en la ecuación 2 donde se tiene el mismo significado matemático.

N +2 P−F
Q=1+ (2)
S

Donde P es el número de capas del relleno cero.

▪ 3.2.3 Capa de agrupación

La idea principal de la agrupación es el muestreo descendente para reducir la


complejidad de otras capas, en la agrupación no afecta la cantidad de filtros. La
agrupación máxima es uno de los tipos más comunes de métodos de agrupación
donde se elige el mayor vecino dentro de un vecindario, junto a la agrupación
promedio donde se elige el valor promedio entre los vecinos de la subregión. Uno de
los tamaños para el vecindario más común es la agrupación es un cuadrado 2 × 2
como se puede ver en la figura 6, donde se realiza la agrupación por medio de
colores y se elige el máximo entre el vecindario [8].

Figura 6: Capa de agrupación en la imagen de características.

▪ 3.2.4 Capa Flatten

La capa flatten es la capa intermedia entre la parte convolucional y la capa full-


connected. Permite pasar la información de una matriz a un vector columna, para ser
procesado posteriormente por las capas que están totalmente interconectadas. Este
proceso se observa mediante la figura 7. [9]

Figura 7: Capa Flatten

▪ 3.2.5 Capa full-connected

En la capa full-conected la red neuronal por medio de una base de datos, la cual
contiene imágenes y una etiqueta indicando a qué clase pertenece cada una de las
imágenes. Durante el entrenamiento, la red intenta clasificar dichas imágenes y en
caso de fallar, ajustará los vectores de pesos asociados a cada una de las neuronas.
El entrenamiento se divide en épocas. Durante cada época se itera sobre el total de
las imágenes, o un subconjunto de ellas, dividiendo cada época en iteraciones de
tiempo más pequeñas conocidas como steps. En cada step se le pasará a la red un
número de imágenes igual a un parámetro conocido como batch size, y por lo tanto
en cada época se utilizarán un número de imágenes igual al batch size multiplicado
por el número de pasos. En nuestra red, utilizaremos el total de las imágenes en
cada época, las cuales se dividirán en tanto steps como permita el batch size [9].

▪ 3.3 Detección de la enfermedad en el fruto

Después de lograr detectar los puntos locales donde se encuentra el fruto de cacao,
es necesario el uso del proceso de cuantificación de una imagen que se llama
extracción de características. El proceso de extracción de características gobierna
las reglas, algoritmos y metodologías que se utiliza para cuantificar de manera
abstracta el contenido de una imagen usando sólo una lista de números, llamada
vector de características. Los descriptores de imagen y los descriptores de
características gobiernan cómo se abstrae y cuantifica una imagen, mientras que los
vectores de características son la salida de los descriptores y se utilizan para
cuantificar la imagen. Para este caso específico se utilizará el histograma de color
que describen la imagen, en elementos sanos y enfermos por medio de métodos
tradicionales de aprendizaje de máquinas, para el desarrollo de este proceso se
utilizará las máquinas de soporte vectorial que son las más populares en la
actualidad. Es importante aclarar que si es necesario utilizar otro descriptor de
imagen se aplicará para que la SVM tenga mejores resultados.

▪ 3.3.1 Histograma de color

La naturaleza de las plantas se expresa en la gran diversidad de tonalidades que


pueden ser encontradas en ellas, es por ello que el análisis del espectro de colores
en el fruto puede representar una importante fuente de información sobre el estado
de salud y demás variables que influyen en ellos; todo esto después de extraer las
características de color y suavizar para provocar mejoras en el histograma de los
datos de entrenamiento y así agruparlas de acuerdo a las características conocidas;
para realizar la búsqueda de la imagen a tratar mediante el aprendizaje adquirido por
la red neuronal [10], de este modo, si fusionamos cada una de las tres componentes
de color de la imagen, previamente umbralizadas y posteriormente coloreadas, cada
píxel habrá sido codificado como un código {Ci,Cj,Ck}. [16].

▪ 3.3.2 Máquinas de soporte vectorial

Un algoritmo de máquinas de soporte vectorial es un algoritmo de aprendizaje


automático que se utiliza frecuentemente para procesos de clasificación y regresión
de dos grupos de datos. Para explicar las SVM, primero debemos comenzar con el
concepto de separabilidad lineal. Un conjunto de datos es linealmente separable si
podemos dibujar una línea recta que separe claramente todos los puntos de datos
en la clase 1 de todos los puntos de datos que pertenecen a la clase 2, en nuestro
caso se pretende clasificar en elementos entre sanos y enfermos [14].
Independientemente de si tenemos una línea, un plano o un hiperplano, esta
separación es nuestro límite de decisión, todos los puntos de datos para una clase
dada se colocan en un lado del límite de decisión, y todos los puntos de datos para
la segunda clase en el otro. La problemática de este algoritmo está en cómo dividir
las clases encontrando una posición óptima del hiperplano de división.
▪ 3.3.3 Algoritmo utilizado para entrenar redes neuronales

La metodología planteada para entrenar una red neuronal parte de la filosofía del
software libre, que implica que hay muchos desarrollos en el que se puede apoyar
una aplicación como la presente, por ejemplo aplicaciones como darknet,
desarrollada por Google, nos brinda una serie de modelos preentrenados con la
capacidad de ser enriquecidos y ajustados con las imágenes propias del problema
planteado; entonces se requiere una serie de imágenes que contienen los frutos a
estudiar, y un tiempo de procesamiento en computadores de alta gama como los
ofrecidos por amazon de manera virtual parta poder realizar el ajuste de los pesos y
así un aprendizaje de máquina sintetizado en un archivo de alrededor de 200MB,
del cual se partirá a la hora de encontrar el objetivo en una imagen, y catalogarlo
entre enfermo o sano. [17]

4. Metodología
Objetivo 1
Reconocer el fruto del cacao en una imagen por medio de redes
neuronales convolucionales, generando una zona de interés
para el estudio de la enfermedad del monilia en la planta

Actividades:
• Proponer un modelo que contenga los parámetros para implementar una
red neuronal.
• Crear una base de datos conformada por 5000 fotos de 6 megapíxeles con
frutos de cacao de plantaciones ubicadas en los municipios de Angostura y
Briceño (Antioquia).
• Someter las imágenes a un pre-procesamiento para aumentar el número de
datos.
• Implementar una red neuronal que reconozca los frutos y los patrones
específicos a partir del aprendizaje supervisado; el backend de esta contiene
librerías de keras y tensorflow y el aprendizaje será alimentado con las fotos
obtenidas.

Objetivo 2
Identificar la enfermedad de la molina por diferentes técnicas de
procesamiento de imágenes, generando una alerta que se
almacene en un servidor.

• Implementar técnicas de regresión como análisis bayesiano, regresión


lineal y máquinas de soporte vectorial, siendo las SVM la técnica más usada en
los últimos tiempos.
• Generar informes, paquetes de datos y seleccionar protocolos para
comunicaciones.

Objetivo 3
Diseñar plataforma en el servidor por medio de un software libre
que permita la presentación de la información al usuario final.
• Implementar un servidor y transmitir la información hasta él.

Objetivo 4
Evaluar el dispositivo final por medio de estadística descriptiva,
y así generar una prueba controlada.

● Hacer pruebas en un entorno controlado que permita hacer una base de


datos que descriptiva del funcionamiento del dispositivo.
● Presentar un informe detallado por medio de estadística descriptiva.

◦ 5. Cronograma de Actividades
Semana → 1 3 4 5 6 7 8 9 10 11 12 14
2 13
Objetivo Actividad ↓

x x x
Proponer modelo

x x x
Adquirir base de datos
1
Implementar red neuronal x x x x x
Clasificar los frutos entre sanos y no x x x x
2
Generar informes x x

3 Implementación de servicio remoto x x x

4 Hacer pruebas x x x x x x x
Exposición x

◦ 6. Resultados Esperados

Al desarrollar el trabajo de grados se espera un algoritmo capaz de acertar en un


porcentaje significativo la presencia de una infección específica. una vez analizada
se trasmitirá a un servidor que presente la información sintetizada al usuario (front
end) y de este modo entregar un análisis a los cultivadores del cacao y a las
comunidades agrícolas, que sirva para abordar la problemática biológica.

◦ 7. Presupuesto
Item Cantidad Valor/unidad Total
1 $ 300000 $300000
cámara fotográfica

2 $ 800000 $1600000
Computador con
sistema operativo
linux

400 horas $35.09 /hora $14036


Servicio de
computación remota

◦ 8. Referencias bibliográficas

[1] .[Qihao Weng, Ph.D.,. An Introduction to Contemporary Remote Sensing. Digital


Image Analysis, Chapter (McGraw-Hill Education: New York, Chicago, San
Francisco, Lisbon, London, Madrid, Mexico City, Milan, New Delhi, San Juan, Seoul,
Singapore, Sydney, Toronto, 2012).
https://aplicacionesbiblioteca.udea.edu.co:2612/content/book/9780071740111/chapt
er/chapter8]

[2] [S. Khobragade, A. Tiwari, C. Y. Patil and V. Narke, "Automatic detection of major
lung diseases using Chest Radiographs and classification by feed-forward artificial
neural network," 2016 IEEE 1st International Conference on Power Electronics,
Intelligent Control and Energy Systems (ICPEICES) , Delhi, 2016, pp. 1-5.

doi: 10.1109/ICPEICES.2016.7853683, URL:


http://aplicacionesbiblioteca.udea.edu.co:2487/stamp/stamp.jsp?
tp=&arnumber=7853683&isnumber=7853053

[3]P. Korbel and K. Slot, "CNN-based object recognition with deformable grids and
multiple-feature image representation," 2005 9th International Workshop on Cellular
Neural Networks and Their Applications, Hsinchu, Taiwan, 2005, pp. 65-68. doi:
10.1109/CNNA.2005.1543162, URL:
http://aplicacionesbiblioteca.udea.edu.co:2487/stamp/stamp.jsp?
tp=&arnumber=1543162&isnumber=32957

[4] Durán Suárez, J. (2017). Redes neuronales convolucionales en R:


Reconocimiento de caracteres escritos a mano.

[5] Gil, P., Torres, F., & Ortiz Zamora, F. G. (2004). Detección de objetos por
segmentación multinivel combinada de espacios de color.

[6]LeCun, Y., Bottou, L., Bengio, Y., & Haffner, P. (1998). Gradient-based learning
applied to document recognition. Proceedings of the IEEE, 86(11), 2278-2324.

[7] http://www.diegocalvo.es/red-neuronal-convolucional/
[8] Calatayud Giner, J. (2019). Aplicación de métodos de machine learning a la
espectroscopía de protones acelerados por láser (Doctoral dissertation).

[9]J. OOI, L. C. TAY and W. K. LAI, "Bottom-hat filtering for Defect Detection with
CNN Classification on Car Wiper Arm," 2019 IEEE 15th International Colloquium on
Signal Processing & Its Applications (CSPA), Penang, Malaysia, 2019, pp. 90-95.

doi: 10.1109/CSPA.2019.8696080, URL: http://ieeexplore.ieee.org/stamp/stamp.jsp?


tp=&arnumber=8696080&isnumber=8695971

[10][J. Kang and W. Zhang, "An Approach for Image Thresholding Using CNN
Associated with Histogram Analysis," 2009 International Conference on Measuring
Technology and Mechatronics Automation, Zhangjiajie, Hunan, 2009, pp. 421-424.

doi: 10.1109/ICMTMA.2009.311, URL:


http://aplicacionesbiblioteca.udea.edu.co:2487 /stamp/stamp.jsp?
tp=&arnumber=5203002&isnumber=5202890

[11]Krauss, U., ten Hoopen, M., Hidalgo, E., Martínez, A., Arroyo, C., García, J., ... &
Sánchez, V. (2003). Manejo integrado de la moniliasis (Moniliophthora roreri) del
cacao (Theobroma cacao) en Talamanca, Costa Rica. Agroforestería en las
Américas, 10(37-38), 52-58.

[12]Sierra Pérez, D. C. El cacao como producto líder en la sustitución de cultivos


ilícitos en el proceso de posconflicto.

[13]Quiroz, J., & Mestanza, S. (2012). Establecimiento y manejo de una plantación


de cacao. INIAP Archivo Historico.

[14] http://numerentur.org/svm/

[15] W. Phillips-Mora Consultado el 19 de diciembre del 2019. CropLife-Revista.


Disponible en: https://www.croplifela.org/es/plagas/listado-de-plagas/moniliasis-del-
cacao

[16] P. Gil, F. Torres, F.G. Ortiz, DETECCIÓN DE OBJETOS POR SEGMENTACIÓN


MULTINIVEL COMBINADA DE ESPACIOS DE COLOR, Universidad de Alicante.

[17] Brownlee Jason, Deep Learning for Computer Vision

◦ Visto bueno del asesor

Como asesor conozco la propuesta y avalo el contenido de la misma.

Nombre del asesor interno Firma del asesor interno


C.C.

Das könnte Ihnen auch gefallen