Redes Neruorlnales

Trabajo de Investigacion.
Redes Neuronales Articiales.

Cellular Neural Networks.
Erick Lopez Ovando
2273009-6
elopez21@gmail.com
Resumen
El presente documento muestra un nuevo tipo de redes neuronales articiales que data de hace poco
menos de 20 a nos, las Redes Neuronales Celulares. Se comienza con un repaso de terminos basicos,
los cuales seran utilizados posteriormente a lo largo del informe. Posteriormente, se estudiara a grandes
rasgos los origenes de las redes neuronales celulares (de ahora CNN, por sus siglas en ingles), el Automata
Celular y las Redes Neuronales Articiales. Continuando con el primer modelo de un CNN presentado
por Chua y Yang en 1988, y su representacion matematica. Siguiendo con 2 variantes del 1
o
modelo (un
2
o
modelo propuesto por los mismo autores, chua y Yang, en el mismo articulo que presentaron el CNN; y
un 3
o
modelo presentado por Harrer). Para nalizar, se presentara una aplicacion del CNN y los trabajos
enfocados ultimamente, de los cuales nace un interes mayor por el hecho de lograr inferencias de patrones
de distintos tipos y dimensionalidad, proporcionado por un aprendizaje automatico del mismo.
1. Introduccion
El entendimiento de los fenomenos que nos rodean, poder adelantarse ante los hechos, comprender el com-
portamiento de los demas, etc., es conocimiento que nos permite tomar mejores decisiones en el da a da.
Los fenomenos que nos rodean, los cuales, somos partes de ellos o interactuamos con estos, y que a su vez,
dependen de los otros participantes y factores (internos y/o externos); y ademas, se modican a travez
del tiempo, son llamados Sistemas Dinamicos. Entonces, la comprension de sistemas dinamicos nos permite
conocimiento muy valioso y de gran interes, no obstante, la comprension de estos sistemas es muy complicado
y a su vez, los modelos matematicos desarrollados tambien son complicados. Por esto, y con la evolucion de
la tecnologa, se han desarrollado nuevos modelos y que son mas factibles de usarlos con el computador. En
los proximos capitulos se abordarn los fundamentos de un nuevo modelo, para continuar con la presentacion
del mismo y nalmente sus aplicaciones.
2. Conceptos Basicos
2.1. Sistemas Dinamicos
Un sistema dinamico es un sistema que presenta un cambio o evolucion de su estado en un tiempo, el
comportamiento en dicho estado se puede caracterizar determinando los lmites del sistema, los elementos
y sus relaciones; de esta forma se puede elaborar modelos que buscan representar la estructura del mismo
sistema.
Para elaborar un modelo, se debe tener en cuenta:
Un sistema esta formado por un conjunto de elementos en interaccion
El comportamiento del sistema se puede mostrar a traves de diagramas causales.
Hay varios tipos de variables: variables exogenas (son aquellas que afectan al sistema sin que este las
provoque) y las variables endogenas (afectan al sistema pero este s las provoca).
1
Un ejemplo de un sistema dinamico se puede ver en una especie de peces que se reproduce de tal forma que
este a no la cantidad de peces es X
k
, el a no proximo sera X
k+1
.
2.1.1. Tipos de Sistemas
Un sistema dinamico se dice discreto si el tiempo se mide en peque nos lapsos; estos son modelados como
relaciones recursivas, tal como la ecuacion logstica:
x
t+1
= ax
t
(1 x
t
) (1)
donde t denota los pasos discretos del tiempo y x es la variable que cambia con este.
Si el tiempo es medido en forma continua, el sistema dinamico continuo resultante es expresado como una
ecuacion diferencial ordinaria; por ejemplo:
x
t
= ax(1 x) (2)
donde x es la variable que cambia con el tiempo t. La variable cambiante x es normalmente un n umero real,
aunque tambien puede ser un vector en R
k
.
2.1.2. Sistemas lineales y no lineales
Entre los sistemas dinamicos se distinguen los lineales y no lineales. En los sistemas lineales, el lado derecho
de la ecuacion es una expresion que depende en forma lineal de x, tal como:
x
n+1
= 3x
n
Por otro lado, los sistemas dinamicos no-lineales tienen una dependencia de grado mayor, y por lo tanto,
son mas difciles de analizar y a menudo exhiben un fenomeno conocido como caos, con comportamientos
totalmente impredecibles.
2.1.3. Comportamiento de sus estados
Los sistemas dinamicos se pueden clasicar basicamente en 3 clases:
Estables
Inestables
Caoticos
Un sistema estable tiende, seg un transcurre el tiempo, a un punto u orbita, seg un su dimension (atractor).
Un sistema inestable se escapa de los atractores, y un sistema caotico maniesta los dos comportamientos.
Por un lado, existe un atractor por el cual el sistema se ve atrado, pero a la vez, hay fuerzas que lo alejan
de este. De esa manera, el sistema permanece connado en una zona de su espacio de estados, pero sin tender
a un atractor jo.
2.1.4. Representacion de un Sistema
Para comprender un sistema, hay que entender la evolucion de sus estados, es por esto que el modelamiento
de los mismos esta enfocado a explicar los estados en un determinado tiempo y estos, como se ha observa-
do, dependen de muchos factores y de los mismo estados en un instante de tiempo anterior. Por lo tanto,
matematicamente, la representacion de un sistema dinamico (modelamiento) es una ecuacion de diferencias
(en caso discreto, ecu. (1)) o una ecuacion diferencial (en caso continuo, ecu. (2)).
Tambien es posible representar un sistema dinamico gracamente, con un diagrama de estados. En la gura
1 muestra un diagrama de un sistema que cuenta con 5 atractores.
Figura 1: Diagrama de Estados
2.2. Sistema Complejo
Un sistema complejo es un sistema compuesto por varias partes interconectadas o entrelazadas cuyos vnculos
contienen informacion adicional y oculta al observador. Como resultado de las interacciones entre elemen-
tos, surgen propiedades nuevas que no pueden explicarse a partir de las propiedades de los elementos aislados.
Hay que tener presente la diferencia entre un sistema complejo y complicado. Es ultimo, en contraposicion
al complejo, tambien esta formado por varias partes pero los enlaces entre estas no a naden informacion
adicional. Nos basta con saber como funciona cada una de ellas para entender el sistema.
2.2.1. Caracteristicas
Comportamiento difcilmente predecible: Debido a la enorme complejidad de estos sistemas
la propiedad fundamental que los caracteriza es que poseen un comportamiento impredecible. Solo
somos capaces de prever su evoluci on futura hasta ciertos lmites, siempre suponiendo un margen de
error muy creciente con el tiempo. Para realizar predicciones mas o menos precisas de un sistema
complejo frecuentemente se han de usar metodos matematicos como la estadstica, la probabilidad o
las aproximaciones numericas como los n umeros aleatorios.
Emergencia: Este concepto es el que relaciona el todo con las partes. Se llama complejidad emergente
cuando el comportamiento colectivo de un conjunto de elementos da como resultado de sus interacciones
un sistema complejo. Por otro lado tambien existe la idea de simplicidad emergente. Esto es cuando a
partir de una serie de sistemas complejos surge un sistema simple. El ejemplo mas claro es el Sistema
Solar que surge a partir de sistemas complejos como los planetas y el Sol.
Autoorganizacion: Todo sistema complejo emerge a partir de sus partes y uctua hasta quedar
fuertemente estabilizado en un atractor. Esto lo logra con la aparicion de toda una serie de retroali-
mentaciones (o realimentaciones) positivas y negativas que aten uan cualquier modicacion provocada
por un accidente externo.
Las interrelaciones estan regidas por ecuaciones no-lineales: El modelamiento no dan como
resultado vectores, ni pueden superponerse unas con otras. Normalmente todas ellas pueden expresarse
como una superposicion de muchas ecuaciones lineales. Pero ah reside justamente el problema. Solo
se pueden tratar de forma aproximada, cosa que lleva a la imposibilidad de prediccion con precision.
Por otra parte tales ecuaciones suelen tener una fuerte dependencia con las condiciones iniciales del
sistema lo que hace a un mas difcil evaluar su comportamiento.
Es un sistema abierto y disipativo: La energa y materia uyen a traves suyo. Pues justamente
un sistema complejo, en gran medida se puede considerar como una maquina de generar orden para lo
cual necesita del aporte energetico constante que ya hemos comentado.
Es un sistema adaptativo: Un sistema autoorganizado es capaz de reaccionar a estmulos externos
respondiendo as ante cualquier situacion que amenace su estabilidad como sistema. Experimenta as,
uctuaciones. Esto tiene un lmite, naturalmente. Se dice que el sistema se acomoda en un estado y
que cuando es apartado de el tiende a hacer todos los esfuerzos posibles para regresar a la situacion
acomodada.
2.3. Teora del Caos
La Teora del Caos es la denominacion de la rama de las matematicas y la fsica que trata ciertos tipos de
comportamientos impredecibles de los sistemas dinamicos.
Una de las mayores caractersticas de un sistema inestable es que tiene una gran dependencia de las condi-
ciones iniciales. De un sistema del que se conocen sus ecuaciones caractersticas, y con unas condiciones
iniciales jas, se puede conocer exactamente su evolucion en el tiempo. Pero en el caso de los sistemas
caoticos, una mnima diferencia en esas condiciones hace que el sistema evolucione de manera totalmente
distinta.
2.3.1. Movimiento caotico
Para poder clasicar el comportamiento de un sistema como caotico, el sistema debe tener las siguientes
propiedades:
Debe ser sensible a las condiciones iniciales
Debe ser transitivo
Sus orbitas periodicas deben ser densas
Sensibilidad a las condiciones iniciales signica que dos puntos en tal sistema pueden moverse en trayectorias
muy diferentes en su espacio de fase incluso si la diferencia en sus conguraciones iniciales son muy peque nas.
El sistema se comportara de manera identica solo si sus conguraciones iniciales fueran exactamente las
mismas.
La sensibilidad a las condiciones iniciales esta relacionada con el exponente Lyapunov. El exponente Lya-
punov es una cantidad que caracteriza el radio de separacion de trayectorias innitesimalmente cercanas.
La Transitividad signica que la aplicacion de las transformaciones de cualquier intervalo dado I
1
se expanden
hasta que se superpone con otro intervalo dado I
2
, o equivalentemente que hay condiciones iniciales cuyas
orbitas son densas.
2.3.2. Atractores Extra nos
El movimiento caotico esta ligado a lo que se conoce como atractores extra nos, atractores que pueden lle-
gar a tener una enorme complejidad como, por ejemplo, el modelo tridimensional del sistema climatico de
Lorenz, que lleva al famoso atractor de Lorenz. El atractor de Lorenz es, quiza, uno de los diagramas de
sistemas caoticos mas conocidos, no solo porque fue uno de los primeros, sino tambien porque es uno de los
mas complejos y peculiares, pues desenvuelve una forma muy peculiar mas bien parecida a las alas de una
mariposa.
Los atractores extra nos estan presentes tanto en los sistemas continuos dinamicos (tales como el sistema de
Lorenz) como en algunos sistemas discretos (por ejemplo el mapa H`enon).
3. Automata Celular
Un Automata Celular (A.C.) es un modelo matematico que modela a un sistema dinamico que evoluciona en
pasos discretos. Es adecuado para modelar sistemas naturales que puedan ser descritos como una coleccion
masiva de objetos simples que interact uen localmente unos con otros. Son sistemas descubiertos dentro del
campo de la fsica computacional por John von Neumann en la decada de los 50s. La teora de los automatas
celulares inicia con su precursor John von Neumann a nales de los a nos 40s con su libro Theory of Self-
reproducing Automata (editado y completado por A. W. Burks). Aunque John von Neumann puso en
practica los A.C. estos fueron concebidos en los a nos 40s por Konrad Zuse y Stanislaw Ulam. Zuse penso en
los espacios de computo (computing spaces), como modelos discretos de sistemas fsicos. Los aportes de
Ulam vinieron al nal de los 40s poco despues de de haber inventado con Nicholas Metropolis el Metodo de
Monte Carlo.
3.1. Descripcion
Los AC son modelos en los cuales el espacio, el tiempo, y los elementos del conjunto de estados del sistema,
son discretos. Ademas el conjunto de estados posibles es nito, y por lo general peque no.
Un A.C. consiste de:
Una rejilla o cuadriculado de enteros (conjunto Z) innitamente extendida, y con dimension d Z
+
,
donde cada celda de la cuadrcula se conoce como celula.
Cada celula puede tomar un valor en Z a partir de un conjunto nito de estados k.
Cada celula ademas se caracteriza por su vecindad, un conjunto nito de celulas en las cercanas de la
misma.
De acuerdo con esto, se aplica a todas las celulas de la cuadrcula, una funcion de transicion (f) que
toma como argumentos los valores de la celula en cuestion y los valores de sus vecinos, y regresa el
nuevo valor que la celula tendra en la siguiente etapa de tiempo. Esta funcion f se aplica, como ya se
dijo, de forma homogenea a todas las celulas, por cada paso discreto de tiempo.
Figura 2: Tipos de Automatas bidimensionales
3.2. Funcion de Transicion
Sea un AC de arreglo bidimensional M N, donde C(k,l) dene la celula en la posicion (k,l).
C
t+1
= (N
r
(t))
donde N
r
dene la vecidad de tama no r
N
r
= {C(k, l)|max{|k i|, |l j|} r, 1 k M, 1 l N}
Entonces, (.) es la funcion de transicion y dene el proximo estado de la celula en funcion de su vecindad.
3.3. Vecindad
Como se mostro en la seccion anterior, la vecindad una celula esta denida por las celulas que rodean a la
primera, es decir:
N
r
= {C(k, l)|max{|k i|, |l j|} r, 1 k M, 1 l N}
Figura 3: Vecindad de AC. a) 1-vecindad. b) 2-vecindad
Para un mejor entendimiento, podemos observar gracamente la vencidad de un automata celular bidimen-
sional.(Ver Figura 3)
En el primer caso, observamos una vecindad de tama no 1, denominado 1-vecindad; en el segundo caso, la
vecindad es de tama no 2 (2-vencidad). Generalmente una vecindad de tama no r, se denomina r-vencindad.
3.4. Condiciones de Frontera
Por denicion, un A.C. consiste de una arreglo innito de enteros. Sin embargo, para cuestiones practicas
(modelos de sistemas fsicos, llevados a cabo en ordenadores de memoria nita), se requiere tomar ciertas
consideraciones a la hora de implementar un A.C. Es por ello que la denicion original se modica para
dar cabida a los arreglos nitos en donde las celulas del A.C. interact uen. Esto conlleva a la consideracion
extra de lo que debe de suceder con aquellas celulas que se encuentren en los bordes del arreglo, es decir,
condiciones de frontera.
Dentro del ambito de los A.C., se pueden implementar numerosas condiciones de frontera, de acuerdo a lo
que el problema real requiera para su modelado. Por ejemplo:
Frontera abierta. Se considera que fuera del arreglo residen celulas, todas con un valor jo. Por
ejemplo, en el caso particular del juego de la vida y de otros A.C. con dos estados en su conjunto
k, una frontera se dice fra si las celulas fuera de la frontera se consideran muertas y caliente si se
consideran vivas.
Frontera periodica. Se considera al arreglo como si sus extremos se tocaran. En un arreglo de
dimension 1, esto puede visualizarse en dos dimensiones como una circunferencia. En dimension 2, el
arreglo podra visualizarse en tres dimensiones como un toroide.
Frontera reectora. Se considera que las celulas fuera del arreglo reejan los valores de aquellas
dentro del arreglo. As, una celula que estuviera junto al borde del arreglo (fuera de ella) tomara como
valor el de la celula que este junto al borde del arreglo, dentro de ella.
Sin frontera. Haciendo uso de implementaciones que hagan crecer dinamicamente el uso de memoria
del arreglo implementado, se puede asumir que cada vez que las celulas deben interactuar con celulas
fuera del arreglo, esta se hace mas grande para dar cabida a estas interacciones. Obviamente, existe un
lmite (impuesto por la memoria disponible) para esta condicion. Es muy importante no confundir esta
condicion de frontera con la denicion original de A.C. cuyo arreglo es inicialmente innito. En el caso
de un A.C. sin frontera, el arreglo comienza con un tama no denido y nito, y conforme se requiera va
creciendo en el tiempo, lo cual no lo hace necesariamente un modelo mas cercano a la realidad, pues si
se inicializara el arreglo aleatoriamente, con esta condicion solo se pueden inicializar las celulas dentro
del arreglo inicial nito, mientras que en el caso de la denicion original, en teora todas las celulas del
arreglo innito deberan ser inicializadas.
3.5. Clasicacion de Wolfram
Stephen Wolfram ha realizado numerosas investigaciones sobre el comportamiento cualitativo de los A.C.
Con base en su trabajo sobre AC unidimensionales, con dos o tres estados, sobre conguraciones periodicas
que se presentan en el A.C., observo sus evoluciones para conguraciones iniciales aleatorias. As, dada una
regla, el A.C. exhibe diferentes comportamientos para diferentes condiciones iniciales.
De esta manera, Wolfram clasico el comportamiento cualitativo de los A.C. unidimensionales en las sigu-
ientes clases:
Clase I. La evolucion lleva a una conguracion estable y homogenea, es decir, todas las celulas terminan
por llegar al mismo valor.
Clase II. La evolucion lleva a un conjunto de estructuras simples que son estables o periodicas.
Clase III. La evolucion lleva a un patron caotico.
Clase IV. La evolucion lleva a estructuras aisladas que muestran un comportamiento complejo (es
decir, ni completamente caotico, ni completamente ordenado, sino en la lnea entre uno y otro, este
suele ser el tipo de comportamiento mas interesante que un sistema dinamico puede presentar).
3.6. Aplicaciones
Los automatas celulares pueden ser usados para modelar numerosos sistemas fsicos que se caractericen por
un gran n umero de componentes homogeneos y que interact uen localmente entre s. De hecho, cualquier
sistema real al que se le puedan analogar los conceptos de vecindad, estados de sus componentes y
funcion de transicion es candidato para ser modelado por un A.C.
Las caractersticas de los automatas celulares haran que dichos modelos sean discretos en tiempo, espacio o
ambos (dependiendo de la variante de la denicion de A.C. que se use). Algunos ejemplos de areas en donde
se utilizan los automatas celulares son:
Modelacion de ujo de transito vehicular y de peatones.
Modelacion de uidos (gases o lquidos).
Modelacion de la evolucion de celulas o virus como el VIH.
Modelacion de procesos de precolacion.
Procesamiento de imagenes.
Y algunos automatas celulares desarrollados que se encuentran en la literatura, de los cuales podemos citar:
Juego de la Vida de Conway.
Modelo Nagel-Schreckenberg.
Automata de Modelo Electromagnetico
El programa Celulas de Peter Donnelly
Los mundos de Pixel
Hormigas y Plantas
Etc.
4. Redes Neuronales Articiales
Una red neuronal articial es un modelo matematico inspirado en la estructura de las redes neuronales bi-
ologicas y en como procesan la informacion. Estos modelos estan formados por unidades simples, llamadas
neuronas, que se conectan entre s y se disponen en capas. En casi todas las redes neuronales hay una capa
de entrada que recibe la informacion y una capa de salida encargada de trasmitir la informacion procesada
al exterior y puede haber una o varias capas ocultas encargadas de establecer relaciones complejas. Las
conexiones entre las neuronas indican la direccion y el sentido en el que uye la informacion. En general una
Red Neuronal Articial es un sistema paralelo, distribuido y adaptativo.
Existen muchos tipos de redes neuronales, cuando el objetivo es predecir el valor futuro de una serie temporal,
las mas utilizadas son las redes multicapa hacia delante (MultiLayer Perceptron - MLP), en las que la
informacion que llega a cada nodo procede de los nodos de la capa anterior; y las redes recurrentes, en las
que informacion procesada en la capa oculta o en la capa de salida se toma nuevamente como informacion
en la capa de entrada.
Figura 4: Arquitectura de una Red Neuronal Feedforward
La informacion que llega a una neurona j de la capa oculta es
4
i=1
ij
x
i
+
0j
=
j
x +
0j
donde el vector
j
recoge los pesos de las conexiones entre las unidades de la capa de entrada y la neurona j de la capa
oculta. En cada una de las neuronas de la capa oculta se aplica una funcion no lineal , llamada funcion
de activacion, y (
j
x +
0j
) la informacion que parte de la unidad oculta j hacia la neurona de salida. La
informacion total que llega a la neurona de salida es
a
0
+
6
j=1
a
j
(
j
x +
0j
)
y el resultado de aplicar una funcion de activacion F correspondiente a esta neurona es
F
_
_
a
0
+
6
j=1
a
j
(
j
x +
0j
)
_
_
Cuando la funcion de activacion de las neuronas de la capa oculta es la logstica o la tangente hiperbolica,
la red recibe el nombre de MLP. En general, la funcion de activacion F es la identidad, aunque es posible
utilizar otra funcion dependiendo de la naturaleza de los datos, y se considera que todos los nodos de la capa
oculta tienen la misma funcion de activacion. En general una red MLP con q neuronas en una capa oculta,
una capa de entrada con m neuronas y una neurona en la capa de salida se escribe como
h(x, ) = F
_
_
a
0
+
6
j=1
a
j
(
j
x +
0j
)
_
_
donde x R
m
y R
(m+2)q+1
.
En forma general, las redes neuronales se pueden clasicar dependiendo de la naturaleza de su entrada
(continua o binaria) y del tipo de aprendizaje a utilizar, ademas de la arquitectura presente.
Figura 5: Clasicacion de las Redes Neuronales Articiales
5. Redes Neuronales Celulares
Las Redes Neuronales Celulares (RNCs) nacen en el Laboratorio de la Universidad de California en Berkeley;
producto de la mente de Leon O. Chua como una nueva arquitectura de circuito, en el a no de 1987; pero no
fue sino hasta 1988 cuando publica su trabajo de manera conjunta con L. Yang como un par de artculos en
los que presentan la teora [1] as como las primeras aplicaciones [2].
Figura 6: Arquitectura del Circuito propuesto por Chua & Yang
El autor deja ver en el nombre de su teora de manera clara, cuales fueron los fundamentos que le permitieron
forjar su idea. Basicamente son dos las bases que le sirvieron de sustento: las redes neuronales articiales
(RNAs), y los automatas celulares (ACs); de las primeras heredaron su capacidad para el procesamiento
asncrono en paralelo, la dinamica en tiempo continuo y la interaccion global de los elementos de la red;
mientras que de los AC obtuvieron su estructura, o en otras palabras, la idea de distribuir sus elementos de
procesamiento (tambien llamadas celulas) en rejillas regulares y permitir que la comunicacion de cada celula
con las otras se llevara a cabo a nivel local.
Al igual que con sus antecesores (las RNAs), los trabajos no se han concentrado en una area en particular y
es por lo anterior que se observan aplicaciones en procesamiento de imagenes; simulacion de modelos com-
plejos, de manera particular en biologa; encriptacion de datos; o por otro lado, avances teoricos, como los
que permiten la obtencion de los parametros (pesos) que requiere la RNC; extensiones que permiten el uso
de parametros no lineales; por mencionar algunos.
A nivel conceptual un trabajo que marca la historia de estas redes, es el que prueba la universalidad de una
maquina denida mediante una RNC en el sentido de la maquina de Turing.
5.1. Arquitectura de una RNC
Las RNCs obtienen su arquitectura de los ACs, y por lo tanto sus celulas al igual que en los automatas
estan distribuidas en rejillas regulares, aunque esta restriccion ha tendido a desaparecer sobretodo a partir
del anuncio realizado por el Profesor Chua en el 4
o
CNNA. Esta decision es con la nalidad de permitir
una mayor libertad en cuanto a la generacion de arreglos especcos de RNC para la solucion de un problema.
Ahora bien, en una RNC, cada celula (que procesa valores continuos de una se nal) esta interactuando con
las demas dentro de una vecindad nita solamente, una caracterstica mas concebida a partir de los ACs.
El patron de interacciones es el equivalente a los pesos en una RNA. Tal idea permanecio invariante durante
los ultimos a nos aun cuando los investigadores introdujeron grandes cantidades de casos especiales de RNC
para propositos especcos, principalmente porque la conectividad local es necesaria para dise nos complejos
con VLSI.
Lo anterior podra llegar a considerarse como una restriccion ya que puede darse el caso en que sea deseable,
sobretodo para el procesamiento de imagenes, obtener propiedades globales. No obstante, estas caractersti-
cas pueden ser obtenidas a traves de la llamada propiedad de propagacion, la cual dice que el valor de salida
de una celula puede ser afectada despues de n iteraciones por una region mayor de vecinos de la imagen
de entrada. En otras palabras, tras una iteracion una celula se ve afectada por sus vecinos; despues de dos
iteraciones los vecinos de la celula se vieron afectados por sus propios vecinos, as que la celula obtendra in-
formacion de los vecinos de sus vecinos, y as sucesivamente de manera que para un tiempo sucientemente
grande, cualquier par de celulas puede llegar a relacionarse de alguna forma.
5.2. Modelos de una RNC
Dentro de todos los modelos que se han desarrollado dentro de las RNC son tres los que se emplean en la
vasta mayora de los casos: la RNC de una sola capa, la RNC Multicapa y la RNC en Tiempo Discreto. La
primera es la mas com un y corresponde al modelo continuo con una sola capa; es el modelo original, y por
tal razon ademas de que es la mas empleada, normalmente se le llama simplemente RNC. La segunda fue
la primera extension al modelo; esta emplea arreglos de RNCs en capas (dos o mas, de manera semejante
a como se hace con los perceptrones) y es por esto que recibe su nombre. La ultima extension, no opera en
tiempo continuo, sino que utiliza valores discretos de este y de ah su nombre. A continuacion se presenta de
forma breve el funcionamiento de las tres arquitecturas.
5.2.1. Redes Neuronales Celulares de una sola capa
Esta clase, como ya fue se nalado, ha sido el modelo de uso predominante as como la base para las diversas
variaciones y extensiones que se han realizado en la teora. El exito del modelo radica en la simplicidad de
este. Como se podra observar en las siguientes lneas no consta mas que de un arreglo de celulas que estan
descritas por un conjunto simple de ecuaciones, sin embargo, cuentan con una gran riqueza de fenomenos
que pueden ser descritos con ellas gracias a la alta cantidad de elementos que procesan los datos de manera
paralela y continua. Las ecuaciones que denen la dinamica de una red para un arreglo bidimensional son
presentadas a continuacion.
Ecuacion de Estado:
dx
ij
(t)
dt
= x
ij
(t) +
C(g,h)Nr(ij)
A(i, j; g, h)y
gh
(t) +
C(g,h)Nr(ij)
B(i, j; g, h)u
gh
+I
1 i M ; 1 j N
donde
u
ij
, x
ij
, y
ij
, denotan las variables de entrada, estado y salida de C(i, j) respectivamente.
Se asume que u
ij
tiene una magnitud constante.
A y B son 2 matrices del tama no de la vecindad denida. La matriz A se denomina tambien matriz
de retroalimentacion, debido a que ejerce una funcion de control al retroalimentar la salida; y a la
matriz B se le conoce como matriz de control, por afectar a la entrada. A la variable I se le llama
umbral. Todo esto en su conjunto (incluyendo la denicion de la vecindad) es llamado cloning
template. El modelo de coecientes son translacionalmente invariantes (o lo que es lo mismo se
utiliza la misma regla para todas las celulas).
Utilizando la denicion de convolucion se puede reescribir la Ecuacion anterior como:
dx
ij
(t)
dt
= x
ij
(t) +A y
ij
(t) +B u
ij
+I
Ecuacion de Salida:
y
ij
(t) =
1
2
(|x
ij
(t) + 1| |x
ij
(t) 1|)
1 i M ; 1 j N
de forma tal que la salida estara acotada a valores entre 1 y -1 por la accion de la funcion no lineal.
Ecuacion de Entrada:
u
ij
= E
ij
1 i M ; 1 j N
para el cual E
ij
es igual a un valor de entrada constante en el tiempo.
Condiciones iniciales:
|u
ij
| 1
|x
ij
(0)| 1
1 i M ; 1 j N
Para la mayora de los casos el valor x
ij
(0) es igual al valor de entrada u
ij
, con valores que oscilan
entre 1 y -1.
5.2.2. Redes Neuronales Celulares Multicapa
El autor (L. O. Chua) desde un principio concibio y presento en su artculo de la teora de las RNC dos
modelos basicos: el modelo de una sola capa y el de multicapa. Esta primera extension se hace necesaria
porque de no existir, facilmente se podra llegar al caso en que cayo el perceptron. As pues, gracias a esta
extension, se cuenta con un conjunto de elementos arreglados en capas lo que hace posible que cada una
de estas obre persiguiendo un objetivo en particular y el resultado nal consistira entonces de la suma
de los resultados as obtenidos. Es obvio entonces que la variedad de fenomenos que pueden ser analizados
claramente se vera incrementada.
La generalizacion se consigue mediante el empleo de varias variables de estado en cada celula en lugar de
una sola. De acuerdo con lo anterior es necesario modicar el modelo de RNC para poder incluir todas las
capas, de manera que en su forma vectorial y utilizando la denicion para el operador de convolucion la
Ecuacion se reescribe como:
dX
ij
(t)
dt
= X
ij
(t) +A Y
ij
(t) +B U
ij
+I
donde:
A =
_
_
_
_
_
_
A
11
0 0 0
0 0
0
0
A
l1
A
ll
_
_
_
_
_
_
B =
_
_
_
_
_
_
B
11
0 0 0
0 0
0
0
B
l1
B
ll
_
_
_
_
_
_
I =
_
_
_
_
_
_
I
1
I
l
_
_
_
_
_
_
X
ij
=
_
_
_
_
_
_
x
1ij
x
lij
_
_
_
_
_
_
Y
ij
=
_
_
_
_
_
_
y
1ij
y
lij
_
_
_
_
_
_
U
ij
=
_
_
_
_
_
_
u
1ij
u
lij
_
_
_
_
_
_
donde l denota el n umero de capas. Aqu, el operador de convolucion * entre una matriz y un vector se
decodica como una multiplicacion entre matrices, mientras que cuando este entre una entrada de la matriz
y un vector operara de la forma en que fue denido anteriormente.
5.2.3. Redes Neuronales Celulares en Tiempo Discreto
Las RNCs en Tiempo Discreto (RNCTD) fueron propuestas por Hubert Harrer como una clase especial de
RNC la cual puede ser descrita completamente por un algoritmo recursivo cuya dinamica esta denida para
actuar en perodos discretos de tiempo, de ah el porque de su nombre.
Las RNCTD se denen por el siguiente algoritmo:
x
ij
(k) = A y
ij
(k) +B u
ij
+I
y
ij
(k + 1) = f(x
ij
(k)) =
_
_
_
1 si x
ij
(k) > 0
1 si x
ij
(k) < 0
para estas ecuaciones es necesario que todo elemento y
ij
(0) {1, 1} sea denido antes de que se lleve a
cabo cualquier operacion con la red.
La ventaja primordial de las RNCTD se debe al hecho de que la descripcion de la salida para el siguiente
estado puede ser descrita como un conjunto de desigualdades lineales. Los coecientes de la mascarilla en-
tonces pueden ser calculados resolviendo este sistema de desigualdades. Ademas de esto, la simulacion en
una computadora digital es muy simple, ya que no se hace necesario un sosticado algoritmo de integracion.
En forma general podemos representar el funcionamiento de una red neuronal celular (el de una capa,
multicapa o tiempo discreto) mediante la siguiente gura.
Figura 7: Arquitectura de una Red Neuronal Celular
6. Aplicaciones
Una RNC, debido a su estructura, pueden ser aplicadas para cualquier problema donde la estructura de
los datos se halle distribuida en un arreglo regular. A continuacion se presentara un ejemplo enfocado a la
morfogenesis.
6.1. Morfogenesis empleando una RNC
La morfogenesis se reere al estudio de los procesos que describen la formacion de los patrones que se
observan en la naturaleza. A traves de la historia se han realizado diversos trabajos relacionados con el area;
entre los mas importantes se encuentra el llevado a cabo por Alan Turing en 1952, donde demostraba como
un simple modelo de reaccion-difusion permite generar algunos de estos patrones. En la actualidad, uno de
los modelos mas aceptados que se basa en el mismo principio es el llamado sistema Gierer-Meinhardt, en
honor a sus autores, y el cual esta descrito por:
A
t
= F(A, B) +D
A
2
A
B
t
= G(A, B) +D
B
2
B
Para esta ecuacion, A y B representan concentraciones qumicas de elementos llamados activador e inhibidor
respectivamente, F() y G() son funciones no lineales y D
A
y D
B
son los coecientes de difusion. De estos,
el activador crea la inestabilidad que permite la formacion de patrones, mientras que el inhibidor aporta la
estabilidad al sistema una vez que el patr on ha sido creado. Ambos qumicos se difunden por el espacio, pero
si se ha de estabilizar el sistema es necesario que el inhibidor se difunda mucho mas rapido que el activador
(D
B
>> D
A
).
Ahora bien, a pesar de que la ecuacion en general puede ser descrita como un modelo de segundo orden,
algunos de los patrones creados con este pueden ser llevados a cabo en una RNC a pesar de ser un modelo
de primer orden.
Como ya se explico, el elemento qumico que permite la inhibicion debe difundirse mucho mas rapido que el
de excitacion. En una RNC, esto se puede conseguir haciendo r = 2, y permitiendo que los elementos que
esten en el lmite de la vecindad, inhiban a la celula, al multiplicarlos por un factor negativo; mientras que
los elementos mas proximos a esta, haran las veces de activadores al multiplicarlos por un factor positivo.
De esta forma se tiene la interaccion necesaria de los dos elementos basicos.
Teniendo en cuenta estas consideraciones, solo hace falta denir un objeto de estudio adecuado. Un ejemplo
interesante podra ser el que se encuentra en las pieles de felinos, por presentar diversos comportamientos;
en particular en la piel del leopardo y algunos gatos, ya que mientras su cuerpo y la parte inicial de la cola
esta conformada por manchas, en la parte terminal de la cola se cuenta con rayas. Esto nos lleva a considerar
una de dos posibles respuestas, o bien existe una regla que es sensible a la estructura del cuerpo que se
analiza o si no, hay fenomenos que alteran la regla de acuerdo a la porcion que esta siendo analizada. El
problema con esta ultima hipotesis se debe al hecho de que desde el punto de vista biologico, esto equivaldra
a decir que solo algunas porciones del cuerpo se veran afectadas por alg un fenomeno externo, de manera
contraria a lo que com unmente ocurre.
Para una RNC, los parametros son invariantes en el espacio y el tiempo, y el cambio en la estructura (re-
tomando el ejemplo de la cola) se puede conseguir simulando un cilindro que reduce su diametro conforme
se aproxima a uno de los extremos.
Para el sistema, la regla de la RNC sera gobernada por la siguiente mascarilla:
A
_
_
0,25 1 1,5 1 0,25
1 2,5 7 2,5 1
1,5 7 23,25 7 1,5
1 2,5 7 2,5 1
0,25 1 1,5 1 0,25
_
_
; B 0; I 0,7
aunque aqu no se presenta, los valores para de esta mascarilla pueden ser obtenidos tomando su Transfor-
mada Discreta de Fourier y analizando su comportamiento en el espacio.
Los valores que la RNC utiliza como punto de partida son n umeros entre -0.1 y 0.1, los cuales son asignados
a la variable de estado X(0); estos valores estan distribuidos de manera uniforme tal y como se muestra en
la Figura 8.
Figura 8: a) Entrada a una RNC para el modelado de la cola de un leopardo. Los valores presentados son
aleatorios con una distribucion uniforme para valores entre -0.1 y 0.1. Las imagenes b-d) son los resultados
generados por una RNC empleando la mascarilla previamente presentada; notese como a pesar de que se
utiliza una misma regla para todas las celulas se pueden distinguir varios comportamientos gracias a que la
estructura del cuerpo no es la misma para todas sus porciones.
Lo anterior se debe a que en principio se puede armar que los elementos que permiten la activacion y la
inhibicion del sistema se encuentran distribuidos en peque nas cantidades por todo el espacio del sistema.
Ademas considerando siempre una entrada aleatoria se podra obtener una innidad de patrones, inclusive en
presencia de peque nas variaciones, como se muestra en la Figura 8.b-d; mas a un as es claro que los resultados
contin uan con el mismo comportamiento basico, que es precisamente lo que se distingue del analisis visual
de las pieles de los felinos.
Una anotacion importante se debe al hecho de que si bien la entrada mostrada en la Figura 8.a luce como
un area rectangular, en realidad la porcion con la que se trabaja no corresponde a su totalidad; en realidad
se emplean 8 RNCs conectadas entre s cuyas dimensiones son M 24 y N 24, 22, 20, 18, 16, 14, 12, 10;
con condiciones de reexion en los lmites derecho e izquierdo y de periodicidad arriba y abajo, gracias a lo
cual las celulas en los lmites no tienen que considerarse como un caso particular, ademas, la condicion de
reexion genera una estructura en forma de cilindro, que para este caso tiene un radio que decrece hacia un
extremo.
El comportamiento de esta RNC es particularmente interesante, ya que como puede ser observado en la
Figura 8.b-d, este se ve afectado debido a que las dimensiones no son iguales en todas sus porciones, por
lo que, mientras que en el extremo mas ancho se distinguen manchas el mas angosto genera anillos como
resultado. Una explicacion un poco mas extensa acerca del tema sobre morfogenesis puede ser encontrada
en el artculo de Morfogenesis utilizando RNC [4] presentado en la Revista del Centro de Investigacion de la
Universidad la Salle.
Referencias
[1] Chua y Yang, Cellular Neural Networks: Theory, IEEE Trans. Circuits and Systems, CAS-35, 1257-1272
(1988).
[2] Chua y Yang, Cellular Neural Networks: Applications, IEEE Trans. Circuits and Systems, CAS-35,
1273-1290 (1988).
[3] Flores y Gomez, Tutorial sobre Redes Neuronales Celulares: Aplicacion al Procesamiento de Imagenes,
LIDETEA, Universidad La Salle, Mexico.
[4] Flores Memdez & Gomez-Ramrez, Morphogenesis with Cellular Neural Networks, LIDETEA, Univer-
sidad La Salle, Mexico.

Redes Neruorlnales

Hochgeladen von

Dokumentinformationen

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Redes Neruorlnales

Hochgeladen von

Copyright:

Verfügbare Formate

Trabajo de Investigacion.

Redes Neuronales Articiales.

Das könnte Ihnen auch gefallen