Beruflich Dokumente
Kultur Dokumente
Resumen --Empleando un modelo matemtico obtenido a travs de las ecuaciones de Euler-Lagrange, el presente
trabajo muestra la simulacin de un controlador PD sintonizado con redes neuronales recurrentes para el
desplazamiento vertical de un cuadricptero. Durante el entrenamiento de las neuronas, por retropropagacin del
error, la respuesta del sistema no presenta sobrepasos y se logra la estabilizacin en 5 segundos con una tolerancia
de 2% en el error en estado estable. Terminando el proceso de aprendizaje, el controlador Neuro-PD dinmico
sigue sin mostrar sobrepasos y los tiempos de estabilizacin son considerablemente menores a los obtenidos con un
controlador PD convencional. Los resultados de la simulacin sugieren que el uso de un controlador Neuro-PD en
un cuadricptero mejora la maniobrabilidad y estabilidad del vehculo.
Palabras clave: vehculo areo no tripulado, controlador Neuro-PD, redes neuronales recurrentes, control de altura.
Introduccin
Un vehculo areo no tripulado (VANT) es, en pocas palabras, un artefacto volador al cual se la ha sustituido
la tripulacin por un sistema de cmputo y un receptor/transmisor de radio (Austin, 2010). El uso de VANT
tiene como meta principal el efectuar actividades que difcilmente podrn realizarse con un vehculo areo
tripulado. Estas actividades comnmente se clasifican como aburridas, sucias o peligrosas, formando un criterio
operacional conocido como las tres D (dull, dirty or dangerous) (Barnhart, 2012). Existen muchas ventajas
de los VANT sobre las aeronaves tripuladas, incluyendo bajos costos, mayor resistencia y menos riesgo para
las tripulaciones (Castillo, 2005); es seguramente esta la razn por la cual se emplean cada vez ms en la
realizacin de tareas civiles, como lo son el monitoreo de cultivos, la fotografa area, actividades de bsqueda
y rescate, deteccin de incendios, monitoreo de contaminacin, etctera (Austin 2010).
1
I.T.P. Emilio Netzahualcyotl Garca Prez. Alumno de la Maestra en Ingeniera del Instituto Tecnolgico
de Quertaro de la lnea de Automatizacin y Sustentabilidad (autor corresponsal)
emiliogarcia372@gmail.com.
2
M.T.A. Agustn Barrera Navarro. Profesor investigador del Instituto Tecnolgico de Quertaro.
abn792001@yahoo.com.mx
girando a diferentes velocidades los motores delanteros y traseros. El movimiento de roll () es obtenido de
forma similar, pero usando los motores laterales. El movimiento de yaw () se obtiene incrementando (o
decreciendo) las velocidades de los motores que giran en el sentido de las manecillas del reloj mientras que se
hace lo contrario en los motores que giran hacia el otro sentido (Castillo 2005).
Metodologa
El desarrollo de esta investigacin se centra en la simulacin de un controlador Neuro-PID para la regular la
altura de un VANT que ya existe y que se utilizar en futuros trabajos. El primer paso fue obtener el modelo
matemtico que representase la posicin en el eje z del vehculo. Se representa el sistema como un cuerpo slido
que se mueve en tres dimensiones y est sujeto a una fuerza y tres momentos. Se analiza bajo un enfoque de
Euler-Lagrange con coordenadas generalizadas en = (x, y, z, , , ) R6 (Castillo, 2005). El lagrangeano
est dado por:
(, ) = + [1]
Donde
1
= = [2]
2
1
= = [3]
2
= = [4]
Sustituyendo las ecuaciones 2, 3 y 4 en el lagrangeano, se tiene
1 1
(, ) = + = [5]
2 2
(sencos + sen)
[ ] = [ (sencos sen)] [7]
(cos) mg
Donde
= () = 4
= ()
= (9.81 2 )
La fuerza de empuje de los rotores est en funcin de sus propiedades aerodinmicas de las hlices. La
ecuacin que define la fuerza empuje puede deducirse a partir de la ecuacin 8 (Wald, 2006), que corresponde
al coeficiente de empuje CT. En la figura 2 se muestra la variacin de la constante CT ante el incremento del
avance J para una hlice APC 10x4.7 (Brandt, 2015). Para los clculos se asume que la relacin de avance es
muy pequea, por lo que se toman valores de CT entre 0.10 y 0.12.
= [8]
2 4
Donde
=
= (N)
= (1.12 3 )
= ( )
=
Despejando se obtiene
= 2 4 [9]
De la matriz 7 se puede tomar la ecuacin para la fuerza en el eje z. Considerando una condicin ideal donde
los rotores estn perfectamente alineados a este eje y su fuerza de empuje es la misma, Los ngulos y son
igual a cero.
= (cos) mg
cos = 1, con y = 0
Sustituyendo y despejando la aceleracin
= g [11]
()2()+()
= 1.718103 2 9.81 [13]
2
()2()+()
= 1.718103 2 9.81 [14]
(0.001)2
Las ecuaciones que se describen a continuacin son las correspondientes al error de la red (17), el error del
controlador (18), el vector de estradas (19), la salida general de la red (20) y las salidas de la capa oculta (21).
= [17]
= [18]
= 0 + 0 [20]
1
= [21]
1+
Donde:
Figura 4. Topologa de la red neuronal = ( 1) + 1 [22]
El entrenamiento de las neuronas se hace por retropropagacin del error y se usa la funcin gradiente para
minimizar el criterio E (Samarasinghe, 2006). El trmino /(_ ) no puede ser calculado, pero se considera
como la ganancia equivalente del proceso (Cui, 1993)
1
= 2 [23]
2
= = [25]
0 0 0
= = 0 () [26]
=
[24]
= = 0 () [27]
[ ]
() = ( 1) + () [30]
0 () = 0 ( 1) + [31]
() = ( 1) + 0 () [32]
() = ( 1) + 0 () [33]
Resumen de resultados
La primera simulacin fue a un setpoint de 1m. Se utiliz para el aprendizaje de las redes neuronales un factor
de aprendizaje =3, observando que este es el valor mximo para que la seal de control no genere un
comportamiento excesivamente oscilatorio. Los pesos , 0 y se inicializaron de manera aleatoria en un
rango de 1. El entrenamiento de la red se detuvo cuando se alcanz un margen de error en estado estable del
2%.
Se simul tambin la respuesta del sistema ante la variacin de setpoints. Aun cuando el entrenamiento de las
neuronas fue detenido en los primeros 5 segundos, el controlador neuronal sigue las trayectorias sin mostrar
sobrepasos y manteniendo el mismo tiempo de estabilizacin.
Figura 8. Comparacin entre controladores a diferentes setpoints
Conclusiones
La respuesta del sistema con el controlador Neuro-PD estabiliz en 5 segundos dentro del margen de error
establecido, a diferencia del PD que estabiliz en casi el doble de tiempo. El controlador PD presenta un 12%
de sobrepaso, mientras que el Neuro-PD presenta un sobrepaso del 0%. Debido a la naturaleza no lineal de la
red neuronal se mejora la dinmica del proceso a controlar en el estado transitorio en relacin al control PD
puro. Al detener el proceso de aprendizaje se logra reducir o eliminar el efecto de parlisis neuronal, lo que
causara un retardo en el clculo de las ganancias del control neuro-PD.
Recomendaciones
En trabajos futuros, podra lograrse una mejora cambiando la topologa del controlador para incluir otras
variables como parmetros de entrenamiento de la red neuronal; por ejemplo, la velocidad . Tambin podra
acelerarse el proceso de aprendizaje si las funciones de activacin en las neuronas de la capa oculta fueran
hiperblicas y si se disea un algoritmo para determinar el factor de aprendizaje adecuado.
Referencias
Austin, R. (2010). Unmanned Aircaft Systems. UAVS Designs, Development and Deployment.Wiltshire,
Inglaterra: John Wiley & Sons Inc.
Bolton, W. (2006). Ingeniera de Control. Mxico D.F., Mxico: Alfaomega.
Castillo, P. (2005). Modelling and Control of Mini-Fliying Machines.Londres: Springer.
Cui, X., & Shin, K. G. (1993). Direct Control and Coordination Using Neural. IEEE TRANSACTIONS ON
SYSTEMS, MAN, AND CYBERNETICS, vol. 23, no. 3, 686-697.
Samarasinghe, S. (2006). Neural Networks for Applied Sciences and Engineering. New York: Taylor & Francis
Group, LLC.
Ponce, P. (2010). Inteligencia Artificial con Aplicaciones a la Ingeniera. Mxico D.F., Mxico: Alfaomega.
Jarnot, C. (2012). History. In Introduction to Unmanned Aircraft Systems (1st ed., pp. 1-16). Boca Raton, FL:
Richard K. Barnhart.
Wald, Q. (2006). The aerodynamics of propellers. Progress In Aerospace Sciences, 42(2), 85-128.
UIUC Propeller Data Site. (2017). M-selig.ae.illinois.edu. Retrieved 22 February 2017, from http://m-
selig.ae.illinois.edu/props/propDB.html