Garcia Perez Tab 670

DISEO Y SIMULACIN DE UN CONTROLADOR NEURO-
PD DINMICO PARA LA SUSTENTACIN DE VUELO DE

UN VEHCULO AREO NO TRIPULADO
Emilio Netzahualcyotl Garca Prez1, Agustn Barrera Navarro2.
Resumen --Empleando un modelo matemtico obtenido a travs de las ecuaciones de Euler-Lagrange, el presente
trabajo muestra la simulacin de un controlador PD sintonizado con redes neuronales recurrentes para el
desplazamiento vertical de un cuadricptero. Durante el entrenamiento de las neuronas, por retropropagacin del
error, la respuesta del sistema no presenta sobrepasos y se logra la estabilizacin en 5 segundos con una tolerancia
de 2% en el error en estado estable. Terminando el proceso de aprendizaje, el controlador Neuro-PD dinmico
sigue sin mostrar sobrepasos y los tiempos de estabilizacin son considerablemente menores a los obtenidos con un
controlador PD convencional. Los resultados de la simulacin sugieren que el uso de un controlador Neuro-PD en
un cuadricptero mejora la maniobrabilidad y estabilidad del vehculo.
Palabras clave: vehculo areo no tripulado, controlador Neuro-PD, redes neuronales recurrentes, control de altura.
Introduccin
Un vehculo areo no tripulado (VANT) es, en pocas palabras, un artefacto volador al cual se la ha sustituido
la tripulacin por un sistema de cmputo y un receptor/transmisor de radio (Austin, 2010). El uso de VANT
tiene como meta principal el efectuar actividades que difcilmente podrn realizarse con un vehculo areo
tripulado. Estas actividades comnmente se clasifican como aburridas, sucias o peligrosas, formando un criterio
operacional conocido como las tres D (dull, dirty or dangerous) (Barnhart, 2012). Existen muchas ventajas
de los VANT sobre las aeronaves tripuladas, incluyendo bajos costos, mayor resistencia y menos riesgo para
las tripulaciones (Castillo, 2005); es seguramente esta la razn por la cual se emplean cada vez ms en la
realizacin de tareas civiles, como lo son el monitoreo de cultivos, la fotografa area, actividades de bsqueda
y rescate, deteccin de incendios, monitoreo de contaminacin, etctera (Austin 2010).
Descripcin del mtodo

Antecedentes
Los primeros sistemas de vehculos areos no tripulados fueron diseados para los misiles de crucero.
Algunos de ellos fueron el torpedo areo de la Fuerza Naval Estadounidense en 1917, el Kettering Bug de
la Armada Estadounidense en 1918 y el Aerial Target de la Armada britnica en 1914. Aunque ninguno de
estos dispositivos fue utilizado durante la Primer Guerra Mundial, la euforia por los VANT permaneci hasta
la Segunda Guerra Mundial, poca en que los pases aliados usaban aeronaves no tripuladas como blancos
mviles para el entrenamiento de pistoleros mientras que la Alemania Nazi retom el concepto de los misiles
de crucero para atacar el sur de Inglaterra desde los pases bajos (Austin 2010). A partir de la dcada de los 60s
el desarrollo de los VANT se vio beneficiado por la llegada de nuevas tecnologas, como el GPS y otros sensores
avanzados. Para la dcada de los 80s los VANT comenzaron a descontextualizarse del mbito militar para
incorporarse en actividades civiles.
Los VANT pueden clasificarse principalmente en dos grupos: los vehculos de ala fija y los vehculos de
despegue vertical o VTOL (Vertical Take Out of Landing). El helicptero de cuatro rotores o cuadricptero
es el ms popular de los VTOL, posiblemente porque ofrecen una mayor maniobrabilidad y capacidad de carga.
Estas caractersticas han llamado la atencin de los investigadores y tecnlogos en aos recientes.
A diferencia de los helicpteros de una sola hlice, los cuadricpteros anulan el efecto giroscpico girando
un par de sus hlices en el sentido de las manecillas del reloj y las otras dos al contrario. La elevacin es
resultado de la fuerza de empuje de los cuatro rotores (F1, F2, F3 y F4). El movimiento de pitch () se obtiene
1
I.T.P. Emilio Netzahualcyotl Garca Prez. Alumno de la Maestra en Ingeniera del Instituto Tecnolgico
de Quertaro de la lnea de Automatizacin y Sustentabilidad (autor corresponsal)
emiliogarcia372@gmail.com.
2
M.T.A. Agustn Barrera Navarro. Profesor investigador del Instituto Tecnolgico de Quertaro.
abn792001@yahoo.com.mx
girando a diferentes velocidades los motores delanteros y traseros. El movimiento de roll () es obtenido de
forma similar, pero usando los motores laterales. El movimiento de yaw () se obtiene incrementando (o
decreciendo) las velocidades de los motores que giran en el sentido de las manecillas del reloj mientras que se
hace lo contrario en los motores que giran hacia el otro sentido (Castillo 2005).
Figura 1. El cuadricptero en un cuadro inercial
Descripcin del problema

En la actualidad, la mayor parte de las plataformas comerciales para controlar las acciones de vuelo de los
vehculos areos no tripulados utilizan mtodos de control clsicos, como lo es el PID (Proporcional-Integral-
Derivativo). Estas estrategias de control cumplen su cometido de manera efectiva cuando se enfrentan ante
sistemas lineales; sin embargo, los modelos dinmicos de los vehculos areos suelen ser de naturaleza no lineal,
motivo por el cual los controladores clsicos podran no ser la mejor opcin para los VANT.
Metodologa
El desarrollo de esta investigacin se centra en la simulacin de un controlador Neuro-PID para la regular la
altura de un VANT que ya existe y que se utilizar en futuros trabajos. El primer paso fue obtener el modelo
matemtico que representase la posicin en el eje z del vehculo. Se representa el sistema como un cuerpo slido
que se mueve en tres dimensiones y est sujeto a una fuerza y tres momentos. Se analiza bajo un enfoque de
Euler-Lagrange con coordenadas generalizadas en = (x, y, z, , , ) R6 (Castillo, 2005). El lagrangeano
est dado por:
(, ) = + [1]
Donde
1
= = [2]
2
1
= = [3]
2
= = [4]
Sustituyendo las ecuaciones 2, 3 y 4 en el lagrangeano, se tiene
1 1
(, ) = + = [5]
2 2
El modelo general de la ecuacin Euler-Lagrange est definido como

=[ ] [6]

Resumiendo, la solucin para cada eje es
(sencos + sen)
[ ] = [ (sencos sen)] [7]
(cos) mg
Donde
= () = 4
= ()
= (9.81 2 )
La fuerza de empuje de los rotores est en funcin de sus propiedades aerodinmicas de las hlices. La
ecuacin que define la fuerza empuje puede deducirse a partir de la ecuacin 8 (Wald, 2006), que corresponde
al coeficiente de empuje CT. En la figura 2 se muestra la variacin de la constante CT ante el incremento del
avance J para una hlice APC 10x4.7 (Brandt, 2015). Para los clculos se asume que la relacin de avance es
muy pequea, por lo que se toman valores de CT entre 0.10 y 0.12.

= [8]
2 4
Donde
=
= (N)
= (1.12 3 )
= ( )
=
Despejando se obtiene
= 2 4 [9]
Los valores de , y pueden englobarse en

una constante k, de tal forma que la ecuacin para
la fuerza de empuje queda como
Figura 2. Avance vs coeficiente de empuje
= 2 [10]
De la matriz 7 se puede tomar la ecuacin para la fuerza en el eje z. Considerando una condicin ideal donde
los rotores estn perfectamente alineados a este eje y su fuerza de empuje es la misma, Los ngulos y son
igual a cero.
= (cos) mg
cos = 1, con y = 0
Sustituyendo y despejando la aceleracin

= g [11]

= 1.718103 2 9.81 [12]

Finalmente se considera un valor de = 5.15104 , segn los clculos y una masa aproximada de 1.2 Kg,
dando como resultado la ecuacin 12. Con el propsito de realizar las simulaciones pertinentes, se discretiz
dicha ecuacin por medio de aproximacin de Euler con un tiempo de muestreo = 0.001 y se despej la
variable z (ecuacin 15).
()2()+()
= 1.718103 2 9.81 [13]
2
()2()+()
= 1.718103 2 9.81 [14]
(0.001)2
() = 1.718109 ()2 9.81106 + 2( 1) ( 2) [15]

Para tener un punto de comparacin objetivo se dise primero un controlador PD para regular la altura del
cuadricptero. La funcin de transferencia en lazo abierto del controlador se muestra en la ecuacin 16. Con
esta forma de control se ha introducido un cero en el sistema, por lo cual no habr cambios en el tipo de sistema
ni en los errores en estado estable y se aportar amortiguamiento a la respuesta en estado transitorio (Bolton,
2006).
() = ( + )() [16]
La estructura del controlador Neuro-PD propuesto se encuentra en la figura 3. Se trata tambin de un
controlador PD, pero las ganancias Kp y Kd son determinadas por un par de redes neuronales recurrentes. Esta
tipologa de red contiene retroalimentaciones de sus salidas hacia las entradas en las neuronas de la capa oculta.
Son herramientas poderosas para identificar y controlar sistemas dinmicos no lineales (Ponce, 2010).
Figura 3. Topologa de controlador Neuro-PD
Las ecuaciones que se describen a continuacin son las correspondientes al error de la red (17), el error del
controlador (18), el vector de estradas (19), la salida general de la red (20) y las salidas de la capa oculta (21).
= [17]
= [18]
= [(), ( 1)] [19]
= 0 + 0 [20]
1
= [21]
1+
Donde:

Figura 4. Topologa de la red neuronal = ( 1) + 1 [22]
El entrenamiento de las neuronas se hace por retropropagacin del error y se usa la funcin gradiente para
minimizar el criterio E (Samarasinghe, 2006). El trmino /(_ ) no puede ser calculado, pero se considera
como la ganancia equivalente del proceso (Cui, 1993)
1
= 2 [23]
2

= = [25]
0 0 0

= = 0 () [26]
=
[24]

= = 0 () [27]

[ ]
Donde los trminos dinmicos no lineales y estn dados por:
() = ()[1 ()] [ + ( 1)], (0) = 0 [28]
() = ()[1 ()] [ ( 1) + ( 1)] (0) = 0 [39]
Los pesos , 0 y se obtienen mediante la ecuacin 30, donde es el coeficiente de aprendizaje.
() = ( 1) + () [30]
De tal forma, las ecuaciones para calcular los pesos , 0 y son:
0 () = 0 ( 1) + [31]
() = ( 1) + 0 () [32]
() = ( 1) + 0 () [33]
Resumen de resultados
La primera simulacin fue a un setpoint de 1m. Se utiliz para el aprendizaje de las redes neuronales un factor
de aprendizaje =3, observando que este es el valor mximo para que la seal de control no genere un
comportamiento excesivamente oscilatorio. Los pesos , 0 y se inicializaron de manera aleatoria en un
rango de 1. El entrenamiento de la red se detuvo cuando se alcanz un margen de error en estado estable del
2%.
Figura 7. Comparacin entre controladores con un setpoint de 1m
Se simul tambin la respuesta del sistema ante la variacin de setpoints. Aun cuando el entrenamiento de las
neuronas fue detenido en los primeros 5 segundos, el controlador neuronal sigue las trayectorias sin mostrar
sobrepasos y manteniendo el mismo tiempo de estabilizacin.
Figura 8. Comparacin entre controladores a diferentes setpoints
Conclusiones
La respuesta del sistema con el controlador Neuro-PD estabiliz en 5 segundos dentro del margen de error
establecido, a diferencia del PD que estabiliz en casi el doble de tiempo. El controlador PD presenta un 12%
de sobrepaso, mientras que el Neuro-PD presenta un sobrepaso del 0%. Debido a la naturaleza no lineal de la
red neuronal se mejora la dinmica del proceso a controlar en el estado transitorio en relacin al control PD
puro. Al detener el proceso de aprendizaje se logra reducir o eliminar el efecto de parlisis neuronal, lo que
causara un retardo en el clculo de las ganancias del control neuro-PD.
Recomendaciones
En trabajos futuros, podra lograrse una mejora cambiando la topologa del controlador para incluir otras
variables como parmetros de entrenamiento de la red neuronal; por ejemplo, la velocidad . Tambin podra
acelerarse el proceso de aprendizaje si las funciones de activacin en las neuronas de la capa oculta fueran
hiperblicas y si se disea un algoritmo para determinar el factor de aprendizaje adecuado.
Referencias
Austin, R. (2010). Unmanned Aircaft Systems. UAVS Designs, Development and Deployment.Wiltshire,
Inglaterra: John Wiley & Sons Inc.
Bolton, W. (2006). Ingeniera de Control. Mxico D.F., Mxico: Alfaomega.
Castillo, P. (2005). Modelling and Control of Mini-Fliying Machines.Londres: Springer.
Cui, X., & Shin, K. G. (1993). Direct Control and Coordination Using Neural. IEEE TRANSACTIONS ON
SYSTEMS, MAN, AND CYBERNETICS, vol. 23, no. 3, 686-697.
Samarasinghe, S. (2006). Neural Networks for Applied Sciences and Engineering. New York: Taylor & Francis
Group, LLC.
Ponce, P. (2010). Inteligencia Artificial con Aplicaciones a la Ingeniera. Mxico D.F., Mxico: Alfaomega.
Jarnot, C. (2012). History. In Introduction to Unmanned Aircraft Systems (1st ed., pp. 1-16). Boca Raton, FL:
Richard K. Barnhart.
Wald, Q. (2006). The aerodynamics of propellers. Progress In Aerospace Sciences, 42(2), 85-128.
UIUC Propeller Data Site. (2017). M-selig.ae.illinois.edu. Retrieved 22 February 2017, from http://m-
selig.ae.illinois.edu/props/propDB.html

Garcia Perez Tab 670

Hochgeladen von

Dokumentinformationen

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Garcia Perez Tab 670

Hochgeladen von

Copyright:

Verfügbare Formate

DISEO Y SIMULACIN DE UN CONTROLADOR NEURO-

PD DINMICO PARA LA SUSTENTACIN DE VUELO DE

Descripcin del mtodo

Figura 1. El cuadricptero en un cuadro inercial

Descripcin del problema

El modelo general de la ecuacin Euler-Lagrange est definido como

Los valores de , y pueden englobarse en

= 1.718103 2 9.81 [12]

() = 1.718109 ()2 9.81106 + 2( 1) ( 2) [15]

Figura 3. Topologa de controlador Neuro-PD

= [(), ( 1)] [19]

Donde los trminos dinmicos no lineales y estn dados por:

() = ()[1 ()] [ + ( 1)], (0) = 0 [28]

() = ()[1 ()] [ ( 1) + ( 1)] (0) = 0 [39]

Los pesos , 0 y se obtienen mediante la ecuacin 30, donde es el coeficiente de aprendizaje.

De tal forma, las ecuaciones para calcular los pesos , 0 y son:

Figura 7. Comparacin entre controladores con un setpoint de 1m

Das könnte Ihnen auch gefallen