Mantenimiento Turbinas de Gas

INSTITUTO POLITECNICO
NACIONAL
ESCUELA SUPERIOR DE INGENIERA MECNICA Y
ELCTRICA
UNIDAD CULHUACAN
SECCION DE ESTUDIOS DE POSGRADO E INVESTIGACION
ELABORACIN DE LAS FUNCIONES DE REFERENCIA
PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A
POLINOMIOS Y REDES NEURONALES.
T E S I S
QUE PARA OBTENER EL GRADO DE:
MAESTRA EN CIENCIAS DE INGENIERIA EN MICROELECTRONICA
PRESENTA:
ING. CLAUDIA FERNANDA VILLARREAL GONZLEZ
DIRECTOR: DR. IGOR LOBODA
ELABORACIN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A


II

AGRADECIMIENTOS.
Antes que todo quiero agradecer a dios por estar viva
y sana para poder lograr mis objetivos, tambin
agradezco a mis padres Patricia Gonzlez Garca y
Fernando Villarreal Snchez por el apoyo; adems sin
la disciplina que ellos me ensearon, sera ms
difcil concluir mis estudios.
Gracias
al
Instituto
Politcnico
Nacional,
institucin donde estoy estudiando desde el nivel
medio superior, por abrirme las puertas para estudiar
y trabajar.
En particular agradezco a la ESIME Culhuacn por el
apoyo econmico de un semestre y al apoyo acadmico
en la realizacin de mi trabajo de tesis.
Gracias al Dr. Igor Loboda y a mis compaeros: Ivan,
Abelardo, Adrian y Jess por el apoyo y paciencia que
me brindaron durante mis estudios de posgrado.
III

Resumen
El trabajo descrito en esta tesis intenta mejorar el modelo de estado normal de un motor de
turbina de gas. Podemos definir una turbina de gas como un objeto complejo que basa su
funcionamiento en las leyes de termodinmica y mecnica de fluidos y necesita un
diagnstico detallado.
Enfocamos nuestra investigacin a los mtodos del diagnstico paramtrico. La primera
etapa de este diagnstico es encontrar el modelo matemtico que describe a la turbina de
gas en buen estado y que permite describir las fallas repentinas y mecanismos graduales de
envejecimiento de las turbinas de gas. Este modelo de estado normal, mejor conocido
como la funcin de referencia, es una funcin en la cual variables monitoreadas en
turbinas de gas dependen de las variables controladas y las ambientales. Sin embargo, no
es tarea fcil determinar una funcin adecuada de referencia a partir de mediciones, debido
a la cantidad de errores en las mismas.
En esta tesis se estudian y se comparan dos mtodos diferentes para obtener la funcin de
referencia. El primero usa polinomios. Despus de encontrar los coeficientes desconocidos
con los datos de entrenamiento de un motor de turbina de gas, probamos la funcin
polinomial encontrada con otra porcin de datos registrados en el mismo motor.
El segundo incluye una red neuronal artificial para describir la funcin de referencia. Se
eligi una red perceptrn multicapa con tres capas de neuronas: una de entrada, una oculta
y una de salida. La red es supervisada y se entren con un conjunto de datos de entrada y
de salida. Durante el entrenamiento se modifican las conexiones (pesos) entre neuronas de
diferentes capas de tal manera que se minimiza la distancia entre la salida actual de la red
y la salida deseada. As, la red entrenada obtiene la capacidad de describir el
comportamiento del motor.
Cabe mencionar que con el objetivo de optimizar la red se hicieron clculos numerosos
con diferentes condiciones de entrenamiento y varias estructuras de la red. En particular,
en estos clculos modificamos los datos de entrada, el tipo de su normalizacin, el
algoritmo de entrenamiento, nmero de pocas de entrenamiento, nmero de nodos en la
capa oculta y funciones de transferencia de las seales en la red. Al comparar las
variaciones mencionadas, hemos encontrado la mejor variacin de la red, en particular el
algoritmo de entrenamiento: Levenberg-Marquardt con la regularizacin bayesiana.
La comparacin de los dos mtodos mencionados en los datos de validacin ha
demostrado que est mejor variacin de la red neuronal no tiene una exactitud mejor que
los polinomios. Sin embargo, la funcin de referencia con los polinomios es ms simple y
por eso se recomienda para el uso prctico en los sistemas reales de monitoreo de turbinas
de gas.
IV

Abstract
The study presented in this thesis tries to enhance a model of a healthy gas turbine. A gas
turbine can be defined as a complex system based on thermodynamics and flow mechanics
and as a machine that requires to be diagnosed as profound as possible.
The study is devoted to the methods of so called parametric diagnostics, the first stage of
which is to define the model of the motor in a good (healthy) condition. Such model
allows describing gas turbine abrupt faults and gradual degradation mechanisms. The
model known as a baseline model is a function in which monitored gas path variables
depend on engine controlled variables and ambient conditions. However, it is a
challenging problem to create an adequate baseline model on the basis of measured data
because of a number of measurement errors.
In this thesis two different methods to obtain the baseline function are studied and
compared. The first method uses polynomials. After finding their unknown coefficients
with training data of a gas turbine engine, the determined polynomial function is validated
on another data portion of the same engine.
The second includes an artificial neural network for baseline function description. The
perceptron with three layers: an input, hidden layer, and an output, has been chosen. This
network was trained on known input and output data. During the training process, the
connections (weights) between neurons of different layers were modified in the manner
that minimizes the distance between the actual network output and the desired output
(target). Thus, the trained network obtains the capacity to describe the engine behavior.
It is worth to mention that numerous calculations under different training conditions and
with various network structures have been made with the objective to optimize the
network. In particular, in these calculations we varied input data, their normalization
mode, training algorithm, number of training epochs, a hidden layer neuron quantity, and
network signals transfer functions. As a result of the comparison of different network
variations, the best network variation with optimal values for each factor mentioned before
was found. In particular, the Levenberg-Marquardt algorithm with Bayesian regularization
was selected as the best training option.
The comparison of two chosen methods on validation data has demonstrated that the best
network variation does not exceed the polynomials in diagnosis accuracy. Moreover, the
polynomial baseline function is easier to compute. That is why it is recommended for
practical use in real gas turbine monitoring systems.

Introduccin
Las turbinas de gas son mquinas trmicas complejas que convierten energa qumica a
mecnica. El objetivo de la turbina de gas es producir grandes cantidades de energa, por
ejemplo, para mover un generador elctrico o impulsar un avin.
El motor de turbina de gas tiene tres elementos principales que son el compresor, la
cmara de combustin y la turbina que en conjunto tienen un cierto rango de operacin. S
trabajan fuera del lmite de operacin pueden sufrir daos severos en sus componentes,
como por ejemplo grietas y fisuras en los alabes del compresor y de la turbina.
Se puede evitar estos problemas realizando mantenimiento preventivo y correctivo; el
primer mantenimiento es capaz de prevenir accidentes o fallas posibles; por lo tanto hay
que darle mayor importancia. Sin embargo, para realizar ambos mantenimientos hay que
detener la maquina donde los paros implican excesivos gastos econmicos ya que estos
pueden durar hasta semanas.
Una solucin a este problemas es el monitoreo permanente de variables como la
temperatura en la salida de la turbina. Con el conjunto de mediciones podemos realizar un
anlisis y manipulacin de datos para identificar donde est la falla y ahorrar un tiempo
considerable de revisin en el paro. Esta herramienta se conoce como diagnostico
paramtrico. [21], [23], [24] y [29].
El presente trabajo consiste en obtener un modelo del comportamiento de la turbina de gas
en buenas condiciones. Este modelo se determina con el uso de dos herramientas:
polinomios y redes neuronales artificiales. Para entrenar la red neuronal se usan los datos
simulados por un modelo termodinmico y los reales. Despus, las herramientas se
comparan con nuevos datos reales.
El objetivo es escoger entre polinomios y la red neuronal una herramienta que es mejor
para aproximar los datos del motor de turbina de gas en buen estado. Se mantiene la
hiptesis que la red puede arrojar mejores resultados por su alta flexibilidad. [19], [20] y
[27]
VI

CONTENIDO
CAPITULO 1. Turbinas de gas, diagnstico y mantenimiento.
1.1. Descripcin de turbinas de gas.
1.2. Aplicaciones de las turbinas de gas.
1.3. Aplicaciones en Mxico.
1.4. Mantenimiento de turbinas de gas.
1.5. Diagnstico de turbinas de gas.
1.5.1. Mtodos Fsicos.
1.5.2. Mtodos paramtricos.
1
2
13
14
15
18
19
21
CAPTULO 2. Redes Neuronales Artificiales.

2.1. Introduccin.
2.2. Estructura de las redes neuronales.
2.3. Clasificacin.
2.4. Perceptrn multicapa.
30
31
32
40
41
CAPTULO 3. Desarrollo de los algoritmos.

3.1. Introduccin.
3.2. Planteamiento del problema.
3.3. Funcin de referencia.
3.3.1. Modelo descrito por polinomios.
3.3.2. Modelo descrito por redes neuronales.
3.4. Matlab como herramienta de aplicacin.
44
45
47
48
49
52
62
CAPITULO 4. Discusin de resultados.

4.1. Prueba de las herramientas.
4.2. Tarea 1: Bsqueda de la estructura de la red.
4.3. Tarea 2: Mtodos de ajuste de pesos.
4.4. Tarea 3: Modificacin de las funciones de transferencia.
4.5. Tarea 4: Modificacin de los parmetros
de salida.
4.6. Tarea 5: Influencia del mtodo de inicializacin de pesos y umbrales.
4.7. Tarea 6: Opcin de paro automtico.
4.8. Tarea 7: Entrenamiento con datos reales.
80
81
81
83
86
90
92
93
95
CONCLUSIONES.
97
ANEXOS.
101
VII

CAPITULO
1.
TURBINA
DE
MONITOREO Y DIAGNSTICO.
GAS,

1.1. Descripcin de turbinas de gas

La turbina de gas es una planta de potencia, la cual produce una gran cantidad de energa
con un tamao y peso relativamente pequeos. Durante ms de 15 aos se han aplicado
en la industria petroqumica. Actualmente funcionan con gas natural, diesel, nafta,
metano, aceites vaporizados e incluso basura.
Las primeras turbinas de gas tenan una eficiencia muy baja, aproximadamente 15%, sin
embargo por su peso reducido y tamao compacto fueron atractivas para ciertas
aplicaciones. Este lmite en la eficiencia se debe a la temperatura de entrada a la turbina.
Actualmente se tienen temperaturas ms altas porque los alabes se construyen con un
material ms resistente.
En la figura 1.1 podemos distinguir los componentes principales de la turbina de gas: el
compresor, la cmara de combustin y la turbina. [1]
Figura 1.1. Partes principales de la turbina de gas.
El compresor es un dispositivo que aumenta la presin en un fluido de trabajo. Los

compresores se clasifican como centrfugos y axiales. Algunas turbinas de gas pequeas
emplean una combinacin de ambos tipos de compresores.
En el compresor centrfugo el aire entra en direccin axial y sale en direccin radial por
un difusor. Un difusor es un dispositivo que aumenta la presin de un fluido a costa de
una prdida de velocidad, el fluido pasa de un rea mayor a una menor; la figura 1.2
2

ilustra la imagen de un difusor. En el compresor centrifugo la combinacin de un alabe

rotatorio y un alabe estacionario (difusor) forma una etapa como se muestra en la figura
1.3. A la relacin de presin de salida entre presin de entrada se le denomina razn del
compresor. El compresor de tipo centrfugo tiene una razn de 1:3 por etapa. La
operacin exitosa de las plantas de potencia depende de la eficiencia del compresor, es
por eso que tenemos que escoger el compresor ms adecuado en el que intervienen
diferentes disciplinas de la ingeniera. El trabajo que realiza el compresor consiste en
convertir la energa cintica de los alabes rotatorios a energa potencial en los alabes
estacionarios. Para el uso en plantas de potencia se prefiere un compresor axial cuyo
funcionamiento detallaremos a continuacin. [2]
Figura 1.2. Difusor cnico
Figura 1.3: Componentes de un compresor
El compresor axial acelera un fluido de trabajo (aire) para que despus pase por un
difusor donde saldr con un nivel de presin bastante alto. Al fluido lo acelera un alabe
rotatorio conocido como rotor, e incrementa su presin un alabe estacionario conocido
como estator. Lo anterior se desarrolla en una sola etapa, pero el compresor tiene
3

bastantes etapas. Se tiene una fila adicional de alabes gua (alabes de entrada) para que
el flujo siga una direccin axial y no se vaya a desviar entrando con un ngulo de ataque
a la primera etapa del compresor. Existen tambin alabes estacionarios a la salida del
compresor cuyo objetivo es controlar la velocidad que entra a la cmara de combustin.
En el compresor axial el aire pasa de una etapa a la siguiente, en cada etapa se
incrementa la presin. Aproximadamente se logra una relacin final de presiones de
17:1.
Como toda turbo-maquina, un compresor axial puede ser descrito por coordenadas
polares (figura 1.4); donde Z representa la longitud de la flecha, r es el radio de la flecha
y q es el ngulo de rotacin del alabe.
Figura 1.4: Coordenadas polares de un compresor axial.
La superficie del alabe es curva con una zona convexa y una zona cncava. A la zona
cncava se le conoce como zona de presin y la zona convexa es la zona de succin. La
lnea de cuerda del alabe es la lnea dibujada sobre el eje vertical en la direccin de la
cuerda (figura 1.6). En esta imagen podemos apreciar las diferentes variables que
intervienen en el giro del alabe El ngulo de inclinacin q es el ngulo de rotacin del
alabe.
La distancia S es la distancia entre alabes. La solidez es la razn entre la cuerda y la
distancia entre alabes (c/s) y es una medida de indicacin entre los efectos de
interferencia entre alabes. Un rango de exactitud aceptable de solidez es de 0.5 a 0.7. b1,
es el ngulo de entrada y b2 es el ngulo de salida de flujo formados por la vertical y la
lnea de inclinacin. Aunque idealmente el aire entra y sale con los mismos ngulos a
los que giran los alabes, en la prctica esto no ocurre as y el aire saldr a un ngulo a1 y
a2 conocidos como Angulo de ataque de entrada y salida respectivamente que si
alcanzan un valor mximo ocasionarn inestabilidad a lo largo del compresor.
4

Figura 1.5: Elementos del perfil de un alabe
La velocidad de entrada del flujo que atraviesa al compresor se puede entender mejor si
nos auxiliamos de un diagrama (figura 1.6) conocido como triangulo de velocidades. El
aire atraviesa el alabe rotatorio con una velocidad V y un ngulo a1 que acta junto con
la velocidad tangencial (U) para producir la velocidad relativa W que forma un ngulo
a2 con la vertical. Al pasar por el estator entrara con una velocidad V2 formando un
ngulo a3 con la vertical, las componentes de esta velocidad tangencial U y la velocidad
relativa W2.

Figura 1.6: Triangulo de velocidades.
La cmara de combustin es el dispositivo que sigue, su tarea consiste en incrementar la

temperatura del gas de alta presin que sale del compresor. En la cmara de combustin
se desarrolla un proceso conocido como combustin que consiste en mezclar aire con
combustible. Los productos de la combustin son mezclados con aire para salir con una
temperatura adecuada hacia la turbina. La combustin de los gases naturales es una
reaccin que ocurre entre carbono, hidrgeno y oxgeno. Despus de la reaccin se
produce calor y sus productos son:
CH 4 + 4O
CO2 + 2 H 2O + Calor
(1.1).
Se requieren cuatro partculas de oxgeno para quemar una de metano. Los productos de
la combustin son una partcula de dixido de carbono y una de agua.
La cmara de combustin est compuesta por tres zonas:
La zona de recirculacin. Su funcin es evaporar, parcialmente calentar y preparar
el combustible.
Zona de llama. Idealmente todo el combustible estar quemado al final de esta
zona.
Zona de dilucin. Su funcin es mezclar el gas caliente con el aire diluido.

El gas que sale de la mezcla deber tener una temperatura y velocidad adecuadas. La
temperatura a la entrada de la cmara de combustin depende de la relacin de presiones
en el compresor, carga y tipo de motor; y si la turbina es regenerativa o no.
Normalmente el desempeo de la cmara de combustin depende de tres factores:
eficiencia, prdida de presin y una temperatura de salida baja.
La perdida de presin es el problema ms importante porque afecta el consumo del
combustible. La perdida de presin usualmente tiene un rango del 2% al 8% de presin
esttica. Est perdida es igual a un decrecimiento en la eficiencia del compresor. El
resultado de un incremento en el consumo de combustible y baja salida de potencia
afectada por el tamao y peso del motor.
Otro problema importante durante la combustin es la formacin de xido ntrico. La
reaccin qumica que produce xido ntrico es:
2 N + 5O + H 2O
2 NO + 3O + H 2 O
2 HNO
(1.2).
La formacin de acido ntrico no ocurre durante el proceso de combustin, pero despus

el oxido ntrico oxida y enfra al NO2 rpidamente; por lo tanto es necesario controlar la
formacin de oxido ntrico para que no se convierta en acido ntrico. Si reducimos la
temperatura de combustin, retardaremos la formacin de acido ntrico.
Otros productos indeseables son el oxido de azufre y acido sulfrico, sin embargo su
control es ms caro. Una alternativa es separar la mayor cantidad posible de azufre del
combustible. Las turbinas de gas contienen suficiente aire, lo cual no produce CO
(monxido de carbono).
La cmara de combustin podra ser un tubo que conecte al compresor con la turbina.
Realmente este arreglo sera imprctico porque la combustin a altas velocidades
producira grandes prdidas de presin. La perdida de presin es directamente
proporcional a la velocidad del aire; por esta razn el aire pasa primero por un difusor
que reduce la velocidad de entrada a la cmara de combustin y simultneamente reduce
a la mitad la perdida de la presin.
Existe un lmite mnimo de velocidad para sostener a la flama durante la combustin,
por lo tanto debe de existir un equilibrio de la velocidad y este se logra con ayuda de
bujas. Generalmente, la buja enciende y el gas (propano/butano) incendia, tanto la
buja como el gas son necesarios al principio, hasta que el queroseno alcanza la
temperatura adecuada (aproximadamente 100 C); entonces cortamos el gas auxiliar.
A continuacin se inyecta carburante precalentado en los vaporizadores por pequeos
tubitos de un dimetro interior entre 0.4 y 0.6 mm, (inyectores), dentro de la cmara de
combustin. En esta zona se mezcla con aire comprimido y se incendia. La temperatura
7

de combustin es proporcional al rendimiento; esto quiere decir que entre ms alta

mejor. Sin embargo, una temperatura muy alta calentar a la turbina en exceso; las
temperaturas de entrada en la turbina no pueden superar las limitaciones trmicas de los
materiales. Para reducir la temperatura de entrada a la turbina slo se quema parte del
aire comprimido. Esto se logra dividiendo el aire al entrar en la cmara de combustin:
parte del aire se mezcla con el combustible y se inflama, y el resto se emplea para enfriar
la turbina.
Las cmaras de combustin se clasifican como:
Tubular (zona de combustin). Est formada por un nmero de unidades de dimetro
pequeo con revestimientos y cubiertas individuales. Tienen las ventajas de que los
pequeos tubos son fciles de sustituir; la desventaja es que desperdician la seccin
transversal que atraviesa al aire (figura 1.7).
Anular. La cmara de combustin anular tiene una o dos envolturas continuas. El
combustible se introduce por conducto de toberas a la entrada de la envoltura y el
aire secundario lo hace por perforaciones. Sus ventajas son que utiliza con
efectividad el espacio disponible y suministra una mezcla casi uniforme; su
desventaja principal es que es difcil desarmar para dar el mantenimiento. (figura 1.8)
Tubo-Anular. Es un diseo mixto desarrollado para reunir las ventajas de los dos
tipos anteriores. (figura 1.9).
Figura 1.7: Cmara de combustin tipo tubular.

Figura 1.8: Cmara de combustin tipo anular.
Figura 1.9: Cmara de combustin tubo-anular.

9

El tercer dispositivo es la turbina, su funcin es extraer energa cintica de la expansin

de los gases que se producen en la cmara de combustin, la acumulacin de energa
cintica se convierte en potencia del orden de caballos de fuerza para mover un eje, el
compresor y algunos accesorios.
La turbina de gas est hecha de alabes estacionarios y rotatorios unidos a una flecha y un
disco. Las turbinas se dividen en tres tipos: impulso, reaccin y una combinacin de
ambas conocida como impulso-reaccin. La energa de cada etapa est en funcin del
rea de la tobera y de la configuracin. Es importante considerar el rea de la tobera en
el diseo porque si es corta chocar rpidamente con el flujo y si es larga no operar con
su eficiencia mxima.
La turbina de impulso no produce cambios de presin entre el alabe rotatorio de entrada
y el de salida. Sin embargo, la velocidad relativa de entrada ser la misma que la
velocidad relativa de salida. Los alabes gua de entrada forman un camino para el flujo
que tiene la caracterstica de reducir la presin y aumentar la velocidad.
En la turbina de reaccin los alabes gua solo alteran el paso del flujo. El incremento de
velocidad y disminucin de presin en el gas es acompaado de una forma convergente
entre los alabes rotatorios. En la turbina de impulso W1=W2. En la turbina de reaccin
W1=C1 y W2=C2. La diferencia entre los dos tipos de turbinas se muestra en la figura
1.10.
Figura 1.10: Comparacin entre la turbina de impulso y la de reaccin.
Algunas turbinas basadas en sus objetivos incorporan dos compresores y dos turbinas
con ejes diferentes. En este caso la primera turbina (de mayor presin) maneja al ltimo
compresor y la ltima turbina maneja al primer compresor.
Las turbinas de gas tienen elementos importantes para su funcionamiento conocidos
como accesorios. Estos elementos no son parte de la operacin en la conversin de
energa y sin embargo son necesarios por ejemplo para el suministro de combustible.
Ejemplos de estos accesorios son:
10

Sistemas de ignicin. La buja produce mediante un arco elctrico la flama que

atraviesa la cmara de combustin, despus el aire se encarga de mantenerla.
Sistemas de lubricacin. Proporciona el aceite necesario para vencer la friccin en
dispositivos como cojinetes.
Tanques. Acumulan una reserva extra de aceite para periodos de paro en el motor.
Bombas. El aceite y el fluido deben mantener una presin constante, la cual se
logra con ayuda de una bomba.
Filtros. Son los encargados de detener el paso a partculas contaminantes que
pueden causar dao al funcionamiento general del fluido.
Enfriadores. Se encargan de reducir el nivel de temperatura de entrada a la turbina
de gas para que la soporten los materiales.
Si clasificamos a las turbinas de gas, podemos empezar a dividirlas en base al lugar de
aplicacin; principalmente son de aire y de superficie (mar y tierra). Dentro de las
aeroderivativas o basadas en aplicaciones para aviacin estn el turboventilador,
turbojet y turbohlice. Las turbinas de gas basadas en superficie se utilizan para impulso
mecnico. Vamos a revisar con detalle los diferentes tipos de motores:
Motores de Reaccin. Utilizan una tobera al final para lograr un mayor empuje y
aprovechar mejor la energa calorfica de los gases que entran a la turbina; tambin
utilizan un difusor para aumentar la presin al inicio del compresor. El turbojet se
caracteriza por tener un gran empuje a la salida de la turbina con ayuda de la tobera;
este empuje es capaz de producir un gran chorro de aire para elevar el motor. En el
turboventilador y el turbohlice se extrae energa de la tobera para impulsar el
compresor y el ventilador o la hlice, los cuales lograran que vuele el avin. La
figura 1.11 contiene los componentes principales de los motores de aviacin. [3]
11

Figura 1.11: Motor Turbojet.
Motores de impulso mecnico. Pueden ser dispositivos de impulso mecnico para uso
pesado, uso mediano y aeroderivativas (basadas en motores de aviacin) y se aplican
como generadores elctricos, bombeo mecnico y propulsin marina. Estos motores
pueden tener un rbol de salida independiente, un rbol con conexin longitudinal y
un rbol doble longitudinal. Cuando el rbol est conectado a la turbina se le conoce
como conexin en caliente y cuando est conectado al compresor se le conoce como
conexin final en fro. Las figuras 1.12 y 1.13 muestran ambos esquemas
respectivamente.
Figura 1.12: Esquema de turbina con rbol conectado

en lado caliente.
12

Figura 1.13: Esquema de turbina con rbol conectado

en lado fro.
1.2. Aplicaciones de las turbinas de gas.

Dos reas principales de aplicacin de las turbinas de gas son la propulsin en aviacin
y generacin de potencia elctrica. Su uso en aviacin genera potencias para manejar el
compresor y equipos auxiliares. Los gases que salen a alta velocidad son los
responsables de la propulsin necesaria para elevar el avin. Las turbinas de gas son
usadas en plantas de potencia estacionarias en conjuncin con plantas de potencia de
vapor a alta temperatura. En estas plantas, la salida de los gases de las turbinas de gas
sirve como fuente de calor. El ciclo de turbinas de gas se ejecuta tambin en ciclos
cerrados para plantas de potencia nuclear. Actualmente el fluido de trabajo no tiene que
ser aire, puede usarse un gas con caractersticas mejores, por ejemplo helio. [4]
La mayora de las flotas navales del este ya usan turbinas de gas para propulsin y
generacin de potencia elctrica. Las turbinas de gas LM2500 de General Electric para
la potencia de embarcaciones tienen una eficiencia trmica de un ciclo simple de 37 por
ciento. Las turbinas de gas WR-21 de General Electric equipadas con regeneracin y
refrigeracin intermedia tienen una eficiencia trmica de 43 por ciento y producen 21.6
MW. La regeneracin causa una reduccin en la temperatura de escape de 600 C a 350
C. El aire es comprimido a 3 atmosferas antes de entrar por el refrigerador intermedio.
Comparada con las turbinas de vapor y los sistemas de propulsin diesel, la turbina de
gas ofrece ms potencia con menor tamao y peso, alta rentabilidad, mayor tiempo de
vida y una mayor operatividad. La propulsin de vapor arranca en 4 min. ; Y la turbina
de gas en tan solo 2 min. Muchos sistemas de propulsin marina modernos usan turbinas
de gas junto con motores diesel porque los motores de turbinas de gas solas consumen
ms combustible. En sistemas diesel-turbinas de gas combinados, el diesel es necesario
13

para suministrar una menor potencia y la turbina de gas para aportar una mayor
velocidad.
En las plantas de potencia de turbinas de gas, la relacin de presiones del compresor
(llamada razn de trabajo) es muy alta. Ms de la mitad del trabajo de salida de la
turbina es usado para manejar el compresor. La situacin empeora cuando la eficiencia
isoentrpica en la turbina y el compresor disminuyen. En contraste las turbinas de vapor
disminuyen un porcentaje muy pequeo la razn de trabajo. Sin embargo, no es
sorprendente que un lquido sea comprimido en plantas de vapor en lugar de gas, y el
trabajo de flujo estacionario sea proporcional al volumen especfico del fluido de
trabajo.
Una planta con una alta razn de trabajo requiere turbinas ms largas para suministrar
potencia al compresor. Las turbinas de gas son ms largas que las turbinas de vapor para
la misma potencia neta de salida.
1.3. Aplicaciones en Mxico.

Uno de los principales usos de las turbinas de gas en Mxico es la generacin de
energa. La principal empresa que se dedica a la generacin y distribucin es Comisin
Federal de Electricidad por medio de contratos a la iniciativa privada. Su principal
proveedor es el grupo UNION FENOSA cuenta en Mxico con 1.550 MW de potencia
bruta instalada en ciclos combinados de gas.
En Mxico tambin son utilizadas por la industria aeronutica unas de las empresa que
utilizan son Mexicana de Aviacin y Aeromxico. Otra aplicacin es para la industria
petrolera.
A continuacin se en listan las principales empresas dedicadas a la comercializacin de
turbinas de gas as como el diseo:
IGSA: Empresa que brinda un servicio en plantas de emergencia, instala plantas de
potencia mediante su divisin de motores y turbinas a gas. Industrializa 150 turbinas
aeroderivativas con marcas como: Orenda, Kawasaki, General Electric y Rolls Royce.
[5]
ALSTOM: Empresa dedicada a la construccin y servicios de plantas de potencias.
Principalmente de turbinas de gas y vapor. En Mxico se localiza en Morelia.
14

Turbinas de Zihuatanejo: empresa que provee los siguientes servicios: anlisis, diseo,
drafting, publicaciones tcnicas e ilustraciones y desarrollo de mtodos.
Estos servicios son desarrollados a travs de los grupos:
1. Diseo y anlisis.
2. Modelado de slidos y drafting.
3. Publicaciones tcnicas.
4. Desarrollo de mtodos.
Siemens de Mxico: Empresa dedica a dar los siguientes servicios: reparaciones,
modernizaciones, asistencia tcnica en sitio o servicios completos de operacin y
mantenimiento.
Uno los servicios que ofrece esta empresa es la modernizacin y mejoras de turbinas de
gas. Esto es realizado con el uso de materiales ms resistentes, revestimiento con
tecnologa avanzada, arreglos de sellos mejorados, flujos de enfriamiento optimizados
donde se puede mejorar el grado de eficiencia de la turbina y prolongar la vida til.
ITR forma parte de una red mundial de lderes en la Industria Aeronutica, empresa que
se dedica al desarrollo e investigacin que es una de las ms reconocidas en los sectores
de transporte areo, Ingeniera, Fabricacin y Mantenimiento de Turbinas de gas. En
Mxico ofrece los siguientes servicios. [6]
Mantenimiento y reparacin de motores
Ingeniera de Diseo y Desarrollo
Fabricacin de componentes
Grupo Sentry empresa afiliada a Sentry Intercontinental LTD de Inglaterra se dedica
principalmente a la comercializacin de turbinas de gas industriales Rolls- Royce para
los sectores de petrleo y gas, as como la generacin de energa elctrica incluyendo
plantas de cogeneracin. Tambin se dedica a comercializacin de refacciones para
turbinas industriales y aeronuticas.
1.4. Mantenimiento de las turbinas de gas.

El mantenimiento involucra la restauracin de las tolerancias a estados iniciales
comparables con los que fueron manufacturados los componentes de la turbina de gas.
Debido a la complejidad de las turbinas de gas mismas y de todos sus componentes el
mantenimiento no es sencillo y se debe realizar puntualmente, ejecutndolo con
procedimientos muy exactos. [1]
Para resolver los problemas de mantenimiento, las soluciones se dividen en cuatro
categoras:
15

Entrenamiento de personal. La gente debe ser entrenada adecuadamente para adquirir

experiencia, y ser tcnicos altamente capacitados. El buen entrenamiento es costoso
pero tambin es muy retribuyente. Las mquinas cambian su estructura a pasos
agigantados y requieren de un conocimiento de diversas disciplinas. Los mtodos
clsicos deben dar resultados antes de complicar el tipo de mantenimiento que
necesitan.
Herramientas y refacciones. Las herramientas de anlisis son boroscopio,
analizadores de vibracin y programas de mantenimiento en lnea. El equipo de
refaccin puede ahorrar gastos si se sustituye en un lapso de tiempo mnimo.
Reemplazo de piezas. Es importante considerar los problemas que involucra tener
que comprar refacciones. El reemplazo de piezas cuesta mucho porque alarga el
tiempo de paro, incluso cuando las piezas no son fciles de sustituir y tardamos
bastante tiempo en adquirirlas. La solucin de muchos usuarios para reducir costos e
inversin es tener un banco de piezas de reemplazo al inicio que adquieren una
planta.
Mejoras para la rehabilitacin de la maquinaria. El mantenimiento es costoso y baja
la rentabilidad de la operacin de la mquina por el tiempo de paro del sistema; sin
embargo el mantenimiento es necesario. Se ha detectado que una tercera parte de los
paros en la maquinaria es debido a fallos. Esto se puede reducir bastante si
implementamos un sistema de control y revisamos constantemente mientras trabaja la
mquina su estado y si ocurre alguna falla importante.
En resumen podemos hablar de 2 tipos de mantenimiento: preventivo y correctivo. El
primero tiene la funcin de aumentar el tiempo de vida de la mquina y asegurar un
buen funcionamiento sin fallas; el segundo consiste en reparar fallas despus de tener
problemas en la maquinaria de la turbina de gas, y es el que tenemos que evitar.
Entre los tipos de mantenimiento correctivo se tiene:
Lavado de turbomaquinaria. Son tres razones de limpieza. La primera es para
restaurar la capacidad del sistema. Si la unidad es un generador su potencia mxima
bajara s est sucio. Si la maquinara es un compresor dinmico, la mugre obstruir su
cabeza, y por lo tanto, reducir su nivel de caudal.
La segunda razn es para incrementar la eficiencia de la maquinaria. En muchos
casos los componentes sucios requieren una mayor cantidad de combustible porque
los depsitos de mugre obstruyen su transferencia de calor.
16

La tercera razn es para predecir fallas porque las partculas contaminantes se

acumulan en pistones y vlvulas causando un exceso de velocidad que no se pueda
detener y como consecuencia sobrepase esfuerzos en maquinas centrifugas y algunas
vibraciones. Las tcnicas ms comunes de limpieza utilizan abrasivos y solventes.
Mantenimiento en la seccin caliente. Las cmaras de combustin se pueden remover
ntegramente para su inspeccin. Las grietas no son comunes y en caso de
encontrarlas necesitaran una atencin inmediata. Es muy importante identificar el
tipo de grieta y si el metal analizado se puede reparar. El rea quemada es muy
susceptible de estar sucia. Los alabes de la turbina se inspeccionan continuamente
por ser un rea que corre peligro constantemente por las altas temperaturas.
Mantenimiento del compresor. Debe de inspeccionarse antes que el rea de la seccin
caliente. En los compresores axiales se dan fallas principalmente en los discos y
alabes rotatorios. Durante el mantenimiento cada alabe tiene que lavarse y revisar si
no tiene grietas, en caso de tenerlas se sustituir o reparar por medio de soldaduras.
Mantenimiento a cojinetes. Muchas fallas de las turbinas de gas son causadas por
vibracin y esfuerzos rotatorios. Los cojinetes pueden amortiguar o atenuar estos
esfuerzos. Principalmente se revisan cuatro secciones de los cojinetes: superficie de
zapata metlica, superficie pivote de retencin, anillos de estancamiento, sellos tipo
o-ring y superficies de bola.
Como cualquier equipo de potencia, las turbinas de gas requieren de un programa de
inspecciones para reparar o reemplazar componentes daados. Un diseo apropiado de
inspeccin conducida y programas de mantenimiento preventivo incrementa la
disponibilidad de las turbinas de gas y reduce el mantenimiento fuera de lnea. La
inspeccin y el mantenimiento preventivo son caros, pero no tan costosos como los
paros. Todas las manufactureras hacen nfasis a la descripcin de procedimientos de
mantenimiento preventivo para asegurar la rentabilidad de su maquinaria; y cualquier
programa de mantenimiento debe basarse en las recomendaciones de los
manufactureros. La inspeccin y el mantenimiento preventivo se pueden adaptar a las
recomendaciones y manuales del fabricante.
Las inspecciones diarias se pueden llevar a cabo mientras funciona la maquinaria. Para
una inspeccin ms profunda es necesario desarmar la turbina de gas. Los chequeos
diarios deben incluir (pero no estn limitados) las siguientes caractersticas:
Nivel de lubricacin de aceite.
Filtros de aceite hacia el motor.
Aflojamiento de sujetadores, tubos y conexiones elctricas.
17

Entradas de filtros.
Sistemas de escape.
Sistemas de control y monitoreo con indicadores de luces.
La inspeccin diaria requiere al menos una hora para realizarse de manera adecuada. Los
intervalos entre inspecciones dependen de las condiciones de la turbina de gas.
Generalmente los fabricantes proporcionan guas para determinar los intervalos de
presin que se basan en la temperatura de gas, tipo y calidad del combustible utilizado y
nmero de interrupciones.
La primera inspeccin menor con la turbina trabajando es el punto de referencia ms
importante que se almacenara. Todos los datos deben ser comparados cuidadosamente
con la informacin de la instalacin de la turbina para acertar si alguna configuracin
cambi, desalineamiento o un desgaste excesivo ha ocurrido durante la operacin. Las
inspecciones siguientes son igual de importantes desde la verificacin de las
recomendaciones del fabricante hasta ayudar a establecer las condiciones de operacin.
Cuando establezcamos el tiempo para realizar mantenimientos mayores, el departamento
de operacin y los ingenieros de manufactura deben planear la inspeccin en base a los
datos de medicin. Antes de poner fuera de servicio a la turbina, se tomara un tiempo
para realizar una prueba en presencia del ingeniero de manufactura. Estas pruebas usan
como referencia la medicin de presin y temperatura, cuyas variables servirn como
grado de comparacin con pruebas idnticas que se van a realizar con la planta fuera de
servicio. Las pruebas operacionales finalizaran con un exceso de velocidad que indicar
a que mecanismo se prestar ms atencin durante el paro de la mquina.
1.5. Diagnstico de las turbinas de gas.

La informacin que obtenemos con el monitoreo es si el motor trabaja correctamente o
tiene al menos una falla. Sin embargo, no podemos predecir donde est exactamente la
falla y para buscarla tenemos que de tener el motor. [7]
El diagnstico es la disciplina que se encarga del estudio de las tcnicas de la deteccin
de fallas. El poder predecir el componente donde se encuentra la falla del motor y la
causa nos permitir ahorrar tiempo y dinero en el paro del motor.
Algunas de las fallas ms comunes en las turbinas de gas se describen en la tabla 1.1.
18

Tabla 1.1: Fallas principales en los motores de turbinas de gas.
COMPRESOR
Componente
Alabes
rotatorios
estacionarios
Disco
Pernos
Falla
Causa
Fatiga (resonancia), erosin, objetos

externos, choques corrosivos, ruido,
desgaste.
Fatiga lineal, desgaste, friccin.
Fatiga mecnica, friccin.
Vibracin, surge, stall, distorsin de flujo.
Cargas de temperatura centrifuga

Arranques y paros cclicos, friccin.
CAMARA DE COMBUSTION
Componente
Falla
Causa
Boquilla
Fatiga trmica, pandeo, fatiga trmica,

desprendimiento
corrosin y distorsin
trmica.
Fatiga.
Desgaste, corrosin, fatiga trmica.
Fatiga trmica, desgaste y friccin.
Puntos calientes, gradientes de temperatura,

vibracin, pulsaciones de presin dinmica
excesivas.
Ciclos a presin.
Pulsacin y vibracin.
Pulsaciones dinmicas y vibracin.
Componente
Falla
Causa
Alabes rotatorios
Fatiga de alta eficiencia, desalineamiento,

corrosin, solidificacin, erosin.
Alabes Estacionarios
Ruptura lineal, corrosin, solidificacin,

arqueo, fatiga trmica.
Ruptura lineal, fatiga de bajo rendimiento
Esfuerzos trmicos y centrfugos, desarrollo

vibratorio, crecimiento de temperatura del
combustible, problemas de enfriamiento.
Problemas de enfriamiento, perfil trmico
impropio.
Enfriamiento impropio entre ruedas, esfuerzos
trmicos.
Carcasa
Tubos de flama
Piezas de transicin
TURBINA
Discos
1.5.1. Diagnstico por medios fsicos.

La direccin de la diagnosis fsica incluye: inspeccin visual, inspeccin de las partes
interiores del motor con equipo ptico, el anlisis de la estructura del aceite usado, el
grupo de mtodos de la bsqueda de grietas y otros.
Estos mtodos se aplican durante el mantenimiento y reparacin del motor. Los
requisitos son parar el motor y desmontarlo.
Monitoreo de partculas en el lubricante. Las superficies de rodamiento generan
partculas y estn sujetas a fallas incipientes. Las partculas pueden generarse de
diferente tamao y distribucin. El incremento en la falla depende del tamao. En
cojinetes y chumaceras bajo condiciones elasto-hidrodinmicas, donde el grosor de la
pelcula es grande comparado con superficies speras, una superficie que esta
fatigada se siente rugosa y produce partculas de 100 a 1000 m. En el rgimen de
cuerpos lubricados y de sustancias mezcladas las partculas son ms pequeas
(<100m). Bajo estas condiciones de lubricacin, los modos de desgaste por abrasivos
19

y adhesivos ocurren. El patinaje de cojinetes sucede cuando las cargas de los

cojinetes son ligeras y pueden producir partculas pequeas (<25m). Los sistemas de
monitoreo de partculas son:
Detectores magnticos (rango de 50 a 1000m).
Detectores elctricos.
Detector de pulsos elctricos (aplicado en caja de velocidades y helicpteros).
Monitor de flujo de partculas tipo pantalla.
Separador de fuerzas centrfugas.
Monitor de partculas de flujo inductivo.
Monitor de partculas de flujo capacitivo.
Adicionalmente encontramos tcnicas para analizar muestras de aceite y son:
o Anlisis del espectrmetro de aceite (efectividad<10m).
o Sensor magntico para anlisis cualitativo de partculas.
o Ferrografa (efectividad<1-100m).
o Espectrmetro de rayos X.
o Microscopio de escaneo de electrones.
Procedimiento de anlisis de espectrmetro. Es una tcnica que se realiza con el
motor parado y puede fallar por errores del personal y por problemas con el tiempo
de ciclo. Es especialmente til en operaciones de altura donde la mano de obra es
ms comn. La experiencia con las operaciones aterrizadas fuera de lnea muestran
que este esquema est en desuso.
Inspeccin borscopica. Usualmente se lleva a cabo en intervalos fijos que dependen
de la maquinara y video cmara usadas. Usualmente se obtienen resultados rpidos
con perdidas mnimas de disponibilidad de las turbinas de gas. Para las inspecciones
boroscopicas es importante tener personal bien entrenado y limpiar en concordancia
con las especificaciones del manual del fabricante, para asegurar la garanta de los
componentes crticos. La inspeccin boroscopica puede mostrar grietas y corrosin
midiendo las corrientes de Eddy.
Pirmetros pticos. Medir la temperatura del metal de los alabes de la primera etapa
es posible. Hay industrias que usan los pirmetros pticos todo el tiempo. Los
sistemas de monitoreo en tiempo real guardan las mediciones hechas por los
pirmetros pticos. Los alabes con un sistema de enfriamiento integrado son muy
importantes, los pirmetros pticos proporcionan una herramienta de diagnstico
para la deteccin de desgaste de alabes que se incrementa con el uso.
20

Monitoreo acstico de la cmara de combustin. La salida acstica que es

proporcional a la medida de los patrones de flama, pulsaciones de baja frecuencia o
inestabilidad del combustor.
Sistema de inspeccin visual. El sistema graba imgenes de la flama y por medio de
procedimientos computacionales podemos estudiar su fluctuacin.
Revisin de partculas de gas. Est tcnica utiliza sensores localizados en ductos de
turbinas de gas y pueden detectar partculas provocadas por el desgaste (superficies
con friccin, asperezas, desgaste de cuas, etc.).
Clarmetros. Permiten medir el claro de rotacin del alabe.
Anlisis de seales de corrientes de motores. Identifica problemas mecnicos y
elctricos. Las variaciones de corriente en la lnea de alimentacin indican
deterioracin en el motor.
Anlisis termogrfico. Est tcnica usa fotografa infrarroja defectos en dispositivos
mecnicos, elctricos y electromecnicos incluyendo switches y calderas.
Monitoreo ultrasnico de desgaste de amortiguacin. En el transductor se monta un
cristal piezoelctrico y mide la distancia entre el cristal y la superficie de
amortiguamiento. Cuando el desgaste ocurre, la distancia decrece y es detectada
electrnicamente.
Monitoreo acstico de fugas en tubos de calderas. Se puede monitorear perdidas en
las tuberas de caldera por sensores de emisin acstica. La salida de los sensores es
el sonido del agua que producen los gases de escape. Para mayor cantidad de
sensores acondicionados adecuadamente es posible detectar ms fugas.
Monitoreo del sistema de lubricacin. La presin del lubricante es un indicador de la
salud. La presin alta podra deberse al mal funcionamiento del regulador de presin
u obstruccin de aceite en ventiladores y filtros. La baja presin podra ser
consecuencia de prdidas y fallas en el nivel de las vlvulas. Es importante tambin
revisar la temperatura del lubricante.
1.5.2. Diagnstico paramtrico.

Los sistemas de monitoreo automtico son una parte esencial de las plantas de potencia
de turbinas de gas y se aplican no solamente para realizar las pruebas de las turbinas de
gas. Los algoritmos de anlisis de parmetros de medicin (presin del gas, temperatura
del gas, velocidad de rotacin, consumo de combustible) permiten predecir las fallas de
las turbinas de gas y pronosticar su comportamiento el resto de vida del motor, sin
detenerlo y desensamblarlo. [8]
21

Los parmetros del conducto de flujo dependen del funcionamiento del rgimen el cul
es determinado por las condiciones de entrada y control U y el estado tcnico de la
turbina de gas descrito por
Los mtodos paramtricos se clasifican segn el tipo de parmetros medidos en:
o
o
o
o
o
o
Diagnosis del conducto de flujo.

Diagnosis de las vibraciones.
Diagnosis del sistema de aceite.
Diagnosis del sistema combustible.
Diagnosis del sistema de arranque.
Diagnosis de la mecanizacin del motor.
Los dos primeros son ms sofisticados.

Los sistemas automatizados de diagnosis de ITG (Instalaciones de Turbinas de Gas)
estacionarios proceden de los de aviacin los cuales pasaron las siguientes etapas de
desarrollo:
o
o
o
o
o
o
Sistemas en base del monitoreo visual.

Sistemas con los registradores de emergencia (finales de los 50s).
Sistemas de los registradores de mantenimiento (AIDS).
Sistemas integrados de la diagnosis del avin.
Sistemas individuales de la diagnosis del avin.
Sistemas individuales de la diagnosis de motor (FADEC- Full Authory Digital
Electronic Control).
La diagnosis de los motores de turbina de gas se basa en los modelos diagnsticos, los
cuales establecen la relacin entre el estado actual del motor y las variables medidas.
Un requisito principal es que los modelos diagnsticos simulen las fallas del motor. Los
modelos del conducto de flujo tienen fundamento en la teora de turbomaquinas. Se
pueden clasificar de acuerdo a su descripcin matemtica:
Modelos de caja negra (nivel uno).
GC = C 0 + C1TE + C 2 PE + C3 n PA + C 4 nPA + C5 nPATE
(1.3).
donde Gc es el caudal de combustible; TE, y PE son la temperatura y la presin en la

entrada de motor y nPA es la velocidad del rotor de presin alta.
22

Modelos de nivel dos. En el diagnstico de las turbinas de gas se propagan en gran

escala los modelos lineales y no lineales de nivel dos en los cuales el motor se
describe con la profundidad de componente (compresor, turbina etctera). En la
ecuacin (1.4) se muestra el modelo lineal que relaciona la matriz de rcoeficientes de
influencia H con
los cambios pequeos de los parmetros del estado dQ y los cambios
r
de la norma dY del conducto de flujo alrededor de un rgimen estacionario del motor
(rgimen diagnstico).
r
dY = HdQ
(1.4).
Modelo no lineal del conducto de flujo

El modelo no lineal sirve para calcular los parmetros de turbina de gas en diferentes
regimenes estacionarios y tiene la forma de la ecuacin (1.5) Los modelos matemticos
pueden obtenerse mediante dos vas:
o Precisar y profundizar la descripcin de los procesos fsicos de la turbina de gas:
Est va es muy lenta y compleja
o Identificar el modelo con los datos experimentales. Est va busca parmetros
r
interiores del modelo (por ejemplo, vparmetros de las caractersticas Q )
para aproximarlos con los de medicin Y * . Por lo tanto podemos presentar el
procedimiento de la identificacin como el problema de optimizacin que describe
la ecuacin (1.6):
r
r r
Y = F (Q,U )
r
r
r r r
Q = arg min Y * - Y (Q, U
(1.5).
(1.6).
Donde
es el signo de la norma de vector. El procedimiento de la identificacin del
modelo no lineal forma el fundamento de los algoritmos diagnsticos ms completos y
complejos.
El modelo universal y esquema generalizado de la turbina de gas son las bases del software
del modelo no lineal. El modelo permite realizar clculos como el clculo de la caracterstica
de estrangulacin y clculo de la matriz de coeficientes de influencia.
23

Calculo de la caracterstica de estrangulacin.

El clculo den estrangulacin es el clculo del rgimen estacionario e incluye los
cmputos sucesivos del paso del flujo (el clculo de los componentes desde el principio:
entrada, compresor, cmara de combustin, etc.). Los argumentos se desconocen al inicio
del procedimiento. El algoritmo de clculor es el siguiente:
Incluimos los argumentos en el vector X de variables desconocidas, antes de inicio del
computor damos a las variable unos valores iniciales y calculamos el paso de flujo con el
vector X determinado. Sin embargo, los parmetros
calculados del paso no son ciertos a
r
causa del uso de valores libres del vector X . Por lo tanto, formamos el sistema de
ecuaciones algebraicas.
r r r r
H [X , U , Q ] = 0
(1.7 ).
Este conjunto de ecuaciones refleja la condicin de trabajo de todos los componentes de la

turbina de gas. Por ejemplo, la ecuacin (1.8) refleja el balance de potencias de un rotor.
HN =
NC
-1
N Th mec - DN T
(1.8).
El sistema se resuelve por el mtodo Newton-Rhapson que presenta un procedimiento

cclico. En cada iteracin i nueva la solucin actual Xi+1 se busca con la suma de la
solucin previa y la correccin conveniente:
r
r
X i+1 = X i + DX i
(1.9).
La correccin DX i se determina como la solucin del sistema lineal siguiente:

r
r
N i = B i DX i
Los elementos de la matriz B se computan digitalmente segn la frmula:
24
(1.10).

(B )
ql
dH i q
dX i l
(1.11).
Forma paramtrica de las caractersticas.

En el modelo cada caracterstica de componente n = f (P1 , P 2 ) se escribe en la forma
paramtrica siguiente:
n = n 0 1 + a
P 1 - P 10
P - P 20
+c
+b 2
DP 1
DP 2
(1.12).
Donde:
n 0 es el valor inicial de la caracterstica.
P1 , P 2 , P 10 yP 20 Cantidades actuales y bsicas de los argumentos.
DP 1 yDP 2 Cambios probables de los argumentos.
a, b y c Coeficientes constantes.
r
Los parmetros de las caractersticas de los componentes (forman el vector Q en el

modelo) tienen la capacidad de desplazar de las caractersticas e imitar la influencia de
fallas al motor. Tal presentacin de las caractersticas permite automatizar el proceso del
clculo del modelo lineal (la matriz de los coeficientes de influencia H).
Calculo de la matriz de los coeficientes de influencia.
Los elementos H ij =
Yi
presentan las derivadas particulares y pueden ser determinadas
Q j
por la formula:
Yi - Yi 0
Y
i0
Q j - Q j0
Q j 0
(1.13).
Tenemos que calcular el rgimen estacionario 1+r veces: una vez con todos los
parmetros iniciales Q j 0 y r veces con las variaciones alternas de r parmetros de las
caractersticas.
25

Mtodos paramtricos de la diagnosis de MTG

Dentro de la diagnosis paramtrica de MTG se distinguen tres direcciones:
o Monitoreo de tolerancia. Se monitorea por valores extremos; desviaciones de la
norma (se usa la norma individual o la de la serie) y motores contiguos. El objeto de
monitoreo segn el valor y del parmetro diagnostico puede estar en uno de dos
estados: DG (buen estado cuando y<ylim) y D1 (estado defectuoso cuando y>ylim),
donde ylim es el lmite del buen estado. Sin embargo, la decisin diagnostica d0 o d1 se
ejecuta por el parmetro medido y* que contiene los errores aleatorios. Hay dos tipos
de probabilidad de errores dentro este monitoreo: la probabilidad del fallo falso
Pff=P10=P (d1/D0) y la del fallo omitido P fo=P01=P (d0/D1). Para disminuir el nivel
total de los errores se introduce la frontera de aceptacin de la decisin diagnostica
yfr que se distingue del lmite ylim . Podemos formar el criterio de la minimizacin en
la vista (c10P10+c01P01). En caso comn c01/c10>1, porque el error de fallo omitido es
muy grave. El mtodo de monitoreo por valores extremos es el ms simple de los
tres, pero el problema de la minimizacin de los errores diagnsticos no es trivial.
o Anlisis de las tendencias. El anlisis diagnostico ser efectivo cuando se asegura el
descubrimiento oportuno de las fallas. Para lograr este objetivo podemos disminuir la
frontera yfr pero eso significa el aumento de la probabilidad Pff. Otro enfoque al
descubrimiento temprano de las fallas est relacionado con el anlisis de las
tendencias en comportamiento de los parmetros medidos, Dos hiptesis se verifican:
D0- el valor verdadero no se vara, D1- el valor verdadero se vara (gradualmente o
por sobresalto). Al evitar la influencia del rgimen se analizan tambin los cambios
absolutos Dy=y*-yn o los relativos dy =
y * - yn
, donde yn es la norma de parmetro.
yn
Se aplican prcticamente cuatro mtodos de anlisis en:

1) Los cambios de parmetro dentro de un ciclo de monitoreo.
yi - yi- < [Dy ]
(1.14).
2) Aplicacin de la alineacin (alisamiento) exponencial.

i
yi = yi -1 + a ( yi - yi -1 ) = a (1 - a ) i +k yk
(1.15a ).
k =1
yi - yi- < [Dy ]

26
(1.15b ).

3) Aplicacin de la alineacin por el mtodo del valor promedio.

yi =
yi + yi -1 + ...... + yi- n +1
n
(1.16).
4) Criterio-R.
.
n-
r=
(y
k +1
k =1
n
(y
- yk ) 2
, donde
- y)
y=
1 n
yk
n k =1
(1.17a ).
k =1
r > [r ]
(1.17b).
o Localizacin de las fallas. La variedad de mtodos conocidos de localizacin de las

fallas del conducto de flujo parte de dos direcciones: la diagnosis en base de la
identificacin del modelo matemtico (direccin terica) y en base a la clasificacin
real en el espacio de los parmetros medidos (direccin emprica). Analizamos
primeramente los mtodos de la direccin terica.
- Mtodo de las matrices diagnosticas. Al ignorar los errores de medicin formamos
el sistema siguiente de las ecuaciones lineales.
r
r
HdQ = dY *
(1.18).
Si el nmero r de parmetros desconocidos Q j es igual al nmero m de

mediciones Yi* la solucin del sistema es:
r
dQ = H -1dY *
(1.19).
- Mtodo de los mnimos cuadrados. Los errores de la estimacin Q pueden

disminuir por el incremento del nmero de mediciones y la diagnosis en varios
regmenes. El numero de las ecuaciones del sistema (1.8) excede el numero de
variables desconocidas, y el mtodo de los mnimos cuadrados da la solucin
aproximada
27

d Q = A-1 H T Wd Y *
(1.20).
donde W- matriz de los pesos de mediciones y A=HT WH- matriz cuadrada.

Esta solucin corresponde a la distancia mnima
f (Q ) = [d Y * -d Y (Q) ]W [d Y * -d Y (Q) ]
(1.21).
entre la medicin y el modelo.

- Mtodo en la base de la formula de Bayes. Se aplica la hiptesis que el estado de
objeto puede corresponder a una clase de la clasificacin Dj, j=1,.,q. Es
conveniente la probabilidad P( D J / Z *) como criterio de proximidad del estado a la
clase. Las probabilidades necesarias se encuentran por la formula de Bayes
P( DJ / Z *) =
f ( Z * / D J ) P( DJ )
Q
f (Z * / D
(1.22).
)P(DJ )
J =1
donde P (DJ) - la probabilidad a priori; f ( Z * / D J ) - la densidad condicional

Aunque las fallas afectan a las mediciones y variables de conducto de flujo registradas;
el impacto en los cambios en las condiciones de operacin es ms importante. Es porque
al ejecutarse proceden del clculo previo de desviaciones. Existen clculos entre la
diferencia de las variables medidas de un motor daado y un motor en buen estado
(variables de referencia). Para cada medida monitoreada Yi, la desviacin relativa Y* i
del valor actual medido Y*i de un valor de referencia Y0i. La desviacin se calcula con
la siguiente expresin (Loboda 2002):
dy =
yi * - y0 i
y0 i
(1.23).
Cada valor de referencia depende de un vector de condiciones operacionales (variables

r
de condiciones de motor y condiciones externas juntas) U y el vector de referencia se
r
r
presenta como Y0 = F (U ) .
28

La exactitud de las desviaciones depende de la calidad de la funcin de referencia. Sin

embargo, el clculo adecuado de la funcin de referencia cambia con el problema. El
modelo termodinmico puede ser empleado como funcin si los factores de correccin
son fijos y corresponden a la funcin de referencia del motor. Este modelo tiene la
desventaja de que es complejo el procedimiento para su obtencin y en tiempo real su
clculo puede retrasarse. Una alternativa de construccin de la funcin de referencia es
el mtodo de polinomios y las redes neuronales. En esta tesis calcule la funcin de
referencia con una red neuronal y compar los resultados con una funcin de referencia
que se obtuvo por polinomios.
Conclusiones del captulo.

En el captulo se describi el funcionamiento termodinmico de la turbina de gas, as
como cada uno de los componentes que la integran. Por razones de seguridad,
econmicas y debido a los procesos complejos a que son sometidos todos los
componentes de la turbina de gas requieren un monitoreo permanente de su
comportamiento. El captulo tambin introduce el rea de diagnostico paramtrico de
turbinas de gas. Este tipo de diagnstico involucra la funcin de referencia en la
simulacin de las fallas de las turbinas de gas. Para esta tesis hemos escogido dos
mtodos diferentes del clculo de la funcin mencionada. El primer mtodo usa las redes
neuronales descritas en el capitulo siguiente.
29

CAPITULO 2.
ARTIFICIALES.
REDES
30
NEURONALES

2.1 Introduccin.
Uno de los grandes enigmas que ha preocupado al hombre desde tiempos ancestrales es
el de su propia naturaleza. Cules son las caractersticas que nos hacen humanos, que
tiene el hombre que no tienen el resto de los animales, que nos hace nicos entre
todos los seres vivos. Este enigma ha venido asociado con el de la inteligencia, pues
dentro de la naturaleza humana est el ser inteligente, y esta es una caracterstica que
distingue absolutamente a nuestra especie. Es por esto por lo que el estudio de la
inteligencia ha fascinado a filsofos y cientficos desde siempre y ha sido un tema
recurrente en tratados y libros, y sin embargo no se han producido avances
significativos. [9]
A medida que la ciencia y la tecnologa han ido avanzando, el objetivo se ha ido
perfilando: uno de los retos ms importantes a los que se enfrenta el ser humano de
nuestra generacin es el de la construccin de sistemas inteligentes. Aqu, sistema
puede ser entendido como cualquier dispositivo fsico o lgico capaz de realizar la
tarea requerida. Este es precisamente el objetivo de la disciplina cientfica conocida
con el nombre de Inteligencia Artificial.
Dentro de la Inteligencia Artificial se pueden distinguir dos grandes reas. Una se
ocupa de la construccin de sistemas con caractersticas que se puedan definir como
inteligentes. A este campo se le denomina Inteligencia Artificial Simblica. En este
caso, se define el problema a resolver y se disea el sistema capaz de resolverlo
siguiendo esquemas prefijados por la disciplina. Los Sistemas Expertos siguen este
esquema: se introducen una serie de reglas lgicas que recogen el conocimiento de un
experto sobre una materia, y mediante mecanismos de inferencia parecidos a los que
empleamos al razonar, se sacan conclusiones.
Frente a esta perspectiva se encuentra la otra gran rea de la Inteligencia Artificial, la
Subsimblica. En este caso no se realizan diseos a alto nivel de sistemas capaces de
resolver los problemas utilizando las tcnicas de la disciplina, sino que se parte de
sistemas genricos que van adaptndose y construyndose hasta formar por s mismos
un sistema capaz de resolver el problema. Esto quedar ms claro con un ejemplo. Una
perspectiva simblica consiste en el estudio de los mecanismos de razonamiento
humano a alto nivel, cmo nos enfrentamos a un problema, cmo lo abordamos y
resolvemos; y se elaboran programas que realizan las mismas tareas.
Cuanto mejor haya podido entenderse la forma de razonar humana, ms eficiente ser el
sistema producido a la hora de resolver los problemas planteados. La perspectiva
subsimblica trata de estudiar los mecanismos fsicos que nos capacitan como seres
inteligentes, frente a los programas de computador clsicos que son simples autmatas
31

que obedecen rdenes muy concretas. El mecanismo fundamental que capacita a los
seres vivos para la realizacin de tareas sofisticadas no preprogamadas directamente es
el sistema nervioso. Desde este punto de vista la perspectiva subsimblica trata de
estudiar los mecanismos de los sistemas nerviosos, del cerebro, as como su estructura,
funcionamiento y caractersticas lgicas, con la intencin de disear programas basados
en dichas caractersticas que se adapten y generen sistemas capaces de resolver
problemas. Es en este campo donde se encuadran las Redes de Neuronas Artificiales.
2.2 Estructura de las redes Neuronales.

La neurona artificial, clula o autmata, es un elemento que posee un estado interno,
llamado nivel de activacin, y recibe seales que le permiten, en su caso, cambiar de
estado. [9]
Si se denomina S al conjunto de estados posibles de la neurona, S podr ser, por
ejemplo, S = {0, 1}, siendo 0 el estado inactivo y 1 el activo. S tambin podr tomar un
mayor nmero de valores, S = {0, 1, 2,, n} para representar, por ejemplo, una imagen
con n +1 niveles de gris, o incluso un intervalo continuo de valores, por ejemplo S =
[0,1].
Las neuronas poseen una funcin que les permite cambiar de nivel de activacin a
partir de las seales que reciben; a dicha funcin se la denomina funcin de transicin
de estado o funcin de activacin. Las seales que recibe cada neurona pueden provenir
del exterior o de las neuronas a las cuales est conectada.
El nivel de activacin de una clula depende de las entradas recibidas y de los valores
sinpticos, pero no de valores anteriores de estados de activacin. Para calcular el
estado de activacin se ha de calcular en primer lugar la entrada total a la clula, Et.
Este valor se calcula como la suma de todas las entradas ponderadas por ciertos
valores.
Salidas
Figura 2.1: Esquema de una unidad de proceso tpica.
32

La Figura 2.1 muestra un modelo que representa esta idea. Aqu un grupo de entradas x1,
x2,, xn son introducidas en una neurona artificial. Estas entradas, definidas por un
vector X, corresponden a las seales de la sinapsis de una neurona biolgica. Cada seal
se multiplica por un peso asociado w1, w2,, wn antes de ser aplicado el sumatorio
etiquetado por S. Cada peso corresponde a la fuerza de una conexin sinptica, es decir
el nivel de concentracin inica de la sinapsis, y se representa por un vector W.
El sumatorio, que corresponde al cuerpo de la neurona, suma todas las entradas
ponderadas algebraicamente, produciendo una salida que se denomina E, as:
E = x1 w1 + x2 w2 + .......... xn wn
(2.1).
Esto puede ser definido en forma vectorial como sigue:

E = X TW
( 2.2).
Las seales E son procesadas adems por una funcin llamada funcin de activacin o
de salida T, que produce la seal de salida de la neurona S. Dependiendo de la funcin
F, habr distintos modelos de autmatas; por ejemplo:
Modelo computacional
Lineal: S = KB con K constante.
Umbral: S = 1 si E >=q , S = 0 si E <=q; siendo q el umbral constante.
Cualquier funcin: S = F (I); siendo F una funcin cualquiera.
En la Figura 2.2 se muestra un ejemplo de una unidad tpica de proceso de una Red
Neuronal Artificial. A la izquierda se ve una serie de entradas a la neurona; cada una
llega de la salida de otra neurona de la red. Una vez calculada la salida de una neurona,
como se ha explicado en el apartado anterior, esta se propaga, va conexiones de salida,
a las clulas destino. Todas las conexiones de salida reciben el mismo valor de salida.
33

Figura 2.2: Red multicapa.
A la manera en que las clulas se conectan entre si se la denomina patrn le

conectividad o arquitectura de la red. La estructura bsica de interconexin de clulas
es la de la red multicapa, mostrada en la Figura 2.2. Se trata de la estructura tpica
de implementacin del paradigma conocido como RETRO PROPAGACIN. El primer
nivel lo constituyen clulas de entrada; estas unidades reciben los valores de unos
patrones representndoos como vectores que sirven de entrada a la red. A continuacin
hay una de capas intermedias, llamadas ocultas, cuyas unidades responden a rasgos
particulares que pueden aparecer en los patrones de entrada. Puede haber uno o mas
niveles ocultos. El ltimo nivel es el de salida. La salida de estas unidades sirve como
salida de toda la red.
Cada interconexin entre unidades de proceso acta como una ruta de comunicacin:
a travs de estas interconexiones viajan valores numricos de una clula a otra. Estos
valores son evaluados por los pesos de las conexiones. Los pesos de las conexiones se
ajustan durante la fase de aprendizaje para producir una Red de Neuronas Artificial
final.
As pues, una Red de Neuronal Artificial podra definirse como un grafo cuyos nodos
estn constituidos por unidades de proceso idnticas, y que propagan informacin a
travs de los arcos. En este grafo se distinguen tres tipos de nodos: los de entrada, los de
salida y los intermedios.
El funcionamiento de la red es simple. Para cada vector de entrada, este es introducido
en la red copiando cada valor de dicho vector en la clula de entrada correspondiente.
Cada clula de la red, una vez recibida la totalidad de sus entradas, las procesa y genera
una salida que es propagada a travs de las conexiones entre clulas, llegando como
entrada a la clula destino. Una vez que la entrada ha sido completamente propagada por
34

toda la red, se producir un vector de salida, cuyos componentes son cada una de las
clulas de salida.
As pues, el esquema de funcionamiento de una Red de Neuronas por capas como la de
la Figura 2.2 puede describirse mediante la ecuacin:
r
S = F ( F ( F ( F ( X .W1 ).W 2 ).W3 ).W 4 )
(2.3).
Donde W1, W2, W3 y W4 son los pesos de la primera a la cuarta capa; F es la funcin de
activacin idntica en todas las neuronas; X es el vector de entrada a la red, y S es el
vector de salida que la red produce. W son matrices de conexiones entre las capas de la
red, y por lo tanto se trata de multiplicaciones de matrices. La funcin de activacin F
desempea un papel importante en un esquema de Red de Neuronas.
A continuacin se describen las funciones de activacin ms populares. [10]
Funciones lineales: son funciones que dan salida lineal:
f ( x ) = x, x R
( 2.4).
Funciones escaln: son funciones que dan una salida binaria dependiente de si el valor
de entrada est por encima o por debajo del valor del umbral. Ejemplos de estas
funciones son la funcin signo, sgn(x), y la funcin escaln estndar, (x), funciones
definidas como:
- 1 si x < 0
sgn( x) =
1 en otro caso,
0, si x < 0
1 en otro caso.
q ( x) =
(2.5).
La figura 2.3 compara las funciones de activacin lineal y signo. La funcin lineal da
una respuesta gradual de la entrada, mientras que la funcin umbral no lineal determina
un umbral objetivo de disparo para la actividad. En este caso, la funcin neuronal
resulta.
35

Figura 2.3. Funciones de activacin lineal y signo.
Funciones sigmoidales. Son funciones montonas acotadas que dan una salida gradual
no lineal para las entradas. Las funciones sigmoidales ms populares son:
1. La funcin logstica de 0 a 1.
f c ( x) =
1
1 - e -cx
Figura 2.4. Funcin de activacin no lineal unipolar.
36
( 2.6).

Al utilizar esta funcin de activacin dar una salida gradual entre 0 y 1 para las
entradas.
2.
La funcin tangente hiperblica de -1 a 1.

f c ( x) = tanh(cx)
( 2.7).
Con esta funcin de activacin dar una salida gradual de 1 a -1 para las entradas.
Figura 2.5. Funcin de activacin no lineal bipolar.
Arquitectura
Las neuronas se pueden organizar en capas conectadas por varios tipos de uniones
incluyendo conexiones hacia adelante, laterales y hacia atrs:
1. Conexiones hacia delante: Conectan neuronas de una capa con neuronas de la capa
siguiente (ver figura 2.2). Cada una de estas conexiones implica una composicin
funcional entre las funciones de activacin de las correspondientes neuronas y, como se
ver ms adelante, da a la red neuronal la capacidad de reproducir una amplia clase de
funciones no lineales.
2. Conexiones laterales: conectan neuronas de la misma capa. Junto con el caso simple
de redes de una sola capa (ver figura 2.7), este tipo de conexin se usa generalmente en
capas competitivas, donde cada nodo se conecta a s mismo mediante un peso positivo
(excitante) y a los dems nodos de la capa con pesos negativos (inhibitorios).
37

3. Conexiones hacia atrs (o recurrentes): incorporadas a las redes para tratar modelos
dinmicos y temporales, es decir, modelos con memoria (figura 2.8).
Figura 2.7. Red hopfield
Figura 2.8. Red de Jordan.
En algunos casos, la topologa de la red permite clasificar las unidades neuronales de

una forma natural como sigue:
Capa de entrada de una red neuronal. Una unidad se dice que est en la capa de entra de
una red neuronal (X, U), si es la entrada de al menos un unidad procesadora de U y no es
la salida de ninguna unidad procesadora de U.
38

Capa de salida de una red neuronal. Una unidad se dice que est en la capa de salida de
una red neuronal (X, U), si es la salida de al menos una unidad procesadora de U y no es
la entrada de ninguna unidad procesadora de U.
Capas intermedias u ocultas de una red neuronal. Una unidad se dice que est en la capa
intermedia de una red neuronal (X, U), si es la entrada de al menos una unidad
procesadora de U y, al mismo tiempo, es la salida de al menos una unidad procesadora
de U.
Aprendizaje.
Una de las principales propiedades de la RNA es una capacidad de aprendizaje a partir
de unos datos. Una vez que ha sido elegida la arquitectura de red para un problema
particular, los pesos de las conexiones se ajustan para codificar la informacin contenida
en un conjunto de datos de entrenamiento.
Validacin.
Una vez que ha terminado el proceso de aprendizaje y los pesos de la red neuronal han
sido calculados, es importante comprobar la calidad del modelo resultante. Por ejemplo,
en el caso del aprendizaje supervisado, una medida de calidad puede dar en trminos de
los errores entre los valores de salida y los obtenidos por la red neuronal. Algunas
medidas estndar del error son:
1. La suma de los cuadrados de los errores (Sum of Square Errors, SSE), definida como
r
b p - b*p
( 2.8).
p =1
2. La raz cuadrada del error cuadrtico medio (Root Mean Square Error, RMSE)
definida como:
3.
El error mximo,
n
e = max b p - b p
p =0... N
39
(2.10).

Tambin es deseable realizar una validacin cruzada para obtener una medida de la
calidad de prediccin del modelo. Con este propsito, los datos disponibles se pueden
dividir en dos partes: una parte destinada al entrenamiento de la red y otra parte a la
comprobacin. Cuando el error de comprobacin es mucho mayor que el error de
entrenamiento, entonces se produce un problema de sobre ajuste durante el proceso de
entrenamiento.
2.3. Clasificacin.
Existen cuatro tipos redes neuronales: las redes no supervisadas, supervisadas, hibridas y
reforzadas. En las primeras no conocemos los valores de salida y las neuronas se van
descartando de acuerdo a los valores que obtienen.
En el aprendizaje supervisado se presenta a la red un conjunto de patrones junto con
la salida deseada e iterativamente sta ajusta sus pesos hasta que la salida tiende a ser
la deseada utilizando para ello informacin detallada del error que comete en cada
paso. Ejemplos de estas redes son: Perceptron, Adaline-Madaline, Perceptron
Multicapa, Correlacin en cascada, Mquina de Boltzmann, LVQ ,GRNN y Support
Vector Machines
En el aprendizaje no supervisado consiste en la estimacin de la funcin densidad de
probabilidad para distribuir patrones pertenecientes al espacio de entrada a partir de
muestras. En este tipo de aprendizaje se presentan a la red multitud de patrones sin
adjuntar la respuesta deseada, la red estima la probabilidad con la regla de
aprendizaje a partir de la cual pueden reconocerse regularidades en el conjunto de
entradas, extraer rasgos o agrupar patrones segn su similitud. Dentro de esta
clasificacin se encuentran Hopfield y mapas de Kohonen.
En el aprendizaje hibrido coexisten dos tipos de aprendizaje, supervisado y no
supervisado, las cuales tienen lugar normalmente en distintas capas de neuronas. Las
redes de base radial caen en este grupo y tienen la caracterstica de que la capa oculta
trabaja con aprendizaje no supervisado.
El aprendizaje reforzado se sita en medio del aprendizaje supervisado y no
supervisado. Como en el primero se emplea informacin sobre el error cometido,
pero en este caso existe una nica seal de error que representa un ndice global del
rendimiento de la red, es decir, solo se indica lo bien o mal que est actuando. Como
40

en el caso del no supervisado, no se suministra explcitamente la salida deseada. En

ocasiones se denomina aprendizaje por premio y castigo.
2.4. Perceptrn multicapa.

La red tipo perceptron fue inventada por el psiclogo frank Rosenblat en el ao 1957. Su
intencin era ilustrar algunas propiedades fundamentales de los sistemas inteligentes en
general, sin entrar en mayores detalles con respecto a condiciones especficas y
desconocidas para organismos biolgicos concretos. El primer modelo de perceptron fue
desarrollado en un ambiente biolgico imitando la funcin del ojo humano,
fotoperceptron se le llamo a dispositivo que responda a seales pticas. [11]
El perceptron era inicialmente un dispositivo de aprendizaje, en su configuracin inicial
no tena la capacidad de distinguir patrones de entrada muy complejos, sin embargo
mediante un proceso de aprendizaje este adquira esta capacidad. En esencia, el
entrenamiento implicaba un proceso de refuerzo mediante el cual la salida de las
unidades A se incrementa o disminuye dependiendo de si las unidades A contribuan o
no a las respuestas correctas del perceptron para una entrada dada. Se aplicaba una
entrada y el estimulo se propagaba a travs de las capas hasta que se activase una unidad
de respuesta.
Si se haba activado la unidad de respuesta correcta, se incrementaba la salida de las
unidades A que hubieran contribuido. Si se activaba una unidad R incorrecta, se haca
disminuir la salida de las unidades A que se hubiesen contribuido.
La red tipo perceptron emplea principalmente dos funciones de transferencia, escaln
unipolar con salidas 1, 0 o escaln bipolar con salidas 1, -1; su uso depende del valor de
salida que se espera para la red es decir si la salida de la red es unipolar o bipolar; sin
embargo la funcin bipolar es preferida sobre la unipolar, ya que el tener un cero
multiplicando algunas de los valores resultantes el producto de las entradas por el vector
de pesos, ocasiona que estos no se actualicen y que el aprendizaje sea ms lento.
La nica neurona de salida del perceptron realiza la suma ponderada de las entradas,
resta el umbral y pasa el resultado a una funcin de transferencia de tipo escaln. La
regla de decisin es responder +1 si el patrn presentado pertenece a la clase A, o -1 si el
patrn pertenece a la clase B, la salida depende de la neta.
El perceptron es un tipo de red de aprendizaje supervisado, es decir necesita conocer los
valores esperados para cada una de las entradas presentadas: su comportamiento est
definido por pares de esta forma:
41

{p1 , t1}, {p2 , t2 }LLL{pa , ta }
( 2.11).
Cuando p es aplicando a la red salida de la red es comparad con el valor esperado t, y la

salida de la red est determinada por:
a = f wi p - hard lim s wi p
i
(2.12).
Los valores de los pesos determina el funcionamiento de la red, estos valores se pueden
fijar o adoptar utilizando diferentes algoritmos de entrenamiento de la red.
El proceso de entrenamiento el perceptron se expone a un conjunto de patrones de
entrada y los pesos de la red son ajustados de forma que al final de entrenamiento se
obtengan salidas esperadas para cada unos de esos patrones de entrada.
El algoritmo de entrenamiento del perceptron puede resumirse en los siguientes pasos:
1. Se inicializa la matriz de pesos y el valor de la ganancia, por lo general se asignan
valores aleatorios a cada uno de los pesos wi y al valor b.
2. Se presenta el primer patrn a la red, junto con la salida esperada en forma de pares
entrada/salida.
3. Se calcula la salida de la red por medio de
a = f ( w1 p1 + w2 p 2 + b)
(2.13).
4. Cuando la red no retorna la salida correcta, es necesario alterar el valor de los pesos,
tratando de llevarlo hasta p y as aumentar las posibilidades de que la clasificacin sea
correcta, una posibilidad es adicionar p a w haciendo que el vector w apunte en la
direccin de p, y de esta forma despus de repetidas presentaciones de p a la red, w se
aproximar asintticamente a p; este es el procedimiento adoptado para la regla de
aprendizaje del perceptron.
Antecedentes del algoritmo retropropagacin.
Dado que existe un enorme abanico de estructuras existentes, solo nos limitaremos a
hablar sobre el algoritmo de retropropagacin en el cual se basa la red que utilizamos
para reconocimiento de patrones. Esta red no permite realizar un diagnstico en una
turbina de gas
42

El primer algoritmo de entrenamiento para redes multicapa fue desarrollado por Paul
Verbos en 1974, ste se desarrollo en un contexto general, para cualquier tipo de redes,
siendo las redes neuronales una aplicacin especial, razn por la cual algoritmo no fue
aceptado dentro de la comunidad de desarrolladores de redes neuronales. Fue solo hasta
mediados de los 80 cuando el algoritmo Backpropagation (retropropagacin)
redescubierto.
Uno de los grandes avances logrados con la Backpropagation es que esta red aprovecha
la naturaleza paralela de las redes neuronales para reducir el tiempo requerido por un
procesador secuencial para determinar la correspondencia entre unos patrones dados.
Adems el tiempo de desarrollo de cualquier sistema que se est tratando de analizar se
puede reducir como consecuencia de que la red puede aprender el algoritmo correcto sin
alguien tenga que reducir por anticipado el algoritmo en cuestin.

Se discuti que las redes neuronales artificiales son modelos matemticos de las redes
neuronales biolgicas, su objetivo es imitar las capacidades que tienen el hombre y los
animales de reconocer objetos e interpretar estmulos. Para poder implementar estos
modelos es necesario considerar que la neurona es un pequeo procesador con
capacidades limitadas a comparacin de las computadoras actuales. Sin embargo al
trabajar millones de ellas en conjunto son capaces de realizar tareas como reconocer
patrones y extraer caractersticas de un proceso de aprendizaje. En esta tesis se pretende
entrenar a una red neuronal para aprender una funcin de referencia y comparar su
capacidad de simular el comportamiento de turbinas de gas con la misma capacidad de
un polinomio como lo describe el captulo siguiente.
43

CAPITULO 3. DESARROLLO DE LOS

ALGORITMOS.
44

3.1. Introduccin.
En el capitulo uno describimos el objeto de estudio y porque es importante evitar un mal
funcionamiento, tambin se mencionaron los mtodos fsicos y paramtricos que nos
permiten identificar fallas y el estado actual del motor.
El monitoreo basado en la condicin y la teora del diagnstico es importante para tener
una mayor seguridad operacional, reducir la cantidad y severidad de las fallas, as como
minimizar el costo del mantenimiento de la maquinaria. Se define como la recoleccin e
interpretacin inteligente de datos para predecir fallas. [12]
La teora del diagnstico abarca tres etapas que son: etapa preliminar del clculo de las
desviaciones a travs de la funcin de referencia, monitoreo (deteccin de fallas),
diagnstico mismo (identificacin de fallas) y pronstico.
En este trabajo de tesis consideramos la etapa preliminar, que sirve como referencia a
otros modelos que involucran fallas y puede reducir costos considerablemente porque
podemos ahorrar tiempo y dinero en pruebas de un motor piloto.
El modelo elegido describe las variables del conducto de flujo y tiene fundamento en la
teora de turbomaquinas. El modelo que se mencionara en este captulo es del tipo caja
negra y puede tener por ejemplo la siguiente estructura:
GC = C 0 + C1TE + C 2 PE + C 3 n PA + C 4 n PA 2 + C 5 n PA T E
(3.1).
donde Gc es el caudal de combustible; TE, y PE son la temperatura y la presin en la

entrada de motor y por ultimo hPA es la velocidad del rotor de presin alta.
En este captulo se explica el procedimiento para encontrar el modelo del
funcionamiento correcto de una turbina de gas. El motor utilizado es una instalacin de
turbina de gas de dos rotores y de turbina de potencia (motor turboeje con turbina libre).
Se usa para accionar un compresor centrfugo en tuberas de gas natural.
La instalacin fue presentada en las investigaciones por su modelo termodinmico y una
base de datos medidos durante el mantenimiento. Las variables medidas en el conducto
de flujo se difieren en las de control y las monitoreadas. Segn el proceso
termodinmico en una turbina de gas, las variables monitoreadas que definen el vector Y
dependen de las condiciones de operacin (variables de control y condiciones
atmosfricas en conjunto) unidas en el vector U .

Podramos usar el modelo termodinmico como funcin de referencia; pero es
imprctico y costoso en tiempo. Por lo tanto, debemos encontrar una funcin para
45

aproximar los datos del modelo termodinmico y comprobar su efectividad con datos
reales.
En contraste con la interpolacin, la aproximacin busca encontrar una funcin que este
cerca en cierta medida de los datos de partida, pero no tiene que coincidir con el valor
exacto de los mismos. La mayora de los mtodos de aproximacin se basan en
minimizar una norma o distancia entre la funcin actual (o los datos que la representan)
y su aproximacin.
Existen numerosos mtodos para aproximar funciones de varias variables. Por ejemplo,
se tienen los mtodos ms clsicos empleando polinomios, series de Fourier, o Splines;
y otros ms modernos que emplean Wavelets, funciones de base radial, Splines
multivariables o funciones Ridge.
Una Red Neuronal Artificial al ser una asociacin de pares entrada-salida se puede
interpretar como una funcin. De tal forma que si una red neuronal es capaz de aprender
con un mnimo error cualquier conjunto de datos, ser un aproximador universal de
funciones.
De los mtodos anteriores, en esta tesis aplicamos el mtodo de polinomios y las redes
neuronales artificiales para obtener la funcin de referencia. El objetivo del captulo es
explicar el desarrollo de ambas herramientas para obtener la funcin de referencia.
El polinomio contiene tres elementos que son un vector de variables independientes, un
vector de variables dependientes y los coeficientes que las relacionan. Para encontrar los
coeficientes consideramos aproximar el conjunto de vectores U e Y que se obtuvieron
por medio de un modelo termodinmico. El algoritmo para obtener los coeficientes del
polinomio es conocido como mnimos cuadrados.
La red neuronal como se defini en el captulo dos es un modelo artificial y sistemtico
basado en las redes biolgicas; aunque no significa que pueda imitar el comportamiento
real de las neuronas del cerebro. Esta representacin puede tener dos o ms niveles
llamados capas. Para este trabajo la red neuronal utilizada para el clculo fue un
perceptrn multicapa con tres capas: la capa de entrada cuyas neuronas son los
elementos del vector U, la capa oculta cuyo nmero no est definido inicialmente y la
capa de salida cuyas neuronas forman el elemento Y. El algoritmo de entrenamiento es
conocido como retropropagacin o regla delta. Con la misma base de datos usada para el
clculo de coeficientes del polinomio, se entreno a la red neuronal para variar los pesos.
Al terminar el ajuste de todos los pesos de la red, con diversas modificaciones en todos
los parmetros de la red, se introducen valores reales para comprobar la exactitud de la
red.
El algoritmo para obtener los coeficientes del polinomio es conocido como mnimos
cuadrados. En la red neuronal es conocido como retropropagacin o regla delta.
46

La herramienta de simulacin es matlab versin 2007; la ltima seccin del captulo

describe las instrucciones en matlab para el desarrollo de los programas.
3.2. Planteamiento del problema.

Debido a la complejidad que implica un motor de turbina de gas, y la importancia de
sus aplicaciones es importante detectar fallas sin que la turbina de gas detenga su
funcionamiento. Esto se logra midiendo las variables constantemente, para realizar
clculos que tienen que cotejar con un rango tolerable al que tiene la turbina de gas,
normalmente cuando est en ptimas condiciones, sin fallas. Sin embargo, esto no es
tarea sencilla, porque hay que distinguir por medio de nmeros y algoritmos si las
desviaciones en las mediciones se deben a problemas de contaminacin o problemas
ms graves como por ejemplo corrosin en algunos de los alabes del compresor. [13]
Para obtener la funcin de referencia, podemos basarnos en un conjunto de mediciones,
durante un periodo de tiempo. Las variables se obtienen con registros de mediciones en
tiempo real, cuando la turbina de gas funciona correctamente o de un modelo
termodinmico muy complejo, que aumentara el tiempo de clculo s se aplica al
algoritmo. Para la efectividad de la funcin de referencia consideramos los periodos de
lavado y contaminacin, que pueden variar considerablemente los datos, y tambin los
errores durante la medicin. El rango de tolerancia del modelo de estado normal de la
turbina de gas se define mediante las desviaciones:
dY =
Y - Y0
Y0
(3.2).
donde Y es el valor actual medido. Tanto Y como Y0 dependen de las condiciones de

operacin y por lo tanto dY puede servir como un buen indicador del envejecimiento
(degradacin) y fallas. Sin embargo, sobre la degradacin del motor, muchos factores
negativos afectan el clculo de las desviaciones sobre todo la inexactitud de la funcin.
Por eso el xito del diagnstico depende directamente de la perfeccin de la funcin de
referencia.
Las graficas de estas desviaciones son las que nos dan una idea cualitativa de la calidad
del modelo. En este caso comparamos las grficas de los dos mtodos que describiremos
a continuacin.
En este captulo se proponen dos soluciones, primero, un polinomio donde no se
conocen los coeficientes; la segunda opcin es una red neuronal que despus de ser
47

entrenada hay que modificar los pesos. En la red neuronal hay que calcular el nmero de
neuronas en la capa oculta, la cantidad de pocas para alcanzar el error mnimo, el cual
se asigno de 18x10-6. Adems, entrenamos la red con funciones de transferencia
unipolar, bipolar y lineal. Con cada una de las funciones de transferencia utilizamos
diecisiete variantes del algoritmo de retropropagacin definidas en matlab.
3.3. Funcin de referencia.

El presente trabajo analiza los parmetros medidos en el conducto de flujo de una
turbina de gas, tales como: temperaturas y presiones en el conducto de flujo, velocidades
de rotacin y caudal de combustible.
Para analizar los parmetros medidos y concluir el estado del sistema por medio de este
anlisis es necesario compararlos con los valores de referencia de un motor en buenas
condiciones despus de la fabricacin o un mantenimiento. Estos valores dependen de
las condiciones de operacin del motor. Por ende para describir todas variables de
referencia del motor en buenas condiciones se necesita una funcin vectorial -funcin de
referencia- que tiene el vector de las condiciones de operacin como argumentos. Las
diferencias entre los valores medidos y la funcin de referencia son conocidas como
desviaciones. Estas desviaciones por un lado cambian gradualmente a causa de
diferentes mecanismos de degradacin de turbinas de gas (por ejemplo, contaminacin
de compresores), por otro lado son afectadas por errores de la funcin misma. Por lo
tanto las graficas de las desviaciones no slo demuestran los efectos de degradacin sino
tambin reflejan la calidad de la funcin de referencia. [14]
La funcin de referencia est formada por dos vectores U e Y, vectores compuestos por
variables estndar del conducto de flujo.
r
El vector Y son variables de Y1 a Y7 las cuales se muestran en la siguiente tabla:
Tabla 3.1: Vector de salida de la funcin de referencia.
No
1
2
3
4
5
6
7
Nomenclatura
npa
Pc
Tt
Tc
Pt
Pt
ntpa
Nombre
Velocidad del rotor de presin alta
Presin del compresor
Temperatura de la turbina de presin alta
Temperatura del compresor
Presin de la turbina de presin alta
Presin de la turbina de potencia
Velocidad de Rotacin de la turbina de potencia
48

Estas variables Y son funcin de un vector U con variables de U1 a U4 las cuales se

muestran en la siguiente tabla:
Tabla 3.2: Argumentos de la funcin de referencia.
No
1
2
3
4
Nomenclatura
Gc
ntp
Ta
Pa
Nombre
Caudal de combustible
Velocidad de rotacin de la turbina de potencia
Temperatura ambiental
Presin ambiental
La funcin de referencia tiene la estructura de la siguiente ecuacin:

r
r
Y = F (U )
(3.3).
En estudios previos usamos la herramienta de polinomios para aproximar la funcin de

referencia necesaria. Dado que las redes neuronales artificiales son conocidas como
aproximadores perfectos, en este captulo se exponen las redes en la aplicacin a la
funcin de referencia para el diagnstico de un motor de turbina de gas. Durante la
investigacin se analizan diferentes modificaciones de la red y se comparan con los
polinomios.
3.3.1. Modelo descrito por polinomios.

En este caso las variables de salida Y quedan definidos por un polinomio de segundo
grado del tipo:
Y = c0 + c1 PH + c 2 TH + c3 n FT + c 4 G f + c5 PH TH + c 6 PH n FT + c7 PH G f + c8TH n FT +
c9 TH G f + c10 G f n FT + c1 P 2 H + c 2 T 2 H + c3 n 2 FT + c 4 G 2 f
(3.4).
El problema de encontrar los coeficientes de ci es un problema de ajuste de curvas de

regresin no lineal y mltiple que se simplifica con algebra lineal. [15]
Con motivo de presentar toda la funcin vectorial, podemos generalizar la expresin (3.4)
en la forma siguiente:
r
r
Y0* = V * A
49
(3.5).

donde Y0* . es el vector rengln de variables monitoreadas de dimensin m, V * . es el vector

rengln k-dimensional que une todos los componentes 1, u1 , u 2 , K, u32 , u 42 . y la matriz A
(km) incorpora los coeficientes ai para todas m variables monitoreadas.
Obviamente, el numero de ecuaciones m en el sistema lineal (3.5) no es suficiente para
estimar (mk) coeficientes desconocidos. A fin de obtener ms datos, involucramos en
r
r
los clculos las mediciones Y0 y U de n diferentes puntos de operacin y formamos las
matrices correspondientes Y (nm) y V (nk). Con las matrices nuevas, la ecuacin (3.5)
se transforma en
Y = VA
(3.6).
Para estimar los coeficientes desconocidos de la matriz A se aplica el mtodo de mnimos

cuadrados (MMC). El MMC consiste en encontrar tales estimaciones que minimizan la
suma de errores cuadrados
[
n
r r
yij - Vi* A j
(3.7).
i =1 j =1
Para encontrar la condicin de minimizacin nos basamos en el teorema de la mejor

aproximacin, cuya definicin es que V debe ser la proyeccin ortogonal de Y. [16]
Para un mejor entendimiento del problema considera cualquier vector u como la suma de
dos vectores ortogonales u pr y uc.
u = u pr +u c
(3.8).
Figura 3.1.-El vector de V ms cercano a u es u pr.
Tomando en cuenta la figura 3.1, upr es la proyeccin ortogonal en el plano V, el cual es

perpendicular a uc. Sea cualquier recta v diferente a upr, dentro del plano V, es obvio que
es ms grande que upr. Para una demostracin ms formal, consideremos (3.9):
50

uc = u - u pr < u - v
(3.9).
Los vectores upr-v y u-upr son ortogonales, porque el primero est en V y el segundo en
V ^ . Por tanto, se puede aplicar el teorema de Pitgoras expresado en (3.10):
u - u pr
+ u pr - v = (u - u pr ) + (u pr - v ) = u - v
(3.10).
En consecuencia, u - u pr < u - v , porque u pr - v 0 .

Sea Y - VA~ que es ortogonal a cualquier vector A, llegamos a (3.11) mediante el siguiente
procedimiento:
~
(Y - VA)VA = 0
~ )V = 0
V * (Y - VA
~) = 0
V * (Y - VA
~
V *Y - V *VA = 0
~ = V *Y
V *VA
A = (V *V ) -1V *Y
(3.11).
Esta solucin del MMC requiere un exceso de los datos de entrada. Por consiguiente,
tenemos que cumplir la condicin (nm)> (mk) o n>k. La solucin (3.11) asegura
errores aleatorios reducidos de las estimaciones, si comparamos con la solucin:
A = (V ) -1 Y
(3.12).
que se tiene para el caso n=k, cuando el nmero de ecuaciones se iguala al nmero de las
variables desconocidas.
Al poner la estimacin A . en la ecuacin (3.5), tenemos la funcin de referencia
La siguiente herramienta para crear la funcin de referencia y la principal en la presente
investigacin es la llamada redes neuronales artificiales.
51

3.3.2. Mtodo de aproximacin por redes neuronales

La teora de redes neuronales se basa en el modelo de las neuronas del cerebro. La
neurona es una clula activada por estmulos qumicos y biolgicos y tiene una capacidad
muy pequea del tratamiento de informacin. Sin embargo, cuando estn conectadas
millones de ellas trabajan como una red muy poderosa de procesadores paralelos. Eso
ocasiona que en muchas aplicaciones prcticas los supercomputadores modernos todava
no son capaces de semejarse con el funcionamiento del cerebro humano.
Aunque en el pasado las redes neuronales artificiales tenan el objetivo general de un
procesamiento de nivel ms bajo, por ejemplo, reconocimiento de patrones e inteligencia
artificial; existen teoremas que demuestran que redes como el perceptron multicapa y la
red de base radial, puedan aproximar varias funciones matemticas.
La primer investigacin de las virtudes del perceptrn multicapa como dispositivos para
la representacin de funciones continuas arbitrarias, la realizaron Hecht Nielsen (1987),
quienes se basaron en el teorema de superposicin de Kolomogorov que formulo
Sprecher en 1965. Entonces, Gallant y White mostraron que una red con una capa oculta,
con cosenos montonos ajustados en la capa oculta, e insertados en la salida como un
caso especial de red de Fourier se aproxima a un conjunto de series de Fourier dada por
su salida. Sin embargo, en el contexto del tradicional perceptrn multicapa, fue Cibenko
quien demostr rigurosamente que una sola capa oculta es suficiente para aproximar
uniformemente una funcin continua contenida en un hipercubo. [17]
Para resumir los teoremas mencionados anteriormente centraremos la atencin en los
resultados realizados por Funahashi y Cybenko en 1989:
Definamos a j (.) como un campo de funciones continuas, montonas y crecientes. Ip
denota el hipercubo unitario de dimensin-p [0,1]p. El espacio de funciones continuas en
Ip se llamara C(Ip). Entonces, dada una funcin f C ( I p ). y e > 0. , existe un entero M y
un grupo de constantes i, i y wji, donde i=1,.M y j=1,..p tal que:
M
i =1
j =1
F ( x1 , K , x p ) = a ij ( w ji x j -q j )
(3.13).
Como condicin de aproximacin de la funcin f(.); se debe cumplir que:

F ( x1 ,K, x p ) - f ( x1 ,K, x p ) < e
52
(3.14).

para todo {x1 ,K , x p } I p .

El teorema es directamente aplicable al perceptrn multicapa. Primero, notemos que la
funcin logartmica 1 [1 + exp(-v)] no lineal en un modelo neuronal para la construccin de
un perceptrn multicapa, es necesariamente una funcin monoticamente creciente que
satisface las condiciones de la funcin j (.) .
El teorema de aproximacin universal est respaldado por una justificacin matemtica
de aproximacin de funciones continuas.
Para el presente estudio seleccionamos el perceptrn multicapa que se entrena con el
algoritmo de retropropagacin. La estructura de la red utilizada se muestra en la figura
3.2. Como podemos ver, es una red neuronal con 3 capas: La primera es la capa de
r
entrada donde cada seal es un elemento del vector U de las condiciones de operacin de
turbinas de gas. A su vez, las salidas de estas se propagan con los pesos de la matriz w1
hacia la capa oculta que se activa con una funcin sigmoide de transferencia. De manera
semejante las salidas de la capa oculta se propagan con los pesos de la matriz w2 a los
nodos de salida. En ellos se suman y a travs de la funcin de transferencia forman las
r
seales de salida, elementos del vector Y0 de las variables monitoreadas.
El algoritmo que entrena a la red neuronal se basa en la biologa de humanos donde la
memoria a corto y largo plazo est asociada con las fuerzas entre las clulas presinapticas
y postsinapticas. De esta manera tenemos que ir modificando los valores de los pesos
hasta que mediante el procesamiento no lineal (o lineal) de cada capa se alcanza el valor
r
deseado de la salida Y0 . El desarrollo del algoritmo de retropropagacin para el
entrenamiento del perceptrn ha impulsado una amplia difusin de esta red. El objetivo
del entrenamiento de retropropagacin es encontrar tales valores de todos pesos que
minimizan la diferencia (error promedio e) entre las salidas deseadas de la red y las
actuales para todos los datos de la muestra de entrenamiento. Esta muestra consta de los
mismos datos que las matrices V e Y usadas para calcular los coeficientes de polinomios.
Podemos tratar el entrenamiento como el problema de la minimizacin de la funcin
e(w1,w2) en el espacio multidimensional de todos los pesos desconocidos.
53

Figura 3.2.-Estructura del perceptrn la funcin de referencia.
A pesar de la capacidad de aplicacin que comprende una red neuronal, es una estructura
compleja. Por eso, se examinaran cada uno de sus elementos en este captulo, tambin se
menciona el procedimiento matemtico que implica el algoritmo de entrenamiento, mejor
conocido como regla delta generalizada.
La retropropagacin estndar es un algoritmo de descenso del gradiente, como la regla de
aprendizaje de Widrow Hoff, que establece el movimiento de los pesos hacia el gradiente
negativo de la funcin definida por la red. Hay un gran nmero de variantes para el
mtodo de retropropagacin, basados en tcnicas estndar de retropropagacin, por
ejemplo: el mtodo de Newton y el gradiente conjugado. El toolbox de matlab utiliza ms
de una optimizacin, por lo que es importante describir primero detalladamente el mtodo
de retropropagacin estndar.
En la aplicacin de retropropagacin, distinguimos dos fases de clculo. La primera fase,
que se refiere a la propagacin hacia adelante y la segunda fase es la propagacin hacia
atrs.
En el clculo hacia delante los pesos sinpticos permanecen inalterados y las funciones de
las seales de la red son calculadas neurona por neurona. [9]
Para entender cmo se propagan los valores de entrada hacia delante consideremos la
figura 3.3 que muestra un perceptrn multicapa con C capas, C-2 capas ocultas y nc
neuronas en la capa c, para c=1,2,..,C. El peso de la conexin de la neurona i de la
capa c a la neurona j de la capa c+1 es wijC . Los componentes del vector de umbrales de la
54

capa c son uiC . Denominaremos las entradas como xi = ai1 , salidas aic de la capa oculta c y
aiC = yi salidas globales de la ltima capa.
Figura 3.3.-Red PERCEPTRON de C capas.
Los valores con los que se activan las neuronas de la capa de entrada con las seales del
exterior y se expresan como el vector X=(x1, x2, . , xn).
Las neuronas ocultas se encargan de procesar la informacin recibida aplicando una
funcin de activacin, que se explico en el capitulo dos; y puede ser sigmoidal, tangente
hiperblica o lineal:
f ( x) =
Funcin sigmoidal
Funcin Tangente hiperblica

Funcin lineal
1
1 + e-x
f ( x) =
(3.15).
1 - e- x
1 + e-x
f ( x) = x
(3.16).
(3.17).
El argumento de las funciones es la sumatoria de los productos de las activaciones de la

capa anterior por los pesos ms el umbral. Es decir:
nc -1
aic = f ( w cji-1 a cj-1 + u cj )
para i = 1,2,........, nc y c = 2,3,......... ., C - 1
j =1
donde a cj -1 son activaciones de la capa c-1, o sea la capa anterior.
55
(3.18).

Las activaciones en la capa de salida son similares a las neuronas en la capa oculta; con la
diferencia que son salidas globales de toda la red. La funcin puede ser tambin
sigmoidal o lineal y el argumento es la sumatoria de los productos de las activaciones en
la ultima capa oculta por los pesos ms el umbral. La activacin se calcula en (3.19):
nc -1
yi = aiC = f ( w Cji -1a Cj -1 + u Cj )
para i = 1,2,........, nc
(3.19).
j =1
donde Y=(y1,y2,..,yn) es el vector de salida de toda la red.

Esta fue la fase de activacin de la red. La segunda fase, conocida como propagacin
hacia atrs, comienza por la capa de salida, que transmite la seal de error hacia su
izquierda, capa por capa, al mismo tiempo calcula recursivamente el gradiente local para
cada neurona. Este proceso recursivo permite que los pesos sinpticos de la red actualicen
sus valores de acuerdo con la regla delta. Por cada neurona localizada en la capa de
salida, d es igual a la seal de error de la neurona multiplicada por la derivada de la
funcin de activacin no lineal. Para las neuronas en la capa oculta hay que considerar las
conexiones vecinas y calcular el error recursivamente. El detalle de esta ltima fase del
algoritmo reside en que se aplican criterios diferentes en la capa oculta y la capa de
salida.
Para la segunda fase del algoritmo, comenzaremos por definir el error e(n) cometido por
la red para el patrn n, dado por:
e( n ) =
1 nc
( si (n) - yi ( n)) 2
2 i=1
(3.20).
La seal de error de la salida de la neurona j durante la iteracin n (presentacin del

ensimo patrn de entrenamiento) se define como:
e j (n) = s j ( n) - y j (n)
(3.21).
Sea N el nmero de patrones o ejemplos de entrenamiento. El error cuadrtico promedio

se obtiene sumando E(n) desde 1 hasta N y normalizando con respecto a N:
Eav =
1
N
E ( n)
n=1
56
(3.22).

La suma instantnea de los errores cuadrticos E(n) y el promedio de los errores

cuadrticos Eav son funcin de todos los parmetros libres (por ejemplo, pesos sinpticos
y umbrales) de la red. Eav representa la funcin de costo como medida del rendimiento
del aprendizaje. El objetivo del proceso de aprendizaje es ajustar los parmetros libres
para minimizar Eav. Los ajustes a los pesos se realizan en concordancia con los errores
calculados por cada patrn presentado a la red. La aritmtica promedio de estos cambios
individuales de los pesos sobre todo el grupo de entrenamiento es una estimacin del
cambio verdadero que resultara de modificar los pesos iniciales para minimizar la
funcin de costo Eav para el grupo de entrenamiento completo.
La minimizacin del error se lleva a cabo por el mtodo del descenso del gradiente, con
fundamento en la teora del clculo. El gradiente con respecto a los pesos de la capa de
salida es independiente del gradiente respecto a los pesos de las capas ocultas, el cmputo
para el incremento DW se ilustra en las siguientes ecuaciones:
Pesos en la capa de salida w Cji -1 (n) = wCji -1 ( n - 1) - a
e( n)
wCji -1
Pesos en la ultima capa oculta wkjC -2 (n ) = wkjC -2 ( n - 1) + a
e(n)
wkjC -2
(3.23).
(3.24).
El gradiente e w representa un factor de inestabilidad, determinado por la direccin en

busca del espacio de pesos para los pesos sinpticos w. Por tanto, para actualizar los
pesos es necesario evaluar la derivada del error e(n) en dicho punto como en la ecuacin
(3.25).
e(n) e(n) yi (n)
=
w Cji -1 yi ( n) w Cji -1
(3.25).
Diferenciando ambos lados de la ecuacin (3.20) con respecto a yi(n) y considerando la

salida deseada constante, obtenemos:
e(n)
= -( si ( n) - yi (n))
yi ( n)
57
(3.26).

Diferenciando ambos lados de la ecuacin (3.19) con respecto a wji(n), obtenemos:

nc -1
y i ( n )
=
f
(
w Cji -1a Cj -1 + uiC )a Cj -1
C -1
w ji (n)
j =1
(3.27).
El gradiente local matemticamente se define como:

nC -1
nC -1
j =1
j =1
d iC ( n) = -e j ( n) f ( wCji -1a Cj -1 + uiC ) = -( si ( n) - yi ( n)) f ( wCji -1a Cj -1 + u iC )
(3.28).
El gradiente local puntual requiere cambios en los pesos sinpticos. De acuerdo con
(3.28) el gradiente local d j (n) para la salida de la neurona j es igual al producto de la seal
de error ej(n) y la derivada de la funcin de activacin asociada.
Sustituyendo en (3.25), encontramos la expresin para actualizar los pesos de la capa de
salida.
e(n)
= d iC (n) a Cj -1 ( n)
wCji -1
(3.29).
De las ecuaciones anteriores podemos notar que un factor clave involucrado en el clculo
del ajuste de pesos Dw ji (n) es la seal de error ej(n) a la salida de la neurona j. En este
contexto, debemos identificar dos casos distintos, dependiendo en que parte de la red est
localizada la neurona j. En el primer caso estar localizada en la capa de salida.
Este caso es el ms simple porque cada nodo de la salida de la red est alimentado con la
respuesta deseada, hacindose abiertamente importante para el clculo asociado con la
seal de error. En el segundo caso, la neurona j est localizada en la capa oculta. Cada
una de las neuronas ocultas no son accesibles, pero comparten la responsabilidad de los
errores en la capa de salida de la red. La pregunta, sin embargo, consiste en como castigar
o premiar a las neuronas de la capa oculta la parte de su responsabilidad. A este problema
lo conocemos como problema de crdito-asignacin y es una forma elegante de propagar
hacia atrs la seal de error de la red (Viuela y Galvn: 54).
CASO 1: La neurona j se localiza en la capa de salida.
Cuando la neurona j se encuentra en la capa de salida de la red, es alimentada
directamente con la respuesta deseada. Por lo tanto usamos la ecuacin (3.21) para
calcular la seal de error asociada con est neurona. Despus de determinar ej(n), es fcil
usar (3.28) para obtener el gradiente d i (n) .
58

CASO 2: La neurona j se localiza en la capa de oculta.

Cuando la neurona j est localizada en alguna capa oculta de la red, no hay una respuesta
deseada especfica para esa neurona. Por consiguiente, la seal de error para una neurona
oculta puede determinarse recursivamente en trminos de las seales de error de todas las
neuronas conectadas con ella directamente; la complejidad del algoritmo de
retropropagacin reside en este procedimiento.
En este caso elegimos un peso de la capa C-2 a la capa C-1. El peso de la conexin de la
neurona k de la capa C-2 a la neurona j de la capa C-1 es wkjC -2 , cuyo peso influye en todas
las salidas de la red, por lo que la derivada del error respecto al peso toma en cuenta la
sumatoria de todas las salidas en la red y es mostrado en (3.30).
nC
y (n)
e(n)
=
( si (n) - yi (n)) i C -2
C -2
wkj
wkj
i =1
(3.30).
Para calcular la derivada de la salida yi(n) respecto al peso wkjC -2 , hay que considerar que
el peso solo influye en la neurona j de la capa C-1.
nC -1
a Cj -1
yi ( n)
C -1 C -1
C
C -1
= f ( w ji a j + u i ) w ji
wkjC -2
wkjC -2
j =1
(3.31).
Sustituyendo 3.31 en 3.30 y aplicando la definicin de gradiente local de (3.28).

a Cj -1
e( n) nC C
C -1
= d i ( n) w ji
wkjC -2 i=1
wkjC -2
(3.32).
La derivada de la neurona j de la capa oculta C-1 con respecto al peso que la conecta con
C-2 la calculamos en (3.33).
a Cj -1
wkjC -2
nC - 2
= f ( wkjC -2 akC -2 + u Cj -1 )a kc-2 (n )

k =1
59
(3.33).

Nuevamente podemos definir un gradiente local para las neuronas de la capa C-1 en la
expresin (3.34).
nC - 2
nC
k =1
i =1
d j C -1 ( n) = f ( wkjC -2 a kC -2 + u Cj -1 ) d iC ( n) wCji -1
(3.34).
A partir de 3.34 podemos generalizar el gradiente local para las neuronas de la capa
oculta como sigue:
nc
nc +1
k =1
i =1
d j c+1 ( n) = f ( wkjc akc + u cj ) d ic +2 (n) wcji
(3.35).
El factor f (v j (n)) involucrado en el clculo del gradiente local d j (n) en la ecuacin

(3.34) depende solamente de la funcin de activacin asociada con una neurona oculta k.
El factor restante involucrado en el clculo, la sumatoria sobre nc+1, depende de dos
grupos de trminos. El primer grupo de trminos, d i (n) , requiere conocimiento de las
seales de error ej(n), para todas estas neuronas caen en la capa a la derecha inmediata a
la neurona j oculta. El segundo grupo de estos trminos, wji, consiste en los pesos
sinpticos asociados con estas conexiones.
En aplicaciones prcticas del algoritmo de retropropagacin, para entrenar a la red se
utilizan muchos grupos de ejemplos. Cada ejemplo es un conjunto de entradas y salidas
conocidas a priori para el caso de una red supervisada. Despus de presentar todo el
conjunto de ejemplos terminamos un proceso que se conoce como poca. El proceso de
aprendizaje se repite poca por poca hasta que los pesos sinpticos y los umbrales de la
red se estabilizan y el error cuadrtico promedio converge a un valor mnimo. Es buena
prctica presentar aleatoriamente los ejemplos a la red de una poca a otra. Esta
aleatoriedad tiende a buscar el espacio de pesos estocsticamente sobre los ciclos de
aprendizaje, esto evita la posibilidad de calcular valores cclicos en los vectores de los
pesos sinpticos.
Existen dos maneras para que el algoritmo de retropropagacin presente los ejemplos a la
red durante una poca. Los dos modos de entrenamiento son:
Modo Serie. En el algoritmo de retropropagacin modo serie, los pesos se
actualizan despus de la presentacin de cada ejemplo. Para ser especfica,
consideramos una poca que consiste de N ejemplos de entrenamiento (patrones)
arreglados en orden [ X (1), d (1)], K , [X ( N ), d ( N )]. El primer ejemplo [ X (1), d (1)] en la
60

poca es presentado a la red, inmediatamente despus la red desempea la

secuencia de clculos hacia adelante y hacia atrs, como resultado los pesos
sinpticos y niveles de umbral ajustan sus valores. La red recibe el segundo
ejemplo [ X (2), d ( 2)] para posteriormente efectuar los clculos haca adelante y
atrs, seguido de un ajuste ms rpido en los valores de pesos y umbrales. Este
proceso continuar hasta el ltimo ejemplo [ X ( N ), d ( N )]. Designemos Dw ji (n) al
cambio en el peso sinptico despus de presentar el patrn n. Entonces, el cambio
de peso en la red Dw ji , promedio durante el entrenamiento de N patrones, esta dado
por:
Dw ji =
1
N
Dw ji (n) = n=1
E (n)
a
=
N n=1 w ji ( n)
N
N
e j (n)
e (n) w
j
n =1
ji
( n)
(3.36).
Modo Lotes. En el modo por lotes, le red actualiza los pesos despus de la
presentacin de todos los ejemplos de entrenamiento, es decir, despus de una
poca los pesos y umbrales cambian sus valores. Para una poca, definimos la
funcin costo como el error cuadrtico medio, ecuacin (3.22). Para una tasa de
aprendizaje constante h , la regla delta define el ajuste de los pesos sinpticos:
Dw ji = -a
Eav
a
=w ji
N
e (n)
j
n =1
e j ( n)
w ji
(3.37).
Comparando la ecuacin (3.36) con la (3.37), observamos con facilidad las diferencias.
Desde un punto de vista operacional, en tiempo real, es preferible el modo serial, porque
requiere menor capacidad de almacenamiento para cada conexin sinptica. Sin embargo,
los patrones son presentados a la red de manera aleatoria, el uso de actualizacin de pesos
patrn por patrn hace que la bsqueda en el espacio de pesos sea de naturaleza
estocstica, lo cual ocasiona que el algoritmo quede atrapado en un mnimo local. En
cambio, el entrenamiento por lotes posee mayor exactitud en la estimacin del gradiente.
En la presente investigacin, entrenamos a la red neuronal por lotes debido a que el
tiempo de ejecucin es ms rpido y aprovechar procedimientos de aprendizaje ms
eficientes definidos en matlab.
Cuando entrenamos a la red neuronal propuesta consideramos dos funciones de
activacin o transferencia no lineales, ambas funciones tienen un rango de salida
limitado; [0,1] para el caso del sigmoide logartmico y [-1,1] para la tangente hiperblica.
Sin embargo, las salidas deseadas asociadas a las entradas tienen un rango de [- , ] ,
rango que ocasiona conflicto al entrenar la red.
61

Por lo tanto, al entrenar a la red neuronal se normalizo el rango, es decir, acotar el rango
del conjunto de vectores Y al rango [0,1] con respecto al valor menor y mayor de todos
los ejemplos de salidas deseadas.
Una vez ajustados los pesos de la red se procede a probar su funcionamiento con
ejemplos ajenos a la etapa de educacin; pero se obtendrn salidas con valores de 0 a 1, a
dichas salidas se aplica un proceso de normalizacin inverso para ampliar el intervalo
respecto a los valores originales de la etapa de entrenamiento. La etapa de normalizacin
que acabamos de describir se le conoce como preprocesamiento y posprocesamiento.
Despus de establecer la arquitectura y detallar el mtodo de aprendizaje de la red es
importante destacar los elementos que se pueden cambiar, los cuales son: cantidad de
neuronas en la capa oculta, numero de pocas, definicin inicial de pesos y umbrales,
funciones de activacin, algoritmo de entrenamiento y finalmente, rango de
normalizacin durante el preprocesamiento y el posprocesamiento.
En la seccin siguiente se describen las instrucciones para programar el polinomio y la
red neuronal en matlab, tambin cada una de las variantes del algoritmo de retropropagacin que matlab ofrece como funciones para entrenar la red.
3.4. Matlab como herramienta de aplicacin

Los dos algoritmos para calcular la funcin de referencia se programaron en matlab
versin 2007. Para calcular los coeficientes y entrenar la red se utilizo un archivo el cul
contiene 330 vectores de entrada y salida, el vector de salida se calculo por medio de un
modelo termodinmico y tuvo como argumentos los parmetros de entrada. Para validar
el polinomio y la red neuronal se utiliz otro archivo con 4096 vectores de entrada y
salida, basados en mediciones hechas a un motor en buen estado.
Un fragmento del archivo de entrenamiento se muestra en la figura 3.4 y el archivo de
prueba, en la figura 3.5.
62
330 vectores.

r
Y
Figura 3.4.-Archivo de entrenamiento base.
4096 vectores.
r
U
r
U
r
Y
Figura 3.5.-Archivo de prueba export.
63

Para abrir un archivo de texto en matlab se utiliza la funcin fopen. Para describir dicha
funcin analicemos el siguiente cdigo:
fid=fopen('base.txt','rt');
El indicador fid es un valor de retorno que sirve como identificador del fichero. Los
argumentos de la funcin son el nombre del archivo junto con la extensin, encerrado con
comillas simples. El archivo debe guardarse en el mismo directorio que el programa, en
caso contrario debemos escribir la ruta. Al lado derecho del nombre del archivo, separado
con comas, se escriben entre comillas simples las letras que indican las acciones
permitidas para el archivo, por ejemplo:
'r'
'w'
'a'
'r+'
'w+'
'a+'
'W'
'A'
Leer.
Sobrescribir (crea el archivo si no existe).
Adjuntar (escribir a continuacin).
Leer y escribir (no crea el archivo).
Truncar o crear para leer y escribir.
Leer y adjuntar (crea el archive si no existe).
Escribir.
Adjuntar sin sobrescribir.
Despus de abrir el archivo aplicamos el cdigo siguiente:

krb=-2;
while ne(1,feof(fid))
tmpline=fgets(fid);
krb=krb+1;
end;
En el cdigo anterior vamos a incrementar la variable krb despus de ejecutar la funcin

fgets que se encarga de leer lnea por lnea del archivo hasta terminar. Cuando termina de
leer al archivo fid regresara un uno, la cual es la condicin para terminar el ciclo. Es
decir, con el ciclo anterior vamos a contar el nmero de lneas que es igual a la cantidad
de vectores para calcular los coeficientes y entrenar a la red. La variables krb tiene un
valor inicial igual a menos dos porque la informacin en las dos primeras lneas del
archivo son solo comentarios.
De acuerdo con la explicacin anterior de la funcin fgets, el siguiente cdigo realizara
un salto a las dos primeras lneas del archivo.
64

tmpline=fgets(fid); % skip line

Para poder manipular los valores numricos del archivo base en matlab, es necesario
pasarlos a una matriz como se muestra en el siguiente cdigo:
UYT=fscanf(fid,'%g',[kuy,krb]); % reading the U and Y information
La funcin de la instruccin fscanf es leer los datos para retornarlos a un arreglo o matriz
y en general tiene la siguiente sintaxis:
[var1,var2,]=fscanf(fid, cadena de control ,size)
Donde fid es el identificador del fichero, size es un vector opcional para indicar el tamao
del vector o matriz a leer. La cadena de control va encerrada entre apstrofos simples, y
contiene el formato para las variables, por ejemplo:
%s
%d
%f
%lf
para cadenas de caracteres.

para variables enteras.
para variables de punto flotante.
para variables de doble precisin.
En este caso escogimos el formato g que se refiere a elementos reales de la matriz con
valores enteros y de punto flotante.
Para separar los datos de entrada y salida de la matriz UYT y formar la matriz que
contiene las variables del polinomio se utilizaron diversas rutinas con ciclos for. La
matriz de variables de polinomios la nombramos A y a la matriz que almaceno los
clculos de los coeficientes la nombramos X.
El cdigo siguiente aplica las ecuaciones (3.11) y (3.12) al clculo de los coeficientes:
ky=7;
for k=1:ky
X(:,k)=A\Y(:,k);
YE(:,k)=A*X(:,k);
DY(:,k)=(Y(:,k)-YE(:,k))./YE(:,k);
end;
Para crear la red neuronal mostrada en la figura 3.2 en matlab se programa la siguiente
instruccin:
65

nx=minmax(U');
net=newff(nx,[13,7],{'tansig','logsig'},'trainc');
net.trainParam.goal=0.0002;
net.trainParam.epochs=1500;
net.trainParam.show=35;
La funcin newff se refiere una arquitectura perceptrn multicapa que utiliza el algoritmo
de retropropagacin para su entrenamiento y tiene como argumentos: nx, el cual es el
valor de retorno de la funcin minmax (funcin que toma el valor mximo y mnimo de
cada neurona de entrada para tener una mejor distribucin de los ejemplos); a
continuacin entre parntesis cuadrados se especifica el numero de neuronas de las capas
ocultas y la capa de salida (separada cada capa por comas); entre corchetes se especifica
la funcin de transferencia de cada capa y finalmente entre comillas simple el algoritmo
de entrenamiento utilizado por toda la red neuronal, por ejemplo trainlm.
En la instruccin anterior la capa oculta y la capa de salida utilizan como funcin de
transferencia a la tangente hiperblica y la sigmoide lgica respectivamente.
El entrenamiento de la RNA se realiza por medio de la instruccin:
[net,tr]=train(net,U',Ynorm);
La instruccin train llama a la funcin net.trainFcn, usando las caractersticas definidas

por net.trainParam., rutina por medio de la cual podemos definir las caractersticas de la
red, por ejemplo, el nmero pocas y de nodos en la capa oculta. Ynorm dentro del
parntesis se refiere al vector de supervisin que construye le funcin de error junto con
el vector de supervisin y se obtiene del archivo base, sin embargo estos datos deben ser
normalizados a un rango entre [0,1] y [-1,1] por ser los rangos de salida de las funciones
no lineales de propagacin en el perceptrn.
La instruccin train actualiza todos parmetros libres despus de una poca, cuando todos
los ejemplos son presentados a la red. Es decir, educa con el mtodo de retropropagacin
por lotes. [17]
Aunque el mtodo original sea el algoritmo de retropropagacin existen modificaciones
para que la red converja ms rpido, por ejemplo, el mtodo de Levenberg-Marquardt. A
continuacin se definen los algoritmos para entrenar la red:
Traingd (Gradiente Descendente por Lotes).

Cuando entrenamos a la red neuronal con esta instruccin de matlab, aplicamos el
algoritmo de retro-propagacin que se explico en la seccin anterior. Los parmetros
66

libres como pesos y umbrales de la red se actualizan despus de que transcurre una poca,
o sea por lotes.
Durante la ejecucin de esta funcin los pesos y umbrales son actualizados en la
direccin negativa del gradiente. Los siete parmetros asociados a esta funcin son:
epochs, show, goal, time, min_grad, max_fail, lr.
El parmetro lr se refiere a la tasa de aprendizaje y es importante tomarlo en cuenta
porque si es muy pequeo ser muy lenta la convergencia de la funcin de error hacia un
mnimo, sin embargo, si el parmetro lr es grande puede causar inestabilidad en el
algoritmo.
Traingdm (Gradiente Descendente con momento).

A partir de traingd podemos encontrar tres variaciones ms.
El gradiente descendiente con momento no solo responde al gradiente local, tambin se
dirige en la superficie de error. Acta como un filtro pasa bajas, que permite que la red
ignore ciertas caractersticas de la superficie de error. Sin el momento, el entrenamiento
podra detenerse en un mnimo local.
Esta funcin tiene dos parmetros que son: lr, definido anteriormente y mc que se refiere
al momento.
El momento considera dos nuevos trminos h y Dw(n - 1) que se agregaran a la ecuacin
(3.23), obteniendo la siguiente ley:
w(n ) = w(n - 1) - a
e(n)
+ hDw( n - 1)
w
donde Dw( n - 1) = w(n - 1) - w( n - 2)
(3.38).
(3.39).
Aunque conserva las propiedades del algoritmo anterior, el termino h Dw(n - 1)

proporciona cierta inercia, es decir, la modificacin actual depende de la modificacin
anterior.
Aplicando sucesivamente (3.39) en (3.38), se obtiene:
Dw(n - 1) = w( n - 1) - w(n - 2) = -a
n-1
e( n - 1)
e(t )
+ hDw(n - 2) = -a h n -1-t
w
w
t =0
Por lo tanto, podemos generalizar (3.38) en (3.41) como se muestra a continuacin:

67
(3.40).

w(n ) = w(n - 1) - a h n-t

t =0
e(t )
w
(3.41).
El cambio del peso actual es funcin de los gradientes de las iteraciones anteriores. Por lo
tanto, si la derivada parcial del error respecto a los pesos cambia de signo en iteraciones
consecutivas, la suma compensa este cambio con un incremento en el peso ms suave,
evitando oscilaciones bruscas. Por otra parte, si la derivada parcial del error conserva el
mismo signo en iteraciones consecutivas, el momento procura un cambio mayor en el
peso, con el fin de acelerar la convergencia del algoritmo.
Traingda, Traingdx (tasa de aprendizaje variable).

Se menciono anteriormente que cuando la derivada de la funcin de error con respecto a
los pesos sinpticos tiene el mismo signo durante muchas iteraciones consecutivas,
significa que la superficie de error cay en una superficie plana, como consecuencia
podemos quedar atrapados en un mnimo local, para evitarlo debemos incrementar la tasa
de aprendizaje.
Si la derivada de la funcin de costo o error con respecto a los pesos sinpticos cambia de
signo durante muchas iteraciones consecutivas, significa que estamos pasando por
diferentes picos y valles. Por lo tanto, para prevenir la oscilacin en los valores de los
pesos tenemos que reducir la tasa de aprendizaje.
La funcin de costo o error depende tanto de los pesos como de la tasa de aprendizaje, lo
cual nos permite obtener una relacin entre el gradiente y la tasa de aprendizaje.
Para describir matemticamente el algoritmo podemos considerar la funcin de costo para
la suma instantnea de los errores cuadrticos:
2
1 nC
e(n) = [si (n ) - yi (n)]
2 i =1
(3.42).
Aunque la funcin de error definida en (3.42) es igual a la funcin de error del algoritmo
estndar, el espacio de parmetros involucra a otra tasa de aprendizaje. Denotemos a ji (n)
el parmetro de tasa de aprendizaje que depende de w ji (n) para la iteracin n. Aplicando
la regla de cambio a e(n) podemos escribir:
e( n) e(n) yi ( n)
=
a ji
yi ( n) a ji ( n)
68
(3.43).

Por conveniencia redefinimos las ecuacin (3.23) como:

w ji (n) = w ji (n - 1) - a ji (n )
e(n - 1)
w ji (n - 1)
(3.44).
e( n - 1) c-1
]a j + u cj )
w ji (n - 1)
(3.45).
Sustituyendo (3.44) en (3.19), obtenemos:

nc -1
yi (n ) = f ( [ w ji (n - 1) - a ji (n)
j =1
Por lo tanto, diferenciando 3.45, tenemos:

nc -1
y i ( n)
E (n - 1) C -1
= f ( w ji ( n)a Cj -1 + u Cj )( )a j
a ji ( n)
w ji ( n - 1)
j =1
(3.46).
Despus, evaluamos la derivada parcial e( n) yi ( n) . Para el caso en que la neurona i

reside en la capa de salida, la respuesta deseada si (n) es alimentada externamente.
Diferenciando (3.42) con respecto a yi(n) resulta:
e(n)
= -[si - yi ( n)]
yi ( n)
(3.47).
donde ei(n) es la seal de error. Entonces, usando la derivada parcial de (3.46) y (3.47) en
(3.43) y reagrupando trminos, escribimos la ecuacin 3.48:
nC -1
e( n - 1) C -1
e(n)
= -[ si ( n) - yi (n)] f ( w ji (n)a Cj -1 + u Cj ) a j
a ji ( n)
j =1
w ji (n - 1)
(3.48).
La derivada parcial E (n - 1) w ji ( n - 1) en el lado derecho de la ecuacin (3.48) se refiere

a la funcin de error en el tiempo n-1. Sustituyendo (3.29) en (3.48), podemos simplificar
la ecuacin como se muestra abajo:
e(n)
e( n) E ( n - 1)
=a ji ( n)
w ji ( n) w ji (n - 1)
69
(3.49).

Ahora estamos listos para formular una regla para la actualizacin en la tasa de
aprendizaje que se ejecuta escalonadamente en la superficie de error. Especficamente, el
ajuste aplicado a a ji (n) es:
Da ji (n + 1) = -g
e(n)
e( n) e(n - 1)
=g
a ji (n)
w ji (n ) w ji (n - 1)
(3.50).
donde g es una constante positiva, llamada parmetro de control de paso escalonado para
el proceso de adaptacin de la tasa de aprendizaje. Haremos dos observaciones
importantes:
Cuando la derivada de la superficie de error con respecto a los pesos tiene el
mismo signo algebraico en dos iteraciones consecutivas, el ajuste Da ji (n + 1) tiene
un valor positivo. El proceso de adaptacin, por consiguiente, incrementa la tasa de
aprendizaje para el peso wji. Respecto al aprendizaje de retropropagacin, la
direccin crecer ms rpido.
Cuando la derivada de la superficie de error con respecto a los pesos sinpticos
cambia de signo en dos iteraciones consecutivas, el ajuste Da ji (n + 1) ser negativo.
Respecto a la retropropagacin avanzar ms lento. Este proceso de aprendizaje es
conocido como regla delta-delta.
El mtodo anterior tiene un problema significativo. Si el gradiente conserva el mismo
signo pero el cambio en magnitud es pequeo entre dos iteraciones consecutivas, el ajuste
positivo aplicado a la tasa de aprendizaje implica una variacin muy pequea en los
pesos. Tambin, tiene signos opuestos, pero una diferencia significativa en las
magnitudes entre iteraciones, se aplicara un ajuste muy grande a los pesos. Bajo estas
circunstancias, es difcil establecer un valor adecuado del parmetro calculado g .
Esta limitacin de la regla delta-delta motivo crear una regla que unificar los algoritmos
del momento y la tasa de aprendizaje.
Si a ji (n) denota la tasa de aprendizaje. La regla de actualizacin de la tasa de aprendizaje
es la siguiente:
k
Da ji (n + 1) = - ba ji ( n)
si S ji (n - 1) D ji ( n) > 0
si S ji (n - 1) D ji ( n) < 0
en otro caso
70
(3.51).

Dji(n) y Sji(n) se definen en las ecuaciones (3.52) y (3.53).

D ji (n) =
e( n)
w ji (n)
S ji (n ) = (1 - x ) D ji (n - 1) + xS ji (n - 1)
(3.52).
(3.53).
donde x es una constante positiva. La cantidad D ji (n) es el valor actual del gradiente. La
variable S ji (n) es la suma promediada exponencialmente de valores actuales y pasados
del gradiente, con x como base y la iteracin n es el exponente. El procedimiento de tasa
de aprendizaje adaptativa es llamado regla delta-palanca-delta.
Trainrp (retro propagacin resistente).

Las redes con ms de una capa de neuronas trabajan con funciones de transferencia no
lineales, especialmente en las capas ocultas. Estas funciones son conocidas como
funciones aplastadas porque comprimen el rango de entrada de infinito a finito. Las
funciones sigmoidales estn caracterizadas por el hecho de que sus inclinaciones se
acercan a cero cuando las entradas son muy grandes. Lo anterior causa problemas con el
gradiente escalonado porque el gradiente cambia lentamente ocasionando que pesos y
umbrales estanquen su actualizacin y se alejen de sus valores ptimos.
El propsito de la retropropagacin con resistencia es eliminar los efectos indeseables en
la magnitud de las derivadas parciales. La actualizacin de los parmetros libres
considera el signo del gradiente solamente; pero ignora su magnitud. El tamao en el
cambio de los pesos es independiente de su valor de actualizacin. A los pesos y
umbrales se va a sumar un valor delt_inc si el gradiente cambia de signo durante dos
iteraciones consecutivas; se les restara un valor delt_dec, si no hay tal cambio. Si el
gradiente es cero, entonces el valor en los pesos y umbrales permanecer igual.
Traincgf (formula Fletcher-Reeves).

Una red neuronal inicialmente comienza a trabajar con una gran cantidad de neuronas;
pero a medida que el entrenamiento avanza, ya no son necesarias todas las neuronas.
Como solucin a este problema se proponen tcnicas, por ejemplo, podar la red. Una de
las tcnicas de podado consiste en extraer informacin de la segunda derivada de la
superficie de error para realizar un balance entre la complejidad de la red y la reduccin
de la funcin de error. El modelo local de la superficie de error se construye con series de
71

Taylor. Si llamamos dwi a la perturbacin del peso sinptico wi ; el cambio

correspondiente en la funcin de error E representada por series de Taylor ser:
dE = gidwi (n) +
i
1
h jidwidw j + componentes de orden mas grande
2 i j
(3.54).
donde gi es el componente i del vector gradiente de E, h ji es un componente de la matriz

hessiana de E. Ambos son representados en las siguientes ecuaciones:
gi =
hii =
E
wi
2E
w j wi
(3.55).
(3.56).
El objetivo es identificar un grupo de parmetros cuya supresin del perceptrn multicapa

causara un incremento mnimo en la funcin de error. Una solucin prctica del problema
sigue dos enfoques:
Aproximacin extrema. La red eliminar algunos parmetros solo despus que el
proceso de entrenamiento converge. Dicha suposicin es vlida cuando los
parmetros libres caen en un mnimo local o global de la superficie de error. En tal
caso, gi(n) es cero, y la primera sumatoria del lado derecho de (3.54) es nula.
Aproximacin cuadrtica. Supongamos que la curva de error cerca de mnimos
locales y globales es cuadrtica. Entonces en (3.54) los trminos de orden superior
sern ignorados.
Bajo las suposiciones anteriores (3.54) se reduce a (3.57):
dE =
1
1
h ji dwidw j = dwT H dw
2 i j
2
(3.57).
donde dw es la perturbacin aplicada al vector w, y H es la matriz hessiana que contiene

todas las derivadas de segundo orden de E con respecto a los elementos del vector w.
En el mtodo de gradiente descendente de primer orden, la direccin del vector est dada
por el negativo del gradiente del vector. Como consecuencia, la aproximacin al mnimo
global toma la forma de camino de zigzag. El mtodo del gradiente conjugado evita este
72

problema porque incorpora una formula entre la direccin y el gradiente del vector.
Fletcher y Reeves aplicaron la primera propuesta. El gradiente conjugado garantiza
localizar el mnimo de una funcin cuadrtica de N variables en N pasos. Para una
funcin no cuadrtica, como la de error cuadrtico medio, en el perceptron multicapa, son
mas de N pasos y necesita un criterio de convergencia.
Si p(n) es la direccin del vector en la iteracin n del algoritmo. Entonces la regla de
actualizacin de pesos es:
w(n + 1) = w( n) + a (n) p (n)
(3.58).
donde h (n) es el parmetro de aprendizaje. Para definirlo, consideramos la direccin del

vector inicial p(0) que es igual al negativo del gradiente g(n), en el punto inicial n=0:
p (0) = - g (0)
(3.59).
Cada direccin de vector sucesiva es calculada en funcin de la magnitud del gradiente y

la direccin anterior. Quede expresado matemticamente as:
p ( n + 1) = - g ( n + 1) + b (n) p (n)
(3.60).
donde b (n) es un parmetro variable con el tiempo, las reglas para determinarlo tienen
argumentos como el gradiente actual y el pasado. La formula de Fletcher-Reeves se
muestra en la siguiente ecuacin:
b (n) =
g T ( n + 1) g (n + 1)
g T (n) g (n)
(3.61).
Traincgp (Formula de Polak-Ribier).

La formula de Polak-Ribiere para b (n) es:
b (n) =
g T ( n + 1)[ g ( n + 1) - g ( n)]
g T (n ) g ( n)
73
(3.62).

Traincgb (Formula de Powell-Beale).

En todos los algoritmos que utilizan el gradiente conjugado, la bsqueda de direccin
peridicamente reajusta el gradiente negativo. El punto de ajuste ocurre cuando el
nmero de iteraciones es igual al nmero de parmetros libres de la red; pero existen
diferentes mtodos para implementar la eficiencia en el entrenamiento. La versin de
Powell basada en el trabajo de Beale comienza cuando hay un poco de ortogonalidad a la
izquierda del gradiente actual y el gradiente previo. La siguiente inecuacin tiene la tarea
de verificarlo:
g T (n) g ( n + 1) 0.2 g ( n + 1)
(3.63).
Si la condicin es cierta, la direccin cambia junto con el negativo del gradiente.

Los algoritmos que acabamos de describir tienen un parmetro importante en la ecuacin
(3.58), conocido como tasa de aprendizaje a (n) , este parmetro se actualiza por medio de
la siguiente ecuacin:
a (n) = arg min{x av ( w(n) + ap(n))}
a
(3.64).
El cual consiste en un algoritmos de optimizacin, en matlab se realiza con las siguientes

rutinas:
Bsqueda de oro (srchgol).

Bsqueda de Bren (srchbre).
Bsqueda hibrida de una seccin cubica (srchhyb).
Bsqueda de Charalambous (srchcha).
Bsqueda hacia atrs (srchbac).
Aunque matlab ya tiene la mejor rutina predefinida para cada funcin, es posible
cambiarla con el parmetro srchFcn s lo deseamos. [18]
Trainscg (Gradiente conjugado adaptativo).

Este mtodo es costoso computacionalmente porque requiere, para la respuesta de la red,
que todas las entradas sean calculadas muchas veces. Este procedimiento combina
Levenberg-Marquardt, que explicare ms adelante, con gradiente conjugado.
74

Trainbfg (Quasi Newton de Broyden, Fletcher, Goldfarb y Shanno).

El mtodo de gradiente conjugado usa una matriz hessiana en su deduccin, sin embargo
el procesamiento de esta no es llevado a cabo. En cambio, en el mtodo de Newton y sus
variantes la matriz hessiana juega un papel predominante.
Usando la expansin de series de Taylor, aproximamos el incremento de actualizacin
para la funcin de error Eav(w) como mostramos a continuacin:
DEav ( w) = Eav ( w + Dw) - Eav ( w) @ g T Dw +
1
DwT HDw
2
(3.65).
donde g es el vector gradiente y H es la matriz hessiana. Diferenciando (3.65) con

respecto a Dw , el cambio DEav (w) ser minimizado cuando:
g + HDw = 0
(3.66).
la cual produce un valor optimo para un incremento en los pesos Dw igual a:

Dw = H - 1 g
(3.67).
El mtodo de Newton es ms rpido que el gradiente, sin embargo, es difcil calcular

computacionalmente la inversa de H. Hay algoritmos basados en el mtodo de Newton
que no requieren calcular la segunda derivada. Se llaman mtodos de Quasi-Newton o de
secante. Aproximan la matriz hessiana en cada iteracin y calculan el gradiente
conjugado
Trainoss (Algoritmo de la secante en un solo paso).

El algoritmo anterior necesitaba una cantidad mayor de memoria y clculos que el
gradiente conjugado, existe una mejor aproximacin que requiere menos memoria. Este
mtodo OSS es un puente entre el gradiente conjugado y Quasi-Newton. No almacena la
matriz hessiana en cada iteracin, suponiendo anterior una matriz identidad.
Trainlm (Levenberg-Marquardt).
Al igual que el mtodo quasi-Newton, el algoritmo Levenberg-Marquardt fue diseado
para aproximar velozmente el entrenamiento de segundo orden sin tener que calcular la
matriz hessiana. Cuando la funcin de costo toma la forma de suma de cuadrados (tpica
en la retropropagacin), entonces la matriz hessiana se puede aproximar como:
H = JTJ
75
(3.68).

y el gradiente se aproxima a:
g = J Te
(3.69).
donde J es la matriz jacobiana que contiene las primeras derivadas de los errores de la red
con respecto a los pesos, y el vector de errores de la red es e. La matriz jacobiana se
calcula con tcnicas de retropropagacin estndar, menos complejas que los clculos de
la matriz hessiana.
Para aproximar la matriz hessiana el algoritmo de Levenberg-Marquardt actualiza los
pesos con la siguiente formula de Newton:
w(n + 1) = w( n) - [ J T J + mI ]-1 J T e
(3.70).
Cuando el escalar m es cero, como en el mtodo de Newton, usamos la aproximacin a la

matriz hessiana. Cuando m es grande, el gradiente descendente comienza como un
pequeo factor de paso. El mtodo de Newton es ms rpido y se acerca ms al error
mnimo, la meta es acercarse al mtodo de Newton tan rpido como sea posible. Entonces
m decrece despus de cada paso sucesivo (reduccin de la funcin de error) y se
incrementa solo cuando se incrementa la funcin de error. Este procedimiento garantiza
siempre la reduccin de la funcin de error por cada iteracin. La desventaja principal de
Levenberg-Maquardt es que requiere el almacenamiento de algunas matrices que pueden
ser grandes para ciertas aplicaciones. El tamao de la matriz jacobiana es Q x n, donde Q
es el numero de ejemplos de entrenamiento y n es el numero de pesos y umbrales de la
red. Sin embargo, la matriz no tiene que ser calculada y almacenada como tal. Por
ejemplo, si se divide la matriz jacobiana en dos submatrices podemos calcular el hessiano
como abajo:
J
H = J T J = [ J1T J 2T ] 1 = J1T J1 + J 2T J 2
J 2
(3.71).
Por lo tanto, el jacobiano completo no tiene que existir, todo, al mismo tiempo. Podemos
aproximar el hessiano sumando subterminos. Si un trmino ha sido calculado ya puede
ser borrado.
Cuando usamos trianlm en matlab el parmetro mem_reduc determina cuantas filas de la
matriz jacobiana son calculadas en cada submatriz. Si mem_reduc, entonces el Jacobiano
se calculara completo y no habr reduccin de memoria. Si mem_reduc es 2, solo la
76

mitad del Jacobiano ser utilizado para los clculos. Entonces ahorraremos espacio a
comparacin del jacobiano completo.
Trainbr (Regularizacin automtica).

La regularizacin automtica involucra una modificacin en la funcin de error para
premiar aquellos pesos que tienen un valor grande y castigar a aquellos que tienen valores
ms pequeos conforme se actualizan, y por lo tanto pierden efecto en la red. Sea la
funcin de costo expresada como en (3.72):
F = mse =
1
N
ei2 (n) =
n=1
1
N
[s (n) - y (n)]
(3.72).
n =1
Es posible introducir la generalizacin si modificamos la funcin de error agregando un

trmino que consiste de la suma de errores cuadrticos medios de pesos y umbrales
msereg = gmse + (1 - g )msw
(3.73).
donde g es la razn de desempeo, y

msw =
1 N 2
w j ( n)
n n=1
(3.74).
Esta funcin causa que la red tenga pesos y umbrales ms pequeos, y obliga a la red a
generar una curva ms suave e impedir la sobre educacin.
La regularizacin compleja tiene su origen en las tcnicas de podado que definimos
anteriormente. En el diseo de un perceptron multicapa por cualquier mtodo,
construimos un modelo no lineal de un fenmeno fsico responsable de una relacin de
entrada-salida para ejemplos de la red. En la medida que la red es de naturaleza esttica,
necesitamos una medida apropiada de ajuste entre el modelo y los datos observados. Esto
implica que a no ser que tengamos informacin anterior, el proceso deber incluir un
criterio que implique complejidad en el modelo. Los criterios diferentes que consideran la
complejidad del modelo, tienen un objetivo comn descrito en la siguiente frmula:
Criterio de complejidad funcin de penalizacin de
=
+
de mod elo
probabilidad complejidad de mod elo
(3.75).
La diferencia bsica entre los diferente criterios reside en la formula de penalizacin.

77

En el aprendizaje por retropropagacin. Existe otro procedimiento supervisado

importante. Particularmente, se necesita encontrar un vector de pesos que minimice la
funcin de riesgo siguiente:
R( w) = E s ( w) + lEc ( w)
(3.76).
El primer trmino Ec (w) es la funcin de error estndar, la cual depende de la red y los
datos de entrada. La funcin de optimizacin de retro propagacin estndar es el error
cuadrtico medio. El segundo trmino Ec (w) es la penalizacin, que depende de la red
misma, pero su evaluacin se extiende a los pesos sinpticos. Para la presente discusin,
l es el parmetro de regularizacin, importante en la penalizacin respecto a la medida
de rendimiento. Cuando l es cero, nos basta entrenar a la red con los ejemplos, a medida
que l aumenta, crece la importancia en considerar la funcin de penalizacin. En la
prctica, el proceso de decaimiento de pesos ayuda a que el parmetro de regularizacin
actu en ambos casos.
Despus de entrenar a la red con los datos del archivo base, es necesario probar su
aprendizaje, en este caso con los datos del archivo export. Para verificar su efectividad en
matlab lo hacemos con la siguiente instruccin sim:
PB=sim(net,UStr);
La evaluacin de la funcin devolver valores con rango de 0 a 1, para el procesamiento

de estos valores nos basamos en la funcin que aplicamos a la normalizacin de los datos
de entrenamiento. Despus de aplicar la nueva normalizacin, comparamos a la matriz
PB con las mediciones registradas en el archivo export por medio de la formula (3.2).
78


Se describieron las herramientas, polinomios y redes neuronales, para calcular el modelo
de estado normal de una turbina de gas para accionar un compresor centrifugo en tuberas
de gas natural. Se explic tambin su programacin en Matlab. Adems se analizaron las
variantes del algoritmo de entrenamiento de la red neuronal.
79

CAPITULO 4.DISCUSIN DE RESULTADOS.
80

4.1. Prueba de las herramientas.

A fin de confirmar la exactitud de las herramientas (polinomios y redes neuronales), se
forma una muestra diferente a la de entrenamiento, la muestra de validacin. La
disponibilidad de los datos con la influencia de la contaminacin del compresor axial de
turbinas de gas nos brinda una oportunidad adecuada para estimar y comparar las dos
herramientas analizadas.
Eso se realiza a travs del anlisis de las desviaciones correspondientes, calculadas con la
formula dada en (3.2). Primero, se forma la muestra de validacin. Segundo, para todos
los datos de la muestra se calculan dos series de las desviaciones, una con los polinomios
y la otra con las redes. Tercero, se grafican en paralelo ambas series contra el tiempo de
operacin. En estas graficas podemos considerar los errores aleatorios en las desviaciones
en el fondo de los cambios sistemticos causados por la contaminacin del compresor.
Debido a que los errores dependen primero de la adecuacin de la funcin de
referencia, pueden ser buenos indicadores de la calidad de la funcin. Por ltimo, se
comparan
estas
dos
grficas
correspondientes
a
los
polinomios y las redes para concluir sobre la utilidad de las redes. Las tareas siguientes
describen las condiciones de los clculos para formar y probar las funciones de referencia
basadas en los polinomios y las redes.
4.2.-Tarea 1: Bsqueda de la estructura de la red.
En el captulo anterior definimos a la red que calcula la funcin de referencia. La red se
muestra en la figura 3.2 y contiene cuatro neuronas en la capa de entrada y 7 neuronas en
la capa de salida. Sin embargo, el numero de neuronas de la capa oculta no es una
cantidad fija, es decir, realizamos una serie de clculos y experimentos para asignar la
cantidad de neuronas ocultas que nos brinde la mejor aproximacin de la funcin de
referencia.
En conjunto con el nmero de neuronas, se busco experimentalmente la cantidad de
pocas donde la red alcanz un entrenamiento satisfactorio. Ambos parmetros se
variaron en forma creciente, por ejemplo se comenz con 10 neuronas en la capa oculta,
despus se incremento de una por una hasta 15 neuronas. De manera similar se vario el
numero de pocas, deteniendo a la red con 100 hasta incrementar a 300.
Para verificar la exactitud de ambas herramientas se analizaron las graficas de las
desviaciones relativas contra el tiempo, donde el tiempo se mide en horas, y representa
cada fila de los archivos base y export de las figuras 3.4 y 3.5.
Las curvas de las desviaciones son siete, sin embargo, no es posibles observar todas
debido a los limites en las escala de las graficas de matlab. Para tener una mejor
81

visualizacin de las grficas se seleccionaron tres desviaciones que arrojaron las

desviaciones mayores.
Las desviaciones se registran en las figuras se refieren a las variables: Tt (Temperatura de
presin alta), Tc (Temperatura del compresor) y Pt (Presin de la turbina de presin alta).
En la tabla 4.1 se muestran los resultados para el error cuadrtico medio calculados con
diferente nmero de neuronas en la capa oculta y diferentes pocas. Los cuadros
marcados en azul indican las mejores respuestas y las celdas amarillas, las peores.
Tabla 4.1: Nmero de pocas vs nmero de neuronas en la capa oculta.
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
10
0.25380
0.25854
0.06892
0.18040
0.10522
0.06809
0.12798
0.53751
0.23773
0.16020
0.05719
0.05682
0.34993
0.12122
0.51071
0.12048
0.07554
0.53259
0.09807
0.07666
3.86537
2.73437
0.11730
0.09478
0.12496
0.19406
0.11364
0.06473
0.1378
0.10090
11
0.04329
0.06074
0.04535
0.07035
0.10678
0.22728
0.07285
0.14637
0.28837
0.78037
0.08572
0.05389
0.10105
0.05448
0.07669
0.04567
0.04938
0.05079
0.14584
0.09867
0.04675
0.04827
0.09292
0.87830
0.09185
0.05712
0.06634
0.06344
0.05714
0.13317
82
12
0.04444
0.21877
0.08565
0.04128
0.04468
0.15641
0.09551
0.03992
0.04610
0.04083
0.03915
0.05307
0.12691
0.06601
0.81892
0.03847
0.05609
0.12124
0.12625
0.07614
4.5855
0.06891
0.07595
16.5938
0.16579
0.08861
0.05449
0.11821
0.04592
0.11906
13
0.206882
0.086346
1.40216
0.045776
0.397115
0.400441
0.049793
0.140262
0.120828
0.088285
0.078973
0.046101
0.110234
0.093641
0.046146
0.14712
0.039706
0.182618
0.114534
0.061768
0.059190
0.098242
0.061816
0.81165
0.053365
0.221868
0.061859
0.093992
0.053240
0.135739

Despus de diferentes experimentaciones sobre la semilla de mejores resultados se

concluye que se necesitan 211 pocas y 12 neuronas ocultas para que la red alcance un
error mnimo y se obtengan desviaciones ms pequeas o cercanas a las que se calcularon
con polinomios.
En la figura 4.1 se muestra la grafica con las desviaciones entre las medidas de los
archivos y los argumentos de salida de la funcin de referencia basada en la estructura de
la red con doce neuronas en la capa oculta.
Fig. 4.1.-Grafica comparativa de resultados con polinomios y red neuronal con 12 neuronas en la
capa oculta y entrenamiento en 250 pocas.
4.3.-Tarea 2: Mtodos de ajuste de pesos.

Despus de describir en el capitulo anterior todas las funciones de entrenamiento de redes
neuronales predefinidas en matlab podramos deducir que trainlm y trainbr son las
funciones adecuadas para nuestra aplicacin, sin embargo, los resultados varan entre
diferentes aplicaciones. La tabla 4.2 muestra los resultados de todos los mtodos de
entrenamiento. La red neuronal se fija a 12 neuronas ocultas y 250 pocas.
83

Tabla 4.2: Funciones de entrenamiento utilizadas para el calculo de la funcin de referencia.

Funcin
Error
Ajuste de pocas Nodos ocultos Tiempo (s) Estabilidad
TTrraaiinnbbffgg
1
0.00790
1250
35
2.03
T
r
a
i
n
c
g
b
2
T raincgb
0.00302
1500
30
2.25
TTrraaiinnccggff
3
0.00231
1500
30
2.3
T
r
a
i
n
c
g
p
4
T raincgp
0.00882
1213
12
2
TTrraaiinnggdd
5
0.13456
5513
20
5
T
r
a
i
n
g
d
m
6
Train gdm 0.20874
1500
20
4.39
TTrraaiinnggddaa
7
0.06025
450
15
4.1
T
r
a
i
n
g
d
x
8
Train gdx
0.12971
1000
25
4.2
TTrraaiinnoossss
9
0.07436
320
12
0.98
T
r
a
i
n
s
c
g
10
T rainscg
0.03208
550
14
0.89
TTrraaiinnllm
11
m
0.00020
250
15
14.02
0.19223
TTrraaiinnbbrr
12
250
7
13.54
(sse)
Analizando los resultados de la tabla, los algoritmos trainlm y trainbr resultaron los ms
adecuados como se esperaba, aunque sean ms lentos que los dems. Los algoritmos de
gradientes conjugados terminaron el entrenamiento despus de un nmero corto de
pocas y estuvieron muy lejos de alcanzar el error. Finalmente, los algoritmos que se
basan en modificar la tasa de aprendizaje como traingd alcanzaron resultados regulares
despus de un nmero muy grande de pocas y con demasiados nodos en la capa oculta.
La funcin trainbr tuvo la ventaja de alcanzar una desviacin menor que otras funciones
con un menor nmero de nodos en la capa oculta, en esta caso siete.
En las figuras 4.2 y 4.3 se muestran las grficas comparativas del modelo de estado
normal que se obtuvo entrenando a la red neuronal con los algortimos de LevenbergMarquardt y regulacin bayesiana respectivamente.
84

Fig. 4.2.-Grafica comparativa entre polinomios y red neuronal entrenada con funcin trainlm.
Fig. 4.3.-Grafica comparativa entre polinomios y red neuronal entrenada con funcin trainbr.
85

4.4.-Tarea 3: Modificacin de las funciones de transferencia.

Para modificar las funciones de transferencia de activacin de neuronas entre capas,
fijamos la red con cuatro neuronas, que son los argumentos de entrada a la funcin de
referencia, siete neuronas en las capas ocultas y de salida. Se entreno con 250 pocas y
con la funcin trainbr.
Es importante destacar que los datos de supervisin o target se normalizaron a el rango de
0 a 1 para el caso de la funcin de transferencia unipolar (sigmoide logartmico); despus
de probar la red con datos reales los valores de salida globales que arroj la funcin
unipolar caen en el rango de 0 a 1, se normalizaron inversamente a el rango mximo y
mnimo del archivo export.
En el caso de que la funcin de transferencia sea una funcin bipolar como la tangente
hiperblica, los datos deseados con los que se compara la salida de la red para comparar
la salida global, se normalizaron a un rango de -1 a 1, la misma frmula de normalizacin
se aplica con la salida global de la red para ampliar el intervalo en base al archivo export
cuando se pruebe a la red con datos reales.
La ltima funcin de transferencia que se aplic entre la capa oculta y la capa de salida
fue una funcin lineal llamada purelin, se conservo la funcin no lineal unipolar o bipolar
de la capa de entrada a la capa oculta. La funcin lineal tiene como argumento su salida,
es decir, el resultado de evaluar est funcin es que la salida es igual a la entrada, con la
caracterstica de que es una funcin derivable igual que las funciones tansig y logsig a las
cuales se les puede aplicar la regla de retropropagacin. A diferencia de las dos funciones
de transferencia anteriores se tienen como salida argumentos que van del rango de - a
+, lo cual nos permiti realizar dos variantes del programa. La primer variante consisti
en no aplicar una normalizacin a los vectores de prueba o targets y en la segunda
variante se aplic est normalizacin como se vena haciendo con la funciones de
transferencia logsig y tansig.
Se hicieron clculos con:
La funcin bipolar (tansig) en la capa oculta y la funcin unipolar (logsig) en la capa
de salida;
La funcin unipolar (logsig) en la capa oculta y la funcin bipolar (tansig) en la capa
de salida;
En la capa oculta y en la capa de salida, ambas funciones unipolares (logsig);
En la capa oculta y en la capa de salida, ambas funciones bipolares (tansig);
Funcin de transferencia hacia la capa oculta no lineal y funcin lineal (purelin) en la
capa de salida normalizando los datos de salida;
Funcin de transferencia hacia la capa oculta no lineal y funcin lineal (purelin) en la
capa de salida sin normalizacin.
86

Los resultados que se obtuvieron aplicando la funcin bipolar a la salida fueron

ligeramente mejores respecto a la funcin unipolar y se muestran en la figura 4.4. Los
resultados con la funcin de transferencia lineal hacia la capa de salida fueron peores con
respecto a las variantes anteriores, incluso sin normalizacin, finalmente se muestran en
las figuras 4.5 y 4.6.
Fig. 4.4.-Grafica comparativa entre polinomios y red neuronal entrenada con funcin de
transferencia bipolar.
87

Fig. 4.5. Resultados entrenado una red neuronal con el algoritmo de retropropagacin (regulacin
bayesiana) y funciones (pureline).
Fig. 4.6. Resultados entrenado una red neuronal con el algoritmo de retropropagacin (regulacin
bayesiana) y funciones (pureline sin normalizar).
88

4.5.-Tarea 4: Modificacin de los parmetros de salida.

Para esta tarea se realizo una modificacin en los lmites de salida de la funcin logsig.
Para explicarlo primero consideremos que esta funcin tiene la caracterstica de que sus
lmites de salida estn en el rango de 0 a 1 con el rango de entrada de - a +.
Para el caso de los valores que se usan para entrenar la red no tenemos un intervalo de
entrada tan grande y como consecuencia el intervalo de salida no ser entre 0 y 1, para
solucionar este problema se normalizaron los valores en un intervalo aproximado de 0.1 a
0.9 para el caso de la funcin unipolar.
Para el caso de la funcin bipolar se normalizo con un rango entre -0.9 y 0.9. Los
resultados para ambas funciones se muestran en las figuras 4.7 y 4.8.
Figura 4.7. Resultados entrenando una red neuronal con el algoritmo de retropropagacion (regulacin
bayesiana) y funciones (tansig y logsig) modificando los argumentos de logsig
89

Figura 4.8. Resultados entrenando una red neuronal con el algoritmo de retropropagacion
(regulacin bayesiana) y funciones (logsig y tansig) modificando los argumentos de tansig.
4.6.-Tarea 5: Influencia del mtodo de inicializacin de pesos y umbrales.

En esta variante se consideran diferentes maneras de inicializar los parmetros libres
como pesos y umbrales. Anteriormente se obtuvo un mejor clculo con una red de siete
neuronas en la capa oculta, 250 pocas de entrenamiento, funcin de transferencia bipolar
en la capa oculta y unipolar en la capa de salida.
Tomando en consideracin est red, se cambio el mtodo para obtener los valores
iniciales de los parmetros libres, en este caso, pesos y umbrales.
La tabla 4.3 muestra el error sse, para el caso de la funcin trainbr en comparacin con la
funcin que inicializa los pesos y umbrales. Por ejemplo, initzero los inicializa todos a
cero e initnw regresa valores de pesos y umbrales uniformemente distribuidos.
El cdigo que se agrego al programa de matlab fue el siguiente:
net.layers{1}.initFcn='initwb'
net.layers{2}.initFcn='initwb'
En el cdigo llamamos a las capas 1 y 2 de la red para que la funcin de inicio sobre los
parmetros sea igual a la que escribimos entre comillas simples .
90

Las grficas comparativas de desviaciones quedaron con resultados muy similares para
las cuatro funciones que proporcionan valores iniciales en pesos y umbrales. Para
establecer un criterio de cules eran los mejores valores de pesos y umbrales se calculo el
error sse.
Tabla 4.3:Inicializacin de parmetros libres vs error sse.
METODO
SSE
initzero
0.19898
initwb
0.23796
initnw
0.241568
rands
0.223248
midpoint
0.207156
En la figura 4.9 se ilustra la grfica para las desviaciones con la funcin del sse ms
pequeo, es decir initzero, donde los pesos y umbrales se actualizan con valores iniciales
igual a cero.
Fig. 4.9. Resultados entrenando una red neuronal con pesos y umbrales inicializados todos a cero
91

4.7.-Tarea 6: Opcin de paro automtico.

En muchas ocasiones se considera que el nmero de pocas, con el que trabajamos
inicialmente no es suficiente para alcanzar el error o es demasiado grande y puede
generar una sobre educacin, para solucionar este problema utilizamos el algoritmo
conocido como parada temprana o early stopping, este mtodo tiene la ventaja de que no
tenemos que definir el nmero de pocas porque compara dos muestras de igual tamao,
la primera es la muestra de entrenamiento y la segunda de prueba.
El mtodo consiste en calcular el error cuadrtico medio (MSE) para ambas muestras y
cuando el MSE de la muestra de prueba comienza a divergir la red se detiene y emite la
salida.
En esta tarea entrenamos con dos muestras de 150 elementos cada una, que se obtuvieron
de la mitad de datos del archivo base. Estos datos consistieron en tomar las primeras 150
horas para una muestra y las subsecuentes para una segunda muestra.
Los resultados que se obtuvieron no mejoraron con respecto a mtodos anteriores, como
se muestra en la figura 4.10.
Fig. 4.10. Resultados con red neuronal educada con el algoritmo de parada temprana para 2 muestras
de entrenamiento
92

4.8.-Tarea 7: Entrenamiento con datos reales.

En esta variante se entreno a la red neuronal con datos reales propios del archivo export.
Para entrenar a la red se tomaron muestras del archivo export de 1 a 150 horas y de 1000
a 1100 horas, se escogieron estos datos porque son los que siguen al lavado del motor, lo
anterior se observa en graficas anteriores.
Para probar la red se eligieron los datos de 151 a 999 horas y 1101 a 4091 horas, donde se
encuentra el mayor ruido y las desviaciones ms grandes.
Despus de elegir ambas muestras, se entreno a la red neuronal y se calcularon los
coeficientes con 251 datos.
Para verificar ambos mtodos se utiliz el resto de los datos reales, o sea 3840 datos.
Los resultados se muestran en la figura 4.11, en esta variante se modificaron el nmero de
neuronas en la capa oculta y el nmero de pocas, sin embargo, en una red supervisada
no es conveniente entrenar con datos estables y probar con datos con ruido es por esto
que en la grfica de desviaciones contra el tiempo se puede apreciar una sobreeducacin.
Fig. 4.11. Resultados de red neuronal con entrenamiento de datos reales.
93


Describimos los resultados de comparacin entre la funcin de referencia con polinomios
y con una red neuronal (perceptrn multicapa). La comparacin consisti en graficar y
comparar visualmente las desviaciones computadas contra el tiempo de operacin por las
dos versiones de la funcin.
Se describi cada una de las modificaciones que se realizaron para mejorar los resultados
de la red neuronal artificial. Se observ un comportamiento un poco diferente en estas
modificaciones, sin embargo, el algoritmo de regulacin bayesiana fue el mejor algoritmo
de entrenamiento. Los resultados empeoraron en la modificacin donde se entreno a la
red con datos reales, lo que demuestra que un perceptrn multicapa entrenado en datos
con ruido puede bajar su capacidad de describir datos nuevos.
Casi en todos los casos se observ una mejor calidad de las desviaciones computadas por
los polinomios. Por lo tanto, podemos concluir que los polinomios tienen en general una
mejor exactitud, a excepcin del caso de la modificacin de la red con el algoritmo de
regulacin bayesiana y funcin de transferencia bipolar, en el cual, ambas herramientas
tienen una exactitud igual.
94

CONCLUSIONES GENERALES.
Pues, dentro del desarrollo de la tesis los siguientes trabajos cientficos han sido
ejecutados.
En el primer captulo se describi el funcionamiento termodinmico de la turbina de gas,
as como cada uno de los componentes que la integran. Se concluye que todos los
componentes de la turbina de gas requieren un monitoreo permanente de su
comportamiento por razones de seguridad, econmicas y debido a los procesos complejos
a que son sometidos. Se introduce el rea de diagnostico paramtrico de los motores de
turbina de gas el cual permite analizar el comportamiento de un motor sin detener su
funcionamiento. Este tipo de diagnstico involucra la funcin de referencia en la
simulacin de las fallas del motor. Se llama funcin referencia o modelo de estado
normal porque describe una turbina de gas en buenas condiciones. Este modelo es una
funcin vectorial que relaciona las variables medidas en el conducto de flujo con las de
control y aire ambiental. Las fallas y el deterioro del motor afectan al estado del motor y
a sus mediciones en el conducto de flujo pero no afectan a tal modelo. Por lo tanto, las
diferencias entre las variables medidas y las computadas por esta funcin (podemos
llamar estas diferencias como desviaciones) son buenas indicadores de fallas y se usan
ampliamente en el diagnstico de turbinas de gas.
Hemos escogido dos mtodos diferentes del clculo del modelo para investigar y escoger
el mejor mtodo. El primer mtodo usa las redes neuronales descritas en el capitulo dos.
Las redes neuronales artificiales son modelos matemticos de las redes neuronales
biolgicas. Su objetivo es imitar las capacidades que tienen el hombre y los animales de
reconocer objetos e interpretar estmulos. Para poder implementar estos modelos es
necesario considerar que la neurona es un pequeo procesador con capacidades limitadas
a comparacin de las computadoras actuales. Sin embargo al trabajar muchas ellas en un
conjunto son capaces de resolver problemas muy serios. Se escogi una red llamada el
perceptron multicapa. Este tipo de redes es utilizado frecuentemente para aproximar
funciones complejas por eso se espera que el perceptron describa bien el comportamiento
de turbinas de gas.
El captulo tres describe el segundo mtodo de la formacin de la funcin de referencia.
Este mtodo involucra polinomios para describir la funcin deseada y el mtodo de
mnimos cuadrados para calcular los coeficientes desconocidos de los polinomios usando
datos registrados en un motor para girar un compresor centrifugo en tuberas de gas
95

natural. El captulo tambin describe algoritmos que realizan los dos mtodos para formar
la funcin de referencia as como los programas correspondientes elaborados en el
ambiente de Matlab. Adems se analizaron las variantes del algoritmo de entrenamiento
de la red neuronal.
En el captulo cuatro se presentan los resultados de comparacin entre la funcin de
referencia con polinomios y la con el preceptrn multicapa. La comparacin consisti en
graficar y comparar visualmente las desviaciones computadas contra el tiempo de
operacin por las dos versiones de la funcin.
Se describi cada una de las modificaciones que se realizaron para mejorar los resultados
de la red neuronal artificial. Se observ un comportamiento un poco diferente en estas
modificaciones, sin embargo, el algoritmo de regulacin bayesiana fue el mejor algoritmo
de entrenamiento. Casi en todos los casos se observ una mejor calidad de las
desviaciones computadas por los polinomios. Por lo tanto, podemos concluir que los
polinomios tienen en general una mejor exactitud, a excepcin del caso de la
modificacin de la red con el algoritmo de regulacin bayesiana y funcin de
transferencia bipolar, en el cual, ambas herramientas tienen una exactitud igual.
As llegamos finalmente a la siguiente conclusin: la red neuronal seleccionada,
perceptron multicapa, no puede sobrepasar los polinomios en la exactitud de la
descripcin del comportamiento del motor analizado. Adems, es necesario tener en
cuenta que el perceptron es una herramienta de mayor complejidad y costo
computacional. Por lo tanto, para formar la funcin de referencia en sistemas reales de
monitoreo de turbinas de gas, se recomienda aplicar los polinomios a pesar de lo que las
redes neuronales son ms usadas actualmente.
96

REFERENCIAS.
[1]
Boyce, Meherwan P. Gas Turbines Engineering Handbook. Gulf Publishing

Company, July 1995.
[2]
White, Frank M. Mecnica de Fluidos. Mc Graw Hill.
[3]
Tony Giampaolo. The Gas Turbine Handbook: Principles and Practices. Prentice
Hall. 1997.
[4]
Bathie William W. Fundamentos de Turbinas de Gas. Editorial Limusa.
[5]
http://www.igsa.com.mx/
[6]
http://www.siemens.com.mx/
[7]
Rao, B.K.N., 1996. Handbook of Condition Monitoring. Elsevier Advanced

Technology, Oxford, 604p.
[8]
Loboda, Igor. Notes: Construction of Gas Turbine Plants and Engines. National
Aerospace University of Ukraine, 2002.
[9]
Isasi Viuela, Galvn Len. Redes de Neuronas Artificiales, Un Enfoque

Prctico". Prentice Hall, 2004.
[10] Bonifacio Martn del Bro, Alfredo Sanz Molina, Redes neuronales y Sistemas
Difusos. Alfaomega Grupo Editor, Mxico, 2001.
[11] James A. Anderson. Redes Neuronales. Alfaomega, 2007.
[12] Loboda I., Yepifanov S., Feldshteyn Y. Deviation problem in gas turbine
health monitoring. Proceedings of IASTED International Conference on Power
and Energy Systems (PES2004), Clearwater Beach, Florida, USA, pp. 335340.
97

[13] Loboda I., Yepifanov S., Feldshteyn Y. Diagnostic analysis of maintenance data o
fault gas turbine for driving an electric generator. ASME Turbo Expo 2009:
International
Technical
Congress
Power
for
Land
Sea
& Air, Orlando, Florida, USA, June 812, 2009, 12p., ASME Paper No. GT2006
0176.
[14] Villarreal Gonzlez C.F., Loboda I., Trahyn Amescua I.K. Aplicacin de las redes
neuronales en modelo de estado normal para el diagnstico de turbinas de gas.
Memorias del 5to Congreso Internacional de Ingeniera Electromecnica y
Sistemas, ESIME, IPN, Mxico, D.F., 10-14 noviembre de 2008, 6p, ISBN 978-607-414-049-1.
[15] Villarreal Gonzlez C.F., Loboda I., Trahyn Amescua I.K. Anlisis de una red
neuronal en la aplicacin a la funcin de referencia de una turbina de gas.
Congreso de Instrumentacin SOMI XXIV, Mrida, Yucatn., 14-16 octubre de
2009, 11 p, 274-CVG.
[16] Nakos George, Joyner David. Algebra lineal con aplicaciones. International
Thomson Editores.
[17] Haykin Simon. Neural Networks A comprehensive foundation. IEEE PRESS,
1994.
[18] http://www.mathworks.com/products/neuralnet/
[19] Ehsan Mesbahi Mohsen Assadi et al. A unique technique for vaporative gas
turbine (EvGT) parameters. IGTI/ASME Turbo Orlaens, USA, 7p., ASME Paper
2001-GT-0008.
[20] Mohsen Assadi Ehsan, Mesbahi, et al. A novel correction technique for simple
gas turbine parameters. IGTI/ASME Turbo Expo 2001, June 4-7, 2001, New
Orlaens, USA, 7p., ASME Paper 2001-GT-0008.
[21] Magnus Fast, Mohsen Assadi, Andrew Pike, Peter Breuhaus. Different condition
monitoring models for gas turbines by means of artificial neural networks.
IGTI/ASME Turbo Expo 2009, June 8-12, 2009, Orlando, Florida, USA, 11p.,
ASME Paper GT2009-59364.
98

[22] Kacprzynski Gregory J., Michael Gumina, Michael J. Roemer, Daniel E. Caguiat,
Thomas R. Galie, Jack J. McGroarty (2001). A prognostic modelling approach for
predicting recurring maintenance for shipboard propulsion system. Proceedings of
ASME Turbo Expo 2001, New Orleans, LA USA, 7p., 2001-GT-0218.
.
[23] Roemer Michael J., Kacprzynski Gregory J. (2000). Advanced diagnostics and
prognostics for gas turbine engine risk assessment. IGTI/ASME Turbo Expo, May
8-11, Munich, Germany, 10p., 2000-GT-30.
[24] Bryce Lord TransCanada Pipelines Ltd, Joshua Bennett Idax Incorporated.
Equipment health monitoring failure mode characteristics case study. 17th
National Petroleum Show, Calgary, Canada June 12th to 15th, 2000, 25p.
[25] Orlando J. Illi, Frank L. Greitzer, Lars J. Kangas, Tracy J. Reeve. An artificial
neural network system for diagnosing gas turbine engine fuel faults. 48th Meeting
of the Mechanical Failures Prevention Group, Wakefield, MA, April 19-22, 1994,
9p.
[26] S.O.T. Ogaji, Y. G. Li, Suresh Sampath, Riti Singh. Gas path fault diagnosis of a
turbofan engine from transient data using artificial neural networks. IGTI/ASME
Turbo Expo 2003, June 16-19, 2003, Atlanta, Georgia, USA, 10p., ASME Paper
GT2003-38423.
[27] Praveen Shankar, Rama K. Yedavalli. A neural network based adaptive observer
for turbine engine parameter estimation. IGTI/ASME Turbo Expo 2006, May 811, 2006, Barcelona, Spain, 9p., ASME Paper GT2006-90603.
[28] Suresh Sampath, Riti Singh. An integrated fault diagnostics model using genetic
algorithm and neural networks. Journal of Engineering for Gas Turbines and
Power -- January 2006 -- Volume 128, Issue 1, pp. 49-56.
[29] C. Romessis, K. Mathioudakis. Bayesian network approach for gas path fault
diagnosis. Journal of Engineering for Gas Turbines and Power -- January 2006 -Volume 128, Issue 1, pp. 64-72.
99

[30] C. Romessis, A. Kyriazis, K. Mathioudakis. Fusion of gas turbine diagnostic

inference the Dempster-Schafer approach. IGTI/ASME Turbo Expo 2007, May
14-17, 2007, Montreal, Canada, 9p., ASME Paper GT2007-27043.
[31] C. Remessis, K. Mathioudakis. Detection of gas turbines malfunctions from
emission concentration distributions. IGTI/ASME Turbo Expo 2007, May 14-17,
2007, Montreal, Canada, 8p., ASME Paper GT2007-27107.
[32] Hai Kiu, Neil Eklund, Weizhong Yan, Piero Bonissone, Feng Xue, Kai Goebel.
Estimating deterioration level of aircraft engines. IGTI/ASME Turbo Expo 2007,
May 14-17, 2007, Montreal, Canada, 7p., ASME Paper GT2007-27519.
100

ANEXO A.
PROGRAMAS
101

Esta seccin contiene los programas base que se utilizaron en el clculo de la funcin de
la funcin de referencia. Se aplicaron modificaciones al algoritmo de retropropagacin,
las funciones de transferencia de las capas oculta y de salida, numero de neuronas en la
capa oculta y procedimientos de normalizacin.
PROGRAMA 1
Clear;
kuy=11; ku=4; ky=7; kcoef=15; tk=273.15;
ntk=[2 7 8 10]; ktk=4;
npol1=[5 1 2 3 4 1 1 1 2 2 3 1 2 3 4];
npol2=[5 5 5 5 5 2 3 4 3 4 4 1 2 3 4];
d1=330; d2=4091;
% Modelo con mtodos numricos
krb=-2;
tmpline=fgets(fid);
krb=krb+1;
end;
fclose(fid);
% Measured parameter input
fclose(fid);
UY=UYT';
% Matrix formation
for k=1:ktk
UY(:,ntk(k))=UY(:,ntk(k))+tk;
end;
%UY(:,8)=UY(:,8)*sqrtt0./sqrt(UY(:,2)); % Temperature correction
for k=1:ku
U(:,k)=UY(:,k);
U2(:,k)=UY(:,k); %MODIFICACION DE PROGRAMA ORIGINAL
end;
u1=ones(krb,1);
U2(:,ku+1)=u1;
for k=1:kcoef
A(:,k)=U2(:,npol1(k)).*U2(:,npol2(k));
end;
% RRRRREDES NNNNEURONALES
for k=1:ky
Y(:,k)=UY(:,k+ku);
end;
nx=minmax(U');
102

net=newff(nx,[13,7],{'tansig','logsig'},'trainbr');
Yt=Y';
for i=1:ky
Ypmn(i)=min(Yt(i,:));
Ypmx(i)=max(Yt(i,:));
dif(i)=Ypmx(i)-Ypmn(i);
for j=1:d1
Ynorm(i,j)=(Yt(i,j)-Ypmn(i))/dif(i);
end
end
y5y2=Y(:,5)./Y(:,2);
% Model coefficients, model parameters and errors
for k=1:ky
X(:,k)=A\Y(:,k);
YE(:,k)=A*X(:,k);
DY(:,k)=(Y(:,k)-YE(:,k))./YE(:,k);
end;
[dymx,nymx]=max(DY);
[dymn,nymn]=min(DY);
sdy=std(DY,1,1);
% File size
fid=fopen('export.txt','rt');
krs=-2;
tmpline=fgets(fid);
krs=krs+1;
end;
fclose(fid);
UYST=fscanf(fid,'%g',[kuy,krs]); % reading the U and Y information
fclose(fid);
% Matrix formation
UYS=UYST';
for k=1:ktk
UYS(:,ntk(k))=UYS(:,ntk(k))+tk;
end;
%UYS(:,8)=UYS(:,8)*sqrtt0./sqrt(UYS(:,2)); % Temperature correction
for k=1:ku
US(:,k)=UYS(:,k);
US2(:,k)=UYS(:,k); %MMMMMMODIFICACION DE LAS REDES NEURONALES
end
Utr=U';
PB2=sim(net,Utr);
for j=1:ky
103

for k=1:d1
PBorigen2(j,k)=(PB2(j,k)*dif(j))+Ypmn(j);
end
end
PBorigentr2=PBorigen2';
for k=1:ky
YS(:,k)=UYS(:,k+ku);
end;
%%%%%%%%%%%%L A P R U E B A%%%%%%%%
YSt=YS';
for i=1:ky
YpmnEX(i)=min(YSt(i,:));
YpmxEX(i)=max(YSt(i,:));
difEX(i)=YpmxEX(i)-YpmnEX(i);
for j=1:d2
YnormEX(i,j)=(YSt(i,j)-YpmnEX(i))/difEX(i);
end
end
UStr=US';
PB=sim(net,UStr);
for nn=1:ky
Ypmndb(nn)=min(Ypmn(nn),YpmnEX(nn));
Ypmxdb(nn)=max(Ypmx(nn),YpmxEX(nn));
difdb(nn)=Ypmxdb(nn)-Ypmndb(nn);
end
for j=1:ky
for k=1:d2
PBorigen(j,k)=(PB(j,k)*difdb(j))+Ypmndb(j);
end
end
PBorigentr=PBorigen';
%%%%%%%**************la prueba********%%%%%%%%%%%%%%%
u1s=ones(krs,1);
US2(:,ku+1)=u1s;
for k=1:kcoef
AS(:,k)=US2(:,npol1(k)).*US2(:,npol2(k));
end;
for k=1:ky
end;
YStr=YS';
for k=1:7
DYrn2(:,k)=(YS(:,k)-PBorigentr(:,k))./PBorigentr(:,k);
end;
[dymx,nymx]=max(DYrn2);
[dymn,nymn]=min(DYrn2);
sdy=std(DYrn2,1,1);
for k=1:ky
end;
104

sdy=std(DYrn2,1,1);
for k=1:ky
DYrn1(:,k)=(Y(:,k)-PBorigentr2(:,k))./PBorigentr2(:,k);
end;
sdy=std(DYrn1,1,1);
% Model parameters and errors
for k=1:ky
YES(:,k)=AS*X(:,k);
DYS(:,k)=(YS(:,k)-YES(:,k))./YES(:,k);
TMP(:,k)=YS(:,k)-YES(:,k);
end;
DSUMM=(DYS(:,2)-DYS(:,3)+DYS(:,4)+DYS(:,5)-DYS(:,6))/5; %Integral cryterion
[dymxs,nymxs]=max(DYS);
[dymns,nymns]=min(DYS);
sdys=std(DYS,1,1);
% Plot variable
t=1:krs;
%
SECONDARY MODEL FORMATION AND APPLICATION
tc0=1700; dtc=700; kcc=2;
if tc0+dtc<krs
% verification of an existance of long export file
tc=tc0+1:tc0+dtc;
ic=1:dtc;
%nyc=1:kcc; ncc(nyc)=[1 2 3 4 5 6 7 8 9 10 11 12 13 14 15];
nyc=1:kcc; ncc(nyc)=[1 5];
YC(ic,:)=YS(tc,:)-YES(tc,:);
AC(ic,nyc)=AS(tc,ncc);
for k=1:ky
XC(:,k)=AC\YC(:,k);
YCE(:,k)=AC*XC(:,k);
DYC(:,k)=YC(:,k)-YCE(:,k);
end;
ASC(:,nyc)=AS(:,ncc);
for k=1:ky
DYESC(:,k)=ASC*XC(:,k);
YESC(:,k)=DYESC(:,k)+YES(:,k);
DYSC(:,k)=(YS(:,k)-YESC(:,k))./YESC(:,k);
end;
DCSUMM=(DYSC(:,2)-DYSC(:,3)+DYSC(:,4)+DYSC(:,5)-DYSC(:,6))/5; %Integral cryterion
end
t2=1:d1;
figure(2)
subplot(2,2,1);
plot(t2,DY(:,3),t2,DY(:,4),t2,DY(:,6)); %t,DYS(:,1),t,DYS(:,2),t,DYS(:,3),
xlabel('tiempo (horas)');
ylabel('Desviaciones');
title('Polinomios: Entrenamiento');
legend('Tt','Tc','Pt');
grid on;
subplot(2,2,2);
105

plot(t,DYS(:,3),t,DYS(:,4),t,DYS(:,6)); %t,DYrn2(:,1),t,DYrn2(:,2),t,DYrn2(:,3),
title('Polinomios: Validacin');
grid on;
subplot(2,2,3);
plot(t2,DYrn1(:,3),t2,DYrn1(:,4),t2,DYrn1(:,6)); %t,DYrn1(:,1),t,DYrn1(:,2),t,DYrn1(:,3),
hold on;
title('Redes Neuronales: Entrenamiento');
grid on;
t2=1:d1;
subplot(2,2,4);
plot(t,DYrn2(:,3),t,DYrn2(:,4),t,DYrn2(:,6)); %t,DYrn1(:,1),t,DYrn1(:,2),t,DYrn1(:,3),
title('Redes Neuronales: Validacin');
grid on;
PROGRAMA 2
clear;
kuy=11; ku=4; ky=7; kcoef=15; tk=273.15;
ntk=[2 7 8 10]; ktk=4;
npol1=[5 1 2 3 4 1 1 1 2 2 3 1 2 3 4];
npol2=[5 5 5 5 5 2 3 4 3 4 4 1 2 3 4];
d1=330; d2=4091;
d11=d1/2;
earlystoppign=1
%
PRIMARY MODEL FORMATION
% Modelo con mtodos numricos
krb=-2;
tmpline=fgets(fid);
krb=krb+1;
end;
fclose(fid);
fclose(fid);
UY=UYT';
% Matrix formation
for k=1:ktk
UY(:,ntk(k))=UY(:,ntk(k))+tk;
end;
106

for i=1:d11
UYM(i,:)=UY(i,:);
end
d11ex=d11+1;
for j=d11ex:d1
UYM2(j-165,:)=UY(j,:);
end
for k=1:ku
U(:,k)=UYM(:,k);
U2(:,k)=UYM(:,k); %MODIFICACION DE PROGRAMA ORIGINAL
end;
for k=1:ku
Umit(:,k)=UYM2(:,k);
U2mit(:,k)=UYM2(:,k); %MODIFICACION DE PROGRAMA ORIGINAL
end;
u1=ones((krb/2),1);
U2(:,ku+1)=u1;
for k=1:kcoef
A(:,k)=U2(:,npol1(k)).*U2(:,npol2(k));
end;
% RRRRREDES NNNNEURONALES
for k=1:ky
Y(:,k)=UYM(:,k+ku);
end;
for k=1:ky
Ymit(:,k)=UYM2(:,k+ku);
end;
%entrenamiento con mitad de base de datos....................
nx=minmax(U');
Yt=Y'
for i=1:ky
for j=1:d11
end
end
Ytmic=Ymit';
for i=1:ky
Ymdpmn(i)=min(Ytmic(i,:));
Ymdpmx(i)=max(Ytmic(i,:));
difmd(i)=Ymdpmx(i)-Ymdpmn(i);
for j=1:d11
Ynormd(i,j)=(Ytmic(i,j)-Ymdpmn(i))/difmd(i);
end
end
107

%................early stoppipign.................%%%%%%
if earlystoppign==1
val.P=Umit';
val.T=Ynormd;
[net,tr]=train(net,U',Ynorm,[],[],val);
else
end
y5y2=Y(:,5)./Y(:,2);
% Model coefficients, model parameters and errors
for k=1:ky
X(:,k)=A\Y(:,k);
YE(:,k)=A*X(:,k);
DY(:,k)=(Y(:,k)-YE(:,k))./YE(:,k);
end;
[dymx,nymx]=max(DY);
[dymn,nymn]=min(DY);
sdy=std(DY,1,1);
% File size
krs=-2;
tmpline=fgets(fid);
krs=krs+1;
end;
fclose(fid);
fclose(fid);
% Matrix formation
UYS=UYST';
for k=1:ktk
end;
for k=1:ku
US(:,k)=UYS(:,k);
US2(:,k)=UYS(:,k); %MMMMMMODIFICACION DE LAS REDES NEURONALES
end
%simulacion uno.....................................
Utr=U';
PB2=sim(net,Utr);
for j=1:ky
for k=1:d11
end
end
108

%simulacion dos.....................................
Ytmic=Ymit';
for i=1:ky
for j=1:d11
end
end
Umtr=Umit';
PB2mit=sim(net,Umtr);
for j=1:ky
for k=1:d11
PBorigenm(j,k)=(PB2mit(j,k)*difmd(j))+Ymdpmn(j);
end
end
PBorigentrm=PBorigenm';
u1sm=ones(d11,1);
Umit(:,ku+1)=u1sm;
for k=1:kcoef
ASM(:,k)=Umit(:,npol1(k)).*Umit(:,npol2(k));
end;
for k=1:ky
Ysgmt(:,k)=ASM*X(:,k);
DYMTS(:,k)=(Ymit(:,k)-Ysgmt(:,k))./Ysgmt(:,k);
Tdifmt(:,k)=Ymit(:,k)-Ysgmt(:,k);
end;
for k=1:ky
end;
%%%%%%%%%%%%L A P R U E B A%%%%%%%%
YSt=YS';
for i=1:ky
YpmnEX(i)=min(YSt(i,:));
YpmxEX(i)=max(YSt(i,:));
difEX(i)=YpmxEX(i)-YpmnEX(i);
for j=1:d2
YnormEX(i,j)=(YSt(i,j)-YpmnEX(i))/difEX(i);
end
end
UStr=US';
PB=sim(net,UStr);
for nn=1:ky
Ypmndb(nn)=min(Ypmn(nn),YpmnEX(nn));
Ypmxdb(nn)=max(Ypmx(nn),YpmxEX(nn));
difdb(nn)=Ypmxdb(nn)-Ypmndb(nn);
end
for j=1:ky
for k=1:d2
PBorigen(j,k)=(PB(j,k)*difdb(j))+Ypmndb(j);
end
109

end
PBorigentr=PBorigen';
%%%%%%%**************la prueba********%%%%%%%%%%%%%%%
u1s=ones(krs,1);
US2(:,ku+1)=u1s;
for k=1:kcoef
AS(:,k)=US2(:,npol1(k)).*US2(:,npol2(k));
end;
for k=1:ky
end;
YStr=YS';
for k=1:7
end;
sdy=std(DYrn2,1,1);
for k=1:ky
DYrn3(:,k)=(Ymit(:,k)-PBorigentrm(:,k))./PBorigentrm(:,k);
end;
sdy=std(DYrn3,1,1);
for k=1:ky
DYrn1(:,k)=(Y(:,k)-PBorigentr2(:,k))./PBorigentr2(:,k);
end;
sdy=std(DYrn1,1,1);
% Model parameters and errors
for k=1:ky
YES(:,k)=AS*X(:,k);
DYS(:,k)=(YS(:,k)-YES(:,k))./YES(:,k);
TMP(:,k)=YS(:,k)-YES(:,k);
end;
DSUMM=(DYS(:,2)-DYS(:,3)+DYS(:,4)+DYS(:,5)-DYS(:,6))/5; %Integral cryterion
[dymxs,nymxs]=max(DYS);
[dymns,nymns]=min(DYS);
sdys=std(DYS,1,1);
t=1:krs;
%
SECONDARY MODEL FORMATION AND APPLICATION
tc0=1700; dtc=700; kcc=2;
if tc0+dtc<krs
% verification of an existance of long export file
tc=tc0+1:tc0+dtc;
ic=1:dtc;
%nyc=1:kcc; ncc(nyc)=[1 2 3 4 5 6 7 8 9 10 11 12 13 14 15];
nyc=1:kcc; ncc(nyc)=[1 5];
YC(ic,:)=YS(tc,:)-YES(tc,:);
AC(ic,nyc)=AS(tc,ncc);
110

for k=1:ky
XC(:,k)=AC\YC(:,k);
YCE(:,k)=AC*XC(:,k);
DYC(:,k)=YC(:,k)-YCE(:,k);
end;
ASC(:,nyc)=AS(:,ncc);
for k=1:ky
DYESC(:,k)=ASC*XC(:,k);
YESC(:,k)=DYESC(:,k)+YES(:,k);
DYSC(:,k)=(YS(:,k)-YESC(:,k))./YESC(:,k);
end;
DCSUMM=(DYSC(:,2)-DYSC(:,3)+DYSC(:,4)+DYSC(:,5)-DYSC(:,6))/5;
end
t2=1:d11;
figure(2)
subplot(2,3,1);
plot(t2,DY(:,3),t2,DY(:,4),t2,DY(:,6)); %t,DYS(:,1),t,DYS(:,2),t,DYS(:,3),
grid on;
subplot(2,3,2);
plot(t2,DYMTS(:,3),t2,DYMTS(:,4),t2,DYMTS(:,6)); %t,DYMTS(:,1),t,DYMTS(:,2),t,DYMTS(:,3),
title('Polinomios: Validacion');
grid on;
subplot(2,3,3);
plot(t,DYS(:,3),t,DYS(:,4),t,DYS(:,6)); %t,DYS(:,1),t,DYS(:,2),t,DYS(:,3),
grid on;
subplot(2,3,4);
hold on;
grid on;
subplot(2,3,5);
hold on;
title('Redes Neuronales: Validacion2');
grid on;
111

subplot(2,3,6);
hold on;
title('Redes Neuronales: Validacion');
grid on;
PROGRAMA 3
clear;
kuy=11; ku=4; ky=7; kcoef=15; tk=273.15;
ntk=[2 7 8 10]; ktk=4;
npol1=[5 1 2 3 4 1 1 1 2 2 3 1 2 3 4];
npol2=[5 5 5 5 5 2 3 4 3 4 4 1 2 3 4];
d1=750; d2=4091;
d11=d1/2;
krs=-2;
tmpline=fgets(fid);
krs=krs+1;
end;
fclose(fid);
fclose(fid);
% Matrix formation
UYS=UYST';
for k=1:ktk
end;
for k=1:ku
US(:,k)=UYS(:,k);
end
for i=1:150
USed(i,:)=US(i,:);
end
for j=1000:1100
USed(j-849,:)=US(j,:);
end
%UScomp=setdiff(US,USed,'rows');
for i=151:999
UScomp(i-150,:)=US(i,:);
end
for j=1101:4091
UScomp(j-251,:)=US(j,:);
112

end
for k=1:ky
end;
for i=1:150
YSed(i,:)=YS(i,:);
end
for j=1000:1100
YSed(j-849,:)=YS(j,:);
end
%UScomp=setdiff(US,USed,'rows');
for i=151:999
YScomp(i-150,:)=YS(i,:);
end
for j=1101:4091
YScomp(j-251,:)=YS(j,:);
end
.......ccccccccccffff.........entrenamiento con mitad de base de datos....................
nx=minmax(USed');
Yt=YSed';
for i=1:ky
for j=1:251
end
end
[net,tr]=train(net,USed',Ynorm);
%simulacion uno.....................................
Utr=USed';
PB2=sim(net,Utr);
for j=1:ky
for k=1:251
end
end
%simulacion dos.....................................
Ytmic=YScomp';
for i=1:ky
for j=1:3840
end
113

end
Umtr=UScomp';
PB2mit=sim(net,Umtr);
for j=1:ky
for k=1:3840
PBorigenm(j,k)=(PB2mit(j,k)*difmd(j))+Ymdpmn(j);
end
end
PBorigentrm=PBorigenm';
for k=1:ky
DYrn2(:,k)=(YSed(:,k)-PBorigentr2(:,k))./PBorigentr2(:,k);
end;
for k=1:ky
DYrn3(:,k)=(YScomp(:,k)-PBorigentrm(:,k))./PBorigentrm(:,k);
end;
t=1:251;
t2=1:3840;
figure(2)
subplot(1,2,1);
hold on;
grid on;
subplot(1,2,2);
hold on;
title('Redes Neuronales: Validacion');
grid on;
114

ANEXO B.
PUBLICACIONES.
115

Aplicacin de las redes neuronales en modelo de estado normal para el

diagnstico de turbinas de gas
Claudia Fernanda Villarreal Gonzlez1, Igor Loboda1, Ivan Karol Trahyn Amezcua1
1
Instituto Politcnico Nacional, ESIME Culhuacn, Mxico, D.F., Av. Santa Ana, 1000, C.P. 04430
Telfono:(55) 5624 2000 ext.73254, E-mail: loboda@calmecac.esimecu.ipn.mx
Resumen - Para reconocer el estado actual de una turbina

de gas por medio de las variables medidos en su
conducto de flujo es necesario describir el
comportamiento del motor cuando est en buenas
condiciones, es decir la funcin de referencia. En este
artculo para una turbina de gas estacionaria de dos
rotores se proponen redes neuronales para obtener esta
funcin, se comparan con polinomios, se aplica el modelo
termodinmico
para
calcular
los
coeficientes
desconocidos de la funcin de referencia y se usa una
base de datos reales para examinar la funcin.
Palabras Clave turbina de gas, diagnstico,
desviaciones, funcin de referencia
Abstract In order to recognize gas turbine actual

conditions by means of measured gas paths variables, it
is necessary to describe a healthy or base-line engine. In
the present paper, neural networks are proposed for a
stationary two shaft gas turbine to determine its baseline function and they are compared with polynomials in
the same application. The thermodynamic model is
applied to calculate unknown coefficients of this function
and a field database is used to examine the function.
Keywords - gas turbine, diagnostics, deviations, base-line
function
I. INTRODUCCION
Las turbinas de gas han dominado en la generacin de
energa elctrica y lo seguirn haciendo por muchas
dcadas. Estas plantas de generacin de potencia se
caracterizan por un nivel elevado de potencia y altos costos
de combustible. Un monitoreo permanente en tiempo real
puede minimizar impacto econmico de un paro inesperado
o fallo. Algunas organizaciones han reportado un ahorro en
el mantenimiento del 30% debido a la implementacin de

programas de monitoreo.
En general para lograr un diagnstico permanente de
una turbina de gas se usa un sistema automatizado de
monitoreo (health monitoring system) basado en variables
medidas en el conducto de flujo (presin, temperatura,
velocidad de rotacin, caudal de combustibles etc.). Este
sistema guarda los datos medidos en una base especial
diagnostica.
Dos factores principales influyen a las variables
medidas del conducto de flujo; cambio del punto de
operacin del motor y envejecimiento del mismo. La
influencia del punto de operacin es mucho mayor, por lo
tanto para sacar la informacin diagnostica de las
mediciones crudas, se calculan las desviaciones de los
valores medidos respecto a los de referencia [3]. Los ltimos
corresponden a una buena condicin del motor.
Antes de que nuestro sistema pueda detectar
desviaciones por mal funcionamiento tenemos que estar
seguros de que el algoritmo empleado no se desvi de las
caractersticas de un motor en buen estado. Es decir para
poder emplear estos algoritmos debemos comprobar primero
su efectividad en un motor sin degradacin.
El uso de la informacin emprica [6, 10] permite
perfeccionar los algoritmos de diagnstico y los datos con
influencia de la contaminacin de compresor son
ampliamente involucrados en la investigaciones [1,3,5].
Muchas aplicaciones de redes neuronales al diagnstico
de turbinas de gas son conocidas. La mayora de estas se
aplica al problema de reconocimiento de fallas de motor
[2,7, 8, 9,10, 11] y slo algunas se usan para aproximar el
motor en buenas condiciones [por ejemplo, 4].
Investigamos antes tambin el problema de formacin
de la funcin de referencia y aplicamos polinomios para
describir esta funcin [12].
En este artculo para el diagnstico de una turbina de
gas estacionaria se proponen redes neuronales en la
aplicacin a la funcin de referencia y se realiza una
comparacin con polinomios en la misma aplicacin.
Ambas herramientas matemticas estn realizadas en el
116

ambiente matemtico Matlab debido a la facilidad con la

que este programa nos permite desarrollar el software
necesario y comparar las herramientas.
Tabla 2. Condiciones de operacin de la instalacin
(vector U )
No
1
2
Nomenclatura
Gc
n tp
3
4
Ta
Pa
II. METODOLOGA
Las investigaciones de este artculo se aplicaron a una
instalacin de turbina de gas de dos rotores y de turbina de
potencia (motor turboeje con turbina libre). Se usa para
accionar un compresor centrfugo en tuberas de gas natural.
La instalacin fue presentada en las investigaciones por su
modelo termodinmico y una base de datos medidos durante
el mantenimiento. Las variables medidas en el conducto de
flujo se difieren en las de control y las monitoreadas. Segn
el proceso termodinmico en una turbina de gas, las
variables monitoreadas que definen el vector Y dependen

de las condiciones de operacin (variables de control y
condiciones atmosfricas en conjunto) unidas en el vector
Nombre
Velocidad de rotacin de la turbina de
potencia
Presin ambiental
En el proceso del diagnstico total, la operacin

importante del clculo de desviaciones para las variables
medidas precede a las etapas principales de deteccin e
identificacin de las fallas y de pronstico. Estas
desviaciones se calculan en la base de la funcin de
referencia de acuerdo con la expresin siguiente:
U . Por lo tanto, podemos describir el comportamiento de

motor en buenas condiciones tcnicas con una funcin
vectorial:
Y0 = F0 (U ) .
(1)
Esta funcin se llama modelo de estado normal o

funcin de referencia.
Tabla 1 especifica las variables medidas y monitoreadas
en la instalacin analizada de turbina de gas.
Tabla 1. Variables monitoreadas en la instalacin (vector
Y)
No
1
2
3
4
5
6
7
Nomenclatura
n pa
Pc
Tt
Tc
Pt
Pt
n tpa
Nombre
dY =
*
Y * - Y0 (U )
(2)
Y0 (U )
donde Y * es el valor actual medido. Tanto Y * como Y0 (U )

dependen de las condiciones de operacin. Por consiguiente
en contraste a la variable absoluta, la desviacin (2) es libre
de la influencia de estas condiciones y puede servir como un
buen indicador del envejecimiento (degradacin) y fallas.
Sin embargo sobre la degradacin del motor, muchos
factores negativos afectan el clculo de las desviaciones
sobre todo la inexactitud de la funcin (1). Por eso el xito
del diagnstico depende directamente de la perfeccin de la
funcin de referencia.
El modelo termodinmico de una turbina de gas se
puede emplear como la funcin de referencia.
A. Modelo termodinmico
Velocidad del rotor de presin alta

Presin del compresor
Temperatura de la turbina de presin alta
Temperatura del compresor
Presin de la turbina de presin alta
Presin de la turbina de potencia
Velocidad de rotacin de la turbina de
potencia
En el diagnstico de turbinas de gas se utilizan en una

gran escala los modelos termodinmicos no lineales, en los
cuales el motor se describe con la profundidad del
componente (compresor, cmara de combustin, turbina
etc.). El modelo termodinmico sirve no slo para calcular
La estructura de las condiciones de operacin (las

variables de control y las condiciones atmosfricas) se
muestra en la Tabla 2. Todas las variables de la Tabla 1 y
Tabla 2 corresponden al sistema de mediciones estndar de
la instalacin analizada de turbina de gas.
las variables Y0 de una turbina de gas en buenas

condiciones en varios puntos de operacin sino para simular
los efectos del envejecimiento en estos puntos. Para realizar
esta funcin, los parmetros especiales Q se introducen en

la descripcin de las caractersticas de los componentes de la
turbina de gas; estos parmetros permiten desplazar
ligeramente las caractersticas y de esta manera simular el
117

envejecimiento gradual (por ejemplo, contaminacin de

compresor) y las fallas repentinas.
Al tener en cuenta las descripciones previas, el modelo
termodinmico puede ser descrito por la funcin siguiente
(3)
Y = F (U , Q) .
Esta funcin es calculada como un sistema de
ecuaciones algebraicas que reflejan las condiciones del
trabajo conjunto de los componentes de la turbina de gas en
los regmenes estacionarios.
Para el uso del modelo (3) como funcin de referencia,
es necesario precisar el modelo con los datos del motor en
buenas condiciones, es decir encontrar la estimacin
r
Q = Q 0 que acerque el modelo al los datos. El modelo
(4)
Y 0 = F0 (U , Q 0 )
ser la funcin necesaria de referencia o modelo de
estado normal.
Aunque el uso directo del modelo complejo (4) en el
clculo de numerosas desviaciones parece demasiado
complicado. Debido a ello propusimos en [12] usar este
modelo para generar los datos de entrenamiento para otras
herramientas matemticas ms simples. El uso del modelo
consistieron la primera herramienta matemtica para aplicar

[12]. El mtodo de mnimos cuadrados fue aplicado para
calcular los coeficientes ak desconocidos. Para la funcin
aproximada, este mtodo minimiza el error integral
siguiente:
E ( a0 , a1 ,..., an ) = [ f ( x) -Pn ( x)]2 dx .
El problema consiste en encontrar los coeficientes

a0 , a1 ,..., a n que reduzcan E al mnimo. Una condicin
necesaria para encontrar es que
E
= 0; k = 0, 1, ...,n .
(7)
ak
En nuestro caso de la presentacin de la funcin de
referencia deseada en forma de la muestra de datos de
entrenamiento, la ltima puede ser dividida por la matriz de
entrada U(Nn) y la de salida Y(Nm). Con estas matrices
conocidas, el problema de la aproximacin por polinomios
se describe como el sistema
(8)
Y = UA ,
el cual es lineal relativamente los coeficientes desconocidos
de la matriz A(nm). El mtodo de mnimos cuadrados para
el sistema lineal (7) y el caso del exceso de la informacin
(N>n) tiene la solucin analtica bien conocida:
termodinmico nos permiti obtener los valores Y 0 de la
A = ( U*U) -1 U *Y ,
instalacin analizada en una regin amplia del espacio U lo

que es muy difcil realizar en el mantenimiento real. El
conjunto de los vectores U y Y 0 obtenidos en 330 puntos

de operacin constituye la muestra de entrenamiento para
calcular los coeficientes desconocidos de polinomios y redes
neuronales usados en el artculo presente como las funciones
de referencia. En esta muestra valores de un vector U y un
vector Y forman una porcin elemental de datos y la

muestra consta de 330 tales porciones.
+ c5 PaTa + c6 Pa ntp + c7 Pa Ga +
+ c8Ta ntp + c9Ta Gc + c10 ntp Gc +
C. Redes neuronales
Pn ( x) = a0 + a1 x + ....an xn =
(a x
k
k =0
5)
(10)
+ c11 P 2 a + c12T 2 a + c13 n 2 tp + c14 G 2 c
De la explicacin anterior podemos entender que

nuestro trabajo consiste en aproximar los datos de la muestra
de entrenamiento por una funcin donde los argumentos son
Y0.
Los polinomios de grado mximo n
(9)
la cual se usa en nuestra investigacin para determinar los

coeficientes de la funcin de referencia con la muestra de
entrenamiento generada por el modelo termodinmico. Para
entrenar las redes neuronales se usa la misma muestra.
Hemos demostrado en [12] que los polinomios
completos del segundo orden describen bien el
comportamiento de turbinas de gas. Por eso en la
investigacin actual aplicamos la funcin siguiente para
cada variable monitoreada:
Y = co + c1 Pa + c2Ta + c3 ntp + c4Gc +
B. Polinomios
los elementos del vector U y el resultado sera el vector
(6)
La neurona artificial, clula o autmata, es un elemento

que posee un estado interno, llamado nivel de activacin, y
recibe seales que le permiten, en su caso, cambiar de
estado; emulando as el comportamiento de una neurona
biolgica. A la manera en que estas clulas (neuronas,
nodos) se conectan entre s se le denomina arquitectura de la
red.
118

En las investigaciones de este artculo usamos la

arquitectura llamada perceptrn multicapa y el algoritmo de
retropropagacin para su entrenamiento. En particular, se
utilizaron las variaciones de este algoritmo disponibles en
Matlab, las cuales realizan el aprendizaje supervisado
(aprtendizaje con las salidas deseadas de la red son
conocidas) en el modo de lote (batch mode).
En el perceptrn multicapa usado se distinguen tres
tipos de capas: la de entrada, la escondida y la de salida. Las
neuronas de la capa de entrada son las condiciones de
operacin U de la instalacin analizada y las neuronas de la
capa de salida son las variables monitoreadas Y 0

correspondientes a buenas condiciones de la instalacin. El
nmero de neuronas en la capa escondida se vara en
clculos y el nmero ptimo fue 12. El perceptron tiene las
funciones sigmoidales de activacin por lo tanto las salidas
de la red se varan en el intervalo (0-1) y las variables
monitoreadas (elementos del vector Y 0 ) deben ser

normalizadas antes de usarlas en el entrenamiento.
La figura 1 visualiza las descripciones previas y
demuestra la estructura del perceptron usado para la funcin
de referencia.
La conexin entre la capa de entrada y la escondida as
como entre la capa escondida y la de salida se realiza por los
coeficientes (pesos) unidos en dos matrices, W1 y W2
correspondientemente. El objetivo del entrenamiento del
perceptrn es encontrar tales valores de todos pesos que
minimizan la diferencia (error promedio e) entre las salidas
deseadas de la red y las actuales para todos los datos de la
muestra de entrenamiento (la misma que se aplica para
calcular los coeficientes de polinomios). De este punto de
vista podemos tratar el problema de entrenamiento como el
problema de la minimizacin de la funcin e(W1,W2) en el
espacio multidimensional de todos los pesos desconocidos.
Los algoritmos usados de entrenamiento tienen un carcter
iterativo y el error se reduce sucesivamente, iteracin por
iteracin, hasta alcanzar el valor mnimo.
Fig.1. Estructura del perceptrn para la funcin de

referencia
D. Validacin
Ambas herramientas, tanto polinomios como redes
neuronales, calculadas con el uso de la muestra de
entrenamiento necesitan una muestra ms para su
validacin. La muestra de validacin se compuse con la base
de datos reales de la instalacin analizada. Esta muestra
tiene la misma estructura que la muestra de entrenamiento y
incluye 4096 porciones de datos (secciones de medicin)
registradas con el intervalo de una hora durante de un ao de
operacin. El registro cubre dos periodos de contaminacin
y el lavado del compresor lo que presenta informacin
importante para el diagnstico ya que la contaminacin es
reconocida como uno de los mecanismos ms frecuentes de
envejecimiento.
Con respecto al criterio de validacin de la funcin de
referencia, el error promedio e puede ser calculado en la
muestra de validacin y considerado como el criterio. Sin
embargo a diferencia de la muestra de entrenamiento, estos
datos incluyen la influencia de la contaminacin la cual
alterar el criterio e. Por ello el error e se aplicar en el
anlisis de la siguiente seccin slo como un criterio
preliminar mientras que el criterio final ser una estimacin
visual de calidad de las grficas de las desviaciones
calculadas con la funcin analizada como se propone en
[12].
119

III. RESULTADOS
ambas herramientas
contaminacin.
El software del clculo de las desviaciones por medio

de dos herramientas, polinomios y redes neuronales, ha sido
desarrollado en Matlab el que simplific el desarrollo as
como la visualizacin y comparacin de los resultados.
La Figura 1 demuestra las desviaciones obtenidas por
polinomios y redes neuronales en las muestras de
entrenamiento y validacin. Para estos cuatro casos el
formato de graficas es el mismo: desviaciones de tres
variables monitoreadas especificadas en la Tabla 1 contra el
tiempo de operacin t.
Se puede considerar las desviaciones de la parte
izquierda de la figura como errores de aproximacin de los
datos
de
entrenamiento
por
las
herramientas
correspondientes. Podemos ver que las redes tienen los
errores cinco veces ms grandes.
En la parte derecha comportamiento de las desviaciones
computadas con polinomios tambin parece mucho mejor.
Podemos ver tendencias claras del cambio de las
desviaciones a causa de la contaminacin del compresor y el
lavado en el punto t = 920 horas mientras que las
fluctuaciones en las desviaciones computadas con las redes
son significativas y capaces de esconder completamente los
efectos de la contaminacin.
La calidad baja de las desviaciones y de la funcin de
referencia en base de redes neuronales se explica por falta
de ajuste en las redes. El perceptrn usado tiene tres
posibilidades para su ajuste: escoger la variacin propia del
algoritmo de entrenamiento, encontrar nmero necesario de
las iteraciones NI y determinar la cantidad ptima de nodos
de la capa escondida NN.
Despus de escoger el mejor algoritmo de
entrenamiento, formamos un plan de experimento numrico
para determinar los nmeros de iteraciones y nodos. Tabla 3
demuestra este plan rectangular con la variacin
independiente de estos dos parmetros. Cada celda de la
tabla presenta el valor del error promedio e para el clculo
correspondiente con la red neuronal. Los mejores y los
peores resultados se marcan por color.
Se seleccin propia de los nmeros NI y NN as como el
algoritmo de entrenamiento nos ha permitido mejorar
significativamente el funcionamiento de la red neuronal en
la aplicacin a la funcin de referencia y comportamiento de
las desviaciones correspondientes.
Los resultados finales de comparacin de dos
herramientas son graficados en la Fig.3. Observando las
graficas podemos concluir que en la muestra de
entrenamiento los errores de la red neuronal han bajado
aproximadamente en tres veces. En la muestra de validacin
la calidad de la red observada a travs de sus desviaciones se
mejor drsticamente tambin: ahora las desviaciones de
describen
igualmente
bien
la
Tabla 3. Plan del experimento numrico con la red neuronal

NI
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
710
0.25380
1
0.25854
2
0.06892
43
0.18040
2
0.10522
4
0.06809
14
0.12798
4
0.53751
7
0.23773
9
0.16020
9
0.05719
47
0.05682
94
0.34993
3
0.12122
1
0.51071
7
0.12048
2
0.07554
53
0.53259
6
0.09807
58
0.07666
8
3.86537
2.73437
0.11730
3
0.09478
15
0.12496
2
0.19406
4
0.11364
0.06473
76
0.1378
0.10090
8
Nmero de nodos NN
11
12
0.043294 0.04444
6
0.218773
0.060740
6
0.045355
0.085653
6
9
0.070359
0.041288
9
6
0.106783 0.044684
4
0.227283 0.156417
0.072853
5
0.146378
0.288374
0.78037
0.085725
2
0.053898
0.101054
0.054488
7
0.076694
5
0.045679
5
0.049382
7
0.050797
0.095511
4
0.039929
9
0.046107
5
0.040839
7
0.039153
1
0.053076
8
0.126915
0.066013
2
0.818928
0.038479
3
0.056096
9
0.121247
0.145849
0.098670
0.046750
0.048273
7
0.092927
1
0.878309
0.126256
0.076147
5
4.5855
0.091858
3
0.057125
3
0.066343
9
0.063449
0.165796
0.088610
2
0.054494
1
0.118214
0.057145
4
0.133177
0.045922
9
0.119061
0.068911
4
0.075958
6
16.5938
Nota:
120
Mejores respuestas de la red
13
0.206882
0.0863464
1.40216
0.0457762
0.397115
0.400441
0.0497931
0.1402626
0.120828
0.0882855
0.0789731
0.0461012
0.110234
0.0936413
0.0461464
0.14712
0.0397065
0.182618
0.114534
0.0617683
0.0591907
0.09824201
0.061816
0.81165
0.0533651
0.221868
0.0618592
0.0939929
0.0532404
0.135739

La exactitud alcanzada ya con polinomios y reds

neuronales es suficientemente alta y no es inferior a un nivel
conocido de la literatura. Por esta razn, futuros progresos
no vendrn fcilmente.
Peores respuestas de la red
IV. DISCUCIONES
Despus de una serie de ensayos de la red neuronal
perceptrn multicapa variando el nmero de iteraciones
entrenamiento y de neuronas escondidas, nos hemos llegado
a los resultados prcticamente iguales a los de polinomios
computados por el mtodo de mnimos cuadrados. Eso
quiere decir que la funcin de referencia (una generalizacin
de las caractersticas de estrangulacin y las climticas) de
la instalacin analizada es relativamente simple, los
polinomios son suficientes para describirla y la herramienta
ms compleja, perceptron multicapa no puede realizar su
ventaja potencial de flexibilidad elevada.
Aunque el perceptrn multicapa) es un aproximador
universal de funciones tiene todava la desventaja del
conocimiento a priori del numero de nodos ocultos y de la
complejidad de su algoritmo de entrenamiento comparando
con el mtodo matricial de encontrar los coeficientes de los
polinomios.
As, los polinomios parecen ser una herramienta
adecuada para describir la funcin de referencia y calcular
las desviaciones en sistemas de monitoreo de turbinas e gas.
Sin embargo, esta conclusin es preliminar. La
investigacin conducida ha demostrado existen algunas
posibilidades del mejoramiento de la funcin de referencia
con redes neuronales. Tambin hay que extender la
comparacin ejecutada para una instalacin con turbina libre
en otros tipos de turbinas de gas.
V. CONCLUSIONES
As, la formacin de desviaciones, la cual presenta un
problema importante del diagnstico de turbinas de gas, ha
sido considerada en este artculo. La red neuronal perceptron
multicapa fue propuesta, realizada en Matlab y comparada
con polinomios para el clculo de las desviaciones.
La motivacin para realizar este trabajo fue que se
esperaba que la red neuronal pudiera aproximar mejor la
funcin de referencia porque la red tiene ms grados de
libertad.
Despus de realizar numerosas variantes de clculos y
grficas comparativas llegamos a la siguiente conclusin:
ambas herramientas comparadas tienen prcticamente la
misma exactitud sin embargo la red neuronal es una
herramienta ms compleja que un polinomio, por lo tanto
ser ms factible aproximar la funcin de referencia y
calcular las desviaciones con polinomios. Esta conclusin
necesita una comprobacin ms amplia y hay que continuar
las investigaciones en esa rea.
AGRADECIMIENTOS
Las investigaciones de este artculo han sido soportadas
por el Instituto Politcnico Nacional de Mxico (proyecto de
investigacin 20080974).
121

Fig.2. Resultados preliminares de la comparacin de polinomios y redes neuronales
Fig.3. Resultados finales de la comparacin.
122

REFERENCIAS
1. Kacprzynski Gregory J., Michael Gumina, Michael J.
Roemer, Daniel E. Caguiat, Thomas R. Galie, Jack J.
McGroarty (2001). A prognostic modelling approach for
predicting recurring maintenance for shipboard propulsion
system. Proceedings of ASME Turbo Expo 2001, New
Orleans, LA USA, 7p.
2. Roemer Michael J., Kacprzynski Gregory J. (2000).
Advanced diagnostics and prognostics for gas turbine engine
risk assessment. IGTI/ASME Turbo Expo, May 8-11,
Munich, Germany, 10p.
3. Bryce Lord TransCanada Pipelines Ltd, Joshua Bennett
Idax Incorporated. Equipment health monitoring failure
mode characteristics case study. 17th National Petroleum
Show, Calgary, Canada June 12th to 15th, 2000, 25p.
4. Frank L. Greitzer, Lars J. Kangas, Kristine M. Terrones,
Melody A. Maynard, Bary W. Wilson, Ronald A.
Pawlowski, Daniel R. Sisk, and Newton B. Brown. Gas
turbine engine health monitoring and prognostics.
International Society of Logistics (SOLE) 1999 Symposium,
Las Vegas, Nevada, August 30 September 2, 1999, 7p.
5. H. I. H. Saravanamuttoo, B. D. MacIsaac,
Thermodynamic models for pipeline gas turbine diagnostics.
ASME Journal of Engineering for Power, 1983, Vol. 105,
pp.875-884 ASME Paper No.83-GT-235
6. Hans DePold, Jason Siegel, Allan Volponi, Jonthan Hull.
Validation of diagnostic data with statistical analysis and
embedded knowledge. IGTI/ASME Turbo Expo 2003, June
16-19, 2003, Atlanta, Georgia, USA, 7p., ASME Paper

GT2003-38764
7. A.J. Volponi, H. DePold, R. Ganguli. The use of Kalman
filter and neural network methodologies in gas turbine
performance diagnostics: a comparative study.
Journal of Engineering for Gas Turbines and Power -October 2003 -- Volume 125, Issue 4, pp. 917-924
8. Suresh Sampath, Riti Singh. An integrated fault
diagnostics model using genetic algorithm and neural
networks. Journal of Engineering for Gas Turbines and
Power -- January 2006 -- Volume 128, Issue 1, pp. 49-56.
9. C. Romessis, A. Kyriazis, K. Mathioudakis. Fusion of gas
turbine diagnostic inference the Dempster-Schafer
approach. IGTI/ASME Turbo Expo 2007, May 14-17, 2007,
Montreal, Canada, 9p., ASME Paper GT2007-27043.
10. Hai Kiu, Neil Eklund, Weizhong Yan, Piero Bonissone,
Feng Xue, Kai Goebel. Estimating deterioration level of
aircraft engines. IGTI/ASME Turbo Expo 2007, May 14-17,
2007, Montreal, Canada, 7p., ASME Paper GT2007-27519.
11. Al Volponi, Tom Brotherton, Rob Luppold. Empirical
tuning of on-board gas turbine engine model for real-time
module performance estimation. IGTI/ASME Turbo Expo
2007, May 14-17, 2007, Montreal, Canada, 10p., ASME
Paper GT2007-27535
12. I. Loboda, S. Yepifanov, Y. Feldshteyn. Deviation
problem in gas turbine health monitoring / IASTED
International Conference on Power and Energy Systems
(PES-2004), Clearwater Beach, Florida, USA, November 28
December 1, 2004, pp. 335-340.
123
124
ANALISIS DE UNA RED NEURONAL EN LA APLICACIN A LA FUNCION DE REFERENCIA

DE UNA TURBINA DE GAS
Claudia Fernanda Villarreal Gonzlez, Igor Loboda, Ivn Trahyn Amezcua
Instituto Politcnico Nacional, ESIME Culhuacn, Av. Santa Ana 1000, col. San Francisco Culhuacn,
Mxico, D.F. 044300
leydassss@yahoo.com.mx;
iloboda@ipn.mx;
ivan_t_a@yahoo.com.mx
RESUMEN
Para monitorear las variables medidas en el conducto de flujo de un motor de turbina de gas es necesario
describir el comportamiento del motor en buenas condiciones, es decir, determinar la funcin de referencia.
Las desviaciones computadas como diferencias entre valores medidos y valores de referencia pueden servir
como buenos indicadores de la calidad de esta funcin. En el artculo presente se estudian las redes
neuronales en la aplicacin a la funcin de referencia y se comparan con polinomios en la misma aplicacin.
Un modelo termodinmico del motor y una base de datos reales son fuentes de los datos para determinar y
verificar la funcin. A travs de esta funcin se calcularon las desviaciones para ambas herramientas, tanto
redes como polinomios, y se compararon las grficas de desviaciones para varias variaciones en las redes
aplicadas. El anlisis de todas las grficas ha demostrado que las redes, a pesar de de sus caractersticas
altas de aproximacin de datos, no pueden sobrepasar los polinomios en la descripcin del motor de turbina
de gas analizado.
1 INTRODUCCION
Las turbinas de gas son dispositivos mecnicos muy importantes para la economa del pas. Tienen una
infinidad de aplicaciones, por ejemplo: aviacin, generacin de energa elctrica, bombeo de petrleo y
compresin de gas natural.
Por la naturaleza y complejidad de los motores de turbina de gas resulta tardado y costoso detectar y
corregir alguna falla. Sin embargo, existen diferentes sistemas automatizados de monitoreo, los cuales
permiten detectar e identificar las fallas de turbina de gas en un tiempo reducido. De tal manera se puede
bajar drsticamente el nivel de fallos serios. El trabajo de los sistemas mencionados se basa en un
tratamiento diagnstico de los parmetros medidos en los motores de turbina de gas.
124
125
El presente trabajo analiza los parmetros medidos en el conducto de flujo de una turbina de gas, tales
como: temperaturas y presiones en el conducto de flujo, velocidades de rotacin y caudal de combustible.
Para analizar los parmetros medidos y concluir el estado del sistema por medio de este anlisis es
necesario compararlos con los valores de referencia de un motor en buenas condiciones despus de la
fabricacin o un mantenimiento. Estos valores dependen de las condiciones de operacin del motor. Por
ende para describir todas variables de referencia del motor en buenas condiciones se necesita una funcin
vectorial - funcin de referencia - que tiene el vector de las condiciones de operacin como argumentos. Las
diferencias entre los valores medidos y la funcin de referencia son conocidas como desviaciones. Estas
desviaciones por un lado cambian gradualmente a causa de diferentes mecanismos de degradacin de
turbinas de gas (por ejemplo, contaminacin de compresores), por otro lado son afectadas por errores de la
funcin misma. Por lo tanto las graficas de las desviaciones no slo demuestran los efectos de degradacin
sino tambin reflejan la calidad de la funcin de referencia.
En nuestros estudios previos [1-3] usamos la herramienta de polinomios para aproximar la funcin de
referencia necesaria. Dado que las redes neuronales artificiales son conocidas como aproximadores
perfectas, en este artculo se investigan las redes en la aplicacin a la funcin de referencia para el
diagnstico de un motor de turbina de gas. Durante la investigacin se analizan diferentes modificaciones de
la red y se comparan con los polinomios.
2 ENFOQUE UTILIZADO
Desviaciones
El objetivo del diagnostico paramtrico de turbinas de gas es realizar un monitoreo constante de los
parmetros medidos y en caso de una falla detectarla e identificarla ms pronto posible. La eficiencia de un
sistema automatizado de diagnstico depende en la mayor parte de la calidad de las desviaciones. Para una
variable medida y monitoreada Y * , la desviacin relativa puede ser calculada de acuerdo a la expresin
dY * =
Y * - Y0 (U )
(1)
Y0 (U )
donde el valor de referencia Y0 es una funcin del vector U de condiciones de operacin de una turbina de
gas. Las funciones individuales Y0 (U ) computadas para cada variable monitoreada se unen en la funcin
vectorial de referencia como se muestra en la siguiente ecuacin
Y0 = F (U ) = Y0 (U ) .
(2)
En los previos estudios usamos ampliamente la herramienta de los polinomios para formar la funcin (2) en
base de datos registrados de turbinas de gas durante su operacin. Se ha demostrado en [1] que los
polinomios completos del segundo orden describen satisfactoriamente el comportamiento de motores en
diferentes regmenes de operacin (puntos de operacin). Por lo tanto, los polinomios se emplean como la
base de comparacin en el anlisis de las redes neuronales presentado en este artculo.
125
126
Herramienta de los Polinomios
Para una variable monitoreada la funcin de referencia, por ejemplo, de cuatro argumentos, se describe a
travs del polinomio completo del segundo orden como
Y0 (U ) = a0 + a1u1 + a2u 2 + a3u3 + a4u4 + a5u1u2 + a6u1u3 + a7 u1u 4 +
(3)
+ a8u2u3 + a9u2u 4 + a10u3u 4 + a11u12 + a12u 22 + a13u32 + a14 u42
Con motivo de presentar toda la funcin vectorial, podemos generalizar la expresin (3) en la forma
siguiente:
Y0* = V * A ,
(4)
donde Y0* es el vector rengln de variables monitoreadas de dimensin m, V * es el vector rengln kdimensional que une todos los componentes 1, u1 , u2 ,...u32 , u42 y la matriz A (km) incorpora los coeficientes
ai para todas m variables monitoreadas. Obviamente, el numero de ecuaciones m en el sistema lineal (4) no
es suficiente para estimar (mk) coeficientes desconocidos. A fin de obtener ms datos, involucramos en los
clculos las mediciones Y0
y U
de n diferentes puntos de operacin y formamos las matrices
correspondientes Y (nm) y V (nk). Con las matrices nuevas, la ecuacin (4) se transforma en
Y = VA .
(5)
Para estimar los coeficientes desconocidos de la matriz A se aplica el mtodo de mnimos cuadrados
(MMC). El MMC consiste en encontrar tales estimaciones que minimizan la suma de errores cuadrados
n
i =1
yij - Vi* A j .
j =1
(6)
Con la condicin de minimizacin, el sistema de ecuaciones lineales (5) tiene la solucin siguiente bien
conocida:
A = (V *V ) -1 V *Y .
(7)
Esta solucin del MMC requiere un exceso de los datos de entrada. Por consiguiente, tenemos que cumplir
la condicin (nm)>(mk) o n>k. La solucin (7) asegura errores aleatorios reducidos de las estimaciones si
comparar con la solucin
A = (V ) -1 Y
(8)
que se tiene para el caso n=k, cuando el nmero de ecuaciones se iguala al nmero de las variables
desconocidas.
126
127
Al poner la estimacin A en la ecuacin (4), tenemos la funcin de referencia
Y0* = V * A .
(9)
Ahora con la expresin (9) se tiene un modelo de turbina de gas listo para aplicarse a cualquier punto de
operacin nuevo dado por el vector U (recuerde que V * se determina simplemente a travs de U ) y
computar el vector Y0* de las caractersticas de la turbina. A su vez, los valores conocidos Y0 permiten el
clculo de las desviaciones (1).
La siguiente herramienta para crear la funcin de referencia y la principal en la presente investigacin es la
llamada redes neuronales artificiales.
Herramienta de las Redes Neuronales Artificiales

La teora de redes neuronales se basa en el modelo de las neuronas del cerebro. La neurona es una clula
activada por estmulos qumicos y biolgicos y tiene una capacidad muy pequea del tratamiento de
informacin. Sin embargo, cuando estn conectadas millones de ellas trabajan como una red muy poderosa
de procesadores paralelos. Eso ocasiona que en muchas aplicaciones prcticas los supercomputadores
modernos todava no son capaces de semejarse con el funcionamiento del cerebro humano.
La funcin de referencia (4), adems de encontrarse por medio de polinomios tambin se puede aproximar a
travs de una red. Aunque en el pasado las redes neuronales artificiales tenan el objetivo general de un
procesamiento de nivel ms bajo, por ejemplo, reconocimiento de patrones e inteligencia artificial; existen
teoremas [4] que demuestran que redes como el perceptron multicapa y la red de base radial, puedan
aproximar varias funciones matemticas.
Para el presente estudio hemos recogido el perceptrn multicapa que se entrena con el algoritmo de
retropropagacin. La estructura de la red utilizada se muestra en la figura 1. Como podemos ver, es una red
neuronal con 3 capas: La primera es la capa de entrada donde cada seal es un elemento del vector U de
las condiciones de operacin de turbinas de gas. A su vez, las salidas de estas se propagan con los pesos
de la matriz W1 hacia la capa oculta que se activa con una funcin sigmoide de transferencia. De manera
semejante las salidas de la capa oculta se propagan con los pesos de la matriz W2 a los nodos de salida.
En ellos se suman y a travs de la funcin de transferencia forman las seales de salida, elementos del
vector Y0 de las variables monitoreadas.
127
128
Fig.1. Estructura del perceptrn para la funcin de referencia.
El algoritmo que entrena a la red neuronal se basa en la biologa de humanos donde la memoria a corto y
largo plazo est asociada con las fuerzas entre las clulas presinapticas y postsinapticas. De esta manera
tenemos que ir modificando los valores de los pesos hasta que mediante el procesamiento no lineal (o lineal)
de cada capa obtengamos el valor deseado de la salida Y0 . El desarrollo del algoritmo de retropropagacin
para el entrenamiento del perceptron ha impulsado una difusin amplia de esta red. El objetivo del
entrenamiento de retropropagacin es encontrar tales valores de todos pesos que minimizan la diferencia
(error promedio e) entre las salidas deseadas de la red y las actuales para todos los datos de la muestra de
entrenamiento. Esta muestra consta de los mismos datos que las matrices V y Y usadas para calcular los
coeficientes de polinomios. De este punto de vista podemos tratar el entrenamiento como el problema de la
minimizacin de la funcin e( W1 , W2 ) en el espacio multidimensional de todos los pesos desconocidos.
Ambas herramientas descritas arriba, tanto la red entrenada como el polinomio con los coeficientes
determinados, tienen que someterse a pruebas en datos diferentes de los de entrenamiento.
Pruebas de las Herramientas

A fin de confirmar la exactitud de las herramientas, se forma una muestra diferente a la de entrenamiento,
muestra de validacin. La disponibilidad de los datos reales con la influencia de la contaminacin del
compresor axial de turbinas de gas nos presta una oportunidad buena para estimar y comparar la
adecuacin de las dos herramientas analizadas. Eso se realiza a travs del anlisis de las desviaciones
correspondientes.
Primero, se forma la muestra de validacin en la base de estos datos. Segundo, para todos los datos de la
muestra se calculan dos series de las desviaciones, una con los polinomios y la otra con las redes. Tercero,
se grafican en paralelo ambas series contra el tiempo de operacin. En estas grficas podemos considerar
los errores aleatorios en las desviaciones en el fondo de los cambios sistemticos causados por la
contaminacin del compresor. Debido a que los errores dependen primeramente de la adecuacin de la
funcin de referencia, pueden ser buenos indicadores de la calidad de la funcin. Por ltimo, se comparan
estas dos grficas correspondientes a los polinomios y las redes para concluir sobre la utilidad de las redes.
128
129
La seccin siguiente describe las condiciones de los clculos para formar y probar las funciones de
referencia basadas en los polinomios y las redes.
3 CONDICIONES DE CALCULOS
La investigacin del presente artculo se aplic a un motor de turbina de gas de dos ejes y de turbina libre de
potencia. El motor se aplica para accionar un compresor centrfugo de gas natural. Las tablas 1 y 2
describen las variables medidas en este motor.
Tabla 1. Variables monitoreadas (vector Y )

No
Nomenclatura
Nombre
npa
Velocidad del rotor de compresor
Pc
Presin detrs del compresor
Tt
Temperatura detrs de la turbina de presin alta
Tc
Temperatura detrs del compresor
Pt
Presin detrs de la turbina de presin alta
Pt
Presin detrs de la turbina de potencia
ntpa
Tabla 2. Condiciones de operacin (vector U )

No
Nomenclatura
Nombre
Gc
ntp
Ta
Pa
Presin ambiental
El motor fue presentado en el artculo por su modelo termodinmico y una base de datos medidos en campo.
El conjunto de los vectores U e Y 0 obtenidos con el modelo en 330 puntos de operacin del motor
constituye una variacin de la muestra de entrenamiento. Otra variacin incluye datos reales de la base. La
muestra de validacin se compuse slo con los datos reales. La muestra incluye 4096 puntos de operacin
(porciones de datos) registradas cada hora durante un ao de operacin. El registro cubre dos periodos de
contaminacin del compresor con un lavado entre ellos.
129
130
4 MODIFICACIONES ANALIZADAS Y SUS RESULTADOS
En el artculo [3] empezamos a aplicar el perceptron multicapa para describir el comportamiento de turbinas
de gas. Hemos encontrado que el percepron tiene prcticamente la misma exactitud, sin embargo pero
nunca sobrepasa los polinomios en la descripcin de las turbinas de gas. Hemos llegado tambin a la
conclusin que el algoritmo de entrenamiento con mejores resultados fue el de retropropagacin bayesiana y
en el presente artculo continuamos trabajando con el mismo algoritmo. Para encontrar las ptimas
condiciones para la red seleccionada, hemos elaborado en Matlab ocho modificaciones nuevas del algoritmo
bsico de clculo de la funcin de referencia y las desviaciones. En estas modificaciones se cambian las
tcnicas de preprocesamiento de los datos de entrenamiento y las funciones de transferencia usadas, as
como se aplica la opcin de entrenamiento parada temprana (early stopping) y los datos reales para la
muestra de entrenamiento. A continuacin se detallan las modificaciones:
Modificacin 1. En el algoritmo bsico usado en [3] los datos de la salida de la red se normalizan dentro del
rango (0,1) ya que la funcin de transferencia logsig se cambia dentro del mismo rango. La modificacin
actual consiste en la normalizacin dentro del rango reducido (0.1, 0.9) para mejorar la aproximacin de los
datos de entrada.
Modificacin 2. En lugar de la funcin logsig se aplica la funcin purelin la cual cambia linealmente y no
tiene lmites. La normalizacin de los datos dentro del rango (0,1) se conserva como en el algoritmo bsico.
Modificacin 3. Se aplica la funcin purelin pero los datos de la salida de la red no se normalizan.
Modificacin 4. Se aplica la funcin bipolar tansig que se vara dentro de los lmites (-1,1). Los datos se
normalizan dentro los mismos lmites.
Modificacin 5. Se aplica la funcin tansig pero los datos se normalizan dentro del rango reducido (0.9,0.9).
Modificacin 6. Se introducen nodos adicionales llamados umbrales en adicin a las matrices de pesos W1
y W2 . El aumento del nmero total de pesos significa una flexibilidad mayor de la red y un mejoramiento
potencial de la aproximacin de los datos.
Modificacin 7. El algoritmo bsico emplea una sola muestra de entrenamiento. La modificacin actual
aplica la opcin del entrenamiento conocida como parada temprana (Early Stopping). Esta variacin consiste
en entrenar la red con dos muestras; una para entrenar la red y otra para verificarla dentro del mismo
proceso de entrenamiento. Para poder aplicar este algoritmo la muestra de entrenamiento original de 330
porciones de datos fue dividida en dos fragmentos iguales de 165 porciones. Las matrices de pesos W1 y
W2 se obtienen en los datos del primer fragmento y el entrenamiento termina cuando empieza a crecer el
error e( W1 , W2 ) para la red aplicada al segundo fragmento.

Modificacin 8. En el algoritmo bsico as como en todas las modificaciones previas la red neuronal se
entrena con los datos obtenidos por el modelo termodinmico durante la simulacin del motor en buenas
condiciones. Para esta modificacin la muestra de entrenamiento se compone de datos reales
correspondientes a un buen estado del motor despus del lavado de su compresor.
130
131
Hay que mencionar que en las modificaciones 1-6 slo cambiamos el clculo de las redes dejando el
cmputo de los polinomios y las desviaciones correspondientes sin correcciones. Sin embargo, las
modificaciones 7 y 8 relacionadas con variaciones en los datos de entrenamiento influyen al clculo de
ambas herramientas.
La figura 2 muestra los resultados obtenidos para la Modificacin 1 del algoritmo de clculo de la funcin de
referencia y las desviaciones. Se dan las desviaciones obtenidas con tanto los polinomios como las redes
neuronales y aplicadas a los datos de la muestra de entrenamiento y la de validacin. Para estos cuatro
casos el formato de grficas es el mismo: desviaciones de tres variables monitoreadas especificadas en la
Tabla 1 contra el tiempo de operacin t. Se puede considerar las desviaciones de la parte izquierda de la
figura como errores de aproximacin de los datos de entrenamiento por las herramientas correspondientes.
Podemos ver que las redes tienen los errores algunas veces ms grandes. La parte derecha presenta el de
las desviaciones computadas con los datos de validacin. Para la opcin de polinomios, podemos ver
tendencias claras del cambio gradual de las desviaciones a causa de la contaminacin del compresor y un
cambio brusco en el punto del lavado t = 920 horas. Con respecto a las redes, sus desviaciones tienen
fluctuaciones elevadas y capaces de esconder a veces los efectos de la contaminacin.
En la figura 3 se dan las grficas de desviaciones para todas ocho modificaciones analizadas. Para cada
modificacin, slo resultados de la aplicacin de las redes neuronales a los datos de entrenamiento son
presentados. Comparando las graficas de diferentes modificaciones podemos constatar lo siguiente: 1) la
calidad de las desviaciones (relacin "seal sistemtico - ruido") para la Modificacin 5 es aproximadamente
la misma que la de la Modificacin 1; 2) en las Modificaciones 1, 4 y 6 baja la calidad; 3) las Modificaciones
3, 7 y 8 tienen la peor calidad de las desviaciones (las fluctuaciones aleatorias prcticamente esconden los
efectos sistemticos de la contaminacin). Al comparar las figuras 2 y 3, se puede agregar que en ninguna
modificacin del algoritmo las redes sobrepasan los polinomios.
De otras grficas no presentadas en este artculo tambin podemos concluir que en la muestra de
entrenamiento los polinomios siempre tenan mejor exactitud.
CONCLUSIONES
As, en este artculo ha sido considerado el anlisis de las redes neuronales en comparacin con los
polinomios en la misma aplicacin a la descripcin de turbinas de gas. La motivacin para realizar este
trabajo fue que se esperaba que la red neuronal pudiera describir mejor el comportamiento de los motores
porque las redes potencialmente tienen mejor flexibilidad.
La red neuronal perceptron multicapa fue propuesta y analizada. A travs de ambas herramientas, las redes
y los polinomios, fue realizado en Matlab el clculo de la funcin de referencia y las desviaciones para las
variables monitoreadas de un motor de turbina de gas. Las redes fueron estimadas por el medio de las
grficas de las desviaciones construidas para ambas herramientas.
Despus de realizar numerosas modificaciones del clculo mencionado y analizar para todas las
modificaciones las grficas comparativas, llegamos a la siguiente conclusin: la red seleccionada no puede
sobrepasar los polinomios en la exactitud de la descripcin del comportamiento del motor analizado.
Adems, la red neuronal es una herramienta ms compleja en su uso que un polinomio. Estas conclusiones
comprueban los resultados de comparaciones previas de las herramientas para describir parmetros de
131
132
turbinas de gas. Sin embargo, tenemos que continuar estos estudios ya que se tiene la informacin que las
redes neuronales artificiales describen perfectamente el comportamiento de las plantas de potencia ms
complejas, tales como las del ciclo combinado.
AGRADECIMIENTOS
Las investigaciones de este artculo han sido soportadas por el Instituto Politcnico Nacional de Mxico
(proyecto de investigacin 20091273).
REFERENCIAS
1. Loboda I., Yepifanov S., Feldshteyn Y. Deviation problem in gas turbine health monitoring, Proceedings of
IASTED International Conference on Power and Energy Systems (PES-2004), Clearwater Beach, Florida,
USA, pp. 335-340.
2. Loboda I., Yepifanov S., Feldshteyn Y. Diagnostic analysis of maintenance data of a gas turbine for driving
an electric generator, ASME Turbo Expo 2009: International Technical Congress Power for Land Sea &
Air, Orlando, Florida, USA, June 8-12, 2009, 12p., ASME Paper No. GT2009-60176.
3. Villarreal Gonzlez C. F., Loboda I., Trahyn Amescua I. K. Aplicacin de las redes neuronales en modelo
de estado normal para el diagnstico de turbinas de gas, Memorias del 5to Congreso Internacional de
Ingeniera Electromecnica y de Sistemas, ESIME, IPN, Mxico, D.F., 10-14 noviembre de 2008, 6p,
ISBN 978-607-414-049-1.
4. Bonifacio Martn del Bro, Alfredo Sanz Molina. Redes neuronales y sistemas difusos. Alfaomega Grupo
Editor, Mxico, 2001, 399p.
132
133
Fig.2. Desviaciones de la Modificacin 1. Polinomios y redes neuronales aplicados a los datos de

entrenamiento y validacin.
133
134
Fig.3. Desviaciones de todas las Modificaciones 1-8. Redes neuronales aplicadas a los datos de
entrenamiento.
134
135
UDK 621.43.004.62
IGOR LOBODA*, YAKOV FELDSHTEYN**,
CLAUDIA FERNANDA VILLARREAL GONZLEZ*
*National Polytechnic Institute, School of Mechanical and Electrical Engineering, Mexico
**Compressor Controls Corporation, USA
DIAGNOSTIC ANALYSIS OF GAS TURBINE HOT SECTION
TEMPERATURE MEASUREMENTS
Temperatures measured in a hot section of gas turbines are very important for a gas path analysis. A
suite of parallel thermocouples are usually installed in the same gas path station in order to compute
a filtered and averaged temperature quantity for its further use in control and diagnostic systems.
However, in spite of the preliminary treatment, the resulting quantity is not completely free from
errors. To eliminate or reduce the errors, the present paper analyzes anomalies in the behaviour of
each thermocouple of an industrial gas turbine engine. To that end, time graphs of both measured
magnitudes themselves and their deviations from reference magnitudes are plotted. In order to draw
sound conclusions, the analysis is conducted on a large volume of the data collected for three
particular engines.
Key words: gas turbine, gas path analysis, thermocouples, field data, temperature recording errors.
135
136
Nomenclature
Subscripts and superscripts

0
Baseline function value
Abbreviations
Measured value
EGT
Exhaust gas temperature
Index of a thermocouple probe
GPA
Gas path analysis
max
Maximum value
HPT
High pressure turbine
med
Mean value
PT
Power turbine
Temperature
PTT
Power turbine temperature
Total value
T_PT
Mean power turbine temperature
1. Introduction
Scalar parameters and vectors
dTpt
Deviation of a particular PTT probe
dTt
Deviation of a particular EGT probe
Engine operation time variable
Gas path analysis (GPA) techniques provide

invaluable insight into gas turbine condition.
These techniques are based on measured and
recorded gas path variables (pressures,
temperatures, rotation speeds, fuel consumption,
etc.) and hot section temperatures (exhaust gas
temperature as well as temperatures behind low
and intermediate pressure turbines, if any)
among them. Advancements in electronics and
computer processing enable less expensive field
data collection to support the GPA.
Vector of baseline functions arguments
Gas path variable
Maximal deviation
d0
Signal-to-noise ratio
dY
Deviation of a gas path variable
Spread (of temperature); interval (of
time)
e
e1 , e 2 , e 3
Error of a gas path variable; noise range

(of temperature)
Error components
s (e S ) Standard deviation of the errors
As engine integrity depends on gas

temperature values, temperature measurement
and recording are of great importance for gas
turbine control and diagnostic systems. The
control system can employ these variables,
especially the EGT, in engine control programs in
order to avoid engine overheating. As to the
diagnostic
system,
some
temperature
measurement applications worthy to mention are
given below.
In engine component diagnostic techniques,
which involve all available gas path variables into
the analysis, the gas temperatures are confirmed
136
137
to be very informative diagnostic parameters
[1,2,8]. Life usage algorithms of the hot section,
which is the most critical part of the engine, also
employ these temperatures [10]. In such
applications, the gas temperature in each hot
section measurement station is commonly
computed by averaging the data of particular
thermocouple probes. However, temperature
profiles contain additional valuable information
on the performances of a burner and turbines. For
this reason, gas temperature profile monitoring [3]
became an integral part of modern diagnostic
systems.
As noted in many papers, for example, in [5],
thermocouple probes as well as other gas path
sensors can deteriorate with time or present abrupt
malfunctions. Such errors can be significant and
impact on control and diagnosis techniques. That
is why it is desired that the techniques take into
account possible errors in input information.
Sensor fault accommodation procedures,
which mitigate a negative effect of sensor errors
on a control system and allow the control to be
tolerant to them, are proposed [for example, 7].
With respect to the diagnostic techniques,
some options are considered to take into
consideration possible sensor errors and faults. A
sensor-fault-tolerant diagnosis tool is proposed
[6]. Another option is the multipoint method
described for instance in [5]. It compensates a
sensor error impact by increasing input
information through data collection in many
different operating points. Additionally, many
GPA techniques of today detect and identify
sensor faults [see, for instance, 4,5,6], thus
extending
traditional
engine
component
diagnosis over a gas path measurement system.
with the fact that the characteristics of sensor

normal errors are also known with an
uncertainty. Usually, a total uncertainty range
only can be involved into diagnosis [for example,
11,12] while the proportion between random and
systematic error components and their drifts
remain unknown. Thus, the issue of the input
information tracking and validation remains
relevant.
Direct off-line analysis of raw measurements
[see, for example, 3] can contribute in solving this
challenging problem. The analysis yields the
knowledge of sensor error performance. This
allows excluding sensor faults, reducing sensor
errors and better accommodating them in
diagnostic algorithms.
In the previous investigations [see 1, 2], we
also conducted a metrological analysis of gas
turbine field data. The objective was to ensure
high quality of input data for gas turbine
diagnostic
algorithms
by
identifying
measurement errors and extracting them from
the data. The hot section temperatures were
analysed among the other variables of a standard
gas
turbine
measurement system. The
temperatures were presented by their mean
values computed by averaging particular probes'
data.
Proceeding with the previous off-line
analysis on field data, the present paper looks at
the behaviour of individual thermocouple probes.
The objective is to obtain new information about
probe error performance by analysing great bulk
of the data. In the paper, the term "probe error"
implies a total measurement error without
dividing it into a sensor proper error and a
recording error.
Although various diagnostic algorithms take

In the present analysis, data of each
into consideration an uncertainty in input particular probe are studied against the
information, they only partially mitigate the background of other probes data. Deviations of
impact of errors and faults but can not completely measured probe values from their baseline
eliminate it. One of the difficulties is connected (reference) values are employed as well. Tracking
137
138
the deviations has been found to be a good
procedure to detect and localize sensor problems.
enough. That is why, such polynomials are

employed in the present paper.
The next section describes the principles of

the thermocouple probe data analysis.
As noted in [1,2], the deviations dY * not only

can be good engine deterioration indicators but
also are very sensitive to sensor malfunctions.
Being great, such malfunctions can mask the
effects of engine gradual deterioration and
sudden fault. Hence, it is of great importance to
exclude or reduce the sensor malfunctions in
order to make the deviations to meet better the
diagnostic needs.
2. Principles of gas temperature analysis
The present investigation is partly based on

the principles formed in our previous works. In
these papers, as mentioned before, we explored
carefully acquired data of averaged hot section
temperatures as well as other gas path variables.
The exploration of gas turbine field data was
executed with the aid of advanced graphical tools.
They included tracking the deviations of
measured variables.
A deviation dY * of a monitored gas path
variable Y * is computed according to the
expression
dY =
*
Y * - Y0 (U )
(1)
Figure 1 exemplifies the EGT deviations of a

gas turbine for natural gas pumping stations. The
deviations are plotted here against an operation
time t (in this figure and all figures below a
variable t is given in hours). As can be seen, the
presented data cover approximately 4.5 thousand
hours. The deviations dY * computed on real
measurements with noise are marked by a grey
colour while a black line denotes ideal deviations
dY without noise. A washing of a gas turbine axial
compressor at the time point t = 7970 (here and
below an operation time is given in hours) as well
as fouling periods before and after the washing
are well-distinguishable in the figure.
Y0 (U )
where a baseline function Y0 (U ) presents a
healthy engine performance. A vector U of

functions arguments unites the variables setting
an engine operating point (atmospheric
conditions and engine control variables). In order
to determine the baseline function, a special data
set called a reference set is created. To verify the
function as well as deviation quality, other set,
which is called a validation set, is formed. We
usually include all available recorded data in it.
It is a main problem in computing the
deviations to get an adequate baseline function.
We demonstrated in previous works [1,9] that the
second order full polynomials are adequate
138
Fig. 1. Deviations' characteristics

(The deviations are calculated for the EGT)
139
A difference e S = dY * - dY can be considered
as an error. If we designate the maximum
deviation dY as d 0 , the signal-to-noise ratio
d 0 = d 0 s (e S ) ,
(2)
where s (e S ) is a standard deviation of the errors,

will be an index of diagnostic quality of the
deviations dY * . To enhance the quality we should
reduce the errors e S . To do it better, it is
important to know error structure and sources.
According to Fig.1, the total error e S consists of
three elemental errors and can be given by the
formula:
e S = e1 + e 2 + e 3 ,
(3)
where e1 is a normal noise which is observed at

every time point and has the amplitude
smaller than 0.3%,
e2
presents slower fluctuations of the

amplitude limited by 1.5%, and
e 3 means single outliers with the amplitude
greater than 1.5%.

The errors e1 , e 2 , and e 3 can be induces both
sensor malfunctions of the monitored variable Y *
and inadequacy of the reference function. It is
important for the current investigation to
distinguish error sources and recognize the
sensor malfunctions against the background of
the function inadequacy.
It was shown in [1] and follows from
analyzing a structure of formula (1) that the same
total error e S can also be divided into four
components according possible error sources.
Three of them are related with the reference
function and were studied in [1,2]. The fourth
component is induced by errors of a monitored
variable. The present paper will consider errors
of particular thermocouples.
The availability of parallel measurements of a

suite of thermocouple probes installed in the
same engine station gives us new possibilities of
thermocouple malfunction detection by means of
deviation analysis. If we choose the same
reference function arguments and form particular
reference sets from the same portion of recorded
data, the errors related with the function will be
approximately equal in deviations of all particular
probes. That is why, the differences between
deviations of one probe and deviations of the
other probes can denote probable errors and
faults of this probe. In the synchronous deviation
curves, which are constructed in the present
paper versus an engine operation time, such
differences are well visible. In addition to the
probe malfunction detection, such curves allow
estimating general diagnostic quality of each
probe through signal-to-noise ratio (2).
In the paper, direct analysis of thermocouple
probe measurements is conducted as well. To this
effect, synchronous plots for all particular probes
are constructed vs. the operation time. Engine
operating conditions change from one time point
to another and this explains common temporal
changes of the curves. Anomalies in behaviour of
a particular probe can confirm a probe's
malfunction. Synchronized perturbations in
curves of some probes may be the result of a real
temperature profile distortion because of a hot
section problem.
The principles of the gas temperature
analysis described above are applied to an
industrial free turbine type power plant for
generating electricity. This plant is chosen as a
test case because a large volume of field data,
which include thermocouple measurements, is
available. In the next section, common results of
the study of power plant gas temperatures are
discussed. The section begins with analysis
conditions given in subsection 3.1.
139
140
3. Common Results of Gas Temperature

Measurement Analysis
3.1. Analysis Conditions
For the chosen power plant, field data of

three particular engines, which are called in the
paper as engine 1, engine 2, and engine 3, are
available. The data of each engine cover about one
year of maintenance and include numerous cycles
of fouling and washings. For instance, a total
period of engine 1 data acquisition embraces
4914 hours of operation and consists of five
fouling intervals divided by the washings.
The data of each engine were filtered,
averaged, and recorded hourly in an individual
database. All databases include necessary
measurements of engine operating conditions
and monitored gas temperatures: the EGT and a
power turbine exhaust gas temperature (PTT).
The suite of 11 thermocouple probes is used to
measure the EGT while the PTT measurement is
presented by six probes. The data of all particular
thermocouple probes as well as EGT and PTT
mean values are incorporated in the databases.
With respect to the reference functions for
computing particular probes' deviations, all the
functions have the same three arguments, which
have been determined in [2] as the best: free
turbine shaft power, atmospheric temperature,
and inlet pressure. A free turbine rotation speed,
one of common variables of an engine operating
condition, is not the argument now because the
speed is maintained constant for the analyzed
power plant.
composed from the first 200 time points after the

first washing. The coefficients were calculated by
the least square method because of a
considerable excess of input information
(200>>10) and absence of gross errors in the sets.
3.2. Analysis of the Deviations

For the engines under analysis, the reference
functions and the deviations have been computed
for all EGT and PTT particular probes as well as
for EGT and PTT mean temperatures. The
deviations of engines 1 and 3 showed trends due
to fouling and washings. Since such trends allow
estimating the signal-to-noise ratio, they will be
useful to assess accuracy of each probe. However,
engine 2 deviations demonstrated no notable
systematic changes. Probable explanation is that,
instead of off-line washings of engines 1 and 3,
more frequent on-line washings were applied to
unit 2, which resulted in an approximately
constant fouling severity. It can also be noted
after the comparing engines 1 and 3 that the
engine 1 deviations demonstrate more cases of
abnormal behaviour, which are interesting for the
current analysis. For these reasons, the engine 1
has been chosen to illustrate gas temperature
deviation behaviour.
Figure 2 shows all EGT deviations (11

deviations dTti corresponding to particular
probes and mean temperature deviation dTtmed)
as function of an operation time t. It is known that
the washings took place at the time points t = 803,
1916, 3098, and 4317. As can be seen, deviation
plots reflect in a variable manner the influence of
the fouling and washings. The deviation dTtmed
does it better than deviations of particular probes
dTti, i=1-11. Among deviations dTti, quantities
Each function is a second order full dTt5 and dTt6 , for example, have almost the same
polynomial with three arguments and has 10 diagnostic quality as dTtmed, while quantities dTt1
unknown coefficients. The reference sets for and dTt2 are of little quality. Such differences can
determining the functions' coefficients have been be partly explained by variations in probe
accuracy and reliability. For example, elevated
140
141
random errors of the deviations dTt1 and dTt2
over the whole analyzed period can be induced by
greater noise of the first and second EGT probes.
The dTt1 fluctuations in the time interval 1900 2600 are probably results of frequent incipient
faults of the first probe. Large dTt7 spikes near the
time point t = 4900 can certainly be considered as
consequences of great single faults of the seventh
probe. However, deviation shifts around the point
t = 3351 present the most interest for the current
analysis. The shifts look like a washing result but
they have opposite directions. This case will be
considered in section 4.3.
Let us now consider the PTT deviations
plotted in Fig.3. Comparing this figure with Fig.2,
one can see that the behaviours of new and
previous deviations are different. The PTT
deviations of particular probes seem to be very
similar. All of them properly reflect the fouling
and washings as well as have shifts at the time
point t = 3351. Only small anomalies of each
particular deviation can be detected. That is why
the deviations of mean temperature dTptmed look
like deviations of each particular probe. The
conclusion can be drawn from this analysis that
the thermocouple probes installed behind the
power turbine (PT) have more stable
performances than the probes behind the high
pressure turbine (HPT). This may be explained by
a higher HPT temperature level.
141
142
Fig. 2. EGT deviations

(Engine 1; 11 thermocouple probe deviations dTti and a deviation dTtmed of mean EGT variable)
142
143
Fig. 3. PTT deviations

(Engine 1; 6 thermocouple probe deviations dTpti and a deviation dTptmed of mean PTT variable)
143
144
3.3. Direct Temperature Analysis
It is also useful to compare the deviations of
mean EGT and PTT quantities. As can be seen in
Fig.2 and Fig.3, behaviours of the deviations
dTtmed and dTptmed are different. Although these
figures are not sufficient to conclude what
deviation is better in a diagnostic sense (for
example, on the basis of the signal-to-noise ratio
(2)), this issue has been investigated in [2]. In
spite of more reliable PTT probes, the conclusion
was drawn that general quality of the EGT
deviations is slightly higher.
Detailed deviation analysis performed for all
three engines has also demonstrated that, in
addition to the mentioned case at the point 3351,
there can be other irregularities in deviations of
particular probes that can not be explained by
probe faults. The shifts induced by the washings
give an example of such irregularities. They
should be equal but can indeed differ by 30%. We
may see this effect by comparing the dTt5 and
dTt9 shifts induced by the second washing on
engine 1 (Fig.2, t = 1916) or the dTpt1 and dTpt6
displacements due to the first washing (Fig.3, t =
803). Other irregularity case can be seen in Fig.2
at the point 1380. Some deviations (for example,
dTt11) are positively displaced at this point while
some others have negative shifts or no changes
(see the deviation dTt4).
If we plot temperature curves for all probes

of a suite in the same coordinates (for example, all
temperatures vs. the operation time), an anomaly
of a particular curve will indicate a problem with
the
corresponding
probe.
Consequently,
observing this curve against the background of
the other curves, we are capable to identify a
probe fault when the perturbation exceeds
normal errors.
Such analysis of parallel curves has been
performed for all available data. Figures 4 and 5,
which present the first part of the engine 1 gas
temperature recordings, exemplify the data
analyzed and the graphs used. Here and below,
temperatures are given in Celsius degrees. The
performed study allowed revealing various cases
of anomalies in probe data: gross and hidden
probe faults as well other irregularities. Some
cases of the most interest will be considered later
in section 4.
Displays of the noted irregularities are very

similar to the impact of a reference function
inadequacy. As shown in [1], such inadequacy
provokes deviation perturbations. With the
examples given above, we can state that the
function inadequacy also results in differences
between the deviations of parallel probes that
measure the same temperature. That is why the
deviation analysis can only help with problem
detection in particular thermocouple probes. To
identify the problems, we analyze below direct
temperature measurements.
144
145
Fig. 4. Exaust gas temperature plots

(Engine 1; temperatures Tti of 11 thermocouple probes and a mean temperature Ttmed; data collected
during the first 270 hours of operation)
145
146
Fig. 5. Power turbine temperature plots

(Engine 1; temperatures Tpti of 6 thermocouple probes and a mean temperature Tptmed; data
collected during the first 270 hours of operation)
In addition to the revealed anomaly cases,
common characteristics of thermocouple
normal behaviour have been determined.
Knowledge of such characteristics will help us
to better recognize sensor data irregularities
against the background of normal sensor noise
and regular temperature change.
The graphs given in Fig. 4 and Fig. 5 help to
introduce the thermocouple characteristics.
Comparing the figures, it can be seen that EGT
and PTT measurements change very similarly.
The explanation of such common changes is
obvious the influence of variable engine
operating conditions. As for particular probes of
the same suite (EGT suite or PTT suite), their
individual curves are practically synchronous.
Consequently, it can be stated that a normal
thermocouple noise level e T is not too high and
there are no sensor faults in the presented
measurements. We can also see that a spread
D T between particular probe temperatures
recorded at the same time point is considerable

(up to 85C in Fig. 4).
Maximal values e T max and DT max of the
described
above
noise
and
spread
characteristics have been estimated for
temperatures EGT and PTT of all three engines.
Additionally, temperature levels T were
computed for three engines by the averaging
their mean temperatures Ttmed and Tptmed in
total analyzed time intervals Dt . Table 1
includes the obtained characteristics.
As can be seen, there are no engine to
engine differences in e T max with the exception
of the engine 1 EGT, which has a two times
greater noise compared with the other engines.
Such difference can not be explained by a
slightly higher power level of engine 1 and we
can state that an EGT probe suite of this engine
is less accurate.
146
147
Table 1: Averaged characteristics of
thermocouple probes
Engine
Dt
e T max
D T max
EGT
800
4.0
100
PTT
490
1.5
20
1024526
EGT
720
2.0
100
PTT
475
1.5
17
1-4621
EGT
700
2.0
70
PTT
465
1.5
18
Gas
higher. It arrives at 5% for the EGT and 2%

for the PTT. These values were calculated on the
data from Table 1 with a preliminary
temperature conversion to Kelvin degrees.
temperature
1
74-4914
Note: all characteristics are in Celsius degrees.
As to DT max , we shall pay close attention to

this parameter and, in general, to an issue of
temperature distribution behind the turbines.
In the table, the parameter DT max changes inside
the intervals of 70-100C for the EGT and 1720C for the PTT. So, this parameter of maximal
temperature spread is more or less stable. It has
also been revealed that a current spread DT
varies inside the range (70%-100%) DT max .
Additionally, parameters DT of the EGT and
PTT are in an approximate proportion to
temperatures Ttmed and Tptmed correspondingly.
Moreover, in all analyzed graphs like in Fig. 4
and Fig. 5, an order of particular probes inside
the spread DT was found to be almost constant
during the operation time. Thus, the above
description of a temperature measurement
spread for different probes allows to state that
the spread itself is relatively stable during the
time, as well as a measurement distribution
inside the spread.
What explanation for this significant and
stable data dispersion can be done? It could be a
result of probes different systematic errors.
However, many sources [for example, 11,12]
report a total thermocouple error being less
than 1% while the spread DT is considerably
On the other hand, it is known [3] that a

uniform temperature distribution behind a
turbine is usually disturbed by burner faults
such as clogged or eroded fuel nozzles. Taking
into account the above information, a main
rational explanation for the observed
thermocouple probe measurement spread is a
nonuniform
circular
profile
of
real
temperatures behind turbines, especially
behind the HPT. To these explanations, it is
important to add the conclusion that this
irregular temperature profile is generally
conserved during the operation time according
to the described above analysis. The profile
stability allows developing effective algorithms
of EGT and PTT profile monitoring.
Proceeding with the analysis of particular
thermocouple probes data, in the next section
we consider in detail some specific cases of
irregularity in these data.
4. Cases of Thermocouple Data Abnormal

Behaviour
The term "abnormal behaviour" means

here an anomaly in measurements of a
particular probe when they deviate from
common data behaviour of the other probes.
Three anomaly types will be analysed below in
subsections 4.1, 4.2, and 4.3. The first type is
related with single measurement outliers that
exceed a normal noise. Different cases of such
outliers are analyzed in the next section.
147
148
4.1. Single Outliers
Although the database data were filtered and
averaged before recording, some cases of
single thermocouple probe faults have been
found. Graphs (a) and (b) in Fig. 6 illustrate
them. Observing two 25% spikes in graph (a)
and a 50% spike in graph (b), we can conclude
with no doubt that they are results of faults of
the corresponding EGT probes: the seventh
probe of engine 1 and the first probe of engine
3. We can also see that such large outliers are
easily detectable and the used filtering
algorithm should be modified to exclude them.
Opposite spike directions in the graphs
probably indicate different thermocouple fault
origins.
A greater number of small outliers have
been revealed as well. Graph (c) in Fig. 6, where
EGT measurements for engine 1 are shown,
helps to demonstrate these hidden errors. As
can be seen here, two abnormal shifts in probe
10 data are distinguishable against common
regular behaviour of the other probes. These
small outliers of 10 degrees (1.5%) hardly
exceed a normal noise level. Consequently, it
will be more difficult to automatically detect
and exclude them.
Graph (d) of Fig. 6 present a new case of

small outliers that was found out in EGT
measurements of engine 3. It is visible in the
graph that probes 7 and 8 are synchronously
displaced by about 10 degrees during two time
intervals t = 962.5-966.5 and t = 971.5-972.5.
Additionally, the same measurement increase is
observable in the probe 1 curve at time t =
971.5-972.5. So, unlike the previous case of a
single faulty probe, the considered case
presents correlated shifts in data of some
probes and therefore is more complicated. Two
explanations can be proposed for this case. The
first of them is related with any measurement
system common problem that affects some
probes and alters their data. So, the outliers can
be classified as measurement errors. The
second supposes that the measurements are
correct but a real EGT profile has been changed
in the noted time points. It can be possible
because there is no information that EGT and
PTT probe profiles should be absolutely stable
during operation time. The available data are
not sufficient to give a unique explanation; more
recorded data should be attracted.
148
149
a)
b)
d)
c)
Fig. 6. EGT probes' errors ( a) single gross errors, engine 1 ; b) single gross errors, engine 3;
c) single small errors, engine 1; d) correlated small anomalies, engine 3)
149
150
The next case to analyze is related with the
influence of a power plant operating point on
EGT and PTT profiles.
4.2. Anomalies induced by operating
condition changes
Any considerable change of engine
operating conditions (power set parameter
above all) causes the corresponding shift of hot
section
temperatures.
Such
significant
temperature changes, in their turn, can
potentially give new information on the
behaviour of particular probes in different parts
of a total measurement range.
The available EGT and PTT data have been
observed to find out interesting cases of
operating condition influence. Two revealed
cases are presented by graphs (a) and (b) in
Fig.8. In the left part of graph (a), a mean EGT is
maintained at the approximately constant level
of 730C, then the temperature level is rapidly
reduced up to 585C, and finally it is recovered
to 755C in the right part. A mean PTT in graph
(b) behaves in a similar manner.
150
151
a)
b)
Fig. 7. Influence of engine operating point
( a) EGT, engine 1; b) PTT, engine 2)
151
152
These common and large temperature variations are accompanied by small but visible changes of the
measurement distribution inside of a total spread DT . For example, it can be seen in graph (a) illustrating
EGT probe behaviour that in the left and right parts of the graph the curve of probe 1 is situated higher
than the curve of probe 5. However, in the central part, where temperatures are reduced, the curves'
positions are apposite. As a result, relative curve positions have been changed by 30C or 4.5%.
Other example can be seen in graph (b), where PTT probe curves are presented. Before the point t =
339.5, where the temperature level drops, the third probe occupies the highest position among all probes.
It goes to the lowest position then and finally almost comes back to its highest position after the point t =
340.5, when a temperature level is partly recovered. In this example, the curve position of probe 3 has
been changed by 15C (3.3%) relatively a mean temperature T_PT.
The described distortions in the distribution of thermocouple probe data can not be classified as
random thermocouple errors because the anomalies are obviously related with operating condition
changes. Other possible interpretation implies a systematic probe error that varies due to temperature
magnitude variations. However, this error as well as a total error should be within the limit 1% for
thermocouples in good condition. So, a variable systematic error may only be responsible for a part of the
4% measurement distortion that is why another explanation should be added. As a result of the
performed analysis, the next explanation is accepted as principle: the profile of real temperatures slightly
varies with the change of operating conditions.
Now we revert to the mentioned above case of engine 1 deviation shifts at the time point t = 3351.
To make clear this case, direct temperature measurements will be studied in the next section on the basis
of the same temperature graphs as analysed in subsections 4.1 and 4.2.
4.3. The Case of Engine 1 Measurement Shifts at the Point t = 3351

Figure 8 helps to illustrate EGT measurement behaviour for engine 1 operation around the point t =
3351. To distinguish better temperature curves of different probes, only four more representative probes
are presented. We can see that a temperature level drastically changes in the central part of the figure and
relative positions of probe curves are altered, especially after the noted point. For example, probe 4
occupies the highest position in the left part of the figure but the lowest position in the right part. At first
sight, this looks like the temperature profile distortions induced by operating condition changes that is
described in the previous subsection. However, the analysis of the data recorded after the point t = 3351
has shown that the temperature profile altered once at this point is not recovered later. Consequently, the
studied case is not similar to the previous ones.
To better understand the case, let us put together all known information about it. This information
given earlier in the present paper and obtained in previous studies can be presented by three following
statements.
a) At the time point t = 3351, significant shifts take place in the deviations dTtmed and dTptmed of mean
temperatures (see figures 2 and 3) as well as in the deviations of monitored pressure variables [2].
152
153
Fig. 8. Measurement shifts after the point t = 3351

(4 EGT probes of engine 1)
b) At this point, shifts of opposite directions are also observable in most of particular deviations dTti of
EGT probes (see Fig.2). PTT deviations dTti are synchronously shifted at the same point (Fig.3).
c) A measurement distribution between EGT probes is perturbed at the same point and a new
temperature profile is then conserved constant.
Taking into account all this information, we think that there is no unique explanation for the studied
case and the following interpretation, which includes some probable causes, is proposed. It seems to us
that the engine has undergone an unplanned service work including some actions. A part of them, for
example, unplanned compressor washing, could return gas path temperatures and pressures to their
healthy engine values. The others, for instance, clogged fuel nozzles washing or thermocouples
recalibration, could change the EGT measurement profile. This explanation of the analyzed case is
supported by the fact that the engine was out of operation 42 calendar days before the mentioned
operating time point.
The results obtained by thermocouple probe data analysis and the perspectives of their applications
are discussed in the following section.
153
154
5. Discussions
A primary visual analysis of gas temperature measurements has been conducted in two previous
sections. It needs some clarification and generalization and three issues are additionally discussed below:
a) quality of the measurements, b) perspectives of gas temperature profile monitoring, and c)
effectiveness of the present visual temperature analysis.
Gas temperature measurement quality depends on thermocouple accuracy and reliability and can
correspondingly be assessed by a noise level e T max and a number of error cases revealed. Coming back to
Table 1, we can see that EGT and PTT probes have approximately equal accuracy levels for all engines
excepting engine 1, which has a two times worse EGT accuracy. It is also worth to repeat the statement
made in subsection 3.3 that the measurements of all considered engines are equally exact with the same
exception.
As to the probe reliability, the probe fault cases have been revealed in EGT data only and the most of
them correspond to engine 1. Summing up the discussion on common measurement quality, we can state
that the EGT measurements are a little worse than PTT ones and engine 1 temperature measurements are
the worst among three engines under analysis.
The deviation curves of Fig.2 help to indicate particular probes that are responsible for low quality of
engine 1 EGT measurements. Elevated fluctuations in the deviations dTt1 and dTt2 point at elevated errors
of probes 1 and 2. Moreover, it can be seen that the deviations of probes 1, 2, 9, and 11 differ from the
other deviations in the reflection of compressor fouling and washings. Specific behaviour of the deviations
of the enlisted probes can also be explained by elevated measurement errors of these probes: erroneous
data included in reference sets could result in inadequacy of the corresponding reference functions and
abnormal behaviour of the deviations.
Perspectives of monitoring of EGT and PTT profiles are the next issue to be discussed. It can be seen
in Fig.4 and Fig.5 and it is typical for all analysed data that, in general, measurements of particular
thermocouple probes change synchronously. This means that the configuration of temperature profiles
behind the HPT and PT is altered a little by variations of engine operating conditions. It is a good promise
for performing effective temperature profile monitoring. The hypothesis that the EGT profile has been
changed at the point t = 3351 due to the service work carried out is an additional confirmation of profile
monitoring utility: since the profile varies because of the supposed fuel nozzle washing, it is also sensible
to nozzle clogging. One more proof of EGT profile sensibility to hot section faults is that the EGT profile
nonuniformity is, in average, five times higher than the PTT nonuniformity (see to the parameter DT in
Table 1). For these reasons, the monitoring of the EGT profile seems to be more effective than the PTT
profile monitoring.
In any case, it will be a challenge to create effective profile monitoring algorithms. Such algorithms
should be sophisticated enough in order to reliably distinguish four situations: normal probe noise, probe
faults, normal temperature profile variations (random or systematic), and profile changes due to hot
section faults (gradual or abrupt). If the faults have been detected, their correct identification is desirable
as well.
154
155
However, an effective fault detection and identification will not come easily. The temperature profile
monitoring may become complicated because, as determined in subsection 4.2, variable operating
conditions can change a little the profile. Moreover, as shown in subsection 4.1, slight random profile
variations are also possible. As a result, we could not always give a unique explanation for the
measurement anomalies analyzed in the present paper and we sometimes supposed both hot section
faults and sensor errors.
Having mentioned the uncertainty in our explanations, it is the moment to discuss the last issue effectiveness of the present gas temperature analysis on the basis of deviation and temperature plots. The
used graphical tools were useful for determining common characteristics of thermocouple probe
behaviour such as a level of normal measurement noise. It is worth to mention that the used graphs have
allowed a direct noise estimating for each engine on its real data. The graphical tools also helped to detect
many interesting cases of measurement anomalies and to get convincing explanations for a part of them.
These tools were useful in the interpretation of the other cases although some uncertainty remained. To
better explain these cases, additional tools are required, including statistical treatment of temperature
measurements. Such tools should be able to determine individual signatures for each of the enlisted above
four situations to be recognized. If that is the case and such signatures are available, the development of
effective algorithms for temperature profile monitoring will be only the matter of time. Proceeding with
the present analysis, we plan to apply new tools to analyze thermocouple probe measurements in order to
determine the basis of effective temperature profile monitoring.
Conclusions
In the present paper, the analysis has been performed of gas temperature measurements by
thermocouple probe suites installed behind the HPT and PT. Field data of a power plant for generating
electricity were attracted. In order to find out and analyse cases of abnormal measurement behaviour,
both temperature deviations and temperature themselves were plotted and tracked for all probes
mounted in a power plant hot section. In order to thoroughly study thermocouple measurements and
draw sound conclusions on measurement behaviour, the temperature analysis was performed on the data
recorded on three particular engines during one year of their operation. This off-line analysis of historic
data yielded important diagnostic information about possible thermocouple faults and hot part
malfunctions. The analysis allowed estimating some characteristics of normal thermocouple probe behaviour
and revealed a number of cases of probe data abnormalities. The cases that are the most interesting from a
diagnostic point of view were explored in detail and explanations were given for them. For example, some
sensor malfunctions were discovered. It was also revealed that gas temperature profiles have, in general, a
stable form although it can be slightly altered by variations in engine operating conditions. A greater
importance of EGT profile monitoring was shown as well. In general, we think that the paper can
contribute in the development of effective algorithms for temperature profile monitoring. In addition to
the analysis performed and conclusions drawn, the detailed graphs of the paper may give new useful
information for experienced gas turbine analysts and performance engineers.
The visual thermocouple data analysis conducted in the paper has demonstrated its general
effectiveness; we have rapidly tracked a lot of information and studied many interesting cases. However,
155
156
we could not find a unique correct explanation for some of them. The point is that the displays of hot
section faults and hidden sensor malfunctions can be vary similar.
The present paper can only be considered as the first attempt to analyze thermocouple data. The
visual qualitative analysis performed should be accompanied by quantitative estimations. If there is no
simple way to achieve higher measurement accuracy, we need to better distinguish between hot
section and sensor problems. That is why we are thinking about other advanced graphical tools and
statistical methods to be applied to the gas turbine thermocouple data.
Acknowledgments
The work has been carried out with the support of the National Polytechnic Institute of Mexico
(research project 20091273).
156
157
References
1. Loboda I. Deviation problem in gas turbine health monitoring / I. Loboda, S. Yepifanov, Y. Feldshteyn .
Proc. IASTED International Conference on Power and Energy Systems, USA, 2004. 6p.
2. Loboda I. Diagnostic analysis of maintenance data of a gas turbine for driving an electric generator /
I. Loboda, S. Yepifanov, Y. Feldshteyn . Proc. ASME Turbo Expo 2009: International Technical Congress
Power for Land Sea & Air, Orlando, Florida, USA, 2009, 12p.
3. Tsalavoutas A. Combined advanced data analysis method for the constitution of an integrated gas
turbine condition monitoring and diagnostic system / A. Tsalavoutas, K. Mathioudakis, N. Aretakis, A.
Stamatis. Proc. ASME Turbo Expo 2000, Munich, Germany, 2000. 8p.
4. Romesis C. Setting up of a probabilistic neural network for sensor fault detection including operation
with component fault / C. Romesis, K. Mathioudakis // Journal of Engineering for Gas Turbines and Power.
2003. Vol. 125, Issue 3. pp. 634-641.
5. Kamboukos Ph. Multipoint non-linear method for enhanced component and sensor malfunction
diagnosis / Ph. Kamboukos, K. Mathioudakis. Proc. ASME Turbo Expo 2006, Barcelona, Spain, 2006. 9p.
6. Borguet S. A sensor-fault-tolerant diagnosis tool based on a quadratic programming approach / S.
Borguet, O. Leonard. Proc. ASME Turbo Expo 2007, Montreal, Canada, 2007. 10p.
7. Randal T. R. Integrated in-flight fault detection and accommodation: a model-based study / T. R.
Randal, K. F. Goebel, N. H. Eklund, B. J. Brunell. Proc. ASME Turbo Expo 2005, Reno-Tahoe, Nevada, USA,
2007. 9p.
8. Mathioudakis K. Assessment of the effectiveness of gas path diagnostic schemes / K. Mathioudakis, Ph.
Kamboukos // Journal of Engineering for Gas Turbines and Power. 2006. Vol. 128, Issue 1. pp. 57-63.
9. J. C. Hernandez Gonzalez. Development of normal state model for gas turbine performance monitoring
/ J. C. Hernandez Gonzalez, I. Loboda, C. De La Cruz Alejo. Memorias del 3er Congreso Internacional de
Ingenieria Electromecanica y de Sistemas, Mexico, 2002. pp. 243 246.
10. Benvenuti E. Innovative gas turbine performance diagnostics and hot parts life assessment
techniques / E. Benvenuti. Proceedings of the Thirtieth Turbomachinery Symposium, Texas A&M University,
Houston, Texas, USA, 2001. pp.23-31.
11. Fairbairn G.W. Performance testing and monitoring of compressor units / G.W. Fairbairn, J.R. Nisbet,
I.C. Robertson. Proc. 52nd Autumn Meeting of the Institution of Gas Engineers, London, England, 1986. 32p.
12. Bryce L. Equipment health monitoring failure mode characteristics case study / L. Bryce, Bennett J.
17th National Petroleum Show, Calgary, Canada, 2000. 25p.
157

Mantenimiento Turbinas de Gas

Hochgeladen von

Dokumentinformationen

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Mantenimiento Turbinas de Gas

Hochgeladen von

Copyright:

Verfügbare Formate

INSTITUTO POLITECNICO

ELABORACIN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A

ELABORACIN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A

ELABORACIN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A

ELABORACIN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A

ELABORACIN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A

ELABORACIN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A

ELABORACIN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A

CAPTULO 2. Redes Neuronales Artificiales.

CAPTULO 3. Desarrollo de los algoritmos.

CAPITULO 4. Discusin de resultados.

ELABORACIN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A

ELABORACIN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A

1.1. Descripcin de turbinas de gas

Figura 1.1. Partes principales de la turbina de gas.

El compresor es un dispositivo que aumenta la presin en un fluido de trabajo. Los

ELABORACIN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A

ilustra la imagen de un difusor. En el compresor centrifugo la combinacin de un alabe

Figura 1.2. Difusor cnico

Figura 1.3: Componentes de un compresor

ELABORACIN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A

Figura 1.4: Coordenadas polares de un compresor axial.

ELABORACIN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A

Figura 1.5: Elementos del perfil de un alabe

ELABORACIN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A

Figura 1.6: Triangulo de velocidades.

La cmara de combustin es el dispositivo que sigue, su tarea consiste en incrementar la

ELABORACIN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A

La formacin de acido ntrico no ocurre durante el proceso de combustin, pero despus

ELABORACIN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A

de combustin es proporcional al rendimiento; esto quiere decir que entre ms alta

Figura 1.7: Cmara de combustin tipo tubular.

ELABORACIN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A

Figura 1.8: Cmara de combustin tipo anular.

Figura 1.9: Cmara de combustin tubo-anular.

ELABORACIN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A

El tercer dispositivo es la turbina, su funcin es extraer energa cintica de la expansin

Figura 1.10: Comparacin entre la turbina de impulso y la de reaccin.

ELABORACIN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A

Sistemas de ignicin. La buja produce mediante un arco elctrico la flama que

ELABORACIN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A

Figura 1.11: Motor Turbojet.

Figura 1.12: Esquema de turbina con rbol conectado

ELABORACIN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A

Figura 1.13: Esquema de turbina con rbol conectado

1.2. Aplicaciones de las turbinas de gas.

ELABORACIN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A

1.3. Aplicaciones en Mxico.

ELABORACIN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A

1.4. Mantenimiento de las turbinas de gas.

ELABORACIN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A

Entrenamiento de personal. La gente debe ser entrenada adecuadamente para adquirir

ELABORACIN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A

La tercera razn es para predecir fallas porque las partculas contaminantes se

ELABORACIN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A

1.5. Diagnstico de las turbinas de gas.

ELABORACIN DE LAS FUNCIONES DE REFERENCIA PARA EL DIAGNOSTICO DE TURBINAS DE GAS EN BASE A

Tabla 1.1: Fallas principales en los motores de turbinas de gas.

Fatiga (resonancia), erosin, objetos

Vibracin, surge, stall, distorsin de flujo.

Cargas de temperatura centrifuga

Fatiga trmica, pandeo, fatiga trmica,

Puntos calientes, gradientes de temperatura,

Fatiga de alta eficiencia, desalineamiento,