Sie sind auf Seite 1von 11

Tema 7

Compresin de bioseales
7.1. Introduccin
Un sistema tpico de procesado de seales biomdicas adquiere una gran cantidad
de datos que deben almacenarse o transmitirse. Es necesario aplicar algn mtodo para
reducir el espacio de almacenamiento preservando el contenido significativo de la
informacin para poder reconstruir posteriormente la seal. En algunas aplicaciones, este
proceso de compresin/descompresin tendr que realizarse en tiempo real. Existen por
tanto tres factores que caracterizan a los algoritmos de compresin de datos:
Eficiencia de compresin: el objetivo es minimizar el nmero de bits de cdigo
almacenados eliminando redundancias presentes en la seal original. Se define
la razn de compresin (RC) como el cociente entre el nmero de bits de la
seal original por el nmero de bits almacenado en la seal comprimida.
Factores tales como la anchura de banda, frecuencia de muestreo y fidelidad
tienen un efecto importante sobre la razn de compresin.
Fidelidad de reconstruccin: Un algoritmo de compresin de datos debe
representar los datos con una fidelidad aceptable. En el campo de la Ingeniera
Biomdica, es frecuente validar la aceptabilidad clnica de la seal reconstruida
mediante inspeccin visual. Se pueden medir tambin los residuos, es decir, la
diferencia entre la seal reconstruida y la original mediante parmetros como el
PRD (el tanto por ciento de la raz cuadrada de las diferencias medias al
cuadrado), definido como:

donde N es el nmero de muestras y las xorg y xrec representan las muestras


originales y reconstruidas, respectivamente.
INGENIERA BIOMDICA
JUAN F. GUERRERO MARTNEZ
Curso 2010-2011

7. 1

Complejidad: esta caracterstica incide directamente en el tiempo de clculo del


algoritmo, y por tanto influye fundamentalmente en el caso de
implementaciones en tiempo real.
La eleccin de un algoritmo de compresin se basa en un balance de las
caractersticas comentadas, en funcin de la aplicacin concreta.
Existen dos grupos de algoritmos de compresin:
1. Algoritmos sin prdidas: producen un residuo cero, y la seal reconstruida es
idntica a la original. Se suelen basar en algn tipo de codificacin.
2. Algoritmos con prdidas: en este caso, la reduccin de datos implica que la
seal reconstruida no es exactamente igual a la original. Generalmente las
prdidas (los residuos) corresponden a caractersticas no fundamentales de la
seal, por lo que se puede obtener una calidad aceptable clnicamente. Por
ejemplo, un algoritmo de compresin de ECG puede eliminar oscilaciones
basales de pequea amplitud. En este caso, el residuo contiene informacin no
interesante desde el punto de vista clnico. La seal reconstruida puede ser
bastante aceptable clnicamente a pesar de tener un residuo alto. Hay tres clases
de algoritmos con prdidas:
Algoritmos de compresin en el dominio del tiempo: se basan en la
extraccin de puntos significativos, guardando muestras que contienen
informacin importante sobre la seal y descartando el resto.
Algoritmos de compresin por transformacin: se basan en la
estimacin de la informacin relevante de la seal en algn dominio
transformado.
Algoritmos de compresin por extraccin de caractersticas: se
basan en obtener una representacin de la seal segn un conjunto de
parmetros (caractersticas) que definen la informacin relevante.
Suelen utilizarse en sistemas de clasificacin automtica, ya que esta
representacin ms compacta simplifica la tarea del clasificador al
comparar con los patrones de cada clase. La reconstruccin de la seal
debe hacerse mediante tcnicas de interpolacin.
La comparacin de prestaciones entre distintos algoritmos no es fcil, puesto que
suelen aplicarse a registros con caractersticas diferentes (frecuencia de muestreo, ancho de
banda, resolucin de las muestras y nivel de ruido), que afectan directamente a las medidas

INGENIERA BIOMDICA
JUAN F. GUERRERO MARTNEZ
Curso 2010-2011

7. 2

de rendimiento. En las siguientes secciones se revisan brevemente algunas de las tcnicas


ms usuales.

7.2. Algoritmos sin prdidas


La principal ventaja de los algoritmos sin prdidas es que la seal puede
reconstruirse sin error. No obstante, el bajo valor de RC que suele obtenerse (del orden de
2:1), hace que no se utilicen generalmente en el campo de bioseales, o al menos como
nico mtodo de compresin. En ocasiones, se aplican a la seal ya comprimida por un
algoritmo con prdidas (que permite mayor RC), para obtener un incremento de
compresin adicional.

Codificacin Huffman
La codificacin Huffman es una de las ms usuales, y se basa en el hecho de que
las distintas amplitudes discretas de la seal digitalizada no ocurren con igual probabilidad.
Asigna una palabra codificada de longitud variable a una muestra de acuerdo con su
probabilidad de ocurrencia. Los valores ms frecuentes tienen asignadas palabras de
cdigo ms cortas.
Su implementacin requiere una tabla de conversin, donde a cada posible valor de
la muestra se le hace corresponder una nica palabra cdigo. Si los datos originales son de
16 bits, la tabla necesitara 65536 posiciones. Una tabla de este tamao crea problemas de
memoria e ineficacia de proceso.
Para reducir el tamao de la tabla, el esquema de la codificacin Huffman
modificada realiza particiones de los datos en un conjunto frecuente y uno infrecuente.
Para los smbolos del frecuente, se genera un cdigo Huffman como en el caso anterior.
Utilizamos una palabra cdigo especial como prefijo para indicar smbolo infrecuente y
aadimos un sufijo correspondiente a la codificacin binaria ordinaria del smbolo.

Codificacin adaptativa
La codificacin Huffman requiere generar una tabla para lo cual es necesario
examinar el conjunto completo de datos para determinar las estadsticas de los mismos. La
tabla de conversin debe ser transmitida o almacenada para permitir la correcta
descompresin.

INGENIERA BIOMDICA
JUAN F. GUERRERO MARTNEZ
Curso 2010-2011

7. 3

Un esquema de codificacin adaptativa intenta construir la tabla segn llegan los


datos. Una tabla de conversin obtenida dinmicamente es sensible a la variacin de la
informacin de la estadstica local. Puede por tanto alterar sus palabras cdigo de acuerdo
con la estadstica local para maximizar la compresin. Adems proporciona espacio extra
puesto que no se necesita una tabla esttica.
Un ejemplo de codificacin adaptativa es el algoritmo de Lempel-Ziv-Welch
(ZLW), que utiliza una tabla de tamao fijo. Inicializa algunas posiciones de la tabla para
algunos conjuntos de datos. Cuando encuentra nuevos datos, utiliza las posiciones no
utilizadas, por lo que cada palabra de datos tiene asignada su propia posicin. Cuando la
tabla est llena, el LZW reinicializa la posicin ms antigua o menos utilizada de acuerdo
con los nuevos valores. Durante la reconstruccin, rehace incrementalmente la tabla de
conversin a partir de los datos codificados.

Diferencia residual
Generalmente, las muestras contiguas de la seal no son estadsticamente
independientes, sino que estn relacionadas entre s. Por tanto, podemos descomponer una
muestra en una parte que est correlacionada con las muestras anteriores y otra parte que
no lo est. La componente correlacionada puede predecirse mediante algn tipo de
predictor, por lo que la parte no correlacionada representar el error de prediccin o seal
residual. Puesto que el rango de amplitudes de la seal residual es generalmente mucho
menor que el de la seal original, requiere menos bits para su representacin. Podemos
reducir todava ms aplicando codificacin Huffman a la seal residual.
Hamilton y Tompkins (1991) usan el hecho de que un ECG tpico est compuesto
de patrones repetitivos con pequeos cambios pulso a pulso. El algoritmo calcula y
actualiza un pulso promedio. Cuando se detecta un pulso, se alinea y sustrae el detectado
del patrn. La seal residual es codificada Huffman y almacenada con informacin sobre
la localizacin del pulso. Finalmente, el algoritmo usa el pulso detectado para actualizar el
patrn.

Codificacin 'run-length'
Utilizada en tecnologa de facsmil, esta codificacin se basa en la alta correlacin
entre bits sucesivos en una lnea de bits de un facsmil. En este caso, los valores sern 1
0, dependiendo de si el pixel es blanco o negro. En un documento tpico, existen zonas de
pixeles blancos y negros que proporcionan esta alta correlacin. Esta codificacin
simplemente transforma las lneas de bits en cadenas del tipo {vi,li}, donde vi son los

INGENIERA BIOMDICA
JUAN F. GUERRERO MARTNEZ
Curso 2010-2011

7. 4

valores y li las longitudes. Se puede obtener una mayor compresin aplicando codificacin
Huffman a la salida del codificador 'run-length'.

7.3. Compresin en el dominio del tiempo


Los algoritmos de compresin en el dominio del tiempo tienen como objetivo
seleccionar aquellos puntos caractersticos de la seal, eliminando la informacin
redundante. Utilizan conocimiento previo sobre la seal a comprimir. A continuacin se
comentan algunos de ellos.

Algoritmo AZTEC
El algoritmo AZTEC (Amplitude Zone Time Epoch Coding) fue desarrollado
originalmente para preprocesar ECG en anlisis de ritmo. Descompone las muestras en
pendientes y tramos rectos, proporcionando una secuencia de segmentos que producen una
aproximacin lineal a tramos del ECG.

Figura 7.1. Algoritmo AZTEC. a) ECG original. b) Umbral pequeo, razn de


compresin 512:233, PRD=24.4%. c) Umbral grande, razn de compresin
512:153, PRD=28.1%. d) Seal filtrada, promediador de 7 puntos, PRD=26.3%.
(W. J. Tompkins Ed. "Biomedical Digital Signal Processing". Prentice Hall)

INGENIERA BIOMDICA
JUAN F. GUERRERO MARTNEZ
Curso 2010-2011

7. 5

Para cada tramo recto se guarda el nmero de muestras y la amplitud media. Para
cada pendiente se guarda el nmero de muestras y la amplitud final. Se distingue entre
recta y pendiente porque el nmero de muestras del primero se guarda con signo + y el de
la segunda con signo -. El umbral o mximo error permitido en un tramo determina el
intervalo de amplitudes de las muestras que se consideran pertenecientes al mismo
segmento, y est directamente relacionado con la RC e inversamente con la fidelidad de
reconstruccin que proporciona el algoritmo. AZTEC no produce una reduccin fija de
datos. La razn suele ser mayor que 10, dependiendo de la seal y del valor del umbral
seleccionado.
El resultado generado es una secuencia alternante de duraciones y amplitudes. Los
datos se reconstruyen expandiendo los tramos rectos y las pendientes en muestras
discretas. Este proceso de reconstruccin produce una seal con perfil de escalera, lo que
no resulta clnicamente aceptable. Por lo tanto requiere postprocesado mediante un filtro de
suavizado o pasa-bajo, que reduzca las discontinuidades. Aunque la salida mejora en
apariencia, introduce distorsin en amplitud.

Algoritmo Fan
Usado originalmente para biotelemetra, el FAN traza lneas entre pares de puntos
inicial y final, de manera que las muestras intermedias estn dentro de un error
predeterminado, .
La figura 7.2 ilustra el mtodo utilizado por el algoritmo. Se toma una muestra
inicial X0. A continuacin se determinan las rectas U1 y L1, que pasan por los puntos (X0,
X1+) y L1 pasa por (X0, X1-), respectivamente. Si X2 est localizada dentro del rea que
subtienden ambas rectas, se generan otras dos, U2 y L2, que pasan por los puntos (X0,
X2+) y (X0, X2+). De las cuatro rectas generadas, se seleccionan las que encierran menor
rea (U1 y L2 en el ejemplo de la figura). El proceso se repite hasta que se encuentra una
muestra localizada fuera del rea definida por las rectas. En ese caso, se guarda el nmero
de muestras procesadas desde X0, y la amplitud de la ltima muestra, que se convierte en el
nuevo X0 para la siguiente iteracin.

INGENIERA BIOMDICA
JUAN F. GUERRERO MARTNEZ
Curso 2010-2011

7. 6

Figura 7.2. Algoritmo FAN. a) Pendientes superior e inferior (U, L) trazadas dentro
de un umbral de error alrededor de las muestras. b) Extrapolacin de XU2 y XL2
desde XU1 y XL1 y X0. (W. J. Tompkins Ed. "Biomedical Digital Signal
Processing". Prentice Hall)
La seal se reconstruye expandiendo los valores obtenidos en muestras discretas.
La razn de reduccin depende de la tolerancia de error. La siguiente figura muestra el
mismo ECG procesado con AZTEC en la figura 7.1, comprimido en este caso con Fan.
Como puede observarse, Fan produce mejor fidelidad de seal que AZTEC para igual
razn de reduccin.
Existen 3 algoritmos basados en la misma aproximacin utilizada por Fan. El
SAPA-2 (Scan-Along Approximation) produce los mejores resultados de los tres. Como en
el Fan, SAPA-2 garantiza que la desviacin entre la seal reconstruida y la original nunca
excede el error preseleccionado.
Adems de las dos pendientes calculadas por el Fan, SAPA-2 calcula una tercera
pendiente denominada central entre la muestra origen y la actual. Cada vez que la
pendiente central no est comprendida entre las dos pendientes de convergencia, la
muestra inmediatamente precedente se toma como punto origen. Por tanto, la diferencia
principal entre SAPA-2 y Fan es que el primero utiliza un criterio de pendiente central en
lugar del de valor de la muestra actual.

INGENIERA BIOMDICA
JUAN F. GUERRERO MARTNEZ
Curso 2010-2011

7. 7

Figura 7.3. Aplicacin del algoritmo FAN. a) ECG original. b) Tolerancia


pequea: razn de reduccin 512:201 PRD=5.6%. c) Tolerancia grande: razn de
reduccin 512:155 PRD=7.2%. d) Seal filtrada de c): promediador de 3 puntos,
PRD=8.5%. (W. J. Tompkins Ed. "Biomedical Digital Signal Processing".
Prentice Hall)

7.4. Compresin por transformacin


En el caso de compresin por transformacin, el proceso consiste en aplicar la
transformada a la seal, evaluar el resultado y seleccionar slo aquellas componentes que
representan el mayor porcentaje de la potencia de la seal. Para realizar la descompresin,
se aplica una transformacin inversa.

Compresin en el dominio de la frecuencia


Para transformaciones en el dominio de la frecuencia, la seal se divide en bloques
de muestras antes de aplicar la transformada a cada uno de ellos. Dentro de este grupo se

INGENIERA BIOMDICA
JUAN F. GUERRERO MARTNEZ
Curso 2010-2011

7. 8

encuentran la transformada discreta de Fourier (DFT), la de Karhunen-Loeve (KLT) y la


transformada discreta del coseno (DCT).
La DCT es una de las ms utilizadas cuando existe alta correlacin entre las
muestras de entrada, lo que suele ocurrir en el caso de bioseales, imgenes, voz, etc. Se
define como:

donde vk es el k-simo coeficiente. La correspondiente transformada inversa (IDCT) viene


dada por:

Al igual que el en caso de la FFT, existe un algoritmo rpido para el clculo de la


DCT. Dos stndares de compresin de imagen y vdeo (JPEG y MPEG) se basan en la
DCT. En compresin de ECG se han obtenido RC de hasta 26:9.

Compresin mediante transformada wavelet


La compresin mediante transformada wavelet se basa en la posibilidad de
representar la seal original mediante algunos coeficientes de aproximacin y detalle de la
descomposicin obtenida mediante la transformada. Los trminos de aproximacin son las
componentes de baja frecuencia y alto valor de escala, mientras que los de detalle
corresponden a las frecuencias altas (escalas bajas). El proceso de descomposicin de la
seal puede verse, por tanto, como un filtrado sucesivo pasa-bajo y pasa-alto, de mltiples
niveles, que para el caso de la transformada discreta proporciona el rbol de
descomposicin (figura 7.4).
El proceso de compresin se realiza en tres etapas. En primer lugar, se calcula la
descomposicin de la seal mediante la aplicacin de una determinada wavelet para un
cierto nivel N. A continuacin, se determinan los umbrales para las componentes de detalle
INGENIERA BIOMDICA
JUAN F. GUERRERO MARTNEZ
Curso 2010-2011

7. 9

correspondientes a todos los niveles desde 1 a N. Por ltimo, la reconstruccin de la seal


comprimida se realiza utilizando los coeficientes de aproximacin originales para nivel N
y los de detalle modificados tras la aplicacin del umbral desde 1 hasta N.
S
cA1

cD1

cA2
cA3

CD2
CD3

Figura 7.4. rbol de descomposicin de la transformada wavelet para una seal S.


cA y cD representan los coeficientes de aproximacin y detalle, respectivamente.
Los subndices indican en nivel de descomposicin.
El mtodo de eleccin de umbrales en el paso 2 da lugar a dos aproximaciones
diferentes de compresin. En un caso, se aplica un umbral global para todas las
componentes quedndose con los coeficientes de mayor valor absoluto. En otro, se aplican
umbrales dependientes del nivel, que pueden ser ajustados por separado proporcionando
un mayor control sobre el proceso.
La siguiente figura muestra un ejemplo de compresin de ECG mediante TW. Se
ha utilizado una wavelet madre de Daubechies tipo 5 y se ha seleccionado un nivel de
descomposicin N=6 (figura 7.5.a). A continuacin se aplican umbrales dependientes
del nivel a las componentes de detalle (figura 7.5.b), y se anulan aquellos coeficientes
de la transformada que no superen los correspondientes umbrales. En la figura 7.5.c
pueden verse los coeficientes originales (central), los coeficientes resultantes, muchos
de los cuales son cero (inferior), y la superposicin de la seal original y reconstruida
(superior). El porcentaje de energa de la seal original retenida por los coeficientes
resultantes es del 99.02%, y el de coeficientes nulos respecto de los originales es del
94.69%.

INGENIERA BIOMDICA
JUAN F. GUERRERO MARTNEZ
Curso 2010-2011

7. 10

a)

b)

c)

Figura 7.5. Compresin de ECG mediante transformada wavelet. a) Seal original y


descomposicin mediante wavelet Daubechies tipo 5. b) Umbrales seleccionados para
los coeficientes originales. c) Seal original y reconstruida, y representacin de los
coeficientes originales y finales.

INGENIERA BIOMDICA
JUAN F. GUERRERO MARTNEZ
Curso 2010-2011

7. 11

Das könnte Ihnen auch gefallen