Sie sind auf Seite 1von 28

EEGLAB: Utilizao do algoritmo ICA para anlise de eletroencefalogramas

Este trabalho teve como objectivo obter uma melhor compreenso de como funciona o ICA, Independent Components analysis, das suas propriedades e as suas aplicaes, que so variadas mas que neste trabalho se iro focar na anlise dos dados obtidos num EEG, electroencefalograma, recorrendo ao EEGLAB, um software open-source que funciona em ambiente MATLAB bastante robusto e que j possui bastantes utilizadores pelo mundo todo.

Anlise dSinais

EEGLAB: Utilizao do algoritmo ICA para anlise de eletroencefalogramas Anlise de Sinais

ndice

1. 2.

Introduo ............................................................................................................................. 2 ICA Independent components analysis............................................................................... 3 2.1. Aplicando o ICA, Independent components analysis - FastICA ............................... 10 Como funciona o ICA ........................................................................................... 12

2.1.1. 3.

EEGLAB ................................................................................................................................ 16 3.1. Decomposio de dados obtidos num EEG usando o ICA........................................... 16 Electroencefalograma - EEG ................................................................................ 16 Aplicando o ICA ................................................................................................... 16 Pr-processamento do sinal. Sim ou No?.......................................................... 18 Estudo e Remoo de componentes ICA ............................................................ 21

3.1.1. 3.1.2. 3.1.3. 3.1.4. 4. 5. 6.

Concluses........................................................................................................................... 24 Referncias .......................................................................................................................... 25 Anexos ................................................................................................................................. 26 6.1. Algoritmos utilizados durante a elaborao deste trabalho ....................................... 26

EEGLAB: Utilizao do algoritmo ICA para anlise de eletroencefalogramas Anlise de Sinais

1. Introduo
Na dcada de 1950, os controladores de trfego areo recebiam mensagens dos pilotos onde vrias vozes estavam misturadas, dificultando a sua compreenso. Collin Cherry, um cientista cognitivo britnico, estudou este problema e que conhecido como o efeito ou problema da festa de cocktail (1953): numa festa onde vrias pessoas conversam na mesma sala, um ouvinte presta apenas ateno a um locutor atravs de um processo de ateno seletiva que o crebro humano executa. (1) Collin Cherry descobriu que quando ouvimos uma mistura de dois sinais e pretendemos prestar ateno apenas a um dele, so as diferenas entre os dois sinais que permitem fazer esta separao. O sinal ignorado pouco processado pelo crebro, isto , detetado mas a semntica ignorada. (2) A separao dos sinais mais eficaz com os dois ouvidos do que apenas um; o som da mesma fonte captado por cada ouvido com uma pequena diferena de intervalo de tempo, o que permite identificar a origem fonte sonora, prestando ateno apenas a essa e ignorando as restantes. (1) Quando vrios recetores, colocados em localizaes diferentes, recebem uma mistura de sinais, pretende-se que cada sinal seja separado na sua forma original. Aplicando o problema da festa de cocktail, vrios microfones colocados em stios diferentes da sala recebem a mistura das vrias conversas, cada dum de maneira diferente, que devero ser separadas no discurso de cada locutor individual.

Ilustrao 1

EEGLAB: Utilizao do algoritmo ICA para anlise de eletroencefalogramas Anlise de Sinais Neste trabalho, o ICA aplicado anlise de EEGs, de modo a separa os sinais da atividade cerebral da mistura recebida pelos sensores Os algoritmos que executam este tipo de anlise chamam-se separao de fontes cega (blind source separation ou BBS), entre os quais se encontra o ICA. Da mistura de sinais, a separao feita com pouca ou nenhuma informao sobre cada componente e do processo de mistura, assumindo que os sinais so estatisticamente independentes.

2. ICA Independent components analysis


Seja si um sinal onde existem n fontes, isto , s1,s2,sn. Seja xj a representao de cada recetor, onde cada recetor se encontra numa localizao diferente, recebendo por isso uma mistura dos n sinais distinta. Cada mistura xj a combinao linear dos si sinais:

Os coeficientes aij so parmetros que dependem da distncia entre a fonte e o recetor e dos quais no se conhece o valor. Para se obter cada sinal si a partir das misturas xj, so calculadas estimativas dos coeficientes aij. Usando a notao matricial, podemos reescrever o problema como:

x vetor da mistura de sinais A matriz dos coeficientes s vetor dos sinais originais

Assim, para se calcular o vetor s:

No mtodo ICA as variveis si so variveis estatisticamente independentes. A estimativa do vetor s feita ao maximizar a independncia estatstica que pode ser feita pela maximizao da distribuio no gaussiana ou pela minimizao da informao mtua. No primeiro caso, a teoria fundamenta-se no teorema do limite central e utilizam-se os mtodos de kurtosis ou de negentropia; no segundo caso, pretende-se maximizar a entropia.

Variveis independentes e no correlacionadas Variveis independentes: Variveis aleatrias so independentes X e Y se e s se verifica a condio:

EEGLAB: Utilizao do algoritmo ICA para anlise de eletroencefalogramas Anlise de Sinais A funo de densidade conjunta igual ao produto das funes de densidade marginais. Outra forma de ver a independncia de variveis pela informao que uma varivel d sobre outra. A partir de variveis independentes, nada se conclui acerca de outra varivel independente. Variveis no correlacionadas: Variveis aleatrias so no correlacionadas se a sua covarincia for nula. A covarincia calculada a partir do valor mdio ou esperado. A covarincia ento dada por:

Variveis independentes so no correlacionadas mas variveis no correlacionadas no so necessariamente independentes. No Gaussianidade condio necessria para se aplicar o ICA que as variveis aleatrias tenham uma distribuio no Gaussiana. A no Gaussianidade necessria para o ICA uma das principais razes pela qual este algoritmo no foi mais cedo desenvolvido. Normalmente assume-se que as variveis aleatrias tm distribuio Gaussiana e o desenvolvimento matemtico de distribuies no Gaussianas foi tardiamente desenvolvido. A estimativa do vetor s, isto , dos sinais separados da mistura, tem como base o Teorema do Limite Central: Teorema do limite central: Para uma sucesso de variveis aleatrias independentes Xi e identicamente distribudas (i.i.d.), com valores mdios finitos () e varincias no nulas e finitas ( 0) tem-se:

Zn converge para uma distribuio Gaussiana reduzida N(0,2 ), independentemente da forma da distribuio de cada varivel aleatria, para um nmero suficientemente grande de distribuies. Pelo teorema do limite central, a soma de duas variveis aleatrias ser mais prxima de uma distribuio Gaussiana do que qualquer uma das parcelas (isto , das variveis que so origem soma). Retomando o problema inicial, temos:

EEGLAB: Utilizao do algoritmo ICA para anlise de eletroencefalogramas Anlise de Sinais

Seja y definido por:

onde w um vector Para que y seja igual a si, necessrio que w seja igual s linhas da matriz transposta de A: Se , ento y=si

Seja z uma nova varivel definida por:

Assim:

Isto :

Para que y seja igual a si, ento o vetor z tem apenas um nico elemento no nulo.

Pelo teorema do limite central, sabemos que: mais gaussiana do que qualquer si;

- ento, zT s menos gaussiana se zT s = si, ou seja, y=si. Assim, a estimativa de w tanto melhor quanto menos gaussiana for a sua distribuio, e consequentemente melhor ser a separao dos sinais. Pretende-se os mximos locais si e si no espao de dimenso n dos vetores w. Porque razo as variveis no podem ser Gaussianas? A distribuio Gaussiana simtrica relativamente ao seu valor mdio.

EEGLAB: Utilizao do algoritmo ICA para anlise de eletroencefalogramas Anlise de Sinais Pelo teorema do limite central, a soma de variveis gaussianas uma varivel gaussiana. O ICA estima a soluo pela no gaussianidade, pelo que variveis gaussianas no do nenhuma informao sobre a direo da matriz A. Medidas de no Gaussianidade Kurtosis O valor de kurtosis dado pela equao:

Se a varincia for igual a 1, ento:

Para uma distribuio Gaussiana, o quarto momento (primeira parcela) pelo que o valor de kurtosis nulo. Variveis no Gaussianas tm valores kurtosis normalmente diferentes de 0 (positivos: distribuies super-gaussianas; negativos: distribuies subgaussianas), embora seja possvel terem tambm valores nulos que so casos muito raros. O valor usado para avaliar a gaussianidade de uma varivel o seu valor absoluto. Considere-se novamente a equao matricial:

O vetor w ser estimado de acordo com a direo em que os valores absolutos de kurtosis de y crescem mais fortemente baseada numa amostra do vetor x. O mtodo de kurtosis de fcil computao mas pouco robusto; depende muito dos valores da amostra que se forem da cauda da distribuio podem gerar valor de kurtosis pouco fivel. Negentropia Entropia: Entropia da informao, ou entropia de Shannon, a mdia do contedo de informao que perdida quando o valor de uma varivel aleatria no conhecida, isto , uma medida de incerteza do valor de uma varivel aleatria. Quanto maior for a imprevisibilidade de uma varivel aleatria, maior a sua entropia; variveis aleatrias independentes, isto , das quais no se obtm informao umas a partir das outras (informao redundante), tm entropia mxima. Se uma varivel for totalmente previsvel (se o seu valor for conhecido) ento a entropia nula. A entropia medida em bits. A entropia H de uma varivel aleatria y dada por:

A distribuio gaussiana a mais entrpica relativamente a qualquer outra distribuio com o mesmo valor de varincia, pelo que a entropia pode ser usada como medida da Gaussianidade de uma varivel aleatria.

EEGLAB: Utilizao do algoritmo ICA para anlise de eletroencefalogramas Anlise de Sinais A negentropia J um avaliador da gaussianidade de um distribuio de varivel aleatria y baseada no conceito de entropia, dada por:

uma varivel aleatria Gaussiana com a mesma covarincia de y. Se o resultado for nulo, a distribuio Gaussiana e se for no nulo, a distribuio no Gaussiana. A negentropia nunca assume valores negativos. Embora a negentropia tenha uma boa base terica, de difcil computao, pelo que se pode utilizar uma aproximao negentropia. Aproximao da negentropia A aproximao negentropia tira partido das vantagens do mtodo de kurtosis e da negentropia, resultando num mtodo de medida da gaussianidade que a combinao dos mencionados. Existem vrias formas de se obter aproximaes da negentropia: Mtodo clssico: utilizada a equao:

A desvantagens deste mtodo a falta de robustez que deriva da utilizao do mtodo de Kurtosis. Princpio de entropia mxima: utilizada a equao:

A funo devolve um valor negativo se a distribuio for gaussiana e no negativo caso contrrio, mesmo quando a aproximao pouco precisa. A funo Gi uma funo de ajuste no quadrtica que se for bem escolhida, simplifica a equao: Se apenas se utilizar uma funo no quadrtica:

A funo G pode ser substituda por:

A constante a1 toma qualquer valore entre 1 e 2 (inclusive). Consegue-se obter com estas aproximaes um bom compromisso as propriedades do mtodo de kurtosis e da negentropia.

EEGLAB: Utilizao do algoritmo ICA para anlise de eletroencefalogramas Anlise de Sinais Minimizao de informao mtua A minimizao de informao mtua um conceito de teoria da informao que substituir os conceitos estatsticos para medir a no Gaussianidade. Informao mtua: A informao mtua uma medida de dependncia de duas variveis aleatrias, ou tal como o nome sugere, mede a informao que duas variveis tm em comum, isto , a informao que uma varivel pode dar sobre a outra. Se as variveis forem independentes, ento a informao mtua zero.

A informao mtua dada pela equao:

A base da funo logaritmo 2 pois a unidade de informao mtua o bit. A informao mtua sempre no negativa. Se as variveis forem independentes, a informao mtua nula j que a fdp conjunta igual s fdp marginal:

Caso contrrio, I (X,Y) ter um valor positivo que ser tanto maior quanto mais informao da varivel X der sobre a varivel Y ou vice-versa. Para uma transformao invertvel y=Wx, uma das propriedades da informao mtua dada por:

Se a varivel yi for no-correlacionada e de varincia 1, ento:

Implicando que:

EEGLAB: Utilizao do algoritmo ICA para anlise de eletroencefalogramas Anlise de Sinais A matriz W ento uma constante, o que leva a que a entropia e negentropia difiram apenas por uma constante:

Usar informao mtua para o ICA significa estimar a matriz AT de maneira a minimizar a informao mtua do vetor s, ou seja, pretende-se maximizar a negentropia. Assumindo que variveis no correlacionadas, o clculo do valor da negentropia simplificado. Princpio Infomax: o princpio infomax uma otimizao para sistemas de rede neurais. O princpio foi pela primeira vez descrito em 1987 por Lisnker. A funo que varre um conjunto de valores de entrada I que devolvem um conjunto de valores de sada O deve maximizar a entropia entre I e O. Os algoritmos infomax so algoritmos de aprendizagem que levam optimizao deste processo. (3)

Ilustrao 2

A aplicao do princpio de Infomax ao algoritmo ICA foi proposto em 1995 por Bell e Sejnowski, procurando a direo onde a entropia maximizada.

EEGLAB: Utilizao do algoritmo ICA para anlise de eletroencefalogramas Anlise de Sinais

2.1.

Aplicando o ICA, Independent components analysis - FastICA

Considere-se o seguinte exemplo com os seguintes sinais para se demonstrar a operao do algoritmo ICA:
A = sin(linspace(0,50,2000)); % matriz A B = sin(linspace(0,37,2000)+27); %matriz B (desfasada de A)

O comando linspace() define o domnio da funo seno que conter 500 pontos e ir variar entre 0 e 50 (A) e entre 0 e 37 (B), fig.3.

1 0.5 0 -0.5 -1

200

400

600

800

1000

1200

1400

1600

1800

2000

1 0.5 0 -0.5 -1

200

400

600

800

1000

1200

1400

1600

1800

2000

Ilustrao 3

Usando agora o formalismo do cocktail-party problem vamos misturar ambos os sinais. A sua combinao linear pode ser visualizada na figura 4.
C1 = 2*A - 3*B; C2 = 1.79*A+4.78*B;
10 5 0 -5 -10

% C.L. 1 % C.L. 2

200

400

600

800

1000

1200

1400

1600

1800

2000

-5

200

400

600

800

1000

1200

1400

1600

1800

2000

Ilustrao 4

10

EEGLAB: Utilizao do algoritmo ICA para anlise de eletroencefalogramas Anlise de Sinais Agora tm-se as condies necessrias para aplicar o ICA a estes dois sinais (neste caso utilizou-se o algoritmo fastICA) para descobrir os sinais originais A e B, e deste modo estudar o funcionamento base que est por trs deste tipo de algoritmos.
Fazendo f = fastica([C1;C2]) conseguimos separar ambos os sinais (fig.5).

1.5

1.5

0.5

0.5

-0.5

-0.5

-1

-1

-1.5

200

400

600

800

1000

1200

1400

1600

1800

2000

-1.5

200

400

600

800

1000

1200

1400

1600

1800

2000

Ilustrao 5

Com trs fontes teremos trs componentes independentes. Ento fica o seguinte:
1

10 5

0
-1 1

-5
0 200 400 600 800 1000 1200 1400 1600 1800 2000

200

400

600

800

1000

1200

1400

1600

1800

2000

10

-1 1

200

400

600

800

1000

1200

1400

1600

1800

2000

-10 10

200

400

600

800

1000

1200

1400

1600

1800

2000

-1

200

400

600

800

1000

1200

1400

1600

1800

2000

-10

200

400

600

800

1000

1200

1400

1600

1800

2000

Ilustrao 6

Usando trs sensores que captam o seguinte: C1 = 2*A - 3*B + 1,5*C; C2 = 1.79*A+4.78*B -C; C3 = 2*C + 3*B -A; % C.L. 1 % C.L. 2 % C.L. 3

O que decompondo com o fastICA obtemos a figura 6. f = fastica([C1;C2;C3]);

11

EEGLAB: Utilizao do algoritmo ICA para anlise de eletroencefalogramas Anlise de Sinais


2 1 0 -1 2 0 200 400 600 800 1000 1200 1400 1600 1800 2000

-2 2 1 0 -1

200

400

600

800

1000

1200

1400

1600

1800

2000

200

400

600

800

1000

1200

1400

1600

1800

2000

Ilustrao 7

Podemos reparar que o ICA no consegue recuperar a amplitude exata dos sinais das fontes.
Nota: Em teoria, ICA apenas consegue extrair fontes que esto combinadas linearmente.

2.1.1. Como funciona o ICA Este modelo estatstico, ICA, um modelo generativo o que significa que procura descrever como os dados observados foram gerados, atravs de um processo de mistura dos componentes independentes, ou fontes. Estes componentes independentes so variveis latentes, ou seja, no podem ser observados diretamente. A matriz A que nos diz como os c.i. esto combinados tambm desconhecida. A nica coisa que observvel o vetor x, e somente atravs deste que temos que determinar, tanto a matriz A como o vetor s. Whitening Este um processo que usado por quase todos os algoritmos ICA existentes e que precede a aplicao do ICA em si. Este processo tem como objeto remover qualquer tipo de correlaes entre os dados, ou seja, os diferentes canais so forados a no estar correlacionados. Isto porque sabemos que componentes independentes so necessariamente no-correlacionados (mas o contrrio no verdade). Uma interpretao geomtrica deste processo que restaura a forma inicial dos dados obtidos (fig.). Deste modo o ICA, a seguir, apenas roda a matriz resultante (fig.). Considere-se duas variveis aleatrias, A e B, e o grfico abaixo em que B est em funo de A.

12

EEGLAB: Utilizao do algoritmo ICA para anlise de eletroencefalogramas Anlise de Sinais

80 60 40 20 0 -20 -40 -60 -80 -80

-60

-40

-20

20

40

60

80

Ilustrao 8

O procedimento o mesmo que anterior: elaborar combinaes lineares com A e B.


C1 = 0.54*A - 0.84*B; C2 = 0.42*A + 0.27*B;

80 60 40 20 0 -20 -40 -60 -80 -80

-60

-40

-20

20

40

60

80

Ilustrao 9

Obtemos um outro grfico em que, agora as variveis dos eixos so C1 e C2. O prximo passo, comum a qualquer algoritmo ICA ser o whitening que visa selecionar apenas os dados que no esto correlacionados, pelos motivos que j foram explicitados anteriormente. Obtemos o seguinte grfico:

13

EEGLAB: Utilizao do algoritmo ICA para anlise de eletroencefalogramas Anlise de Sinais

8 6 4 2 0 -2 -4 -6 -8 -8

-6

-4

-2

Ilustrao 10

Depois de feito o whitening a varincia nos dois eixos igual e a correlao em ambos os eixos nula (o que significa que a matriz da covarincia diagonal e todos os elementos so iguais). Agora que se aplica o ICA, que apenas rodar este sistema de volta ao sistema de eixos original (A e B) de modo a minimizar a sua gaussianidade.

O algoritmo ICA Intuitivamente podemos imaginar que o que o ICA faz rodar a matriz formada, depois de tratada, de volta ao espao original (A,B). Essa rotao efectuada minimizando o grau de gausssianidade dos dados projetados em ambos os eixos (fig.11). aqui que os diferentes algoritmos diferem, pois existem diversos mtodos como o kurtosis, negentropia, informao mtua, entre outros.
-8 8

-6

-4

-2

-2

-4

-6

200

400

600

800

1500 -8 1000 -8 1000

-6

-4

-2

500

0 -8

-6

-4

-2 Ilustrao 11

14

EEGLAB: Utilizao do algoritmo ICA para anlise de eletroencefalogramas Anlise de Sinais Como podemos observar na figura acima, a projeo em ambos os eixos gaussiana ao contrrio do que observamos na figura 11 no espao original (A,B). Ao rodarmos os eixos e minimizando o grau de gaussianidade dos pontos, ICA capaz de recuperar as fontes originais que se supe serem estatisticamente independentes (esta propriedade advm do teorema do limite central que afirma que qualquer combinao linear de duas variveis aleatrias independentes ainda mais gaussiana que as referidas variveis).

15

EEGLAB: Utilizao do algoritmo ICA para anlise de eletroencefalogramas Anlise de Sinais

3. EEGLAB
Este software uma til ferramenta do Matlab na anlise e processamento de sinais obtidos em EEG e MEG principalmente. Para isso utiliza o ICA, anlise tempo/frequncia, entre outros mtodos para deteo/rejeio de artefactos.

3.1.

Decomposio de dados obtidos num EEG usando o ICA

Para este trabalho tem-se dois sinais EEG e sero esses os sinais estudos para mostrarmos o funcionamento do EEGLAB e as suas ferramentas. 3.1.1. Electroencefalograma - EEG Num encefalograma os dados so obtidos atravs de diversos eltrodos, que so so aplicados no couro cabeludo ou na superfcie enceflica. Com isso conseguimos um registo das correntes eltricas desenvolvidas no encfalo. Estes Potenciais eltricos so uma combinao linear dos vrios sinais presentes durante a atividade cerebral. A maioria dos sinais cerebrais observados situam-se entre os 1 e 20Hz. Seria essa a gama de frequncias de interesse ( de salientar que a partir dos 50Hz observa-se a presena de rudo eletrnico, tornando um pouco mais difcil o estudo do comportamento de ondas cerebrais com a mesma frequncia). Com o ICA ir observar-se at que ponto este algoritmo robusto, isto , at que ponto nos resolve e contorna estes diversos problemas. Durante a anlise dos EEG de alguns pacientes no se teve acesso configurao dos eltrodos utilizada (utilizou-se a configurao padro BESA4 definida no EEGLAB), nem ficheiro contendo os eventos. 3.1.2. Aplicando o ICA Aquilo que se pretende ento, determinar os componentes dessa combinao linear que captada em cada eltrodo - semelhante ao problema do cocktail. O ICA pode determinar esses componentes revelando informao sobre a atividade cerebral. O EEGLAB permite utilizar diferentes variantes do ICA, tais como runica (infomax), jader, fastica, entre outros. Todos eles tm um desempenho semelhante quando utilizados grupos de dados pequenos, mas com centenas de canais, o infomax (runica/binica) que d decomposies mais estveis. Usando os parmetros padronizados, o fastica rapidamente calcula os componentes, um a um. Porm, a ordem dos componentes que ele descobre no conhecida previamente, e realizando uma decomposio completa torna-se menos estvel para datasets com um grande nmero de canais, e tambm mais lento que o infomax. O algoritmo infomax apenas escolhe componentes com uma distribuio supergaussiana (com um pico mais acentuado que uma gaussiana semelhante a um T invertido). Se existe um rudo de fundo muito intenso, usa-se o comando extended, 1 na opo command line (Tools->Run ICA->comand line), de modo a detetar tambm subgaussianas, sendo mais sensvel a sinais com uma atividade mais baixa. Torna-se portanto

16

EEGLAB: Utilizao do algoritmo ICA para anlise de eletroencefalogramas Anlise de Sinais um algoritmo robusto, obtendo resultados apreciveis mesmo sem nenhum tratamento prvio dos dados.
Nota1: N componentes estveis ( de um grupo de dados de N canais) requer kN^2 pontos em cada canal, onde k um multiplicador. Ou seja, importante fornecer o mximo de dados possveis para uma decomposio eficaz. No sinal usado na fig. Temos k = 236 frames per ICA -> ((225)^2 = 53248 weights

Outra opo importante a opo stop. Escrevendo na caixa command line: stop,1E-8 (wchange que aparece na tela vai diminui gradualmente at chegar a 1E-8), alargamos o critrio de paragem da decomposio ICA aumentando o tempo de aprendizagem, e retornando decomposies mais fieis, principalmente se tiver muitos pontos (ver nota 1, pg.17). Na tela do matlab observa-se tambm o termo angledelta, que est relacionado com o tempo de aprendizagem durante a decomposio. Para mais opes do command line basta carregar no boto help que se encontra na mesma janela

No boto channels pode-se escolher que canais queremos aplicar ICA, no boto types serve para escolher o tipo de canais (caso, por exemplo se esteja a trabalhar com dados de ECG e EEG e queremos decompor s os de EEG).

Na figura abaixo (fig.) encontra-se representado os sinais captados por vrios eltrodos durante um EEG efetuado a um paciente, sem ICA aplicado.

elA01 elA02 elA03 elA04 elA05 elA06 elA08 elA09 elA10 elA12 elA13 elA14 elA15 Scale elA16 elA18 0 1 2 3 4 5 381 +

Ilustrao 12. EEG sem ICA

17

EEGLAB: Utilizao do algoritmo ICA para anlise de eletroencefalogramas Anlise de Sinais


Vamos ento aplicar o algoritmo ICA infomax que tem como base de operao a minimizao da informao mtua. De todos os algoritmos ICA este o mais robusto e o mais eficiente para uma grande quantidade de dados a analisar. O fastICA, apesar do seu nome, no necessariamente o mais rpido. Para a aplicao do ICA, partida no necessrio nenhum processamento prvio do sinal. No foi aplicado nenhum filtro nem foi definido um eltrodo de referncia. Normalmente usa-se como referncia ou o eltrodo TP10 ou o CZ. Sistemas com eltrodos activos (BIOSEMI) podem adquirir os sinais sem a definio de uma referncia prvia. Ver-se- depois da anlise ICA, se faz alguma diferena aplicar o ICA com ou sem prprocessamento. Os componentes obtidos aps o ICA foi o seguinte:

1 2 3 4 5 6 7 8 9 10 11 12 13 Scale 14 15 0 1 2 3 4 5 71 +

Ilustrao 13. EEG com ICA

Comparando os sinais com e sem ICA podemos ver as suas diferenas (fig.). Observa-se uma grande melhoria na informao disponvel, informao essa que antes se encontrava oculta. Resta ver se com o pr-processamento do sinal conseguimos melhorar os resultados aps a decomposio ICA.

3.1.3. Pr-processamento do sinal. Sim ou No?


Vamos ento aplicar um filtro passa-banda e definir uma referncia para o nosso grupo de dados e ver se notamos alguma diferena, e observar se traz vantagens efetuar este procedimento ou no, antes de aplicar o algoritmo ICA.

Referncia dos canais


Normalmente, a referncia definida no eltrodo TP10 (localizado no mastoide) ou no eltrodo Cz. Com o sistema BIOSEMI possvel referenciar o grupo de dados apenas aps a aquisio. No existe nenhuma referncia privilegiada, ou seja, que seja considerada o melhor local. Porm, alguns

18

Ilustrao 14. Confgurao comum dos elctrodos e referncias utilizadas.

EEGLAB: Utilizao do algoritmo ICA para anlise de eletroencefalogramas Anlise de Sinais


investigadores afirmam que referncias localizadas fora do escalpe introduzem mais rudo, mas nada disto foi provado. Atravs do EEGLAB podemos alterar a referncia com que o grupo dados foi adquirido, para um outro canal.

Ilustrao 15

A opo average reference pode ser utilizada no caso de usarmos uma configurao uniforme e simtrica (fig.), ou seja, no pode haver mais eltrodos numa zona que noutra. Isto comummente usado para configuraes de eltrodos que ocupem a cabea toda. A vantagem de usar uma referncia resulta do facto de que todas as correntes, que circulam numa esfera (eletricamente isolada), somadas so igual a zero assume-se que a passagem de corrente pela base do crnio at ao pescoo to pequena que se despreza. Aquilo se verifica que para o ICA a referncia escolhida irrelevante. Isto verdade porque mudar a referncia modifica as combinao linear dos dados, combinao essa qual o ICA insensvel. A qualidade dos resultados igual independentemente da referncia escolhida. Contudo, no definir uma referncia deixa 40dB de rudo a afetar o grupo de dados.

Filtros
Os filtros no EEGLAB servem sobretudo para remover o rudo dos 50-60Hz. O filtro utilizado foi um filtro passa-banda, usando a opo IIR (infinite impulse response) do EEGLAB, cuja interface grfica igual ao FIR (finite impulse response). A gama de frequncias que se ir estudar ser entre 1 e 30 Hz (eliminamos assim o rudo eletrnico, obtendo sinais mais limpos).

19

EEGLAB: Utilizao do algoritmo ICA para anlise de eletroencefalogramas Anlise de Sinais

elA01 elA02 elA03 elA04 elA05 elA06 elA08 elA09 elA10 elA12 elA13 elA14 elA15 Scale elA16 elA18 0 1 2 3 4 5 123 +

Ilustrao 16. EEG com filtro passa-banda e sem ICA

1 2 3 4 5 6 7 8 9 10 11 12 13 Scale 14 15 0 1 2 3 4 5 46 +

Ilustrao 17. EEG com filtro passa-banda e com ICA

Obtm-se com um tratamento adequado melhores resultados com a decomposio. E no de estranhar. Alis, j se estava espera: o ICA toma tudo em considerao durante a anlise. Se deixamos l os diversos tipos de rudos ( piscar de olhos, rudo electrnico, contraes musculares,etc..), durante a decomposio iro se produzir componentes que aparentam ser rudo. Mais importante ainda, o nmero de componentes dedicados decomposio apenas do EEG proporcionalmente menor. Resumindo, utilizar ICA com dados EEG sem o mximo de rudo possvel o mais indicado. Os artefactos sero isolados num nico componente, podendo ser facilmente removido aps o ICA. Se corrermos duas vezes o ICA no mesmo dataset o que acontece? Os resultados parecem ser ligeiramente diferentes. Isto deve-se ao facto de comear com a weight matrix aleatria (e altera aleatoriamente a ordem dos dados a cada passo). Por esse motivo a convergncia sempre um pouco diferente. Isto no nenhum problema pois aquilo que pode acontecer que certas caractersticas, que

20

EEGLAB: Utilizao do algoritmo ICA para anlise de eletroencefalogramas Anlise de Sinais


no permanecem estveis durante os sucessivos passos da decomposio no so passveis de ser interpretados exceto ser considerado uma incerteza do ICA.

1 2 3 4 5 6 7 8 9 10 11 12 13 Scale 14 15 0 1 2 3 4 5 46 +

1 2 3 4 5 6 7 8 9 10 11 12 13 Scale 14 15 0 1 2 3 4 5 46 +

Ilustrao 18. Comparao de duas decomposies ICA, do mesmo sinal.

3.1.4. Estudo e Remoo de componentes ICA

Depois de se usar o ICA obtemos os componentes, em que alguns contero artefactos. Ora, do nosso interesse removermos esses componentes (como vimos anteriormente estes tipos de rudo, com o ICA, fica cada um isolado num canal.

21

EEGLAB: Utilizao do algoritmo ICA para anlise de eletroencefalogramas Anlise de Sinais


1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 140 141 142 143 144 145

Scale 18 +

Ilustrao 19. EEG utilizado para rejeio de componentes por mapeamento

Para estudarmos as propriedades dos componentes e rejeit-los se necessrio faz-se Tools-> Reject Data using ICA -> reject componentes by map. Nesta janela tambm aceder s propriedades de cada componente. Basta carregar no rectngulo em cima de cada grfico.

Na janela que abre podemos ver a distribuio da potncia com a frequncia e podemos rejeitar ou aceitar este componente. Artefactos devido ao piscar de olhos so quase sempre preszentes nos EEGs. Localizam-se normalmente na parte frontal e parecem-se com o componente 19 (fig.) Estes podem ser identificados por trs razes: 1. Apresenta um espectro que decresce suavemente; 2. O escalpe mostra uma projeo muito forte na parte frontal;

3. possvel ver movimentos oculares no ERP no canto superior direito.

22

EEGLAB: Utilizao do algoritmo ICA para anlise de eletroencefalogramas Anlise de Sinais


IC19
Continous data 60.5 30.2
Trials

IC33

Continous data 13.8 6.9

100

0 -30.2 -60.5

Trials

100

0 -6.9 -13.8

100

200 Frames

300

100

200 Frames

300

Power 10*log10(V2/Hz)

Activity power spectrum

Power 10*log10(V2/Hz)

Activity power spectrum

20 10 0 -10 10 20 30 40 50
Frequency (Hz)

10 0 -10 10 20 30 40 50
Frequency (Hz)

Ilustrao 20

O componente 33 (fig.20) apresenta ter um pico que se destaca nos 25 Hz. Porm, apresenta ter um artefacto que observado na orelha direita e que parece ser devido a movimentos musculares. Apresenta valores altos de potncia para altas frequncias. Mas ainda encontramos muitos componentes com informao til, com sinais cerebrais. Os critrios principais para reconhecer dados relacionados com o crebro so: 1. Observa-se dipolos no mapa do escalpe; 2. Observam-se picos nas frequncias tpicas de um EEG; 3. ERPs regulares, em que no apresenta atividade apenas com algumas tentativas.
IC16

IC30
Continous data 42.9

Continous data 21.2 10.6

21.5

Trials

Trials

100

0 -21.5 -42.9

100

0 -10.6 -21.2

100

Power 10*log10(V2/Hz)

200 Frames

300

100

200 Frames

300

Power 10*log10(V2/Hz)

Activity power spectrum

Activity power spectrum

20 10 0 10 20 30 40 50

10 0 -10 10 20 30 40 50
Frequency (Hz)

Frequency (Hz)

Ilustrao 21

IC29

Continous data 59.2 29.6

Trials

100

0 -29.6 -59.2

100

200 Frames

300

Power 10*log10(V2/Hz)

Activity power spectrum

20 10 0 10 20 30 40 50
Frequency (Hz)

23

Ilustrao 22

EEGLAB: Utilizao do algoritmo ICA para anlise de eletroencefalogramas Anlise de Sinais

4. Concluses
ICA uma ferramenta extremamente robusta e poderosa, no qual um grupo de dados sofreu transformaes lineares de modo a obter componentes que o mais independentes possveis entre si. Uns dos algoritmos mais eficientes: salienta-se o fastICA e o infomax que podem ser aplicados em diversas reas como processamento de udio, sinais biomdicos, imagem, telecomunicaes. No mbito deste trabalho observou-se e concluiu-se que o ICA uma ferramenta imprescindvel na anlise de EEGs. Dos procedimentos efetuados o ICA apresenta as seguintes propriedades: ICA apenas consegue separar combinaes lineares; Como o ICA separa as fontes maximizando a no gaussianidade dos componentes independentes, gaussianas perfeitas no podem ser separadas; Mesmo quando as fontes no so independentes, o ICA encontra um espao onde eles possuem inter-independncia mxima.

24

EEGLAB: Utilizao do algoritmo ICA para anlise de eletroencefalogramas Anlise de Sinais

5. Referncias
o o o o o o o http://sccn.ucsd.edu/~arno/indexica.html http://www.oursland.net/tutorials/ica/ica-intro.html http://mlsp.cs.cmu.edu/courses/fall2012/lectures/ICA_Hyvarinen.pdf http://videolectures.net/mlss05au_hyvarinen_ica/ http://sccn.ucsd.edu/eeglab/eeglabtut.html http://sccn.ucsd.edu/wiki/EEGLAB_TUTORIAL_OUTLINE http://sccn.ucsd.edu/~scott/tutorial/

25

EEGLAB: Utilizao do algoritmo ICA para anlise de eletroencefalogramas Anlise de Sinais

6. Anexos
6.1. Algoritmos utilizados durante a elaborao deste trabalho

Algoritmo 1 A = sin(linspace(0,50,2000)); % matriz A B = sin(linspace(0,37,2000)+27); %matriz B (desfasada de A) C = cos(linspace(0,70,2000) +3); %matrtiz C figure; subplot(3,1,1); plot(A); subplot(3,1,2); plot(B, 'r'); subplot(3,1,3); plot(C, 'g'); C1 = 2*A - 3*B + 1,5*C; C2 = 1.79*A+4.78*B -C; C3 = 2*C + 3*B -A;

% plot A % plot B %plot C % C.L. 1 % C.L. 2 % C.L. 3

figure; subplot(3,1,1); plot(C1); % plot C.L. 1 subplot(3,1,2); plot(C2, 'r'); % plot C.L. 2 subplot(3,1,3); plot(C3, 'g'); % plot C.L. 3 figure; f = fastica([C1;C2;C3]); subplot(3,1,1); plot(f(1,:)); subplot(3,1,2); plot(f(2,:)); subplot(3,1,3); plot(f(3,:));

% aplicar fastICA

Algoritmo 2
POINTS = 1000; % number of points to plot % define the two random variables % ------------------------------for i=1:POINTS A(i) = round(rand*99)-50; % A B(i) = round(rand*99)-50; % B end; figure; plot(A,B, '.'); % plot the variables set(gca, 'xlim', [-80 80], 'ylim', [-80 80]); % redefines limits of the graph % mix linearly these two variables % -------------------------------M1 = 0.54*A - 0.84*B; M2 = 0.42*A + 0.27*B; figure; plot(M1,M2, '.'); set(gca, 'ylim', get(gca, 'xlim')); the graph % withen the data % ---------------

% % % %

mixing 1 mixing 2 plot the mixing redefines limits of

26

EEGLAB: Utilizao do algoritmo ICA para anlise de eletroencefalogramas Anlise de Sinais


x = [M1;M2]; c=cov(x'); % covariance sq=inv(sqrtm(c)); % inverse of square root mx=mean(x'); % mean xx=x-mx'*ones(1,2000); % subtract the mean xx=2*sq*xx; cov(xx'); % the covariance is now a diagonal matrix figure; plot(xx(1,:), xx(2,:), '.'); % show projections % ---------------figure; axes('position', [0.2 0.2 0.8 0.8]); plot(xx(1,:), xx(2,:), '.'); hold on; axes('position', [0 0.2 0.2 0.8]); hist(xx(1,:)); set(gca, 'view', [90 90]); axes('position', [0.2 0 0.8 0.2]); hist(xx(2,:)); % show projections % ---------------figure; axes('position', [0.2 0.2 0.8 0.8]); plot(A,B, '.'); hold on; axes('position', [0 0.2 0.2 0.8]); hist(A); set(gca, 'view', [90 90]); axes('position', [0.2 0 0.8 0.2]); hist(B);

27