Beruflich Dokumente
Kultur Dokumente
http://www.uff.br/rvq
Resumo
As tcnicas de metabolmica so ferramentas poderosas para explicar e prever fentipos
em sistemas biolgicos. Nesta rea, os mtodos quimiomtricos so empregados para
extrair informaes de dados analticos complexos. Dentre os mtodos instrumentais para
obteno dos dados analticos e os mtodos quimiomtricos, os mais utilizados so
ressonncia magntica nuclear de hidrognio (RMN de 1H) e o mtodo dos mnimos
quadrados parciais discriminante (partial least squares-discriminant analysis, PLS-DA). O
presente trabalho descreve alguns aspectos prticos do processamento de espectros de
RMN de 1H e da utilizao de PLS-DA com aplicao para diferenciao de duas espcies de
algas pardas, Dictyota ciliolata e D. crenulata.
Palavras-chave: Metabolmica; PLS-DA; RMN de 1H; quimiotaxonomia; algas pardas;
Dictyota.
* Universidade Federal Fluminense, Instituto de Biologia, Departamento de Biologia Marinha,
ALGAMAR Laboratrio de Produtos Naturais de Algas Marinhas, CEP 24020-141, Niteri-RJ,
Brasil.
valerialaneuville@gmail.com e valerialaneuville@id.uff.br
DOI: 10.5935/1984-6835.20140028
Rev. Virtual Quim. |Vol 6| |No. 2| |396-415|
396
Volume 6, Nmero 2
Maro-Abril 2014
Revista Virtual de Qumica
ISSN 1984-6835
Instituto Federal de Educao, Cincia e Tecnologia do Rio de Janeiro, Rua Senador Furtado
171, Maracan, CEP 20270-021, Rio de Janeiro-RJ, Brasil.
1. Introduo
2. Processamento dos espectros de RMN de 1H e extrao dos dados
3. Mtodo dos mnimos quadrados parciais discriminante
4. Exemplo de aplicao: Seleo dos sinais representativos nos espectros de RMN
de 1H para diferenciao das espcies de algas Dictyota crenulata e D. ciliolata
4.1. Material e mtodos
4.2. Resultados e discusso
5. Concluses
1. Introduo
O termo metabolmica surgiu no final da
dcada de noventa do sculo passado e
refere-se ao estudo qualitativo e quantitativo
de metablitos em sistemas biolgicos para
relacionar variaes dos metablitos com
mudanas genticas ou perturbaes nas
condies ambientais.1-4 Nesta rea, so
utilizados mtodos instrumentais sofisticados
para gerar os dados e mtodos
quimiomtricos para extrair informaes
397
destes.
Independente dos mtodos instrumentais
e quimiomtricos, os trabalhos de
metabolmica incluem as seguintes etapas:
identificao da questo biolgica a ser
estudada,
planejamento
experimental,
amostragem, preparao das amostras,
aquisio, processamento e anlise dos
dados (Figura 1).
A identificao da questo biolgica a ser
estudada o ponto de partida para um
trabalho de metabolmica, seguida de um
Rev. Virtual Quim. |Vol 6| |No. 2| |396-415|
Baddini, A. L. Q. et al.
planejamento experimental, que uma etapa
imprescindvel em qualquer trabalho
cientfico. A amostragem deve ser realizada
para que as amostras representem
significativamente o sistema biolgico a ser
estudado. O preparo da amostra uma etapa
que depende da natureza das amostras e tipo
de anlise que ser feita.
Os mtodos mais utilizados na aquisio
dos dados de metabolmica so baseados em
ressonncia nuclear magntica (RMN) e
cromatografia com espectrmetro de
massas. Dependendo do tipo de dados
gerados, as estratgias de processamento
dos dados so diferentes. Neste trabalho
sero abordados o processamento dos dados
de ressonncia magntica nuclear de
hidrognio unidimensional (1D), mostrando a
importncia e os cuidados que devem ser
tomados nesta etapa.
As anlises dos dados de metabolmica
podem ser realizadas com mtodos de
reconhecimento
de
padres
no
supervisionados e mtodos supervisionados.
O que distingue os mtodos supervisionados
dos no supervisionados o conhecimento
prvio de grupos. Neste artigo ser
apresentado o mtodo dos mnimos
quadrados parciais discriminante (Partial
Least Squares-Discriminant Analysis, PLS-DA)
que o mtodo de reconhecimento de
padres supervisionado mais utilizado.
Tambm sero discutidos os aspectos
prticos da aplicao do programa The
Unscrambler 9.5 com esta finalidade.
O trabalho apresenta, ainda, um exemplo
de aplicao da metabolmica de algas
pardas de duas espcies, sendo elas: Dictyota
ciliolata e Dictyota crenulata. Estas duas
espcies apresentam margens denticuladas e
muitas vezes so de difcil distino. Quatro
so as caractersticas morfolgicas que
distingue-as:
Muitos
trabalhos
sobre
diversas
atividades
biolgicas
dos
diterpenos
produzidos por algas do gnero Dictyota j
foram publicados.11-19 Dentre esses estudos,
podemos destacar a atividade antiviral contra
o vrus da imunodeficincia humana
adquirida tipo 1, o HIV-1, e o herpes simples
humano (HSV-1) de diterpenos das espcies
D. menstrualis e D. pfaffi.11-19 H grande
potencial para descobertas de outras
398
Baddini, A. L. Q. et al.
399
Baddini, A. L. Q. et al.
Baddini, A. L. Q. et al.
Transformada de Fourier
Figura 5. Espectros de RMN de 1H: correo de fase (A); ajuste da linha base em zero (B)
401
Baddini, A. L. Q. et al.
Tabela 1. Programas usados para o processamento dos espectros de RMN de 1H avaliados e
tipos de arquivos para a importao
Programa
.fid ou .ser
Arquivos da Agilent
(Mestrelab, Espanha)
.fid (Varian)
.jdf (JEOL)
.jdx (JCAMP)
Automics19
.fid (Bruker)
XWIN-NMR
Programa conversor para .fid (Bruker)
402
Baddini, A. L. Q. et al.
Espectro
realizado
pelo
reconhecimento de curvas provenientes de
equaes Lorentzianas ou Gaussianas.21 Na
Figura 7, a curva em vermelho representa o
espectro de RMN de 1H original, a cor azul
representa os sinais deconvoludos e o sinal
na cor preta representa o rudo, A soma dos
sinais deconvoludos e do rudo compe o
espectro original. Os programas o Top Spin
e o MestReNova apresentam a ferramenta
de deconvoluo.
Sinais deconvoludos
Rudo
403
Baddini, A. L. Q. et al.
Figura 8. Espectros no normalizados (A); Espectros normalizados pela rea do sinal principal
(B)
404
Baddini, A. L. Q. et al.
Figura 9. Espectro de RMN 1H sem tratamento e bins equidistantes (A), resultado aps a
aplicao do binning (B)
(Eq. 1)
Y =U CT + F
(Eq. 2)
Onde:
P e C so os pesos de X e Y, respectivamente;
T e U so os escores de X e Y,
respectivamente; E e F so os resduos de X e
Y, respectivamente.
No PLS, os valores dos escores nas
matrizes T e U so modificados at que o
melhor modelo linear seja determinado entre
eles e assim, a maior covarincia entre X e Y
seja obtida. Isso feito em uma srie de
etapas e h diversos algoritmos propostos,
dentre eles: NIPALS (Non-linear Iterative
Rev. Virtual Quim. |Vol 6| |No. 2| |396-415|
Baddini, A. L. Q. et al.
Partial
Least
Squares )27,
SIMPLS28
(Statistically Inspired Modification of Partial
Least Squares ), Kernel,29,30 Wide Kernel,31
Ding & Gentleman32 etc. No presente
trabalho ser apresentada uma aplicao do
programa The Unscrambler 9.5 que utiliza o
algoritmo NIPALS para o clculo PLS.
Nos clculos PLS utilizados em
reconhecimento de padres, o mtodo passa
a ser chamado de mtodo dos mnimos
quadrados parciais discriminante (Partial
Least Squares-Discriminant Analysis, PLS-DA)
e se a funo-resposta no for numrica,
como na distino das espcies de algas do
exemplo a seguir, o valor +1 atribudo na
funo-resposta para um grupo e para outro
grupo atribudo zero (ou outro valor, como
-1).
No PLS-DA, a interpretao dos grficos
de escores e pesos passa a ter importncia
maior que nos trabalhos que utilizam os
modelos PLS para previso, como no caso da
calibrao multivariada. No grfico de
escores desejvel haver segregao entre
os grupos em que se deseja discriminao. O
grfico de pesos apresenta o resultado mais
importante do PLS-DA, pois as variveis que
mais contribuem para o modelo iro
apresentar os maiores valores em mdulo.
Para os trabalhos de metabolmica com
RMN, o grfico de pesos mostra que sinais do
espectro so os responsveis pela
discriminao dos grupos.
Alm dos grficos de escores e pesos,
outras caractersticas dos modelos devem ser
observadas:
Nmero de variveis latentes para a
construo do modelo;
Varincia explicada em cada varivel
latente;
Grfico de calibrao que apresenta
os valores previstos pelo modelo versus os
valores reais ou experimentais. Neste grfico,
o coeficiente de determinao (R2) e o erro
mdio quadrtico de calibrao (RMSEC)
devem ser avaliados;
Grfico da validao cruzada que
apresenta os valores previstos pelo modelo
Rev. Virtual Quim. |Vol 6| |No. 2| |396-415|
(Eq. 3)
(Eq. 4)
Onde:
i representa o valor previsto pelo modelo;
i representa o valor previsto pelo modelo
na validao cruzada;
yi representa o valor real;
n corresponde ao nmero de amostras.
406
Baddini, A. L. Q. et al.
Baddini, A. L. Q. et al.
TMS como referncia. Tanto o sinal dos
cidos graxos obtido aps alinhamento,
quanto aqueles considerados como rudo,
foram retirados aps deconvoluo. A
deconvoluo foi realizada empregando o
modo sinttico do MestReNova 8.0. A Figura
Figura 10. Espectro de RMN de 1H de uma das amostras de Dictyota ciliolata(A); Espectro
com aplicao de binning utilizando a faixa de 0,04 ppm (B); Espectro com aplicao de binning
utilizando a faixa de 0,004 ppm (C); Espectro com aplicao de binning (faixa de 0,004 ppm) e
retirada de rudo e sinal em 1,250 ppm aps deconvoluo (D)
Rev. Virtual Quim. |Vol 6| |No. 2| |396-415|
408
Baddini, A. L. Q. et al.
Acetato de dictyol B
4-acetoxydictyodial A
Baddini, A. L. Q. et al.
A normalizao dos espectros foi realizada
usando o valor da rea da regio espectral de
0,5 a 3,0 ppm por apresentar maior
importncia em termos de quantidade de
sinais. Esta etapa foi realizada antes do
Figura 13. Espectro padro da espcie D. ciliolata com alguns sinais destacados referentes
ao acetato de dictyol B38 (A); Espectro padro da espcie D. crenulata com alguns sinais
destacados referentes ao 4-acetoxydictyodial A39 (B); Espectros de D. ciliolata e D. crenulata
aps tratamentos dos espectros de RMN de 1H (C)
Rev. Virtual Quim. |Vol 6| |No. 2| |396-415|
410
Baddini, A. L. Q. et al.
86,3 % da varincia de X.
Os grficos de calibrao com a previso
do modelo sem a retirada de amostras e com
a validao cruzada do tipo leave one out
mostram boa correlao apresentando
respectivamente R2 igual a 0,964 e Q2 igual a
0,850 (Figuras 14A e 14B). As Figuras 14A e
14B apresentam respectivamente o RMSEC e
RMSECV obtidos. O grfico 2D de escores
(Figura 14C) apresenta segregao entre as
espcies. O grfico de pesos da VL1 da Figura
14D mostra que os picos mais importantes
para D. ciliolata ocorrem em 0,880, 1,300,
1,936 e 2,344 e para D. crenulata os sinais
importantes ocorrem em 2,032; 0,936 e
1,616.
Figura 14. Grfico de calibrao (A); grfico de validao cruzada do tipo leave one out (B);
grfico de escores de VL2 X VL1(C); grfico de pesos em VL1 (D)
411
Baddini, A. L. Q. et al.
Os resultados para D. crenulata
confirmam que o 4-acetoxydictyodial A a
substncia importante para diferenciao
desta espcie em relao a D. ciliolata. Os
sinais 2,03, 0,936 e 1,616 correspondem
respectivamente aos hidrognios dos
carbonos 20, 21 e 5.39
Por outro lado, os resultados para D.
ciliolata mostraram que a informao
relevante para diferenciao desta espcie
est em sinais dos hidrognios do esqueleto
guaiano prenilado, esqueleto do diterpeno
majoritrio acetato de dictyol B e de outros
diterpenos presentes na amostra. Os sinais
3,444
e
1,300
correspondem
respectivamente
aos hidrognios
do
esqueleto guaiano prenilado 1, 19 (Figura
15).38 Outro sinal relevante ocorre em
1,936, que corresponde aos hidrognios de
metila do grupamento acetato.38 H ainda
outro sinal importante para diferenciao de
D. ciliolata que o sinal em 0,880, este
corresponde a hidrognios de esteris. Os
esteris abundantes nestas algas so o
fucosterol e o isofucosterol cujas estruturas
moleculares esto apresentadas na Figura 15.
O sinal em 0,880 corresponde aos
hidrognios do carbono 27 destes esteris.40
Fucosterol
R=
Isofucosterol
R=
5. Concluses
Os trabalhos de metabolmica de RMN 1H
compreendem diversas etapas, dentre as
quais os tratamentos dos espectros e os
cuidados na utilizao do mtodo
quimiomtrico so etapas imprescindveis
para a obteno de resultados confiveis.
Rev. Virtual Quim. |Vol 6| |No. 2| |396-415|
Baddini, A. L. Q. et al.
Referncias Bibliogrficas
Cirne-Santos, C. C.; Teixeira, V. L.; CastelloBranco, L. R.; Frugulhetti, I. C. P. P.; BouHabib, D. C. Inhibition of HIV-1 Replication in
Human Primary Cells by a Dolabellane
Diterpene Isolated from the Marine Algae
Dictyota pfaffii. Planta Medica 2006, 72, 295.
[CrossRef] [PubMed]
Rev. Virtual Quim. |Vol 6| |No. 2| |396-415|
Baddini, A. L. Q. et al.
17
chromatographic
data.
Journal
of
Chemometrics 2004, 18, 231. [CrossRef]
25
De Meyer, T.; Sinnaeve, D.; Van Gasse, B.;
Tsiporkova, E.; Rietzschel, E. R.; De Buyzere,
M. L.; Gillebert, T. C.; Bekaert, S.; Martins, J.
C.;
Van Criekinge,
W. NMR-Based
Characterization of Metabolic Alterations in
Hypertension Using an Adaptive, Intelligent
Binning Algorithm. Analytical Chemistry 2008,
80, 3783. [CrossRef] [PubMed]
26
Worley, B.; Power, R. Multivariate Analysis
in Metabolomics. Current Metabolomics
2013, 1, 92. [CrossRef]
27
Geladi, P.; Kowalski, B. R. Partial leastsquares regression: a tutorial. Analytica
Chimica Acta 1986, 185, 1. [CrossRef]
28
De Jong, S. SIMPLS: An alternative
approach to partial least squares regression.
Chemometrics and Intelligent Laboratory
Systems 1993, 18, 251. [CrossRef]
29
De Jong, S.; Ter Braak, J. F. C. Comments on
the PLS kernel algorithm. Journal of
Chemometrics 1994, 8, 169. [CrossRef]
30
Dayal, B. S. Improved PLS algorithms
Journal of Chemometrics. 1994, 11, 73.
[CrossRef]
31
Rnnar, S.; Geladi, P.; Wold, S. A PLS
kernel algorithm for data sets with many
variables and fewer objects. Part 1: Theory
and algorithm. Journal of Chemometrics
1994, 8, 111. [CrossRef]
32
Ding, B.; Gentleman, R. Classification Using
Generalized Partial Least Squares. Journal of
Computational and Graphical Statistics 2005,
14, 280. [CrossRef]
33
Saeys, Y.; Inza, I.; Larraaga, P. A review of
feature
selection
techniques
in
bioinformatics Bioinformatics 2007, 23, 2507.
[CrossRef] [PubMed]
34
Mehmood, T.; Liland, K.H.; Snipen, L.;
Sb, S. A review of variable selection
methods in Partial Least Squares Regression.
Chemometrics and Intelligent Laboratory
Systems 2012, 118, 62. [CrossRef]
35
Cronin, G.; Lindquist, N.; Hay, M.E.; Fenical,
W. Effects of storage and extraction
procedures on yields of lipophilic metabolites
from the brown seaweeds Dictyota ciliolata
and D. menstrualis. Marine Ecology Progress
Series 1995, 119, 265. [CrossRef]
414
18
Baddini, A. L. Q. et al.
36
415
39