Beruflich Dokumente
Kultur Dokumente
Abstrato
Antecedentes: plataformas de sequenciamento de próxima geração têm revolucionou a
nossa capacidade de investigar a composição da microbiota de ambientes complexos,
muitas vezes através de 16S rRNA sequenciação genética do componente bacteriano da
comunidade. Numerosos fatores, incluindo método de extração de DNA, sequências
iniciadoras e plataforma de sequenciamento de empregada, pode afetar a precisão dos
resultados alcançados. O objetivo deste estudo foi determinar o impacto destes três
fatores em 16S rRNA resultados de sequenciamento de genes, utilizando comunidades
mock e DNA comunidade simulada.
Resultados: O uso de diferentes seqüências de primers (V4-V5, V1-V2 e iniciadores
degenerados V1-V2) resultou em diferenças de géneros e espécies detectadas. Os
primers V4-V5 deu os resultados mais comparáveis entre plataformas. Os três Ion PGM
conjuntos de primers detectou mais de 20 espécies da comunidade simulacro do que os
conjuntos equivalentes de primers MiSeq. Os dados gerados a partir de DNA extraído
usando os métodos de extracção 2 foram muito semelhantes.
Conclusões: dados relativos à composição da microbiota diferente dependendo dos
iniciadores e uma plataforma de sequenciamento de que foram usados. Os resultados
demonstram os riscos em comparação de dados gerados por diferentes abordagens de
sequenciamento e destacar os méritos de escolher uma abordagem padronizada para a
sequenciação em situações em que é executado é necessária uma comparação entre a
sequenciação múltipla.
Palavras-chave: sequenciamento de próxima geração, comunidades Mock, 16S rRNA,
MiSeq, Ion PGM, Gut microbiota, Bias, extração de DNA
Resultados
A análise da qualidade dos dados Sequencing
DNA comunidade Mock (HM-782D) e DNA extraído de células da comunidade simulada
(HM-280/1) foi sequenciado nas plataformas MiSeq e Ion PGM. Detalhes sobre o número
de sequenciamento lê, ler comprimentos e percentagem de leituras retidas após
filtragem de qualidade e remoção quimera são fornecidos na Tabela 1. A percentagem
dos lucros lê foi semelhante em todas as plataformas e conjuntos de iniciadores, com a
notável exceção do V4-V5 primers em o Ion PGM, onde 80-90% foram mantidas após a
remoção quimera, em comparação a uma média de 99% retido para os outros iniciadores
em ambas as plataformas. rarefeitos curvas (Fig. 1) demonstram que a maioria das
curvas de começar a planalto, assim sequenciação adicional é improvável para se
obterem novos dados na maioria dos casos.
Discussão
Com o rápido aumento em estudos que investigam a microbiota de diversos ambientes
usando high-throughput abordagens Quencing se-, é fundamental que o impacto de
vários fatores sobre os resultados de sequenciamento ser determinado. Este estudo
analisou os efeitos de procedimentos de extração de DNA, desenho de primers gene 16S
rRNA e a escolha da plataforma de sequenciação nos resultados usando células
comunitárias mock e DNA. A grande maioria dos estudos de sequenciação têm contado
com a sequenciação do gene 16S rRNA para determinar a térios bac- presentes num
ambiente [1, 3]. Estudos anteriores também examinaram os efeitos de iniciadores sobre
os resultados de sequenciação por meio da amplificação do V1-V3, V3-V5 e V6-V9 regiões
do gene de ARNr 16S a partir das mesmas células da comunidade simulados, utilizada
neste estudo (HM 280/1) e sequenciamento Sanger usando e plataformas 454-
pyrosequencing [16]. Eles também observou o efeito da região do gene 16S rRNA alvo em
dados de sequenciação. Nosso estudo utilizou iniciadores visando as V4-V5 e V1-V2
regiões e empregou as plataformas Illumina MiSeq e Ion PGM. Apesar de ambos os
estudos, utilizando as mesmas células comunidade trocistas (HM 280/1), ocorreram
diferenças en- tre os nossos conjuntos de dados, provavelmente devido a uma
combinação de efeitos mer e sequenciador pri-. Semelhante ao estudo de Haas et al.,
Nosso estudo também observou danças abun- relativos não uniformes nas comunidades
simulados. Os resultados demonstraram que os primers V4-V5 deu os resultados mais
comparáveis em todas as plataformas, o que poderia ser um benefício para os
investigadores que se desloquem entre plataformas de sequenciamento mais recentes.
No entanto, este resultado também deve ser considerada à luz do facto de que os
mesmos conjuntos de iniciadores deram abundâncias enviesados. Assim, enquanto este
conjunto de primers deu os resultados mais comparáveis entre plataformas sugerindo
que é menos afetado dos primers conjuntos de plataforma de utilizados, os resultados
ainda mostram discrepâncias entre os resultados esperados e alcançados com este
conjunto de primers. Os resultados a partir dos iniciadores degenerados V1-V2 e V1-V2
eram distintos a partir dos iniciadores V4-V5 e diferem na sua detecção de espécies.
diferenças consideráveis ocorreu com base no qual primer e plataforma foi utilizada.
Apenas duas combinações, ou seja, os iniciadores V4 V5-Ion PGM utilizados no ADN
simulada e os V1-V2 iniciadores degenerados Ion PGM usados nas células de glicerol RBB,
detectou 100% das espécies esperados. Vale a pena notar que os mesmos iniciadores
utilizados em outras placas DNA turas extraído ou simulados não detectou 100% das
espécies esperadas, assim, novamente destacando que os resultados são devido a uma
combinação de fatores, incluindo a extração de DNA procedimento, primer escolha e
plataforma de sequenciamento. Além disso, nenhum conjunto de primers detectou a
espécie esperados exclusivamente e todos deram falsos acertos (% de leituras
conseguido que não se esperava em relação ao total de leituras alcançado) (variando de
6% para a amostra Ion PGM V1-V2 Qiagen PBS a 69% para o Ion PGM V1-V2 degenerada
amostra Qiagen PBS). Estes estavam presentes em baixas abundâncias relativas e
estavam intimamente relacionadas com as espécies tuais dades presentes nas
comunidades de simulação, portanto, sugerimos que eles foram mis-atribuído ao nível de
espécie, devido às semelhanças na sua sequência de gene 16S rRNA por exemplo E.
faecalis presentes na comunidade simulada, mas E. faecium também atribuído ao nível
de espécie. Com base nestes resultados, parece que os primers consistentemente melhor
desempenho na plataforma Ion PGM, com percentagens mais elevadas de espécies
perado ex detectadas e baixos falsos acessos em comparação com a plataforma MiSeq.
Um estudo recente também tomou uma abordagem semelhante à nossa e compararam os
resultados de uma comunidade simulada sequenciados utilizando iniciadores de
segmentação região V1-V2 e sequenciadas nas plataformas MiSeq e Ion PGM [19]. O
estudo encontrou a abundância relativa de ser geralmente de acordo com a composição
comunidade esperado e que os resultados sejam semelhantes em todas as plataformas.
Embora nosso estudo não analisou repetições (devido a limitações no material de
partida), Salipante et al. não encontraram diferenças significativas entre repetições, o
que é consistente com os resultados anteriores também [24]. Estes resultados são
semelhantes aos de Tremblay et al. [22] que também mostraram diferenças nos
resultados de sequenciamento no 454-pirossequenciador eo MiSeq quando diferentes
regiões do gene 16S rRNA foram alvo, utilizando uma comunidade microbiana simulada.
Neste caso, os autores compararam as regiões V4, V6-V8 e V7-V8 e descobriu que os
primers V4 deu os resultados menos tendenciosos. Encontramos também o iniciador V4-
V5 definido para produzir os resultados capazes mais comparáveis entre plataformas. Os
autores também destacam que, actualmente, não há consenso sobre qual conjunto de
primers produz o melhor resultado; portanto, eles sugerem o potencial de usar
metagenomics espingarda para interrogar o seu conjunto de dados e comparar os
resultados com o de seus diferentes conjuntos mer pri- sob investigação. No entanto,
devido ao custo esta ainda não é uma abordagem viável para a maioria dos estudos, mas
poderia ser utilizado, talvez, para seleccionar entre conjuntos de iniciadores anteriores
para com- mencing uma série de estudos baseados na sequenciação.
Este estudo também realizou uma comparação direta das plataformas MiSeq e Ion PGM,
os quais estão sendo usados cada vez mais para 16S rRNA estudos amplicon de
sequenciamento. Os resultados indicaram que não apenas a profundidade de
sequenciação obtida difere por plataforma, mas também a percentagem de sequências
retidos seguinte ING filtro- qualidade e remoção quimera. Nós encontramos o menor
percentual de leituras foi retido a partir das sequências de iniciadores V4-V5 do Ion PGM
(80-90% retidos acompanhamento remoção ing quimera em comparação com uma média
de 99% retido para os outros iniciadores em ambas as plataformas). Isto pode ser devido
ao facto de que estas foram as mais longas lê alcançado na Ion PGM em 380-400 pb.
Atualmente 400 bp é o comprimento de leitura mais longo suportado por esta forma de
plataforma e, embora nós conseguimos mais ler comprimentos com este conjunto de
primers, a qualidade destes lê foi consideravel- mente inferior ao menor lê com os
conjuntos de primers V1-V2 (335- 355 pb), o que resulta em um aumento do número de
leituras a ser removido durante a filtragem e remoção qualidade quimera. Este estudo
demonstrou claramente o impacto da plataforma Quencing se- sobre os resultados
alcançados, achado também observado em estudo anterior [22], que mostraram que as
amostras agrupados por plataforma de sequenciamento usado. Um estudo recente
também comparou as plataformas MiSeq e Ion PGM para sequenciar uma comunidade
microbiana simulada usando primers V1- V2 16S rRNA [19]. Nossos resultados estão de
acordo com este estudo anterior que ambas as plataformas oferecem boa profundidade
Quencing se- e são uma boa alternativa para plataformas mais antigas. No entanto, eles
notaram que eram necessários mais estudos com vista a diferentes regiões do gene 16S
rRNA para compreender plenamente o impacto desses fatores sobre os resultados
Quencing se-. Este estudo anterior também destacou o potencial de minimizar artefatos
de sequenciação utilizando sequenciamento ectional bidir- e também por meio da
otimização do fluxo
ordem na plataforma Ion PGM. Mais uma vez este estudo não concluir sobre qual
combinação de plataforma / primer deu os melhores resultados. Assim, conclui-se que
com base na nossa e dados anteriores, o iniciador e plataforma mais adequada a ser
usada para estudos de sequenciação permanece obscura. Talvez a inclusão de
comunidades simulada ou a comparação dos ARNr 16S de dados para espingarda de dados
metagenomic pode permitem uma abordagem otimizada com base a ser concebido no
início de um grande ensaio baseado em sequenciação e não após o uso desta abordagem
optimizado iria limitar a variação entre os resultados dentro deste julgamento. Assim,
compartilhar as conclusões do Tremblay et al. [22] que, com base em todos os
conhecimentos atuais, consistência protocolo continua a ser mais pertinente para o
resultado do estudo de primário ou sequenciamento escolha da plataforma.
procedimento de extração de DNA tem um impacto significativo nos resultados de
sequenciamento [25, 26]. Vários estudos têm mostrado previamente os efeitos do uso de
diferentes kits comerciais para extração de DNA a partir de amostras fecais no
sequenciamento saída vem [14, 15, 17]. A nossa abordagem foi a de se concentrar
especificamente em apenas dois métodos de extração comumente utilizados em estudos
microbiota para estabelecer se a abordagem de extração de DNA Qiagen amplamente
utilizado foi tão bem sucedida como a abordagem RBB ou se as etapas talão batendo
adicionais produziram resultados mais precisos. Ambos os procedimentos de extração
produziu DNA que deu resultados comparáveis com respeito a filogenia. Isto pode ser
devido à semelhança com estas abordagens, enquanto o uso de um kit de extracção de
DNA comercial diferente poderia produzir resultados significativamente diferentes. Além
disso, este estudo utilizou células comunidade de simulação para investigar os efeitos do
procedimento de extração de DNA. Este é um relativamente simples relativa
comunidade microbiota para, por exemplo, fecal tragem ples. Assim, os resultados
sugerem que o método de extracção tem efeitos mínimos sobre a microbiota dados de
sequenciação podiam na verdade ser devido à facilidade de extracção de ADN a partir
das células da comunidade simulados. Embora tenhamos mostrado procedimentos ção
tanto DNA extração para produzir resultados de sequenciamento semelhantes neste
exemplo, é a nossa recomendação que a selecção e utilização de apenas um método de
extração de DNA para estudos longitudinais é vital para garantir a diferenças nos dados
que podem ser observados são não ocorrendo devido à extração viés.
Conclusões
Este estudo fornece uma comparação direta dos sequenciadores Illumina MiSeq e Ion
PGM e tem mostrado que os sequenciadores MiSeq e Ion PGM oferecer boa profundidade
sequenciamento e fornece informações em nível de espécie, não at- volvimento usando
plataformas mais antigas. Dadas as diferenças demonstradas na composição da
microbiota devido à escolha primer e plataforma de sequenciamento usados, a
necessidade do uso
dos controles internos sobre sequenciamento corridas é evidente. No geral, nossos
resultados são importantes, pois realçar considerações importantes para a concepção e
interpretação de estudos de sequenciamento. Assim, à medida que entramos numa era
de sequenciamento rápido de- senvolvimento, o avanço e melhoria, é de extrema
importância para considerar cuidadosamente, avaliar e rever continuamente as melhores
práticas relativas a concepção, realização e interpretação de estudos de
sequenciamento microbiota.
Métodos
iniciadores de PCR para seqüenciamento do gene 16S rRNA
Os iniciadores de PCR para sequenciação do gene 16S rRNA usando a plataforma de
sequenciação Ilumina MiSeq foram concebidos para consistir de uma sequência de
adaptador Illumina, uma sequência de 12 índice de NT (código de barras), uma região do
iniciador almofada de 10 nt, uma região ligante de 2 nt e o gene da sequência de
iniciador específico (Tabela 3). Três conjuntos de iniciadores, uma segmentação do gião
V4 V5-re [23] e dois pares de iniciadores de segmentação região V1-V2 do gene [4] 16S
rRNA, com conjunto de iniciadores 2, utilizando um iniciador para a frente de- gerar [17]
eram utilizado para sequenciação para determinar o efeito do desenho do iniciador e a
região do gene de ARNr 16S que é orientada, sobre os resultados de sequenciação. Um
conjunto correspondente de 3 pares de iniciadores foram gerados para uso na
plataforma Ion PGM e foram dese- nhado para conter a sequência de iões PGM ligante,
uma sequência de código de barras único 10 nt de Golay, uma sequência espaçadora 2 nt
e a sequência específica do gene (Tabela 4 ).
análise bioinformática
Lê para os MiSeq foram fundidas usando o QIIME (ver- são 1.8) join_paired_ends.py
roteiro eo método fastq-se juntar [28], no entanto, isso não foi necessário para PGM lê
como eram single-ended. t_libraries.py o script QIIME spli- foi usada para demultiplex
tanto MiSeq e PGM lê com parâmetros padrão, no entanto, só lê combinando a
distribuição do comprimento principal; primers V1-V2 (305-325 pb), V4-V5 de primers
(365-385 pb) e PGM:: MiSeq primers V1-V2 (335-355 pb), e V4-V5 de primers (380-400 pb)
e lê com um índice de qualidade média mínima de Q25 foram retidos. sequências
quiméricas foram removidos através USEARCH versão 7.0.1090 utilizando o script
me_ref.py uchi- e a base de dados OURO ChimeraSlayer [29]. A implementação Mothur
do classificador Ribossômico Database Project (RDP) foi usado para atribuir taxonomia
do filo ao gênero [30] com uma inicialização cut-off de 50%. Quaisquer sequências fora
desse corte foram designados como não classificada nessa posição particular.
classificação das espécies, juntamente com a classificação Clostridium Cluster foi obtido
através da utilização de espécies fier classificadas Spingo versão 1.2 com parâmetros
padrão [31]. A sequência qualidade filtrada lê para cada tecnologia e conjunto de
primers foram introduzidos em Spingo e os resultados foram resumidos utilizando o
script spingo_summar- y.py incluído com o software. mapas de calor foram gerados R
versão 3.1.3. O heatmap.2 função foi realizada na célula simulada e DNA simulada
tragem ples com apenas as espécies esperadas incluídas. agrupamento ical Hierarch- foi
realizado utilizando hclust.