Sie sind auf Seite 1von 15

bioRxiv Preprint zum ersten Mal online gestellt 31. Januar 2020; doi: http://dx.doi.org/10.1101/2020.01.30.927871 .

Das
Copyright für diesen Preprint (der nicht von Fachleuten begutachtet wurde) liegt beim Autor / Förderer, der bioRxiv die Lizenz
zur unbefristeten Darstellung des Preprint erteilt hat. Es wird unter einer internationalen CC-BY-NC-ND 4.0-Lizenz zur
Verfügung gestellt .

Unheimliche Ähnlichkeit einzigartiger Inserts im 2019-nCoV- Spike-Protein mit


HIV-1 gp120
und Gag
Prashant Pradhan $ 1,2 , Ashutosh Kumar Pandey $ 1 , Akhilesh Mishra $ 1 , Parul Gupta 1 ,
Praveen
Kumar Tripathi 1 , Manoj Balakrishnan Menon 1 , James Gomes 1 , Perumal Vivekanandan * 1
und
Bishwajit Kundu * 1
1
Kusuma School of Biological Sciences, indisches Technologieinstitut, New Delhi-110016,
Indien.
2
Acharya Narendra Dev College, Universität Delhi, Neu- Delhi-110019, Indien
$
Gleicher Beitrag

* Korrespondierende Autoren - E-Mail:


bkundu@bioschool.iitd.ac.in
vperumal@bioschool.iitd.ac.in

Abstrakt:
Derzeit erleben wir eine schwere Epidemie, die durch das neuartige Coronavirus
2019 (2019-nCoV) verursacht wird. Die Entwicklung von 2019-nCoV ist weiterhin
schwer fassbar. Wir haben 4 Insertionen im Spike-Glykoprotein (S) gefunden, die
für 2019-nCoV einzigartig sind und in anderen Coronaviren nicht vorhanden
sind. Wichtig ist, dass Aminosäurereste in allen 4 Inserts mit denen in HIV-1
gp120 oder HIV-1 Gag identisch oder ähnlich sind . Interessanterweise deutet die
3D-Modellierung des 2019-nCoV darauf hin, dass die Insertionen, obwohl sie in
der primären Aminosäuresequenz diskontinuierlich sind , konvergieren und die
Rezeptorbindungsstelle bilden. Die Entdeckung von 4 einzigartigen Inserts im
2019-nCoV, die alle Identität / Ähnlichkeit mit Aminosäureresten in
Schlüsselstrukturproteinen von HIV-1 aufweisen, ist wahrscheinlich nicht
zufällig. Diese Arbeit liefert bisher unbekannte Erkenntnisse zu 2019-nCoV und
gibt Aufschluss über die Entwicklung und Pathogenität dieses Virus mit wichtigen
Implikationen für die Diagnose dieses Virus.

Einführung
Coronaviren (CoV) sind einzelsträngige positive-sense- RNA-Viren, die Tiere und
Menschen infizieren. Diese werden basierend auf ihrer Wirtsspezifität in 4
Gattungen eingeteilt: Alphacoronavirus, Betacoronavirus, Deltacoronavirus und
Gammacoronavirus (Snijder et al., 2006). Es gibt sieben bekannte Arten von CoVs,
zu denen 229E und NL63 (Gattung Alphacoronavirus), OC43, HKU1, MERS und
SARS (Gattung Betacoronavirus) gehören. Während 229E, NL63, OC43 und HKU1
häufig infizieren Menschen, die SARS und MERS Ausbruch im Jahr 2002 bzw.
2012 eingetreten , wenn das Virus überkreuzten vom Tier auf den Menschen
verursacht erhebliche Mortalität (J. Chan et al, nd;. JFW Chan et al., 2015). Im
Dezember 2019 wurde aus Wuhan, China, ein weiterer Ausbruch des Coronavirus
gemeldet, der auch von Tieren auf Menschen übertragen wurde. Dieses neue
Virus wurde von der Weltgesundheitsorganisation (WHO) vorübergehend als
neuartiges Coronavirus (2019-nCoV) bezeichnet (JF-W. Chan et al., 2020; Zhu et al.,
2020). Obwohl es mehrere Hypothesen zur Entstehung von 2019-nCoV gibt, ist die
Quelle dieses anhaltenden Ausbruchs noch nicht bekannt.
Die Übertragungsmuster von 2019-nCoV ähneln den Übertragungsmustern, die in
den vorangegangenen Ausbrüchen dokumentiert wurden, unter anderem durch
Körper- oder Aerosolkontakt mit mit dem Virus infizierten Personen.

bioRxiv Preprint zum ersten Mal online gestellt 31. Januar 2020; doi: http://dx.doi.org/10.1101/2020.01.30.927871 . Das
Copyright für diesen Preprint (der nicht von Fachleuten begutachtet wurde) liegt beim Autor / Förderer, der bioRxiv die Lizenz
zur unbefristeten Darstellung des Preprint erteilt hat. Es wird unter einer internationalen CC-BY-NC-ND 4.0-Lizenz zur
Verfügung gestellt .

Aus Wuhan wurden Fälle von leichten bis schweren Erkrankungen und
Todesfälle aufgrund der Infektion gemeldet. Dieser Ausbruch hat schnell
entfernte Nationen wie Frankreich, Australien und die USA unter anderem
verbreitet. Die Zahl der Fälle innerhalb und außerhalb Chinas nimmt stark zu.
Unser derzeitiges Verständnis beschränkt sich auf die Virusgenomsequenzen und
bescheidene epidemiologische und klinische Daten. Eine umfassende Analyse der
verfügbaren 2019-nCoV-Sequenzen kann wichtige Hinweise liefern, die unser
derzeitiges Verständnis zur Bewältigung des anhaltenden Ausbruchs verbessern
können.

Das Spike-Glycoprotein (S) des Cornonavirus wird in zwei Untereinheiten (S1 und
S2) gespalten. Die S1-Untereinheit hilft bei der Rezeptorbindung und die S2-
Untereinheit erleichtert die Membranfusion (Bosch et al., 2003; Li, 2016). Die
Spike-Glykoproteine von Coronoviren sind wichtige Determinanten des
Gewebetropismus und des Wirtsbereichs. Darüber hinaus sind die Spike-
Glykoproteine wichtige Ziele für die Impfstoffentwicklung (Du et al., 2013). Aus
diesem Grund sind die Spike-Proteine die am intensivsten untersuchten unter
den Coronaviren. Wir haben daher versucht, das Spike-Glykoprotein des
2019-nCoV zu untersuchen, um seine Evolution, die Sequenz neuartiger
Merkmale und strukturelle Merkmale mithilfe von Rechenwerkzeugen zu
verstehen.

Methodik
Retrieval und Alignment von Nukleinsäure- und Proteinsequenzen
Wir haben alle verfügbaren Coronavirus-Sequenzen (n = 55) aus der NCBI-
Genomdatenbank (https://www.ncbi.nlm.nih.gov/) abgerufen und die GISAID
(Elbe & Buckland-Merrett, 2017) verwendet [https: //www.gisaid.org/], um alle
verfügbaren Sequenzen in voller Länge (n = 28) von 2019 - nCoV am 27. Januar
2020 abzurufen. Die mehrfache Sequenzabstimmung aller Coronavirus-Genome
wurde unter Verwendung der MUSCLE-Software durchgeführt (Edgar, 2004).
basierend auf der Nachbarverbindungsmethode. Von 55 Coronavirus-Genomen
wurden 32 repräsentative Genome aller Kategorien für die phylogenetische
Baumentwicklung unter Verwendung der MEGAX-Software verwendet (Kumar et
al., 2018). Der nächste Verwandte war SARS CoV. Die Glykoproteinregion von
SARS CoV und 2019-nCoV wurde unter Verwendung von Multalin-Software
(Corpet, 1988) ausgerichtet und visualisiert. Die identifizierte Aminosäure- und
Nukleotidsequenz wurde mit der gesamten viralen Genomdatenbank unter
Verwendung von BLASTp und BLASTn abgeglichen. Die Konservierung der
Nucleotid- und Aminosäuremotive in 28 klinischen Varianten des 2019-nCoV-
Genoms wurde durch Durchführung eines Mehrfachsequenz-Alignments unter
Verwendung der MEGAX-Software dargestellt. Die dreidimensionale Struktur von
2019-nCoV- Glykoprotein wurde unter Verwendung des SWISS-MODEL- Online-
Servers (Biasini et al., 2014) erzeugt und die Struktur unter Verwendung von
PyMol (DeLano, 2002) markiert und visualisiert.

Ergebnisse
Unheimliche Ähnlichkeit neuartiger Inserts im 2019-nCoV- Spike-Protein
mit HIV-1 gp120 und Gag
Unser phylogenter Baum von Coronaviren voller Länge legt nahe, dass
2019-nCoV eng mit SARS CoV verwandt ist [Abb. 1]. Darüber hinaus haben
andere neuere Studien die 2019-nCoV mit der SARS CoV in Verbindung gebracht.
Wir verglichen daher die Spike-Glykoproteinsequenzen des 2019-nCoV mit
denen des SARS-CoV (NCBI-Zugangsnummer: AY390556.1). Bei sorgfältiger
Prüfung des Sequenz-Alignments stellten wir fest, dass das 2019-nCoV-Spike-
Glykoprotein 4 Insertionen enthält [Abb. 2]. Um weiter zu untersuchen, ob diese
Inserts in einem anderen Koronavirus vorhanden sind, haben wir ein Vielfaches
durchgeführt

bioRxiv Preprint zum ersten Mal online gestellt 31. Januar 2020; doi: http://dx.doi.org/10.1101/2020.01.30.927871 . Das
Copyright für diesen Preprint (der nicht von Fachleuten begutachtet wurde) liegt beim Autor / Förderer, der bioRxiv die Lizenz
zur unbefristeten Darstellung des Preprint erteilt hat. Es wird unter einer internationalen CC-BY-NC-ND 4.0-Lizenz zur
Verfügung gestellt .

Sequenz - Alignment der Spike - Glykoprotein - Aminosäuresequenzen aller


verfügbaren coronaviruses (n = 55) [siehe Tabelle S.File1] in NCBI RefSeq
(ncbi.nlm.nih.gov) Diese enthält eine Folge von 2019-Ncov [Fig.S1] . Wir fanden
heraus, dass diese 4 Insertionen [Inserts 1, 2, 3 und 4] nur für 2019-nCoV gelten
und in anderen analysierten Coronaviren nicht vorhanden sind. Eine andere
Gruppe aus China hatte drei Insertionen dokumentiert, in denen weniger
Spike-Glykoprotein-Sequenzen von Coronaviren verglichen wurden. Eine
andere Gruppe aus China hatte drei Insertionen dokumentiert, in denen
weniger Spike-Glykoprotein-Sequenzen von Coronaviren verglichen wurden
(Zhou et al., 2020).
Abbildung 1: Die Maximum-Likelihood-Genealogie zeigt die Evolution von 2019-nCoV : Die
Evolutionsgeschichte
wurde unter Verwendung der Maximum-Likelihood-Methode und des auf einer
JTT- Matrix basierenden Modells abgeleitet. Der Baum mit der höchsten Log-
Wahrscheinlichkeit (12458,88) wird angezeigt. Anfängliche Bäume für die
heuristische Suche wurden automatisch erhalten, indem Neighbor- Join- und
BioNJ-Algorithmen auf eine Matrix von paarweisen Abständen angewendet
wurden, die unter Verwendung eines JTT-Modells geschätzt wurden, und dann
die Topologie mit überlegener Log-Wahrscheinlichkeit ausgewählt wurde

bioRxiv Preprint zum ersten Mal online gestellt 31. Januar 2020; doi: http://dx.doi.org/10.1101/2020.01.30.927871 . Das
Copyright für diesen Preprint (der nicht von Fachleuten begutachtet wurde) liegt beim Autor / Förderer, der bioRxiv die Lizenz
zur unbefristeten Darstellung des Preprint erteilt hat. Es wird unter einer internationalen CC-BY-NC-ND 4.0-Lizenz zur
Verfügung gestellt .

Wert. Diese Analyse umfasste 5 Aminosäuresequenzen. Es gab insgesamt 1387


Positionen im endgültigen Datensatz. Evolutionsanalysen wurden in MEGA X
durchgeführt.
2: Mehrfachsequenz-Alignment zwischen Spike-Proteinen von 2019-nCoV und
SARS. Die Sequenzen von Spike-Proteinen von 2019-nCoV (Wuhan-HU-1,
Accession NC_045512) und von SARS CoV (GZ02, Accession AY390556) wurden
unter Verwendung von MultiAlin-Software ausgerichtet. Die unterschiedlichen
Stellen sind in Feldern hervorgehoben.

Wir analysierten dann alle verfügbaren Volllängen - Sequenzen (n = 28) des


2019-Ncov in GISAID (Elbe & Buckland-Merrett, 2017) , wie am 27. Januar, 2020
Gegenwart dieser Einsätze. Da die meisten dieser Sequenzen nicht annotiert sind,
haben wir die Nukleotidsequenzen des Spike-Glykoproteins aller verfügbaren
2019-nCoV- Sequenzen mit BLASTp verglichen. Interessanterweise waren alle 4
Insertionen in allen verfügbaren 2019-nCoV-Sequenzen, die analysiert wurden,
absolut (100%) konserviert [Abb. S2, Abb. S3].

bioRxiv Preprint zum ersten Mal online gestellt 31. Januar 2020; doi: http://dx.doi.org/10.1101/2020.01.30.927871 . Das
Copyright für diesen Preprint (der nicht von Fachleuten begutachtet wurde) liegt beim Autor / Förderer, der bioRxiv die Lizenz
zur unbefristeten Darstellung des Preprint erteilt hat. Es wird unter einer internationalen CC-BY-NC-ND 4.0-Lizenz zur
Verfügung gestellt .

Wir haben dann das ausgerichtete Genom übersetzt und festgestellt, dass diese
Inserts in allen Wuhan 2019-nCoV-Viren mit Ausnahme des 2019-nCoV- Virus von
Bat als Wirt vorhanden sind [Abb. S4]. Fasziniert von den 4 hochkonservierten
Beilagen, die nur für 2019-nCoV erhältlich sind , wollten wir ihre Herkunft
verstehen. Zu diesem Zweck haben wir das lokale Alignment von 2019-nCoV mit
jedem Insert als Abfrage für alle Virusgenome verwendet und Treffer mit 100%
Sequenzabdeckung berücksichtigt. Überraschenderweise stimmte jeder der vier
Inserts mit kurzen Segmenten der Human Immunodeficiency Virus-1 (HIV-1) -
Proteine überein. Die Aminosäurepositionen der Inserts in 2019-nCoV und die
entsprechenden Reste in HIV-1 gp120 und HIV-1 Gag sind in Tabelle 1 gezeigt. Die
ersten 3 Inserts (Insert 1,2 und 3) sind auf kurze Aminosäuresegmente
ausgerichtet Reste in HIV-1 gp120. Der Einsatz 4 war auf HIV-1- Gag ausgerichtet.
Das Insert 1 (6 Aminosäurereste) und Insert 2 (6 Aminosäurereste) im Spike-
Glykoprotein von 2019-nCoV sind zu 100% identisch mit den auf HIV-1 gp120
kartierten Resten . Das Insert 3 (12 Aminosäurereste) in 2019-nCoV ist mit Lücken
auf HIV-1 gp120 abgebildet [siehe Tabelle 1]. Das Insert 4 (8 Aminosäurereste) ist
mit Lücken auf HIV-1- Gag abgebildet.

Obwohl die 4 Inserts diskontinuierliche kurze Abschnitte von Aminosäuren im


Spike-Glykoprotein von 2019-nCoV darstellen, teilt die Tatsache, dass alle drei
eine Aminosäureidentität oder -ähnlichkeit mit HIV-1 gp120 und HIV-1 Gag (unter
allen annotierten Virusproteinen) aufweisen legt nahe, dass dies kein zufälliger
Befund ist. Mit anderen Worten, man kann sporadisch eine zufällige
Übereinstimmung für einen Abschnitt von 6-12 zusammenhängenden
Aminosäureresten in einem nicht verwandten Protein erwarten . Es ist jedoch
unwahrscheinlich, dass alle 4 Inserts im 2019-nCoV- Spike-Glykoprotein zufällig
mit 2 Schlüsselstrukturproteinen eines nicht verwandten Virus (HIV-1)
übereinstimmen .
Die Aminosäurereste der Inserts 1, 2 und 3 von 2019-nCoV- Spike-Glycoprotein,
die auf HIV-1 abgebildet wurden, waren Teil der Domänen V4, V5 und V1 in
gp120 [Tabelle 1]. Da die 2019-nCoV-Inserts variablen Regionen von
HIV-1 zugeordnet waren, waren sie in HIV-1 gp120 nicht allgegenwärtig , sondern
beschränkten sich auf ausgewählte Sequenzen von HIV-1 [siehe S.File1],
hauptsächlich aus Asien und Afrika.

Das HIV-1- Gag-Protein ermöglicht die Wechselwirkung von Viren mit negativ
geladenen Wirtsoberflächen (Murakami, 2008), und eine hohe positive Ladung
des Gag-Proteins ist ein Schlüsselmerkmal für die Wechselwirkung zwischen
Wirt und Virus . Bei der Analyse der pI-Werte für jeden der 4 Inserts in
2019-nCoV und der entsprechenden Abschnitte der Aminosäurereste von HIV-1-
Proteinen stellten wir fest, dass a) die pI-Werte für jedes analysierte Paar sehr
ähnlich waren, b) die meisten dieser pI-Werte waren 10 ± 2 [siehe Tabelle 1].
Bemerkenswerterweise waren die pI-Werte trotz der Lücken in den Beilagen 3
und 4 vergleichbar. Diese Gleichförmigkeit der pI-Werte für alle 4 Inserts
verdient weitere Untersuchung.

Da keines dieser 4 Inserts in einem anderen Coronavirus vorhanden ist, stellt die
für diese Inserts kodierende Genomregion ideale Kandidaten für das Design von
Primern dar, die 2019-nCoV von anderen Coronaviren unterscheiden können.

bioRxiv Preprint zum ersten Mal online gestellt 31. Januar 2020; doi: http://dx.doi.org/10.1101/2020.01.30.927871 . Das
Copyright für diesen Preprint (der nicht von Fachleuten begutachtet wurde) liegt beim Autor / Förderer, der bioRxiv die Lizenz
zur unbefristeten Darstellung des Preprint erteilt hat. Es wird unter einer internationalen CC-BY-NC-ND 4.0-Lizenz zur
Verfügung gestellt .

         
HIV HIV      
Protein Genom Nummer Gesamt Pi
  Virus  
 
   
 
Motive   Motivausrichtung   und Quelle von Polar Verkohlen Valu
  Glykoprotein      
          Variable Land/ Rückstände ge e
         
Region Untertyp      
       
Thailand      
71 76   */
Einfügen 2019-nCoV (GP) TNGTKR   gp120- 5 2 11
1 HIV1 (GP120) TNGTKR  
V4 CRF01_ 5 2 11
 
    404 409     AE      

                   
150 145
 
Einfügen 2019-nCoV (GP) HKNNKS   gp120- Kenia*/ 6 2 10
2 HIV1 (GP120) HKNNKS  
V5 G 6 2 10
    462 467            
   
Einfügen 2019-nCoV (GP) 245 256 gp120- 8 2 10,84
RSYL - - - - TPGDSSSG  
3 HIV1 (GP120) RTYL FNE TRGNSSSG   V1 Indien * / C 10 1 8.75
   
    136 150            
                   

2019-nCoV (Poly 676 684


     
Einfügen QTNS ----------------------- PRRA 6 2 12.00
4 P) QTNS SILMQRSNFKG PRRA
Gag Indien * / C 12 4 12.30
   
  HIV1 (Gag) 366  384          
               
                   

Tabelle 1: Ausgerichtete Sequenzen von 2019-nCoV und gp120-Protein von


HIV-1 mit ihren Positionen in der Primärsequenz des Proteins. Alle Einsätze
haben eine hohe Dichte an positiv geladenen Rückständen. Die deletierten
Fragmente in Insert 3 und 4 erhöhen das Verhältnis von positiver Ladung zu
Oberfläche. * siehe Supp. Tabelle 1 für Zugangsnummern

Die neuen Inserts sind Teil der Rezeptorbindungsstelle von 2019-nCoV


Um strukturelle Einblicke zu erhalten und die Rolle dieser Insertionen in
2019-nCoV- Glykoprotein zu verstehen , haben wir seine Struktur basierend auf
der verfügbaren Struktur von SARS-Spike-Glykoprotein (PDB: 6ACD.1.A)
modelliert. Der Vergleich der modellierten Struktur zeigt, dass sich die Inserts 1, 2
und 3 zwar an nicht zusammenhängenden Stellen in der Proteinprimärsequenz
befinden, sich jedoch falten, um den Teil der Glykoproteinbindungsstelle zu
bilden, der den Wirtsrezeptor erkennt (Kirchdoerfer et al., 2016). (Figur 4). Das
Insert 1 entspricht der NTD (N-terminale Domäne) und die Inserts 2 und 3
entsprechen der CTD (C-terminale Domäne) der S1-Untereinheit im 2019-nCoV-
Spike-Glycoprotein. Der Einsatz 4 befindet sich an der Verbindungsstelle von SD1
(Unterdomäne 1) und SD2 (Unterdomäne 2) der S1-Untereinheit (Ou et al., 2017).
Wir vermuten, dass diese Insertionen der Glykoprotein-Bindungsstelle
zusätzliche Flexibilität verleihen, indem sie eine hydrophile Schleife in der
Proteinstruktur bilden, die die Wechselwirkungen zwischen Virus und Wirt
erleichtern oder verstärken kann .

bioRxiv Preprint zum ersten Mal online gestellt 31. Januar 2020; doi: http://dx.doi.org/10.1101/2020.01.30.927871 . Das
Copyright für diesen Preprint (der nicht von Fachleuten begutachtet wurde) liegt beim Autor / Förderer, der bioRxiv die Lizenz
zur unbefristeten Darstellung des Preprint erteilt hat. Es wird unter einer internationalen CC-BY-NC-ND 4.0-Lizenz zur
Verfügung gestellt .
Abbildung 3. Modelliertes Homotrimer - Spike-Glykoprotein des 2019-nCoV-
Virus. Die Inserts von HIV-Hüllprotein sind mit farbigen Kügelchen gezeigt, die
an der Bindungsstelle des Proteins vorhanden sind.
Evolutionsanalyse von 2019-nCoV
Es wurde spekuliert, dass 2019-nCoV eine Variante des Coronavirus ist, die aus
einer tierischen Quelle stammt, die auf den Menschen übertragen wurde.
Angesichts der Änderung der Spezifität für den Wirt beschlossen wir, die
Sequenzen des Spike-Glykoproteins (S-Protein) des Virus zu untersuchen. S-
Proteine sind Oberflächenproteine, die dem Virus bei der Erkennung und
Bindung des Wirts helfen. Somit kann eine Änderung dieser Proteine als eine
Änderung der Wirtsspezifität des Virus widergespiegelt werden. Um zu wissen ,
die Veränderungen in der S - Protein - Genen von 2019-Ncov und seine Folgen in
strukturellen Umordnungen führten wir in-Sillico Analyse von 2019-Ncov in
Bezug auf alle anderen Viren. Ein Mehrfachsequenz-Alignment zwischen den S-
Protein-Aminosäuresequenzen von 2019-nCoV, Bat-SARS-Like, SARS-GZ02 und
MERS ergab, dass sich S-Protein mit der größten signifikanten Diversität
gegenüber SARS-GZ02 entwickelt hat (Abbildung 1).

Insertionen in die Spike-Proteinregion von 2019-nCoV

Da das S-Protein von 2019-nCoV die engste Verwandtschaft mit SARS GZ02
aufweist, wurde die Sequenz, die für die Spike-Proteine dieser beiden Viren
kodiert, mit der MultiAlin-Software verglichen. Wir fanden vier neue Insertionen
im Protein von 2019-nCoV- „GTNGTKR“ (IS1), „HKNNKS“ (IS2), „GDSSSG“ (IS3) und
„QTNSPRRA“ (IS4) (Abbildung 2). Zu unserer Überraschung fehlten diese
Sequenzinsertionen nicht nur im S-Protein von SARS, sondern wurden auch bei
keinem anderen Mitglied der Coronaviridae- Familie beobachtet (ergänzende
Abbildung). Dies ist verblüffend, da es ziemlich unwahrscheinlich ist, dass ein
Virus in kurzer Zeit auf natürliche Weise solche einzigartigen Insertionen
erhalten hat.

bioRxiv Preprint zum ersten Mal online gestellt 31. Januar 2020; doi: http://dx.doi.org/10.1101/2020.01.30.927871 . Das
Copyright für diesen Preprint (der nicht von Fachleuten begutachtet wurde) liegt beim Autor / Förderer, der bioRxiv die Lizenz
zur unbefristeten Darstellung des Preprint erteilt hat. Es wird unter einer internationalen CC-BY-NC-ND 4.0-Lizenz zur
Verfügung gestellt .

Insertionen haben Ähnlichkeit mit HIV


Es wurde beobachtet, dass die Insertionen in allen Genomsequenzen des
2019-nCoV- Virus vorhanden waren, die aus den jüngsten klinischen Isolaten
erhältlich waren (ergänzende 1). Um die Quelle dieser Insertionen in
2019-nCoV zu kennen, wurde eine lokale Ausrichtung mit BLASTp durchgeführt,
wobei diese Insertionen als Abfrage für das gesamte Virusgenom verwendet
wurden. Unerwarteterweise stimmten alle Insertionen mit dem humanen
Immundefizienz- Virus-1 (HIV-1) überein. Eine weitere Analyse ergab, dass
ausgerichtete Sequenzen von HIV-1 mit 2019-nCoV vom Oberflächenglykoprotein
gp120 abgeleitet wurden (Aminosäuresequenzpositionen: 404-409, 462-467, 136-
150) und aus Gag-Protein (366-384 Aminosäuren) (Tabelle 1). HIV-Gag-Protein ist
an der Bindung der Wirtsmembran, der Verpackung des Virus und der Bildung
virusähnlicher Partikel beteiligt. Gp120 spielt eine entscheidende Rolle bei der
Erkennung der Wirtszelle durch Bindung an den Primärrezeptor CD4. Diese
Bindung induziert strukturelle Umlagerungen in GP120 und erzeugt eine
Bindungsstelle mit hoher Affinität für einen Chemokin- Co-Rezeptor wie CXCR4
und / oder CCR5.

Diskussion
Der aktuelle Ausbruch von 2019-nCoV erfordert eine gründliche Untersuchung
und ein umfassendes Verständnis seiner Fähigkeit, Menschen zu infizieren. Unter
Berücksichtigung der Tatsache, dass sich die Präferenz des Wirts gegenüber
früheren Coronaviren gegenüber diesem Virus deutlich geändert hat, haben wir
die Veränderung des Spike-Proteins zwischen 2019-nCoV und anderen Viren
untersucht. Wir fanden vier neue Insertionen im S-Protein von 2019-nCoV im
Vergleich zu seinem nächsten Verwandten, SARS CoV. Die Genomsequenz der
letzten 28 klinischen Isolate zeigte, dass die für diese Insertionen kodierende
Sequenz unter all diesen Isolaten konserviert ist. Dies weist darauf hin, dass diese
Insertionen vorzugsweise vom 2019-nCoV erworben wurden, was ihm einen
zusätzlichen Überlebens- und Infektionsvorteil verschafft. Bei näherer
Betrachtung stellten wir fest, dass diese Insertionen mit
HIV-1 vergleichbar waren. Unsere Ergebnisse belegen eine erstaunliche
Beziehung zwischen dem gp120 und dem Gag-Protein von HIV mit dem
2019-nCoV- Spike-Glykoprotein. Diese Proteine sind von entscheidender
Bedeutung, damit die Viren ihre Wirtszellen identifizieren und an diese binden
und sich viral zusammensetzen können (Beniac et al., 2006). Da
Oberflächenproteine für den Wirtstropismus verantwortlich sind, implizieren
Änderungen in diesen Proteinen eine Änderung in der Wirtsspezifität des Virus.
Berichten aus China zufolge hat 2019-nCoV an Wirtsspezifität gewonnen, da
ursprünglich bekannt war, dass das Virus Tiere und nicht Menschen infiziert,
aber nach den Mutationen hat es auch beim Menschen Tropismus gewonnen.

Die 3D-Modellierung der Proteinstruktur zeigte, dass diese Insertionen an der


Bindungsstelle von 2019-nCoV vorliegen. Aufgrund des Vorhandenseins von
gp120-Motiven in 2019-nCoV- Spike-Glykoprotein an seiner Bindungsdomäne
schlagen wir vor, dass diese Motivinsertionen eine erhöhte Affinität gegenüber
Wirtszellrezeptoren bereitgestellt haben könnten. Darüber hinaus könnte diese
Strukturänderung auch die Reichweite der Wirtszellen erhöht haben, die
2019-nCoV infizieren kann. Nach unserem Kenntnisstand ist die Funktion dieser
Motive bei HIV noch nicht klar und muss untersucht werden. Der Austausch von
genetischem Material zwischen den Viren ist allgemein bekannt, und ein solcher
kritischer Austausch zeigt das Risiko und die Notwendigkeit auf, die Beziehungen
zwischen scheinbar nicht verwandten Virusfamilien zu untersuchen.

Schlussfolgerungen
Unsere Analyse des Spike-Glykoproteins von 2019-nCoV ergab mehrere
interessante Ergebnisse: Zunächst identifizierten wir 4 einzigartige Inserts im
2019-nCoV- Spike-Glykoprotein, die in keinem anderen Coronavirus enthalten
sind, das bis heute gemeldet wurde. Zu unserer Überraschung wurden alle 4
Beilagen im 2019-nCoV zugeordnet
bioRxiv Preprint zum ersten Mal online gestellt 31. Januar 2020; doi: http://dx.doi.org/10.1101/2020.01.30.927871 . Das
Copyright für diesen Preprint (der nicht von Fachleuten begutachtet wurde) liegt beim Autor / Förderer, der bioRxiv die Lizenz
zur unbefristeten Darstellung des Preprint erteilt hat. Es wird unter einer internationalen CC-BY-NC-ND 4.0-Lizenz zur
Verfügung gestellt .

kurze Aminosäuresegmente in HIV-1 gp120 und Gag unter allen annotierten


Virusproteinen in der NCBI-Datenbank. Diese unheimliche Ähnlichkeit neuartiger
Inserts im 2019-nCoV-Spike-Protein mit HIV-1 gp120 und Gag ist wahrscheinlich
nicht zufällig. Ferner legt nahe , dass die 3D - Modellierung atleast 3 der
einzigartigen Einsätze, die nicht zusammenhängend in der primären
Proteinsequenz der 2019-Ncov Spike - Glycoprotein Converge bildet die
wesentlichen Komponenten der Rezeptor - Bindungsstelle. Es ist zu beachten,
dass alle 4 Inserts einen pI-Wert von etwa 10 aufweisen, was die
Wechselwirkungen zwischen Virus und Wirt erleichtern kann .
Zusammengenommen deuten unsere Ergebnisse auf eine unkonventionelle
Entwicklung von 2019-nCoV hin , die weitere Untersuchungen rechtfertigt.
Unsere Arbeit beleuchtet neue evolutionäre Aspekte des 2019-nCoV und hat
Auswirkungen auf die Pathogenese und Diagnose dieses Virus.

Verweise

Beniac, DR. Andonov, A., Grudeski, E. & Booth, TF (2006). Architektur des SARS-
Coronavirus-Präfix-Spikes. Nature Structural and Molecular Biology , 13 (8), 751–752.
https://doi.org/10.1038/nsmb1123
Biasini, M., Bienert, S., Waterhouse, A., Arnold, K., Studer, G., Schmidt, T., Kiefer, F.,
Cassarino, TG, Bertoni, M., Bordoli, L., & Schwede, T. (2014). SWISS-MODEL:
Modellierung der Tertiär- und Quartärstruktur von Proteinen mit Hilfe von
Evolutionsinformationen. Nucleic Acids Research .
https://doi.org/10.1093/nar/gku340
Bosch, BJ, van der Zee, R., de Haan, CAM & Rottier, PJM (2003). Das Coronavirus-Spike-
Protein ist ein Klasse-I-Virus-Fusionsprotein: Strukturelle und funktionelle
Charakterisierung des Fusionskernkomplexes. Journal of Virology , 77 (16),
8801–8811. https://doi.org/10.1128/jvi.77.16.8801- 8811.2003
Chan, J. F.-W., Kok, K.-H., Zhu, Z., Chu, H., To, K. K.-W., Yuan, S. & Yuen, K.-Y . (2020).
Genomische Charakterisierung des neuartigen humanpathogenen Coronavirus von
2019, das nach einem Besuch in Wuhan von einem Patienten mit atypischer
Pneumonie isoliert wurde. Emerging Microbes & Infections , 9 (1),
221–236. https://doi.org/10.1080/22221751.2020.1719902
Chan, JFW, Lau, SKP, To, KKW, Cheng, VCC, Woo, PCY und Yuen, K.-Y. (2015). Naher Osten
Atmungssyndrom Coronavirus: Ein weiteres zoonotisches Betacoronavirus, das eine
SARS- ähnliche Krankheit verursacht . https://doi.org/10.1128/CMR.00102-14
Chan, J., To, K., Tse, H., Jin, D., Microbiology , K. Y.-T. in & 2013 undefiniert. (nd).
Zwischenartenübertragung und Entstehung neuer Viren: Lehren aus Fledermäusen
und Vögeln. Elsevier .

Corpet, F. (1988). Mehrfachsequenzausrichtung mit hierarchischem Clustering. Nucleic


Acids Research . https://doi.org/10.1093/nar/16.22.10881
DeLano, WL (2002). Das PyMOL Molecular Graphics System, Version 1.1. Schr {ö}
dinger LLC . https://doi.org/10.1038/hr.2014.17
Du, L., Zhao, G., Kou, Z., Ma, C., Sun, S., Poon, VKM, Lu, L., Wang, L., Debnath, AK, Zheng, B.-J. , Zhou,
Y. & Jiang, S. (2013). Identifizierung einer Rezeptorbindungsdomäne im S-Protein des
neuartigen humanen Coronavirus-Coronavirus im Nahen Osten als essentielles Ziel für
die Impfstoffentwicklung. Journal of Virology , 87 (17),
9939–9942. https://doi.org/10.1128/jvi.01048- 13

bioRxiv Preprint zum ersten Mal online gestellt 31. Januar 2020; doi: http://dx.doi.org/10.1101/2020.01.30.927871 . Das
Copyright für diesen Preprint (der nicht von Fachleuten begutachtet wurde) liegt beim Autor / Förderer, der bioRxiv die Lizenz
zur unbefristeten Darstellung des Preprint erteilt hat. Es wird unter einer internationalen CC-BY-NC-ND 4.0-Lizenz zur
Verfügung gestellt .

Edgar, RC (2004). MUSKEL: Mehrfachsequenz-Ausrichtung mit hoher Genauigkeit und


hohem Durchsatz. Nucleic Acids Research . https://doi.org/10.1093/nar/gkh340
Elbe, S. & Buckland-Merrett, G. (2017). Daten, Krankheit und Diplomatie: GISAIDs innovativer
Beitrag zur globalen Gesundheit. Globale Herausforderungen .
https://doi.org/10.1002/gch2.1018
Kirchdörfer, RN, Cottrell, CA, Wang, N., Pallesen, J., Yassine, HM, Turner, HL, Corbett, KS,
Graham, BS, McLellan, JS & Ward, AB (2016). Präfusionsstruktur eines humanen
Coronavirus-Spike-Proteins. Natur . https://doi.org/10.1038/nature17200
Kumar, S., Stecher, G., Li, M., Knyaz, C. und Tamura, K. (2018). MEGA X: Analyse der
molekularen Evolutionsgenetik auf verschiedenen Computerplattformen.
Molekularbiologie und Evolution . https://doi.org/10.1093/molbev/msy096
Li, F. (2016). Struktur, Funktion und Entwicklung von Coronavirus-Spike-Proteinen.
Annual Review of Virology , 3 (1), 237–261.
https://doi.org/10.1146/annurev-virology-110615-042301
Murakami, T. (2008). Rollen der Wechselwirkungen zwischen Env- und Gag-Proteinen im
HIV-1- Replikationszyklus. Microbiology and Immunology , 52 (5),
287–295. https://doi.org/10.1111/j.1348- 0421.2008.00008.x
X. Ou, H. Guan, B. Qin, Z. Mu, JA Wojdyla, M. Wang, SR Dominguez, Z. Qian & S. Cui (2017).
Kristallstruktur der Rezeptorbindungsdomäne des Spike-Glykoproteins des humanen
Betacoronavirus HKU1. Naturkommunikation .
https://doi.org/10.1038/ncomms15216
Snijder, EJ, van der Meer, Y., Zevenhoven-Dobbe, J., Onderwater, JJM, van der Meulen, J.,
Koerten, HK, & Mommaas, AM (2006). Ultrastruktur und Entstehung von
Membranvesikeln, die mit dem Replikationskomplex des schwerwiegenden akuten
respiratorischen Syndroms des Coronavirus assoziiert sind. Journal of Virology , 80 (12),
5927–5940. https://doi.org/10.1128/JVI.02501-05
Zhou, P., Yang, X.-L., Wang, X.-G., Hu, B., Zhang, L., Zhang, W., Si, H.-R., Zhu, Y., Li B., Huang, C.-L.,
Chen, H.-D., Chen, J., Luo, Y., Guo, H., Jiang, R.-D., Liu, M.-Q. , Chen, Y., Shen, X.-R., Wang, X.,… Shi,
Z.-L. (2020). Entdeckung eines neuartigen Coronavirus im Zusammenhang mit dem jüngsten
Ausbruch einer Lungenentzündung beim Menschen und seinem möglichen Ursprung bei
Fledermäusen. BioRxiv . https://doi.org/10.1101/2020.01.22.914952

Zhu, N., Zhang, D., Wang, W., Li, X., Yang, B., Song, J., Zhao, X., Huang, B., Shi, W., Lu, R., Niu, P.,
Zhan, F., Ma, X., Wang, D., Xu, W., Wu, G., Gao, GF, & Tan, W. (2020). Ein neuartiges
Coronavirus von Patienten mit Lungenentzündung in China, 2019. New England Journal
of Medicine , NEJMoa2001017. https://doi.org/10.1056/NEJMoa2001017
bioRxiv Preprint zum ersten Mal online gestellt 31. Januar 2020; doi: http://dx.doi.org/10.1101/2020.01.30.927871 . Das
Copyright für diesen Preprint (der nicht von Fachleuten begutachtet wurde) liegt beim Autor / Förderer, der bioRxiv die Lizenz
zur unbefristeten Darstellung des Preprint erteilt hat. Es wird unter einer internationalen CC-BY-NC-ND 4.0-Lizenz zur
Verfügung gestellt .

Abb. S1 Mehrfachsequenz-Alignment des Glykoproteins der Coronaviridae-


Familie, das alle vier Inserts darstellt.
bioRxiv Preprint zum ersten Mal online gestellt 31. Januar 2020; doi: http://dx.doi.org/10.1101/2020.01.30.927871 . Das
Copyright für diesen Preprint (der nicht von Fachleuten begutachtet wurde) liegt beim Autor / Förderer, der bioRxiv die Lizenz
zur unbefristeten Darstellung des Preprint erteilt hat. Es wird unter einer internationalen CC-BY-NC-ND 4.0-Lizenz zur
Verfügung gestellt .

Abb. S2: Alle vier Inserts sind in den ausgerichteten 28 Wuhan 2019-nCoV -
Virusgenomen vorhanden, die von GISAID erhalten wurden. Die Lücke in der
Bat-SARS Like CoV in der letzten Reihe zeigt, dass Insert 1 und 4 für Wuhan
2019-nCoV sehr einzigartig sind.
bioRxiv Preprint zum ersten Mal online gestellt 31. Januar 2020; doi: http://dx.doi.org/10.1101/2020.01.30.927871 . Das
Copyright für diesen Preprint (der nicht von Fachleuten begutachtet wurde) liegt beim Autor / Förderer, der bioRxiv die Lizenz
zur unbefristeten Darstellung des Preprint erteilt hat. Es wird unter einer internationalen CC-BY-NC-ND 4.0-Lizenz zur
Verfügung gestellt .

Abb. S3 Phylogenetischer Baum von 28 klinischen Isolaten des Genoms von 2019-nCoV, einschließlich eines
aus Fledermaus als Wirt.
bioRxiv Preprint zum ersten Mal online gestellt 31. Januar 2020; doi: http://dx.doi.org/10.1101/2020.01.30.927871 . Das
Copyright für diesen Preprint (der nicht von Fachleuten begutachtet wurde) liegt beim Autor / Förderer, der bioRxiv die Lizenz
zur unbefristeten Darstellung des Preprint erteilt hat. Es wird unter einer internationalen CC-BY-NC-ND 4.0-Lizenz zur
Verfügung gestellt .

Ergänzende Abb. 4. Genom-Alingment der Coronaviridae-Familie. Hervorgehobene


schwarze Sequenzen sind die hier dargestellten Inserts.