Nachweis langer terminaler Wiederholungsorte, die von endogenen Retroviren in Dschungelgeflügel stammen, unter Verwendung von Ganzkörpern

Nachricht

HeimHeim / Nachricht / Nachweis langer terminaler Wiederholungsorte, die von endogenen Retroviren in Dschungelgeflügel stammen, unter Verwendung von Ganzkörpern

Apr 06, 2023

Nachweis langer terminaler Wiederholungsorte, die von endogenen Retroviren in Dschungelgeflügel stammen, unter Verwendung von Ganzkörpern

Wissenschaftliche Berichte Band 13,

Scientific Reports Band 13, Artikelnummer: 7380 (2023) Diesen Artikel zitieren

547 Zugriffe

2 Altmetrisch

Details zu den Metriken

Endogene Retroviren (ERVs) sind genetische Elemente im Genom, die Spuren vergangener Virusinfektionen enthalten. Die Charakterisierung von ERVs kann entscheidende Einblicke in die Evolution der Vögel liefern. Diese Studie zielte darauf ab, neue LTR-Loci (Long Terminal Repeat) zu identifizieren, die von ERVs (ERV-LTRs) abgeleitet sind, die im Referenzgenom fehlen, und zwar unter Verwendung von Gesamtgenom-Sequenzierungsdaten von roten Dschungelvögeln, grauen Dschungelvögeln, Ceylon-Dschungelvögeln und grünen Dschungelvögeln. Insgesamt wurden 835 ERV-LTR-Loci in den vier Gallus-Arten identifiziert. Die Anzahl der ERV-LTRs-Loci, die im roten Dschungelvogel und seinen Unterarten grauem Dschungelvogel, Ceylon-Dschungelvogel und grünem Dschungelvogel nachgewiesen wurden, betrug 362, 216, 193 bzw. 128. Der phylogenetische Baum stimmte mit zuvor gemeldeten Bäumen überein, was darauf hindeutet, dass aus den identifizierten ERV-LTR-Loci möglicherweise Rückschlüsse auf Beziehungen zwischen früheren Dschungelgeflügelpopulationen gezogen werden können. Von den nachgewiesenen Loci wurden 306 ERV-LTRs in der Nähe oder innerhalb der Gene identifiziert und einige waren mit der Zelladhäsion verbunden. Die erkannten ERV-LTR-Sequenzen wurden als endogene Vogel-Retrovirus-Familie, Vogel-Leukose-Virus-Untergruppe E, Ovex-1 und Maus-Leukämie-Virus-bezogene ERVs klassifiziert. Darüber hinaus wurde die Sequenz der EAV-Familie durch Kombination der U3-, R- und U5-Regionen in vier Muster unterteilt. Diese Ergebnisse tragen zu einem umfassenderen Verständnis der Eigenschaften von Dschungelgeflügel-ERVs bei.

Bei einer retroviralen Infektion wird das virale Genom revers transkribiert und als Provirus in das Wirtsgenom integriert. Im Prinzip verfügt das Provirus über alle Voraussetzungen für seine Replikation und besteht aus einer internen Region, die virale Gene (gag, pro/pol und env) kodiert, die bei der Integration von zwei identischen regulatorischen Long Terminal Repeats (LTRs) flankiert werden. Angrenzend an das Provirus befindet sich eine kurze Zielstellenduplikation (TSD) von 4–8 bp in der Wirtsgenomsequenz, die während der Integration erzeugt wird. Die vertikale Übertragung kann dazu führen, dass solche Viren Keimzellen und Fortpflanzungsgewebe infizieren, was zur Bildung endogener Retroviren (ERVs) bei den Nachkommen führt. Nach und nach können ERVs innerhalb von Populationen eine hohe Häufigkeit erreichen und sich schließlich innerhalb der Arten festsetzen1. Typische Vogel-ERVs umfassen die Familien des Vogelleukosevirus (ALV) und des endogenen Vogel-Retrovirus (EAV). Die ALV-Familie umfasst mehrere Untergruppen, und die ERVs der Untergruppe E, die als ALV-E bezeichnet werden, weisen häufig eine hohe strukturelle Integrität auf2. Einer als EAV-HP bekannten Sequenz innerhalb der EAV-Familie fehlt das pol-Gen, wohingegen EAV-0 und EAV-51 das pol-Gen, aber kein env-Gen haben3. Es wurde vermutet, dass ALV-E nur in Gallus gallus, einschließlich rotem Dschungelgeflügel (G. gallus gallus) und kommerziellen Hühnern, nachgewiesen wird, während die EAV-Familie in verschiedenen Gallus-Arten vorkommen könnte3.

Ungefähr 5 % des menschlichen Genoms stammen von ERVs, während ERVs etwa 3 % des Hühnergenoms ausmachen4,5. Allerdings gibt es wahrscheinlich eine beträchtliche Anzahl von ERVs, die bei Hühnern noch nicht entdeckt wurden. Diese ERVs haben eine Rolle bei der Gestaltung der Vogelartenvielfalt gespielt und der Geflügelindustrie aufgrund genetischer Krankheiten wirtschaftliche Verluste verursacht6,7,8. Die Charakterisierung von ERVs wird wesentliche Einblicke in die Vogelevolution liefern.

Mitochondriale DNA-Analysen deuten darauf hin, dass das Rote Dschungelhuhn eine Urhühnerart ist9,10. Zusätzlich zum Roten Dschungelvogel wurden drei weitere Arten der Gattung Gallus identifiziert: Grauer Dschungelvogel (G. sonneratii), Ceylon-Dschungelvogel (G. lafayetii) und Grüner Dschungelvogel (G. varius). Rote Dschungelvögel sind in weiten Teilen Südostasiens und Teilen Südasiens verbreitet, während die anderen drei Arten eingeschränktere Verbreitungsgebiete haben: Graue Dschungelvögel in Zentral- und Südindien, Ceylon-Dschungelvögel in Sri Lanka und Grüne Dschungelvögel auf Java und den umliegenden Inseln. Aktuelle molekulargenetische Studien legen nahe, dass verschiedene Gallus-Arten zur genetischen Zusammensetzung von Hühnern beitragen. Der Ursprung und die Geschichte der genetischen Vielfalt bei Hühnern sind jedoch immer noch nur teilweise geklärt11,12,13. In dieser Studie bestand das Ziel darin, die von ERV abgeleiteten LTR-Loci (ERV-LTR) im Genom anhand von Gesamtgenomdaten für die Gattung Gallus, einschließlich Unterarten, zu identifizieren. Darüber hinaus wurden durch den Vergleich der ERV-LTR-Loci verschiedener Arten und der nachgewiesenen Sequenzen von ERV-LTRs die Eigenschaften von ERV-LTRs aus der Gattung Gallus geklärt.

Hier wurden 100-bp-Paired-End-Reads mit BWA-MEM14 kartiert, und die mittlere Gesamtsequenztiefe betrug 30,6 × (13,5–42,9) für alle Dschungelvögel (Tabelle S1). Die Kartierungsergebnisse sind in Tabelle S1 dargestellt. Mehr als 95,3 % der Paired-End-Reads für jedes Dschungelgeflügel wurden dem Referenz-Gallus-Genom zugeordnet, wohingegen nur 1,56–31,59 % nicht ordnungsgemäß kartiert wurden (falsche Reads). Darüber hinaus waren 0,10–1,86 % der Lesevorgänge Singletons, die nur einer Seite zugeordnet waren. Der Analyseprozess (weitere Einzelheiten finden Sie im Abschnitt „Methoden“) wurde gemäß der Methodik früherer Studien15,16 durchgeführt. Die Gesamtzahl der für jedes Individuum identifizierten Kandidaten-ERV-LTR-Insertionsorte lag zwischen 39 und 2011 (Tabelle S1), basierend auf der RetroSeq-Software17. Als nächstes wurde der Integrated Genome Viewer (IGV)18 eingesetzt, um das Vorhandensein oder Fehlen von TSDs für alle erkannten Loci für jedes Individuum zu bestätigen. Darüber hinaus wurden Contigs mithilfe der extrahierten Lesevorgänge aus den TSDs erstellt und mit Blastn19 analysiert. Insgesamt wurden 835 ERV-LTR-Loci identifiziert. Die meisten der identifizierten ERV-LTRs waren mit der LTR-Region der EAV-Familie verwandt (EAV-HP, EAV-51, EAV-0, ev/J oder endogener Hühner-LTR). Zwanzig LTR-Sequenzen von ALV-E wurden identifiziert, und diese Sequenzen waren nur im Roten Dschungelgeflügel und seinen Unterarten vorhanden (Tabelle S2). In chr2:133.314.053 hatten alle Arten und Unterarten einen Contig, der dem LTR des mit dem murinen Leukämievirus (MLV) verwandten endogenen Retrovirus (DQ280312) ähnelte. Darüber hinaus hatten auf chr3:54.480.182 alle Arten und Unterarten, mit Ausnahme des grünen Dschungelgeflügels, einen Ovex1 (FJ406461). Von den nachgewiesenen ERVs waren 306 in der Nähe oder innerhalb des Gens vorhanden (Tabelle S2). Die Gene Ontology (GO)-Analyse unter Verwendung dieser Gensätze ergab sechs GO-Begriffe (Tabelle S3). Die am höchsten bewertete GO-Kategorie war „Zelladhäsion“ und umfasste Gene wie RELN, CNTN5, CDH20, CDH7, TENM1, SPON1, NRXN3 und CDH4.

Die Anzahl der ERV-Loci, die in fusionierten roten Dschungelvögeln, grauen Dschungelvögeln, Ceylon-Dschungelvögeln und grünen Dschungelvögeln nachgewiesen wurden, betrug 362, 216, 193 bzw. 128 (Tabelle 1). Die Anzahl der im Roten Dschungelgeflügel und seinen Unterarten nachgewiesenen ERV-Loci lag zwischen 61 und 123. Das Venn-Diagramm zeigt ERVs mit gemeinsamen Loci zwischen Unterarten oder Arten (Abb. 1A und B). Unter den Arten wurden 50 Loci als zwischen zwei oder mehr Arten gemeinsam identifiziert, wobei graues Dschungelgeflügel und Ceylon-Dschungelgeflügel mit 36 ​​gemeinsamen Loci den höchsten Grad an Gemeinsamkeit unter den Arten aufwiesen. Im Gegensatz dazu wurden keine gemeinsamen Loci zwischen grünem und rotem Dschungelgeflügel festgestellt. Unter den Unterarten des roten Dschungelgeflügels wurden 13 gemeinsame ERV-Loci entdeckt, wobei die häufigsten Loci zwischen dem roten Dschungelgeflügel und Gallus gallus spadiceus in Thailand identifiziert wurden, mit 57 gemeinsamen ERVs. Der auf allen Loci erstellte Clusterbaum ist in Abb. 1C dargestellt. Der Baum verzweigte sich in der folgenden Reihenfolge: grüner Dschungelvogel, Ceylon-Dschungelvogel, grauer Dschungelvogel und roter Dschungelvogel.

Anzahl der nachgewiesenen Loci des endogenen Retrovirus (ERV) zwischen Arten und Unterarten sowie dem Stammbaum. (A) Venn-Diagramm, das die Anzahl der ERV-Loci über vier Arten und die Überlappung zwischen den einzelnen ERV-Loci angibt. (B) Venn-Diagramm, das die Anzahl der ERV-Loci im Roten Dschungelgeflügel und seinen fünf Unterarten sowie die Überlappung zwischen den einzelnen ERV-Loci angibt. (C) Phylogenetischer Baum, der auf der Grundlage der Anwesenheit oder Abwesenheit von ERV-Loci erstellt wurde. Der Balken zeigt jede Entfernung an.

Insgesamt wurden 367 Loci erhalten, die in der Referenz fehlten und TSD-Sequenzen sowohl auf den 5'- als auch auf den 3'-flankierenden Contig-Sequenzen besaßen. Davon wurden 79 Loci über mehrere Arten oder Unterarten hinweg identifiziert. Diese Loci und Sequenzen sind in Tabelle S4 aufgeführt. Die an derselben Position erhaltenen Sequenzen waren sehr ähnlich. Beispielsweise wurden in den Gruppen neun Nukleotidsubstitutionen bei 346 bp auf chr3:99.634.554 identifiziert. Die phylogenetische Analyse ergab, dass 362 dieser Sequenzen zu den LTRs der EAV-Familie gehören. Gleichzeitig waren die verbleibenden fünf Loci LTRs der ALV-E-, Ovex1- und MLV-verwandten endogenen Retroviren an drei, einem bzw. einem Loci (Abb. 2A). Die LTRs der EAV-Familie wurden anhand ihrer Sequenzmuster weiter in vier Cluster unterteilt, wobei die LTR-Sequenzen in die Regionen U3, R und U5 unterteilt wurden (Abb. 2B und C). LTR-D stimmte mit EAV-21-3 (Zugangsnummer AJ6232390) überein. LTR-A teilte die R- und U5-Regionen mit LTR-D und U3 (im Einklang mit U3 des Beitritts AJ6232391) mit LTR-B. LTR-C stimmte in allen Regionen mit der Sequenz von M31065 überein. In ähnlicher Weise teilten LTR-B und LTR-C identische R- und U5-Regionen, die U3-Regionen waren jedoch unterschiedlich.

Phylogenetischer Baum und Struktur jedes intakten endogenen Retrovirus-Long-Terminal-Repeat (ERV-LTR). (A) Phylogenetischer Baum, der auf der Grundlage der langen terminalen Wiederholungssequenz erstellt wurde. (B) Ausrichtung der repräsentativen Sequenz aus vier Mustern der Familie der endogenen Vogelviren (EAV). (C) Schematische Darstellung der erkannten EAV-LTR-Sequenz. Identische Muster weisen auf homologe Sequenzen hin.

Nach dem Trimmen der in dieser Studie erhaltenen Sequenzdaten anhand strenger Kriterien wurden mehr als 95 % aller Lesepaare dem Gallus-Referenzgenom zugeordnet, obwohl einige Unterschiede in der Tiefe beobachtet wurden. Daher wurden die zusammengestellten Sequenzdaten als hochwertig angesehen. Darüber hinaus wurde der Nachweis von Junglefowl-ERV-LTRs mithilfe falscher Paare und Singleton-Sequenz-Reads versucht, die nicht korrekt auf das Referenzgenom abgebildet wurden. Insgesamt wurden 835 ERV-LTR-Loci im Gallus-Genom nachgewiesen. Dieses Ergebnis ist äußerst zuverlässig, da das Vorhandensein von TSD mithilfe von IGV für die von RetroSeq erkannten Haltepunkte visuell bestätigt wurde und das durch Sammeln der umgebenden Sequenzen erstellte Contig auch ERV-LTR-Sequenzen enthielt. Frühere Studien berichteten über die Verwendung von G. gallus-Genomen und Sequenzierungsdaten der nächsten Generation zum Nachweis von ERV20,21. Beispielsweise nutzte eine Studie die obsERVer-Software in Verbindung mit dem Galgal5-Referenzgenom, um ALV-E in kommerziellen Hühnern nachzuweisen, was zur Identifizierung von ALV-E an 20 Loci20 führte. In ähnlicher Weise wurden 75,22 ± 9,52 Integrationsstellen für EAV-HP bei kommerziellen Hühnern, einheimischen Hühnern und roten Dschungelvögeln unter Verwendung von Galgal421 identifiziert. Obwohl Variationen in den Methoden und Referenzgenomen direkte Vergleiche erschweren, wird die Sammlung solcher Erkenntnisse zweifellos zu einem umfassenderen Verständnis der Eigenschaften endogener Hühner-Retroviren beitragen. Die in dieser Studie verwendete RetroSeq-basierte Methode zielt hauptsächlich auf Nicht-Referenz-ERV-LTR-Loci ab, die theoretisch aus dem Referenzgenom von G. gallus ausgeschlossen sind. Als Ergebnis wurden 835 nicht referenzierende ERV-LTRs an eindeutigen Genompositionen identifiziert.

Die Anzahl der im Roten Dschungelgeflügel und seinen Unterarten identifizierten ERV-LTR-Loci war im Vergleich zur Anzahl der in anderen Arten nachgewiesenen ERV-LTRs relativ gering. Diese Diskrepanz könnte auf die Verwendung des Referenzgenoms des roten Dschungelgeflügels zurückzuführen sein, was möglicherweise zu einer Unterschätzung der Anzahl der vorhandenen ERV-LTRs geführt hat, da die bereits vorhandenen ERV-LTRs, die nur für rote Dschungelvögel gelten, nicht berücksichtigt werden im Referenzgenom. Darüber hinaus ist die in dieser Studie verwendete Methode möglicherweise noch nicht in der Lage, alle nicht referenzierenden ERV-LTR-Loci zu erkennen, da eine ausreichende Menge ungeeigneter Paare und Singletons für die Erkennung unerlässlich ist. Bei einem bestimmten grünen Dschungelvogel wurde eine signifikant hohe Anzahl falscher Paare (31,59 %) beobachtet. Diese Person zeigte einen höheren Wert (2.011 Loci) als andere Personen, selbst nach der RetroSeq-Filterung. Die endgültig identifizierten ERV-LTR-Loci unterschieden sich jedoch nicht wesentlich von denen der anderen, was darauf hindeutet, dass ein bestimmter Datenschwellenwert für die Erkennung von Nicht-Referenz-ERV-LTRs ausreichend war. Dennoch wurden von 835 ermittelten Standorten nur 367 Contigs mit TSDs auf beiden Seiten ermittelt. Dieser Unterschied ist teilweise auf die unzureichende Anzahl von Lesevorgängen zurückzuführen, die durch eine Erhöhung der Datengröße in gewissem Maße verbessert werden könnten. Dennoch wurde festgestellt, dass ERVs beim Menschen dazu neigen, sich in Regionen des Genoms anzusammeln, die wenig komplex und repetitiv sind22,23,24. Darüber hinaus stellt der Nachweis von ERVs, die gag-, pol- und env-Regionen enthalten, sowie von Solo-LTRs eine Herausforderung bei der Verwendung von Short-Read-Sequenzierung dar. Daher sollte der Einsatz von Long-Read-Sequenzierungstechnologien wie Einzelmolekül-Echtzeitsequenzierung und Nanoporensequenzierung in Betracht gezogen werden, um die vollständige Insertionssequenz zu bestimmen.

Die ALV-Familie ist jünger als die EAV-Familie, da sie nur bei Haushühnern und roten Dschungelvögeln vorkommt, während die EAV-Familie auf alle Gallus-Arten beschränkt ist25. In dieser Studie wurde das aus der EAV-Familie stammende LTR bei allen Arten nachgewiesen, wohingegen das von ALV-E nur bei roten Dschungelvögeln und seinen Unterarten nachgewiesen wurde, was mit früheren Berichten übereinstimmt. Daher wird angenommen, dass ALV-E eine internalisierte Sequenz im Genom des roten Dschungelgeflügels ist, nachdem die Population des roten Dschungelgeflügels von der Gattung Gallus abgewichen ist. Es wird angenommen, dass Arten mit ERVs am selben Ort auseinander gingen, nachdem ihr gemeinsamer Vorfahre mit einem Retrovirus infiziert worden war, das internalisiert wurde. In einer früheren Studie26 wurde das ungefähre Divergenzalter der Gattung Gallus geschätzt. Sie errechneten, dass die Abweichung zwischen rotem Dschungelgeflügel und grauem Dschungelgeflügel um 2,56 Millionen Jahre betrug, rotes Dschungelgeflügel und Ceylon-Dschungelgeflügel um 2,88 Millionen Jahre, graues Dschungelgeflügel und Ceylon-Dschungelgeflügel um 1,77 Millionen Jahre und grünes Dschungelgeflügel und andere Gallus-Arten um etwa 4,0 bis 4,1 Millionen Jahre divergierten. Insgesamt stimmte der aus den in dieser Studie erhaltenen ERV-LTR-Loci erstellte phylogenetische Baum im Allgemeinen mit zuvor berichteten phylogenetischen Beziehungen überein. Es spiegelte jedoch nicht das Verzweigungsalter wider (Abb. 1C).

Drei Loci (chr3:40.992.728, chr3:101.202.255 und chr11:7.946.729) stimmten nicht mit zuvor berichteten phylogenetischen Beziehungen überein. Beispielsweise wurden auf chr3:101.202.255 ERV-LTRs nur bei roten Dschungelvögeln, Ceylon-Dschungelvögeln und grünen Dschungelvögeln entdeckt, nicht jedoch bei grauen Dschungelvögeln. Solche ERV-LTRs könnten durch Rekombination oder andere Mechanismen während der Artbildung vom Locus verloren gegangen sein. Alternativ könnte es Fälle von Introgression zwischen den evolutionär entfernten Arten gegeben haben. Frühere Untersuchungen haben gezeigt, dass die Introgression von grünen Dschungelgeflügelarten zu Haushühnern auf Chromosom 512 stattgefunden haben könnte. Darüber hinaus hat die Analyse von Gesamtgenomdaten eine Vermischung von grünen Dschungelgeflügelarten und roten Dschungelgeflügelarten in Indonesien gezeigt26.

Ein Vergleich der LTR-Sequenzen am gleichen Ort ergab Nukleotidsubstitutionen zwischen Arten und Unterarten. Darüber hinaus wurden in dieser Studie mehrere Sequenzmuster in den U3-, R- und U5-Regionen des LTR der EAV-Familie beobachtet. Diese Variation könnte eine Folge einer innerfamiliären Rekombination sein, wie bereits berichtet27. Obwohl diese Substitutionen und LTR-Variationen nicht unbedingt genetische Divergenz widerspiegeln, könnten sie die Annäherung an die komplexe Geschichte vergangener Introgressionen unterstützen. Eine weitere Untersuchung der Verbreitung von ERVs in angrenzenden Regionen könnte unser Verständnis der Artbildung verbessern. Im Gegensatz zu früheren phylogenetischen Analysen, die auf Sequenzen basierten, die einem Referenzgenom zugeordnet waren, wurden in dieser Studie Sequenzen verwendet, die im Referenzgenom nicht vorhanden sind, was detailliertere phylogenetische Analysen in Verbindung mit früheren Methoden ermöglichen könnte.

In der vorliegenden Studie wurden 306 ERV-Sequenzen in den Genen nachgewiesen, von denen einige mit der Zelladhäsion assoziiert waren. Das Vorhandensein von ERVs im Hühnergenom wirkt sich auf den Wirt aus. Eine der bekannten Auswirkungen von ERVs auf Hühner ist beispielsweise der Phänotyp der blauen Eierschale; Das SLCO1B3-Gen wird in der Gebärmutter von Hühnern exprimiert, die blauschalige Eier legen, nicht jedoch bei Hühnern ohne blaue Eierschalen8. Eine Insertion von EAV-HP wurde in der 5'-flankierenden Region von SLCO1B3 identifiziert, und die In-situ-Hybridisierung ergab EAV-HP in der 5'-flankierenden Region von SLCO1B38. Die In-situ-Hybridisierung zeigte, dass die EAV-HP-Insertion mit dem Phänotyp der blauen Eierschale verbunden war. In der vorliegenden Studie wurde die LTR-Insertion in zelladhäsionsbezogene Gene wie RELN, CNTN5, CDH20, CDH7, TENM1, SPON1, NRXN3 und CDH4 nachgewiesen. Die U3-Region eines LTR enthält Enhancer- und Promotorsequenzen, die die virale Transkription steuern28. Es enthält andere Transkriptionsregulationssignale, wie zum Beispiel die TATA-Box29. Die in CNTN5 und NRXN3 eingefügte LTR-Sequenz enthielt die TATA-Box, was darauf hindeutet, dass die Einfügung von ERV-LTRs möglicherweise eine Rolle bei der Entwicklung von Zelladhäsionsprozessen gespielt hat. Weitere Forschung ist erforderlich, um die Mechanismen, durch die ERV-LTRs die Entwicklung der Zelladhäsion und anderer biologischer Prozesse beeinflussen, vollständig zu verstehen. Wenn darüber hinaus die ERV-LTRs kommerzieller Hühner in Bezug auf ERV-Polymorphismen nahezu so vielfältig sind wie die ERV-LTRs von Dschungelgeflügel, die in dieser Studie festgestellt wurden, könnten zukünftige ERV-Analysen kommerzieller und einheimischer Hühner eine wichtige Quelle genetischer Neuheiten sein für Hühnerzuchtprogramme.

Die mit Illumina HiSeq 2000 oder 2500 erhaltenen WGS-Daten von insgesamt 39 Individuen12,30, darunter 16 rote Dschungelvögel, 8 Gy-Dschungelvögel, 10 Ceylon-Dschungelvögel und 5 grüne Dschungelvögel, wurden im Fastq-Format vom European Nucleotide Archive bezogen (Studie). Beitritte waren PRJNA432200 und PRJNA552030). Das Rote Dschungelgeflügel umfasste die Unterarten drei Gallus gallus murghi, zwei Gallus gallus bankiva und insgesamt sieben G. g. spadiceus-Individuen aus Populationen in Indien, Thailand und Vietnam. Die Zugangs-IDs sind in Tabelle S1 aufgeführt. Nukleotide mit schlechter Qualität in diesen Lesevorgängen wurden gekürzt und Adapter mit Trimmomatic v.0.36 unter Verwendung der Einstellungen ILLUMINACLIP: TruSeq3-PE:2:30:10, LEADING:3, SLIDINGWINDOW:4:20 und MINLEN:30 entfernt31 . Die Lesevorgänge wurden mithilfe von Burrows-Wheeler-Aligner- und Mem-Algorithmen auf das G. gallus-Referenzgenom (GRCg6a, GenBank-Assembly-Zugang: GCF_000002315.6) abgebildet. Die Daten wurden im BAM-Format erstellt.

Der ERV-Nachweis wurde nach einer früheren Methode durchgeführt15,16. Die Arten von Lesepaaren, die dem Referenzgenom zugeordnet sind, wurden definiert und Sequenzlesevorgänge extrahiert, die für diese Studie nützlich waren. Die meisten Paired-End-Reads wurden aus der WGS-Karte des Referenzgenoms erhalten. Allerdings können nicht übereinstimmende Lesepaare auch bei unerwarteten Spannweiten und Ausrichtungen auftreten. Nicht-echte Paare sind solche, bei denen das 5‘- oder 3‘-Ende einer Contig-Sequenz im Referenzgenom zugeordnet ist und das andere Ende ganz oder teilweise einem unerwarteten Locus zugeordnet ist. Ein Singleton bezieht sich auf die Zuordnung zum Referenzgenom. Ein Singleton bezieht sich auf ein Ende eines Lesepaars, das nicht auf das Referenzgenom abgebildet ist, während sich ein nicht kartiertes Lesepaar auf beide Enden eines Lesepaars bezieht, das nicht auf das Referenzgenom abgebildet ist (Abb. 3). Nicht übereinstimmende Lesepaare können als Anker Einblick in LTR-bezogene Loci geben. Die RetroSeq-Software wurde verwendet, um Nicht-Referenz-Transposonelemente (TEs) mithilfe nicht übereinstimmender Lesevorgänge zu erkennen17. Der Prozessablauf ist in Abb. 3 dargestellt. Die für RetroSeq verwendeten ERV-Sequenzen wurden vom National Center for Biotechnology Information (NCBI, Bethesda, MD, USA) bezogen und sind in Tabelle S5 aufgeführt. Das Referenzgenom war GRCg6a, das nur Autosomen und Geschlechtschromosomen enthielt. Im RetroSeq-„Aufruf“-Schritt wurden die TE-Insertionspositionen (Breakpoints) anhand der in der „Discover“-Phase erkannten Lesevorgänge geschätzt, wie bereits berichtet. Der Aufrufschritt wurde auf ≥ 10 festgelegt, um Fehlalarme zu reduzieren, und die maximale Lesetiefenoption pro Aufruf wurde auf 10.000 festgelegt, um die BAM-Abdeckung zu erhöhen. Alle anderen RetroSeq-Optionen wurden mit ihren Standardwerten verwendet. Es wurden mindestens sieben Haltepunkte auf Filterebene verwendet. Ein innerhalb von 500 bp erkannter Haltepunkt wurde als identisch angesehen und ausgeschlossen. Das IGV wurde zum Nachweis von TSDs enthaltenden Loci verwendet. Mithilfe der Batch-Skript-Funktionalität von IGV wurde an jedem von der RetroSeq-Analysepipeline erkannten Genomort ein Screenshot erstellt und sorgfältig untersucht. Es wurde angenommen, dass es sich bei den Loci um TSDs handelte, wenn sie auf Lesevorgänge abgebildet wurden, die während der „Entdeckungs“-Phase entweder von der 5‘- oder 3‘-Seite erkannt wurden und sich um 1–10 bp überlappten (Abb. 3). Die 5'- und 3'-Reads, die innerhalb von 150 bp der TSDs kartiert wurden, wurden mit SAMtools32 extrahiert. Der extrahierte Lesesatz wurde zur Generierung des Contigs mithilfe der CAP3-Software33 verwendet. Die mit CAP3 erhaltenen Contig-Sequenzen wurden für eine Blastn-Suche19 verwendet. Zur Bestimmung der ERV-Klasse wurde der niedrigste E-Wert herangezogen. Jede 200-bp-Sequenz vor und nach dem Bruchpunkt wurde aus dem Referenzgenom extrahiert und einer Blastn-Operation unterzogen, um die Möglichkeit des Nachweises von ERV-Sequenzen im Referenzgenom auszuschließen. Loci, die mit den ERVs übereinstimmten, wurden von der Analyse ausgeschlossen. Eine im Referenzgenom nicht vorhandene Sequenz wurde aus der zusammenhängenden Sequenz abgeleitet, die innerhalb der Region erhalten wurde, die auf beiden Seiten durch die TSD-Sequenz oder die Sechs-Basenpaar-Sequenz auf den angrenzenden 5'- bzw. 3'-Seiten der TSD begrenzt wird. wenn die TSD-Länge nicht ausreichte.

Pipeline für den Nachweis nicht referenzierter endogener Gallus-Retroviren – lange terminale Wiederholungen (ERV-LTRs) in Lesedaten der Gesamtgenomsequenzierung (WGS). Im rechten oberen Feld bezeichnet die schwarze Linie die Referenzgenomsequenz des Huhns. Mit Linien verbundene blaue und rote Kästchen bezeichnen die 5′- und 3′-Enden eines Paired-End-Sequenzierungslesevorgangs. Bei den meisten Paired-End-Lesevorgängen handelte es sich um eine ordnungsgemäße Zuordnung, bei einem kleinen Prozentsatz handelte es sich dagegen um eine fehlerhafte Zuordnung. Richtiges Paar: Beide Enden der Paired-End-Sequenz sind genau abgebildet (a). Diskordantes Lesen und geteiltes Lesen: Ein Ende der Paired-End-Sequenz wurde genau kartiert, während das andere Ende am erwarteten Ort im Referenzgenom nur teilweise identifiziert wurde. Die nicht identifizierte Sequenz könnte irgendwo anders im Referenzgenom kartiert werden (b, c). Singleton: Ein Ende der Paired-End-Sequenz war genau abgebildet, während das andere Ende nicht auf dem Referenzgenom abgebildet war (d). Nicht kartierte Read-Paare: Keiner der Reads ist dem Referenzgenom zugeordnet (e). Für die RetroSeq-Analyse wurden diskordante Lesevorgänge, geteilte Lesevorgänge und Singletons verwendet. Im rechten mittleren Bereich wird eine repräsentative Ansicht des Integrative Genomics Viewer (IGV) verwendet, um das Vorhandensein von Target Site Duplications (TSDs) an jedem Locus zu bestätigen, die mit RetroSeq erkannt wurden, Support-Reads aus den TSD-Loci zu extrahieren und die lokale Assemblierung durchzuführen , und analysieren Sie die Contigs auf das Vorhandensein endogener Retroviren (ERV)-Genom-Verbindungen von beiden Seiten. „A“ bezeichnet die Personen, die die TSD haben, und „B“ bezeichnet die Personen, die nicht die TSD hatten. Das rechte untere Feld zeigt ein konzeptionelles Diagramm der lokalen De-novo-Assemblierung mit CAP3. Sequenzen in Rot weisen auf Sequenzen hin, die im Referenzgenom nicht vorhanden sind, und Sequenzen in Lila weisen auf TSDs hin.

Die identifizierten ERV-Loci wurden mithilfe von IGV auf Insertionen innerhalb des Gens untersucht. GO-Analysen für jedes Gen mit einer ERV-Sequenz wurden mit dem R-Paket ClusterProfiler34 durchgeführt. Das Vorhandensein oder Fehlen von ERVs an jedem Ort wurde für die Clusterbildung zwischen Arten und Unterarten als eins oder null angenommen. Der auf Clustering basierende phylogenetische Baum wurde mit der Funktion „dist.binary“ mit ade435 und „hclust“ unter Verwendung des ape36-Pakets der R-Software37 generiert. Die ERV-LTR-Sequenzen jedes Locus wurden mit ClustalW38 abgeglichen und ein phylogenetischer Baum mit der Maximum-Likelihood-Methode in MEGA X39,40 erstellt. Phylogenetische Bäume und Alignments wurden mit FigtTee v1.4.4 (http://tree.bio.ed.ac.uk/software/figtree/) bzw. Mview v1.6741 visualisiert.

Die LTR-Sequenzen jedes Locus und jedes Junglefowl sind in Tabelle S4 aufgeführt. Die während der aktuellen Studie verwendeten und/oder analysierten Datensätze sind auf begründete Anfrage beim entsprechenden Autor erhältlich.

Boeke, JD & Stoye, JP Retrotransposons, endogene Retroviren und die Evolution von Retroelementen. In Retroviruses (Hrsg. Hughes, S. & Varmus, H.) 343–435 (Cold Spring Harbor Laboratory Press, 1997).

Benkel, BF Ortsspezifische Diagnosetests für endogene Virusloci vom Vogelleukose-Typ bei Hühnern. Geflügel. Wissenschaft. 77, 1027–1035 (1998).

Artikel CAS PubMed Google Scholar

Sacco, MA & Nair, VK Prototyp endogener Vogel-Retroviren der Gattung Gallus. J. General Virol. 95, 2060–2070 (2014).

Artikel CAS PubMed Google Scholar

Lander, ES et al. Erste Sequenzierung und Analyse des menschlichen Genoms. Natur 409, 860–921 (2001).

Artikel ADS CAS PubMed Google Scholar

Huda, A., Polavarapu, N., Jordan, IK & McDonald, JF Endogene Retroviren des Hühnergenoms. Biol. Direkte. 3, 1–5 (2008).

Artikel Google Scholar

Bai, J., Payne, LN & Skinner, MA HPRS-103 (exogenes Vogelleukosevirus, Untergruppe J) hat ein env-Gen, das mit denen der endogenen Elemente EAV-0 und E51 verwandt ist, und ein E-Element, das bisher nur in Sarkomviren vorkam. J. Virol. 69, 779–784 (1995).

Artikel CAS PubMed PubMed Central Google Scholar

Smith, LM et al. Neuartige endogene retrovirale Sequenzen im Hühnergenom, die eng mit dem Vogelleukosevirus HPRS-103 (Untergruppe J) verwandt sind. J. General Virol. 80, 261–268 (1999).

Artikel CAS PubMed Google Scholar

Wang, Z. et al. Eine EAV-HP-Insertion in der 5′-flankierenden Region von SLCO1B3 verursacht eine blaue Eierschale beim Huhn. PLoS Genet. 9, e1003183. https://doi.org/10.1371/journal.pgen.1003183 (2013).

Artikel CAS PubMed PubMed Central Google Scholar

Fumihito, A. et al. Als matriarchalischer Vorfahre aller Hausrassen genügt eine Unterart des Roten Dschungelhuhns (Gallus gallus gallus). Proz. Natl. Acad. Wissenschaft. USA 91, 12505–12509 (1994).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Fumihito, A. et al. Monophyletischer Ursprung und einzigartige Ausbreitungsmuster von Hausgeflügel. Proz. Natl. Acad. Wissenschaft. USA 93, 6792–6795 (1996).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Eriksson, J. et al. Die Identifizierung des Yellow-Skin-Gens zeigt einen hybriden Ursprung des Haushuhns. PLoS Genet. 4, e1000010. https://doi.org/10.1371/journal.pgen.1000010 (2008).

Artikel CAS PubMed PubMed Central Google Scholar

Lawal, RA et al. Die Abstammung des Wildartengenoms von Haushühnern. BMC Biol. 18, 13. https://doi.org/10.1186/s12915-020-0738-1 (2020).

Artikel CAS PubMed PubMed Central Google Scholar

Nishibori, M., Shimogiri, T., Hayashi, T. & Yasue, H. Molekulare Beweise für die Hybridisierung von Arten der Gattung Gallus mit Ausnahme von Gallus varius. Anim. Genet. 36, 367–375 (2005).

Artikel CAS PubMed Google Scholar

Li, H. Ausrichten von Sequenzlesevorgängen, Klonsequenzen und Assemblierungs-Contigs mit BWA-MEM. arXiv:1303.3997v2; https://doi.org/10.48550/arXiv.1303.3997 (2013).

Ishihara, S. et al. Nachweis nicht referenzierter endogener Schweine-Retrovirus-Loci im Genom einheimischer vietnamesischer Schweine. Wissenschaft. Rep. 12, 10485. https://doi.org/10.1038/s41598-022-14654-4 (2022).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Wildschütte, JH et al. Entdeckung unfixierter endogener Retrovirus-Insertionen in verschiedenen menschlichen Populationen. Proz. Natl. Acad. Wissenschaft. USA 113, E2326–E2334. https://doi.org/10.1073/pnas.1602336113 (2016).

Artikel CAS PubMed PubMed Central Google Scholar

Keane, TM, Wong, K. & Adams, DJ RetroSeq: Entdeckung transponierbarer Elemente aus Sequenzierungsdaten der nächsten Generation. Bioinformatik 29, 389–390 (2013).

Artikel CAS PubMed Google Scholar

Thorvaldsdóttir, H., Robinson, JT & Mesirov, JP Integrative Genomics Viewer (IGV): Hochleistungsfähige Visualisierung und Exploration von Genomdaten. Knapp. Bioinform. 14, 178–192 (2013).

Artikel PubMed Google Scholar

Altschul, SF, Gish, W., Miller, W., Myers, EW & Lipman, DJ Einfaches Suchwerkzeug für die lokale Ausrichtung. J. Mol. Biol. 215, 403–410 (1990).

Artikel CAS PubMed Google Scholar

Mason, AS et al. Identifizierung und Charakterisierung endogener Insertionen des Aviären Leukosevirus der Untergruppe E (ALVE) in Sequenzierungsdaten des Gesamtgenoms von Hühnern. Mob. DNA 11, 22. https://doi.org/10.1186/s13100-020-00216-w (2020).

Artikel CAS PubMed PubMed Central Google Scholar

Wragg, D. et al. Eine genomweite Analyse zeigt das Ausmaß der EAV-HP-Integration bei Haushühnern. BMC-Genom. 16, 784. https://doi.org/10.1186/s12864-015-1954-x (2015).

Artikel CAS Google Scholar

Gemmell, P., Hein, J. & Katzourakis, A. Orthologe endogene Retroviren zeigen seit der Trennung von Schimpanse und Mensch eine gerichtete Selektion. Retrovirology 12, 52. https://doi.org/10.1186/s12977-015-0172-6 (2015).

Artikel CAS PubMed PubMed Central Google Scholar

Tokuyama, M. et al. Die ERVmap-Analyse zeigt die genomweite Transkription menschlicher endogener Retroviren. Proz. Natl. Acad. Wissenschaft. USA 115, 12565–12572. https://doi.org/10.1073/pnas.1814589115 (2018).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Xiang, Y. & Liang, H. Die Regulation und Funktionen des endogenen Retrovirus bei der Embryonalentwicklung und Stammzelldifferenzierung. Stammzellen Int. 2021, 6660936. https://doi.org/10.1155/2021/6660936 (2021).

Artikel PubMed PubMed Central Google Scholar

Borisenko, L. & Rynditch, AV Vollständige Nukleotidsequenzen ALV-verwandter endogener Retroviren, verfügbar aus dem Entwurf der Hühnergenomsequenz. Folia Biol. 50, 136–141 (2004).

CAS Google Scholar

Guo, Y. et al. Untersuchungen zur Feinstruktur und Mischung der weltweiten Hühnerpopulation offenbaren Zusammenhänge zwischen Populationen und wichtigen Ereignissen in der Zuchtgeschichte. Entwicklung Appl. 15, 553–564 (2022).

Artikel PubMed Google Scholar

Sanchez, DH, Gaubert, H., Drost, HG, Zabet, NR & Paszkowski, J. Hochfrequenzrekombination zwischen Mitgliedern einer LTR-Retrotransposon-Familie während Transpositionsausbrüchen. Nat. Komm. 8, 1283. https://doi.org/10.1038/s41467-017-01374-x (2017).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Grandi, N. & Tramontano, E. Menschliche endogene Retroviren sind uralte erworbene Elemente, die immer noch angeborene Immunantworten prägen. Vorderseite. Immunol. 9, 2039. https://doi.org/10.3389/fimmu.2018.02039 (2018).

Artikel CAS PubMed PubMed Central Google Scholar

Benachenhou, F. et al. Konservierte Struktur und abgeleitete Evolutionsgeschichte von Long Terminal Repeats (LTRs). Mob. DNA 4, 5. https://doi.org/10.1186/1759-8753-4-5 (2013).

Artikel CAS PubMed PubMed Central Google Scholar

Mariadassou, M. et al. Entschlüsselung der Geschichte der Gattung Gallus durch Sequenzierung des gesamten Genoms. Mol. Phylogenet. Entwicklung 158, 107044. https://doi.org/10.1016/j.ympev.2020.107044 (2021).

Artikel PubMed Google Scholar

Bolger, AM, Lohse, M. & Usadel, B. Trimmomatic: Ein flexibler Trimmer für Illumina-Sequenzdaten. Bioinformatik 30, 2114–2120 (2014).

Artikel CAS PubMed PubMed Central Google Scholar

Li, H. et al. Das Sequenzausrichtungs-/Kartenformat und SAMtools. Bioinformatik 25, 2078–2079 (2009).

Artikel PubMed PubMed Central Google Scholar

Huang, X. & Madan, A. CAP3: Ein DNA-Sequenzassemblierungsprogramm. Genomres. 9, 868–877 (1999).

Artikel CAS PubMed PubMed Central Google Scholar

Yu, G., Wang, LG, Han, Y. & He, QY ClusterProfiler: Ein R-Paket zum Vergleich biologischer Themen zwischen Genclustern. OMICS J. Integr. Biol. 16, 284–287 (2012).

Artikel CAS Google Scholar

Dray, S. & Dufour, AB Das ade4-Paket: Implementierung des Dualitätsdiagramms für Ökologen. J. Stat. Softw. https://doi.org/10.18637/jss.v022.i04 (2007).

Artikel Google Scholar

Paradis, E. & Schliep, K. ape 5.0: eine Umgebung für moderne Phylogenetik und Evolutionsanalysen in R. Bioinformatics 35, 526–528 (2019).

Artikel CAS PubMed Google Scholar

R-Kernteam. R: Eine Sprache und Umgebung für statistische Berechnungen. R Stiftung für Statistisches Rechnen, Wien. https://cran.r-project.org (2020).

Thompson, JD, Higgins, DG & Gibson, TJ CLUSTAL W: Verbesserung der Empfindlichkeit der progressiven Ausrichtung mehrerer Sequenzen durch Sequenzgewichtung, positionsspezifische Lückenstrafen und Auswahl der Gewichtsmatrix. Nukleinsäuren Res. 22, 4673–4680 (1994).

Artikel CAS PubMed PubMed Central Google Scholar

Kumar, S., Stecher, G., Li, M., Knyaz, C. & Tamura, K. MEGA X: Analyse der molekularen Evolutionsgenetik auf verschiedenen Computerplattformen. Mol. Biol. Entwicklung 35, 1547–1549 (2018).

Artikel CAS PubMed PubMed Central Google Scholar

Stecher, G., Tamura, K. & Kumar, S. Molekulare evolutionäre Genetikanalyse (MEGA) für macOS. Mol. Biol. Entwicklung 37, 1237–1239 (2020).

Artikel CAS PubMed PubMed Central Google Scholar

Brown, NP, Leroy, C. & Sander, C. MView: Eine webkompatible Datenbanksuche oder ein Viewer für mehrere Ausrichtungen. Bioinformatik 14, 380–381 (1998).

Artikel CAS PubMed Google Scholar

Referenzen herunterladen

Diese Arbeit wurde von der Japan Society for the Promotion of Science Grant-in-Aid for Early-Career Scientists, Grant Number 22K14907, unterstützt. Die Berechnungen wurden teilweise auf dem NIG-Supercomputer am ROIS National Institute of Genetics durchgeführt. Der Autor möchte sich bei Editage (www.editage.com) für die Bearbeitung in englischer Sprache bedanken.

Abteilung für Tierwissenschaften, Nippon Veterinary and Life Science University, 1-7-1 Kyonancho, Musashino, Tokio, 180-8602, Japan

Shinya Ishihara

Sie können diesen Autor auch in PubMed Google Scholar suchen

SI führte alle Experimente, Datenanalysen und das Verfassen des endgültigen Manuskripts durch.

Korrespondenz mit Shinya Ishihara.

Der Autor gibt keine Interessenkonflikte an.

Springer Nature bleibt neutral hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten.

Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die Originalautor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht gesetzlich zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.

Nachdrucke und Genehmigungen

Ishihara, S. Nachweis langer terminaler Wiederholungsorte, die vom endogenen Retrovirus in Dschungelgeflügel stammen, mittels Sequenzierung des gesamten Genoms. Sci Rep 13, 7380 (2023). https://doi.org/10.1038/s41598-023-34520-1

Zitat herunterladen

Eingegangen: 26. Januar 2023

Angenommen: 03. Mai 2023

Veröffentlicht: 06. Mai 2023

DOI: https://doi.org/10.1038/s41598-023-34520-1

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein Link zum Teilen verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt

Durch das Absenden eines Kommentars erklären Sie sich damit einverstanden, unsere Nutzungsbedingungen und Community-Richtlinien einzuhalten. Wenn Sie etwas als missbräuchlich empfinden oder etwas nicht unseren Bedingungen oder Richtlinien entspricht, kennzeichnen Sie es bitte als unangemessen.