304 Iz nerjavečega jekla varjena zvita cev / cevna zomponenta, biosintetični potencial globalnega morskega mikrobioma

Hvala, ker ste obiskali Nature.com.Uporabljate različico brskalnika z omejeno podporo za CSS.Za najboljšo izkušnjo priporočamo, da uporabite posodobljen brskalnik (ali onemogočite način združljivosti v Internet Explorerju).Poleg tega, da zagotovimo stalno podporo, spletno mesto prikažemo brez slogov in JavaScripta.
Drsniki, ki prikazujejo tri članke na diapozitiv.Uporabite gumba za nazaj in naprej, da se premikate po diapozitivih, ali pa gumbe za krmiljenje diapozitivov na koncu, da se premikate po vsakem diapozitivu.

Podroben opis izdelka

304 Zvita cev iz nerjavečega jekla
1. Specifikacija: cevna tuljava iz nerjavečega jekla
2. Tip: varjeni ali brezšivni
3. Standard: ASTM A269, ASTM A249
4. Zunanja cev iz nerjavečega jekla OD: 6 mm do 25,4 mm
5. Dolžina: 600-3500MM ali glede na zahtevo stranke.
6. Debelina stene: 0,2 mm do 2,0 mm.

7. Toleranca: OD: +/-0,01 mm;Debelina: +/-0,01%.

8. Velikost notranje luknje tuljave: 500MM-1500MM (lahko se prilagodi glede na zahteve kupca)

9. Višina tuljave: 200MM-400MM (lahko se prilagodi glede na zahteve kupca)

10. Površina: svetla ali žarjena
11. Material: 304, 304L, 316L, 321, 301, 201, 202, 409, 430, 410, zlitina 625, 825, 2205, 2507 itd.
12. Pakiranje: tkane vrečke v lesenem ohišju, leseni paleti, leseni gredi ali po zahtevi stranke
13. Test: kemična komponenta, meja tečenja, natezna trdnost, merjenje trdote
14. Garancija: pregled tretje osebe (na primer: SGS TV) itd.
15. Uporaba: dekoracija, pohištvo, transport nafte, izmenjevalnik toplote, izdelava ograj, izdelava papirja, avtomobili, predelava hrane, medicina itd.

Vsa kemična sestava in fizikalne lastnosti za nerjavno jeklo, kot je spodaj:

Material ASTM A269 Kemična sestava % Maks
C Mn P S Si Cr Ni Mo NB Nb Ti
TP304 0,08 2.00 0,045 0,030 1,00 18,0-20,0 8,0-11,0 ^ ^ ^ . ^
TP304L 0,035 2.00 0,045 0,030 1,00 18,0-20,0 8,0-12,0 ^ ^ ^ ^
TP316 0,08 2.00 0,045 0,030 1,00 16,0-18,0 10,0-14,0 2.00-3.00 ^ ^ ^
TP316L 0,035 D 2.00 0,045 0,030 1,00 16,0-18,0 10,0-15,0 2.00-3.00 ^ ^ ^
TP321 0,08 2.00 0,045 0,030 1,00 17,0-19,0 9,0-12,0 ^ ^ ^ 5C -0,70
TP347 0,08 2.00 0,045 0,030 1,00 17,0-19,0 9,0-12,0 10C -1.10 ^

 

Material Toplotna obdelava Temperatura F (C) Min. Trdota
Brinell Rockwell
TP304 rešitev 1900 (1040) 192HBW/200HV 90HRB
TP304L rešitev 1900 (1040) 192HBW/200HV 90HRB
TP316 rešitev 1900 (1040) 192HBW/200HV 90HRB
TP316L rešitev 1900 (1040) 192HBW/200HV 90HRB
TP321 rešitev 1900 (1040) F 192HBW/200HV 90HRB
TP347 rešitev 1900 (1040) 192HBW/200HV 90HRB

 

OD, palec OD Toleranca inch (mm) Toleranca WT % Dolžina Tolernace inch (mm)
+ -
≤ 1/2 ± 0,005 (0,13) ± 15 1/8 ( 3,2 ) 0
> 1/2 ~1 1/2 ± 0,005(0,13) ± 10 1 / 8 (3,2) 0
> 1 1/2 ~< 3 1/2 ± 0,010(0,25) ± 10 3 / 16 (4,8) 0
> 3 1/2 ~< 5 1/2 ± 0,015(0,38) ± 10 3 / 16 (4,8) 0
> 5 1/2 ~< 8 ± 0,030(0,76) ± 10 3 / 16 (4,8) 0
8 ~ < 12 ± 0,040 (1,01) ± 10 3 / 16 (4,8) 0
12 ~ < 14 ± 0,050 (1,26) ± 10 3 / 16 (4,8) 0

Naravne mikrobne združbe so filogenetsko in presnovno raznolike.Poleg premalo raziskanih skupin organizmov1 ima ta raznolikost tudi bogat potencial za odkrivanje ekološko in biotehnološko pomembnih encimov in biokemičnih spojin2,3.Vendar ostaja preučevanje te raznolikosti za določitev genomskih poti, ki sintetizirajo takšne spojine in jih vežejo na njihove gostitelje, izziv.Biosintetski potencial mikroorganizmov v odprtem oceanu ostaja večinoma neznan zaradi omejitev pri analizi podatkov o ločljivosti celotnega genoma v svetovnem merilu.Tukaj raziskujemo raznolikost in raznolikost biosintetičnih genskih skupin v oceanu z integracijo približno 10.000 mikrobnih genomov iz gojenih celic in posameznih celic z več kot 25.000 na novo rekonstruiranimi osnutki genomov iz več kot 1.000 vzorcev morske vode.Ta prizadevanja so identificirala približno 40.000 domnevnih večinoma novih biosintetskih genskih skupin, od katerih so bili nekateri najdeni v prej neslutenih filogenetskih skupinah.V teh populacijah smo identificirali linijo, obogateno z biosintetskimi genskimi skupinami (»Candidatus Eudormicrobiaceae«), ki je pripadala nekultiviranemu bakterijskemu deblu in je vključevala nekatere biosintetsko najbolj raznolike mikroorganizme v tem okolju.Od teh smo opisali poti fosfataze-peptida in pitonamida ter identificirali primere nenavadne strukture in encimologije bioaktivnih spojin.Na koncu ta študija prikazuje, kako lahko strategije, ki temeljijo na mikrobiomu, omogočijo raziskovanje prej neopisanih encimov in naravnih živil v slabo razumljeni mikrobioti in okolju.
Mikrobi poganjajo globalne biogeokemične cikle, vzdržujejo prehranjevalne mreže ter ohranjajo zdravje rastlin in živali5.Njihova ogromna filogenetska, presnovna in funkcionalna raznolikost predstavlja bogat potencial za odkrivanje novih taksonov1, encimov in biokemičnih spojin, vključno z naravnimi proizvodi6.V ekoloških skupnostih te molekule zagotavljajo mikroorganizmom različne fiziološke in ekološke funkcije, od komunikacije do tekmovalnosti 2, 7.Poleg svojih prvotnih funkcij so ti naravni izdelki in njihove genetsko kodirane proizvodne poti primeri za biotehnološke in terapevtske aplikacije2,3.Prepoznavanje takšnih poti in povezav je močno olajšalo preučevanje gojenih mikrobov.Vendar pa so taksonomske študije naravnih okolij pokazale, da velika večina mikroorganizmov ni bila gojena8.Ta kulturna pristranskost omejuje našo sposobnost izkoriščanja funkcionalne raznolikosti, ki jo kodirajo številni mikrobi4,9.
Da bi premagali te omejitve, je tehnološki napredek v zadnjem desetletju raziskovalcem omogočil neposredno (tj. brez predhodne kulture) zaporedje fragmentov mikrobne DNK iz celih skupnosti (metagenomika) ali posameznih celic.Sposobnost sestavljanja teh fragmentov v večje fragmente genoma in rekonstrukcije več metagenomsko sestavljenih genomov (MAG) ali posameznih pomnoženih genomov (SAG) odpira pomembno priložnost za taksocentrične študije mikrobioma (tj. mikrobnih skupnosti in mikrobioma).utirajo nove poti.lastni genetski material v danem okolju) 10,11,12.Nedavne študije so dejansko močno razširile filogenetsko predstavitev mikrobne raznolikosti na Zemlji1, 13 in razkrile velik del funkcionalne raznolikosti v posameznih mikrobnih skupnostih, ki prej niso bile zajete v kultiviranih referenčnih sekvencah genoma mikroorganizmov (REF)14.Sposobnost umestitve neodkrite funkcionalne raznolikosti v kontekst gostiteljskega genoma (tj. ločljivost genoma) je ključnega pomena za napovedovanje še neopredeljenih mikrobnih linij, ki domnevno kodirajo nove naravne produkte15,16, ali za sledenje takim spojinam nazaj do njihovega prvotnega proizvajalca17.Na primer, kombinirani pristop metagenomske in enocelične genomske analize je privedel do identifikacije Candidatus Entotheonella, skupine presnovno bogatih bakterij, povezanih s spužvo, kot proizvajalcev različnih potencialov zdravil18.Vendar kljub nedavnim poskusom genomskega raziskovanja raznolikih mikrobnih skupnosti16,19 še vedno manjka več kot dve tretjini globalnih metagenomskih podatkov za največji ocean ekosistemov na Zemlji16,20.Tako na splošno biosintetski potencial morskega mikrobioma in njegov potencial kot skladišča novih encimskih in naravnih produktov ostajata v veliki meri premalo raziskana.
Da bi raziskali biosintetski potencial morskih mikrobiomov v svetovnem merilu, smo najprej združili morske mikrobne genome, pridobljene z uporabo od kulture odvisnih in nekulturnih metod, da bi ustvarili obsežno zbirko podatkov o filogenetiki in delovanju genov.Pregled te baze podatkov je razkril široko paleto biosintetičnih genskih grozdov (BGC), ki večinoma pripadajo družinam še neopredeljenih genskih grozdov (GCF).Poleg tega smo identificirali neznano družino bakterij, ki kaže največjo znano raznolikost BGC v odprtem oceanu doslej.Izbrali smo dve poti ribosomske sinteze in post-translacijsko modificiranega peptida (RiPP) za eksperimentalno validacijo na podlagi njunih genetskih razlik od trenutno znanih poti.Funkcionalna karakterizacija teh poti je razkrila nepričakovane primere encimologije kot tudi strukturno nenavadne spojine z inhibitornim delovanjem na proteazo.
Sprva smo želeli ustvariti globalni vir podatkov za analizo genoma, s poudarkom na njegovih bakterijskih in arhealnih komponentah.V ta namen smo združili metagenomske podatke in 1038 vzorcev morske vode iz 215 globalno porazdeljenih mest vzorčenja (razpon zemljepisne širine = 141,6°) in več globokih plasti (od 1 do 5600 m globine, ki pokrivajo pelagično, mezopelagično in brezno cono).Ozadje 21, 22, 23 (slika 1a, razširjeni podatki, slika 1a in dodatna tabela 1).Poleg zagotavljanja široke geografske pokritosti so nam ti selektivno filtrirani vzorci omogočili primerjavo različnih komponent morskega mikrobioma, vključno z bogatimi z virusi (<0,2 µm), bogatimi s prokarionti (0,2–3 µm), bogatimi z delci (0,8 µm). ).–20 µm) in kolonije brez virusa (>0,2 µm).
a, Skupaj 1038 javno dostopnih genomov (metagenomika) morskih mikrobnih skupnosti, zbranih iz 215 globalno porazdeljenih lokacij (62°J do 79°S in 179°Z do 179°V.).Ploščice zemljevida © Esri.Viri: GEBCO, NOAA, CHS, OSU, UNH, CSUMB, National Geographic, DeLorme, NAVTEQ in Esri.b, ti metagenomi so bili uporabljeni za rekonstrukcijo MAG (metod in dodatnih informacij), ki se razlikujejo po količini in kakovosti (metode) v nizih podatkov (označenih z barvo).Rekonstruirani MAG so bili dopolnjeni z javno dostopnimi (zunanjimi) genomi, vključno z ročno izdelanimi MAG26, SAG27 in REF.27 Prevedi OMD.c, v primerjavi s prejšnjimi poročili, ki temeljijo samo na SAG (GORG)20 ali MAG (GEM)16, OMD izboljša genomsko karakterizacijo morskih mikrobnih skupnosti (hitrost metagenomskega preslikavanja branja; metoda) za dva- do trikrat z bolj dosledno predstavitvijo v globino in zemljepisna širina..<0,2, n=151, 0,2-0,8, n=67, 0,2-3, n=180, 0,8-20, n=30, >0,2, n=610, <30°, n = 132, 30–60° , n = 73, >60°, n = 42, EPI, n = 174, MES, n = 45, BAT, n = 28. d, združevanje OMD v skupine vrst (95-odstotna povprečna identičnost nukleotidov) identificira skupno približno 8300 vrst, od katerih več kot polovica še ni bila opredeljena v skladu s taksonomskimi opombami z uporabo GTDB (različica 89) e, je razvrstitev vrst po tipu genoma pokazala, da se MAG, SAG in REF dobro dopolnjujejo, kar odraža filogenetsko raznolikost morski mikrobiom.Zlasti 55 %, 26 % in 11 % vrst je bilo specifičnih za MAG, SAG oziroma REF.BATS, Bermudska atlantska časovna vrsta;GEM, genomi zemeljskega mikrobioma;GORG, referenčni genom globalnega oceana;HOT, časovna serija Havajskega oceana.
Z uporabo tega nabora podatkov smo rekonstruirali skupno 26.293 MAG, večinoma bakterijskih in arhealnih (slika 1b in razširjeni podatki, slika 1b).Te MAG smo ustvarili iz sklopov iz ločenih in ne združenih metagenomskih vzorcev, da bi preprečili propad naravnega variiranja zaporedja med vzorci z različnih lokacij ali časovnih točk (metod).Poleg tega smo združili genomske fragmente na podlagi njihove korelacije razširjenosti v velikem številu vzorcev (od 58 do 610 vzorcev, odvisno od raziskave; metode).Ugotovili smo, da je to zamuden, a pomemben korak24, ki je bil preskočen v več obsežnih obnovitvenih delih MAG16, 19, 25 in bistveno izboljša količino (2,7-krat v povprečju) in kakovost (+20 % v povprečju) genom.rekonstruiran iz tukaj raziskanega morskega metagenoma (razširjeni podatki, slika 2a in dodatne informacije).Na splošno so ta prizadevanja privedla do 4,5-kratnega povečanja morskih mikrobnih MAG (6-krat, če se upoštevajo le visokokakovostni MAG) v primerjavi z najobsežnejšim virom MAG, ki je danes na voljo16 (metode).Ta na novo ustvarjen komplet MAG je bil nato združen z 830 ročno izbranimi MAG26, 5969 SAG27 in 1707 REF.Sedemindvajset vrst morskih bakterij in arhej je sestavljalo kombinatorno zbirko 34.799 genomov (slika 1b).
Nato smo ovrednotili novo ustvarjeni vir, da bi izboljšali njegovo sposobnost predstavljanja skupnosti morskih mikrobov in ocenili vpliv integracije različnih tipov genoma.V povprečju smo ugotovili, da zajema približno 40–60 % morskih metagenomskih podatkov (slika 1c), kar je dvakrat do trikrat več kot prejšnja poročila samo o MAG tako glede globine kot zemljepisne širine Več serij 16 ali SAG20.Poleg tega smo za sistematično merjenje taksonomske raznolikosti v uveljavljenih zbirkah označili vse genome z uporabo orodja (metod) Genome Taxonomy Database (GTDB) in uporabili povprečno 95-odstotno nukleotidno identiteto celotnega genoma.28 za identifikacijo 8304 skupin vrst (vrst).Dve tretjini teh vrst (vključno z novimi kladi) se prej nista pojavili v GTDB, od tega jih je bilo 2790 odkritih z uporabo MAG, rekonstruiranega v tej študiji (slika 1d).Poleg tega smo ugotovili, da so različne vrste genomov zelo komplementarne: 55 %, 26 % in 11 % vrst je v celoti sestavljenih iz MAG, SAG in REF (slika 1e).Poleg tega je MAG zajel vseh 49 vrst, najdenih v vodnem stolpcu, medtem ko sta SAG in REF predstavljala samo 18 oziroma 11 vrst.Vendar pa SAG bolje predstavlja raznolikost najpogostejših klasov (razširjeni podatki, slika 3a), kot so Pelagic Bacteriales (SAR11), pri čemer SAG pokriva skoraj 1300 vrst, MAG pa samo 390 vrst.Predvsem se REF redko prekrivajo z MAG ali SAG na ravni vrste in predstavljajo >95 % od približno 1000 genomov, ki jih tukaj ne najdemo v metagenomskih nizih odprtega oceana, predvsem zaradi interakcij z drugimi vrstami izoliranih reprezentativnih morskih vzorcev (npr. sedimentov) .ali gostitelj-sodelavec).Da bi bil široko dostopen znanstveni skupnosti, je mogoče ta vir morskega genoma, ki vključuje tudi nerazvrščene fragmente (npr. iz predvidenih fagov, genomskih otokov in fragmentov genoma, za katere ni dovolj podatkov za rekonstrukcijo MAG), primerjati s taksonomskimi podatki .Dostopajte do opomb skupaj s funkcijo genov in kontekstualnimi parametri v podatkovni zbirki oceanske mikrobiologije (OMD; https://microbiomics.io/ocean/).
Nato smo se lotili raziskovanja bogastva in novosti biosintetskega potenciala v mikrobiomih odprtega oceana.V ta namen smo najprej uporabili antiSMASH za vse MAG, SAG in REF, najdene v 1038 morskih metagenomih (metod), da bi napovedali skupno 39.055 BGC.Nato smo jih združili v 6907 neredundantnih GCF in 151 populacij genskih grozdov (GCC; dodatna tabela 2 in metode), da bi upoštevali inherentno redundanco (tj. isti BGC je lahko kodiran v več genomih) in metagenomske podatke Fragmentacija koncentriranih BGC.Nepopolni BGC-ji niso bistveno povečali, če sploh (dodatne informacije), števila GCF-jev oziroma GCC-jev, ki vsebujejo vsaj enega nepoškodovanega člana BGC-ja v 44 % oziroma 86 % primerov.
Na ravni GCC smo našli široko paleto predvidenih RiPP in drugih naravnih izdelkov (slika 2a).Med njimi na primer arilpolieni, karotenoidi, ektoini in sideroforji pripadajo GCC s široko filogenetsko porazdelitvijo in visoko številčnostjo v oceanskih metagenomih, kar lahko kaže na široko prilagoditev mikroorganizmov na morsko okolje, vključno z odpornostjo na reaktivne kisikove spojine, oksidativni in osmotski stres..ali absorpcijo železa (več informacij).Ta funkcionalna raznolikost je v nasprotju z nedavno analizo približno 1,2 milijona BGC med približno 190.000 genomi, shranjenimi v zbirki podatkov NCBI RefSeq (BiG-FAM/RefSeq, v nadaljevanju RefSeq)29, ki je pokazala, da neribosomski peptidi sintetaze (NRPS) in poliketidna sintaza (PKS) BGC (dodatne informacije).Ugotovili smo tudi, da je 44 (29 %) GCC le oddaljeno povezanih s katerim koli RefSeq BGC (\(\bar{d}\)RefSeq > 0,4; slika 2a in metode) in 53 (35 %) GCC samo v MAG, kar poudarja potencial za odkrivanje prej neopisanih kemikalij v OMD.Glede na to, da vsak od teh GCC verjetno predstavlja zelo raznolike biosintetske funkcije, smo nadalje analizirali podatke na ravni GCF, da bi zagotovili podrobnejšo skupino BGC, za katere je predvideno, da kodirajo podobne naravne izdelke29.Skupno 3861 (56 %) identificiranih GCF se ni prekrivalo z RefSeq in > 97 % GCF ni bilo prisotnih v MIBiG, eni največjih zbirk podatkov eksperimentalno potrjenih BGC (slika 2b).Čeprav ni presenetljivo odkriti veliko potencialnih novih poti v okoljih, ki jih referenčni genom ne predstavlja dobro, se naša metoda za dereplikacijo BGC v GCF pred primerjalno analizo razlikuje od prejšnjih poročil 16 in nam omogoča, da zagotovimo nepristransko oceno novosti.Večina nove raznolikosti (3012 GCF ali 78 %) ustreza predvidenim terpenom, RiPP ali drugim naravnim produktom, večina (1815 GCF ali 47 %) pa je kodirana v neznanih vrstah zaradi njihovega biosintetskega potenciala.Za razliko od grozdov PKS in NRPS je manj verjetno, da bodo ti kompaktni BGC razdrobljeni med metagenomskim sestavljanjem 31 in omogočajo bolj časovno in virno intenzivno funkcionalno karakterizacijo njihovih izdelkov.
Skupaj 39.055 BGC je bilo združenih v 6.907 GCF in 151 GCC.a, predstavitev podatkov (notranji zunanji).Hierarhično združevanje razdalj BGC na podlagi GCC, od katerih jih 53 določi samo MAG.GCC vsebuje BGC iz različnih taksonov (ln-transformirana frekvenca vrat) in različnih razredov BGC (velikost kroga ustreza njegovi frekvenci).Za vsak GCC zunanja plast predstavlja število BGC, razširjenost (odstotek vzorcev) in razdaljo (najmanjša kosinusna razdalja BGC (min(dMIBiG))) od BiG-FAM do BGC.GCC z BGC, ki so tesno povezani z eksperimentalno preverjenimi BGC (MIBiG), so označeni s puščicami.b Če primerjamo GCF s predvidenimi (BiG-FAM) in eksperimentalno potrjenimi (MIBiG) BGC, je bilo najdenih 3861 novih (d–>0,2) GCF.Večina (78 %) teh kodira RiPP, terpene in druge domnevne naravne izdelke.c, so bili vsi genomi v OMD, najdeni v 1038 morskih metagenomih, postavljeni v osnovno drevo GTDB, da bi prikazali filogenetsko pokritost OMD.Klade brez genomov v OMD so prikazane sivo.Število BGC ustreza največjemu številu predvidenih BGC na genom v danem klasu.Zaradi jasnosti je zadnjih 15 % vozlišč strnjenih.Puščice označujejo klade, bogate z BGC (>15 BGC), z izjemo Mycobacterium, Gordonia (na drugem mestu za Rhodococcusom) in Crocosphaera (na drugem mestu po Synechococcusu).d, neznano c.Eremiobacterota je pokazala največjo biosintetsko raznolikost (Shannonov indeks glede na vrsto naravnega proizvoda).Vsak pas predstavlja genom z največ BGC v vrsti.T1PKS, PKS tipa I, T2/3PKS, PKS tipa II in tipa III.
Poleg bogastva in novosti raziskujemo biogeografsko strukturo biosintetskega potenciala morskega mikrobioma.Združevanje vzorcev glede na povprečno metagenomsko porazdelitev števila kopij GCF (metode) je pokazalo, da so skupnosti na nizki zemljepisni širini, površinske, s prokarionti bogate in z virusi revne skupnosti, večinoma iz površinskih ali globljih sončnih voda, bogate s terpeni RiPP in BGC.Nasprotno pa so bile polarne, globokomorske skupnosti, bogate z virusi in delci, povezane z večjo abundanco NRPS in PKS BGC (razširjeni podatki, slika 4 in dodatne informacije).Končno smo ugotovili, da so dobro raziskane tropske in pelagične skupnosti najbolj obetavni viri novih terpenov (razširjena podatkovna slika).Največji potencial za PKS, RiPP in druge naravne izdelke (Slika 5a z razširjenimi podatki).
Da bi dopolnili našo študijo biosintetskega potenciala morskih mikrobiomov, smo želeli preslikati njihovo filogenetsko porazdelitev in identificirati nove klade, obogatene z BGC.V ta namen smo postavili genome morskih mikrobov v normalizirano filogenetsko drevo bakterij in arhej GTDB13 in prekrili domnevne biosintetske poti, ki jih kodirajo (slika 2c).V vzorcih (metodah) morske vode smo z lahkoto odkrili več z BGC obogatenih klasov (predstavljenih z več kot 15 BGC-ji), ki so znani po svojem biosintetskem potencialu, kot so cianobakterije (Synechococcus) in bakterije Proteus, kot je Tistrella 32, 33, ali so nedavno pritegnile pozornost zaradi svojih naravni izdelki.kot so Myxococcota (Sandaracinaceae), Rhodococcus in Planctomycetota34,35,36.Zanimivo je, da smo v teh klasih našli več prej neraziskanih linij.Na primer, tiste vrste z najbogatejšim biosintetskim potencialom v vrsti Planctomycetota in Myxococcota so pripadale neopredeljenim kandidatnim redom oziroma rodovom (dodatna tabela 3).Skupaj to nakazuje, da OMD omogoča dostop do prej neznanih filogenetskih informacij, vključno z mikroorganizmi, ki lahko predstavljajo nove tarče za odkrivanje encimov in naravnih proizvodov.
Nato smo označili klas, obogaten z BGC, tako da ne samo preštejemo največje število BGC, ki jih kodirajo njegovi člani, ampak tudi z oceno raznolikosti teh BGC, kar pojasnjuje pogostost različnih vrst naravnih kandidatnih produktov (slika 2c in metode )..Ugotovili smo, da so bile v tej študiji najbolj biosintetsko raznolike vrste predstavljene s posebej izdelanimi bakterijskimi MAG.Te bakterije pripadajo nekultiviranemu deblu Candidatus Eremiobacterota, ki ostaja večinoma neraziskano, razen nekaj genomskih študij37,38.Omeniti velja, da je »ca.Rod Eremiobacterota je bil analiziran le v kopenskem okolju39 in ni znano, da vključuje člane, obogatene z BGC.Tukaj smo rekonstruirali osem MAG iste vrste (identiteta nukleotidov > 99 %) 23. Zato predlagamo ime vrste "Candidatus Eudoremicrobium malaspinii", poimenovano po nereidi (morski nimfi), čudovitem darilu v grški mitologiji in ekspedicijah.'Ka.V skladu s filogenetsko opombo 13 E. malaspinii nima predhodno znanih sorodnikov pod nivojem zaporedja in zato pripada novi bakterijski družini, ki jo predlagamo »Ca.E. malaspinii« kot tipska vrsta in »Ca.Eudormicrobiaceae« kot uradno ime (dodatne informacije).Kratka metagenomska rekonstrukcija 'Ca.Projekt genoma E. malaspinii je bil potrjen z zelo nizkim vnosom, metagenomskim sekvenciranjem z dolgim ​​branjem in ciljnim sestavljanjem enega vzorca (metode) kot enega samega 9,63 Mb linearnega kromosoma s 75 kb podvajanjem.kot edina preostala nejasnost.
Da bi ugotovili filogenetski kontekst te vrste, smo s ciljno rekonstrukcijo genoma iskali 40 tesno povezanih vrst v dodatnih metagenomskih vzorcih, obogatenih z evkarionti, iz ekspedicije Tara Ocean.Na kratko, metagenomske odčitke smo povezali z genomskimi fragmenti, povezanimi s "Ca.E. malaspinii« in domneval, da povečana stopnja novačenja v tem vzorcu kaže na prisotnost drugih sorodnikov (metode).Posledično smo našli 10 MAG, kombinacijo 19 MAG, ki predstavljajo pet vrst v treh rodovih znotraj na novo opredeljene družine (tj. »Ca. Eudormicrobiaceae«).Po ročnem pregledu in kontroli kakovosti (razširjeni podatki, slika 6 in dodatni podatki) smo ugotovili, da »Ca.Vrste Eudormicrobiaceae predstavljajo večje genome (8 Mb) in bogatejši biosintetski potencial (14 do 22 BGC na vrsto) kot drugi člani "Ca".Clade Eremiobacterota (do 7 BGC) (sl. 3a–c).
a, Filogenetski položaji petih 'Ca.Vrste Eudormicrobiaceae so pokazale bogastvo BGC, značilno za morske linije, identificirane v tej študiji.Filogenetsko drevo vključuje vse 'Ca.Za evolucijsko ozadje (metode) so bili uporabljeni MAG Eremiobacterota in člani drugih fil (številke genoma v oklepajih), ki so navedeni v GTDB (različica 89).Najbolj oddaljene plasti predstavljajo klasifikacije na ravni družine (»Ca. Eudormicrobiaceae« in »Ca. Xenobiaceae«) in na ravni razreda (»Ca. Eremiobacteria«).Pet vrst, opisanih v tej študiji, je predstavljenih z alfanumeričnimi kodami in predlaganimi binomskimi imeni (dodatne informacije).b, ok.Vrste Eudormicrobiaceae imajo sedem skupnih jeder BGC.Odsotnost BGC v kladu A2 je bila posledica nepopolnosti reprezentativnega MAG (dodatna tabela 3).BGC so specifični za »Ca.Amphithomicrobium« in »Ca.Amphithomicrobium« (klasa A in B) niso prikazani.c, Vsi BGC-ji, kodirani kot »Ca.Ugotovljeno je bilo, da je Eudoremicrobium taraoceanii izražen v 623 metatranskriptomih, vzetih iz oceanov Tare.Polni krogi označujejo aktivno transkripcijo.Oranžni krogi označujejo log2-transformirane spremembe gube pod in nad stopnjo izražanja gospodinjskega gena (metode).d, krivulje relativne abundance (metode), ki prikazujejo 'Ca.Vrste Eudormicrobiaceae so razširjene v večini oceanskih bazenov in v celotnem vodnem stolpcu (od površja do globine najmanj 4000 m).Na podlagi teh ocen smo ugotovili, da je 'ca.E. malaspinii' predstavlja do 6 % prokariontskih celic v globokomorskih pelagičnih skupnostih, povezanih z žitom.Šteli smo, da je vrsta prisotna na mestu, če je bila najdena v katerem koli delu velikosti dane globinske plasti.IO – Indijski ocean, NAO – Severni Atlantik, NPO – Severni Pacifik, RS – Rdeče morje, SAO – Južni Atlantik, SO – Južni ocean, SPO – Južni Pacifik.
Preučevanje številčnosti in porazdelitve Ca.Eudormicrobiaceae, ki, kot smo ugotovili, prevladuje v večini oceanskih bazenov, pa tudi v celotnem vodnem stolpcu (slika 3d).Lokalno predstavljajo 6 % skupnosti morskih mikrobov, zaradi česar so pomemben del svetovnega morskega mikrobioma.Poleg tega smo ugotovili relativno vsebnost Ca.Vrste Eudormicrobiaceae in njihove ravni izražanja BGC so bile najvišje v evkariontski obogateni frakciji (slika 3c in razširjeni podatki, slika 7), kar kaže na možno interakcijo z delci, vključno s planktonom.Ta ugotovitev je nekoliko podobna 'Ca.Eudoremicrobium BGC, ki proizvajajo citotoksične naravne produkte po znanih poteh, lahko kažejo plenilsko vedenje (dodatne informacije in razširjeni podatki, slika 8), podobno kot drugi plenilci, ki posebej proizvajajo metabolite, kot je Myxococcus41.Odkritje Ca.Eudormicrobiaceae v manj dostopnih (globok ocean) ali evkariontskih in ne prokariontskih vzorcih lahko pojasnijo, zakaj te bakterije in njihova nepričakovana raznolikost BGC ostajajo nejasne v kontekstu raziskav naravne hrane.
Končno smo poskušali eksperimentalno potrditi obljubo našega dela, ki temelji na mikrobiomu, pri odkrivanju novih poti, encimov in naravnih izdelkov.Med različnimi razredi BGC je znano, da pot RiPP kodira bogato kemično in funkcionalno raznolikost zaradi različnih posttranslacijskih modifikacij jedrnega peptida z zrelimi encimi42.Tako smo izbrali dva 'Ca.Eudoremicrobium' RiPP BGC (sliki 3b in 4a-e) temeljijo na istem kot kateri koli znani BGC (\(\bar{d}\)MIBiG in \(\bar{d}\)RefSeq nad 0,2).
a–c, In vitro heterologna ekspresija in in vitro encimski testi nove (\(\bar{d}\)RefSeq = 0,29) skupine biosinteze RiPP, specifične za globokomorske vrste Ca.E. malaspinii' privedla do proizvodnje difosforiliranih produktov.c, modifikacije, ugotovljene z uporabo MS/MS visoke ločljivosti (HR) (fragmentacija, označena z ioni b in y v kemijski strukturi) in NMR (razširjeni podatki, slika 9).d, ta fosforilirani peptid kaže nizko mikromolarno inhibicijo nevtrofilne elastaze sesalcev, ki je ni mogoče najti v kontrolnem peptidu in dehidracijskem peptidu (dehidracija, povzročena s kemičnim odstranjevanjem).Poskus je bil ponovljen trikrat s podobnimi rezultati.Na primer, heterologna ekspresija drugega novega \(\bar{d}\)RefSeq = 0,33) grozda biosinteze beljakovin pojasnjuje delovanje štirih zrelih encimov, ki spreminjajo jedrni peptid s 46 aminokislinami.Ostanki so obarvani glede na mesto modifikacije, predvideno s HR-MS/MS, označevanjem izotopov in analizo NMR (dodatne informacije).Črtkana obarvanost označuje, da do spremembe pride na enem od obeh ostankov.Slika je zbirka številnih heterolognih konstruktov, ki prikazujejo aktivnost vseh zrelih encimov na istem jedru.h, ilustracija podatkov NMR za N-metilacijo amida hrbtenice.Celotni rezultati so prikazani na sl.10 z razširjenimi podatki.i, Filogenetski položaj encima zrelega proteinskega grozda FkbM med vsemi domenami FkbM, najdenimi v bazi podatkov MIBiG 2.0, razkriva encim te družine z aktivnostjo N-metiltransferaze (dodatne informacije).Prikazani so shematski diagrami BGC (a, e), prekurzorskih peptidnih struktur (b, f) in domnevnih kemičnih struktur naravnih proizvodov (c, g).
Prva pot RiPP (\(\bar{d}\)MIBiG = 0,41, \(\bar{d}\)RefSeq = 0,29) je bila najdena le pri globokomorskih vrstah »Ca.E. malaspinii” in kode za prekurzor peptida (sl. 4a, b).V tem zrelem encimu smo identificirali eno samo funkcionalno domeno, homologno dehidracijski domeni lantipeptidne sintaze, ki običajno katalizira fosforilacijo in kasnejšo odstranitev 43 (dodatne informacije).Zato predvidevamo, da modifikacija prekurzorskega peptida vključuje tako dvostopenjsko dehidracijo.Vendar smo z uporabo tandemske masne spektrometrije (MS/MS) in jedrske magnetne resonančne spektroskopije (NMR) identificirali polifosforiliran linearni peptid (slika 4c).Čeprav je bilo nepričakovano, smo našli več vrst dokazov, ki potrjujejo, da je končni produkt: dva različna heterologna gostitelja in brez dehidracije v testih in vitro, identifikacija ključnih ostankov, mutiranih na mestu katalitične dehidracije zrelega encima.vse rekonstruiral “Ca”.Genom E. malaspinii (razširjeni podatki, slika 9 in dodatne informacije) in končno biološka aktivnost fosforiliranega produkta, ne pa tudi kemično sintetizirane dehidrirane oblike (slika 4d).Pravzaprav smo ugotovili, da kaže nizko mikromolarno inhibitorno aktivnost proteaze proti nevtrofilni elastazi, primerljivo z drugimi sorodnimi naravnimi proizvodi v območju koncentracij (IC50 = 14,3 μM) 44, kljub dejstvu, da je treba ekološko vlogo še razjasniti.Na podlagi teh rezultatov predlagamo, da bi pot poimenovali "fosfeptin".
Drugi primer je kompleksna pot RiPP, specifična za 'Ca.Za rod Eudoremicrobium (\(\bar{d}\)MIBiG = 0,46, \(\bar{d}\)RefSeq = 0,33) je bilo predvideno, da kodira naravne beljakovinske produkte (slika 4e).Te poti so posebnega biotehnološkega pomena zaradi pričakovane gostote in raznolikosti nenavadnih kemičnih modifikacij, ki jih vzpostavijo encimi, ki jih kodirajo razmeroma kratki BGC45.Ugotovili smo, da se ta protein razlikuje od prej opisanih proteinov po tem, da nima glavnega motiva NX5N policeramidov in lantioninske zanke landornamidov 46.Da bi premagali omejitve pogostih heterolognih vzorcev izražanja, smo jih uporabili skupaj s sistemom Microvirgula aerodenitrificans po meri za karakterizacijo štirih zrelih encimov (metod).S kombinacijo MS/MS, označevanja izotopov in NMR smo odkrili te zrele encime v 46-aminokislinskem jedru peptida (sl. 4f, g, razširjeni podatki, sl. 10–12 in dodatne informacije).Med zrelimi encimi smo označili prvi pojav člana družine FkbM O-metiltransferaze 47 na poti RiPP in nepričakovano ugotovili, da ta zreli encim uvaja hrbtenično N-metilacijo (sl. 4h, i in dodatne informacije).Čeprav je ta modifikacija znana v naravnih produktih NRP48, je encimska N-metilacija amidnih vezi kompleksna, a biotehnološko pomembna reakcija49, ki je bila doslej zanimiva za družino borozinov RiPP.Specifičnost 50,51.Identifikacija te aktivnosti v drugih družinah encimov in RiPP lahko odpre nove aplikacije in razširi funkcionalno raznolikost proteinov 52 in njihovo kemično raznolikost.Na podlagi ugotovljenih modifikacij in nenavadne dolžine predlagane strukture izdelka predlagamo ime poti "pitonamid".
Odkritje nepričakovane encimologije v funkcionalno označeni družini encimov ponazarja obljubo okoljske genomike za nova odkritja in tudi ponazarja omejeno sposobnost funkcionalnega sklepanja, ki temelji samo na homologiji zaporedja.Tako skupaj s poročili o nekanoničnih bioaktivnih polifosforiliranih RiPP-jih naši rezultati kažejo na vire intenzivne, a kritične vrednosti za prizadevanja sintetične biologije, da bi v celoti razkrili funkcionalno bogastvo, raznolikost in nenavadne strukture biokemičnih spojin.
Tukaj prikazujemo obseg biosintetskega potenciala, ki ga kodirajo mikrobi, in njihov genomski kontekst v globalnem morskem mikrobiomu, kar olajša prihodnje raziskave, tako da damo nastali vir na voljo znanstveni skupnosti (https://microbiomics.io/ocean/).Ugotovili smo, da je velik del njegove filogenetske in funkcionalne novosti mogoče pridobiti le z rekonstrukcijo MAG in SAG, zlasti v premalo izkoriščenih mikrobnih skupnostih, ki bi lahko usmerjale prihodnja prizadevanja za biološko iskanje.Čeprav se bomo tukaj osredotočili na 'Ca.Eudormicrobiaceae« kot linija, ki je še posebej biosintetično »nadarjena«, veliko BGC-jev, predvidenih v neodkriti mikrobioti, verjetno kodira prej neopisane encimologije, ki dajejo spojine z okoljsko in/ali biotehnološko pomembnim delovanjem.
Vključeni so bili metagenomski nabori podatkov iz večjih oceanografskih in časovnih študij z zadostno globino zaporedja, da bi povečali pokritost globalnih morskih mikrobnih skupnosti v oceanskih bazenih, globokih plasteh in skozi čas.Ti nabori podatkov (dodatna tabela 1 in slika 1) vključujejo metagenomiko iz vzorcev, zbranih v oceanih Tare (obogateni z virusi, n = 190; obogateni s prokarionti, n = 180) 12, 22 in odprave BioGEOTRACES (n = 480).Havajski oceanski časovni niz (HOT, n = 68), Bermudsko-atlantski časovni niz (BATS, n = 62)21 in odprava Malaspina (n = 58)23.Branje sekvenciranja iz vseh metagenomskih fragmentov je bilo filtrirano glede na kakovost z uporabo BBMap (v.38.71) z odstranitvijo adapterjev sekvenciranja iz branj, odstranitvijo branj, preslikanih v zaporedja nadzora kakovosti (genomi PhiX), in uporabo trimq=14, maq=20 zavrže slabo kakovost branja, maxns = 0 in minlength = 45. Naknadne analize so bile izvedene ali združene z odčitki QC, če je navedeno (bbmerge.sh minoverlap=16).Odčitki QC so bili normalizirani (bbnorm.sh target = 40, minddepth = 0) pred gradnjo z uporabo metaSPAdes (v.3.11.1 ali v.3.12, če je potrebno)53.Nastali kontigi ogrodja (v nadaljevanju ogrodja) so bili končno filtrirani po dolžini (≥1 kb).
1038 metagenomskih vzorcev je bilo razdeljenih v skupine in za vsako skupino vzorcev so bili metagenomski odčitki kontrole kakovosti vseh vzorcev usklajeni z oklepaji vsakega vzorca posebej, kar je povzročilo naslednje število parno oklepanih skupinskih odčitkov: Morski virusi Tara – obogateni (190×190 ), Prokaryotes Enriched (180×180), BioGEOTRACES, HOT in BATS (610×610) in Malaspina (58×58).Preslikava je bila izvedena z uporabo Burrows-Wheeler-Aligner (BWA) (v.0.7.17-r1188)54, ki omogoča ujemanje odčitkov s sekundarnimi mesti (z uporabo zastavice -a).Poravnave so bile filtrirane tako, da so dolge vsaj 45 baz, imajo ≥97 % identiteto in obsegajo ≥80 % branj.Nastale datoteke BAM so bile obdelane s skriptom jgi_summarize_bam_contig_depths za MetaBAT2 (v.2.12.1)55, da se zagotovi pokritost znotraj in med vzorci za vsako skupino.Končno so bili oklepaji združeni v skupine, da bi povečali občutljivost z individualnim izvajanjem MetaBAT2 na vseh vzorcih z –minContig 2000 in –maxEdges 500. Uporabljamo MetaBAT2 namesto ansambelskega bokserja, ker se je v neodvisnih testih izkazalo za najučinkovitejšega posameznega bokserja.in 10- do 50-krat hitrejši od drugih pogosto uporabljenih boksarjev57.Za testiranje učinka korelacij številčnosti je naključno izbran podvzorec metagenomike (10 za vsakega od dveh podatkovnih nizov Tara Ocean, 10 za BioGEOTRACES, 5 za vsako časovno serijo in 5 za Malaspino) dodatno uporabil samo vzorce.Interni vzorci so združeni, da se pridobijo informacije o pokritosti.(Dodatne informacije).
Dodatni (zunanji) genomi so bili vključeni v nadaljnjo analizo, in sicer 830 ročno izbranih MAG iz podmnožice nabora podatkov Tara Oceans26, 5287 SAG iz nabora podatkov GORG20 in podatki iz baze podatkov MAR (MarDB v. 4) iz 1707 izoliranih REF in 682 SAG) 27. Za nabor podatkov MarDB so genomi izbrani na podlagi razpoložljivih metapodatkov, če se vrsta vzorca ujema z naslednjim regularnim izrazom: '[S|s]single.?[C|c]ell|[C|c]ulture| [I|i] izoliran'.
Kakovost vsakega metagenomskega vsebnika in zunanjih genomov je bila ocenjena z uporabo CheckM (v.1.0.13) in Anvi'o's Lineage Workflow (v.5.5.0)58,59.Če CheckM ali Anvi'o poroča o ≥50 % popolnosti/popolnosti in ≤10 % kontaminaciji/redundanci, shranite metagenomske celice in zunanje genome za poznejšo analizo.Ti rezultati so bili nato združeni v povprečno popolnost (mcpl) in povprečno kontaminacijo (mctn), da se kakovost genoma razvrsti v skladu z merili skupnosti60, kot sledi: visoka kakovost: mcpl ≥ 90 % in mctn ≤ 5 %;dobra kakovost: mcpl ≥ 70 %, mctn ≤ 10 %, srednja kakovost: mcpl ≥ 50 % in mctn ≤ 10 %, primerna kakovost: mcpl ≤ 90 % ali mctn ≥ 10 %.Filtrirani genomi so bili nato korelirani z rezultati kakovosti (Q in Q'), kot sledi: Q = mcpl – 5 x mctn Q' = mcpl – 5 x mctn + mctn x (variabilnost seva)/100 + 0,5 x log[N50] .(implementirano v dRep61).
Da bi omogočili primerjalno analizo med različnimi viri podatkov in tipi genomov (MAG, SAG in REF), je bilo 34.799 genomov dereferenciranih na podlagi povprečne nukleotidne identitete (ANI) za celoten genom z uporabo dRep (v.2.5.4).Ponovitve)61 ​​s 95-odstotnimi pragovi ANI28,62 (-comp 0 -con 1000 -sa 0,95 -nc 0,2) in označevalnimi geni z eno kopijo z uporabo SpecI63, ki zagotavlja združevanje genoma v skupine na ravni vrste.Reprezentativni genom je bil izbran za vsako skupino dRep v skladu z najvišjo oceno kakovosti (Q'), opredeljeno zgoraj, ki je veljala za reprezentativno za vrsto.
Za ovrednotenje hitrosti preslikave je bil uporabljen BWA (v.0.7.17-r1188, -a) za preslikavo vseh 1038 nizov metagenomskih branj s 34.799 genomi, ki jih vsebuje OMD.Kakovostno nadzorovani odčitki so bili preslikani v enostranskem načinu in nastale poravnave so bile filtrirane, da so obdržale samo poravnave dolžine ≥45 bp.in identiteta ≥95 %.Razmerje prikaza za vsak vzorec je odstotek odčitkov, ki ostanejo po filtraciji, deljen s skupnim številom odčitkov kontrole kakovosti.Z uporabo istega pristopa je bil vsak od 1038 metagenomov zmanjšan na 5 milijonov vstavkov (razširjeni podatki, slika 1c) in usklajen z GORG SAG v OMD in v vseh GEM16.Količina MAG, pridobljena iz morske vode v katalogu GEM16, je bila določena s ključnimi poizvedbami metagenomskih virov, pri čemer so bili izbrani vzorci morske vode (npr. v nasprotju z morskimi usedlinami).Natančneje, izberemo »vodno« kot »kategorija_ekosistema«, »morsko« kot »vrsto_ekosistema« in filtriramo »habitat« kot »globok ocean«, »morsko«, »morsko oceansko«, »pelagično morje«, »morska voda«, »Ocean«, »Morska voda«, »Površinska morska voda«, »Površinska morska voda«.To je povzročilo 5903 MAG (734 visokokakovostnih), razdeljenih v 1823 OTU (ogledi tukaj).
Prokariontski genomi so bili taksonomsko označeni z uporabo GTDB-Tk (v.1.0.2)64 s privzetimi parametri, ki ciljajo na GTDB r89 različice 13. Anvi'o je bil uporabljen za identifikacijo evkariontskih genomov na podlagi napovedi domene in priklica ≥50 % in redundance ≤ 10 %.Taksonomska oznaka vrste je opredeljena kot eden od njenih reprezentativnih genomov.Z izjemo evkariontov (148 MAG) je bil vsak genom najprej funkcionalno označen z uporabo prokka (v.1.14.5)65, poimenovanje celotnih genov, definiranje parametrov "arheje" ali "bakterije", kot je potrebno, kar je navedeno tudi za ne- kodiranje genov.in regije CRISPR, med drugimi genomskimi lastnostmi.Označite napovedane gene tako, da identificirate univerzalne označevalne gene z eno kopijo (uscMG) z uporabo fetchMG (v.1.2)66, dodelite ortološke skupine in poizvedujte z emapperjem (v.2.0.1)67 na podlagi eggNOG (v.5.0)68.Podatkovna baza KEGG (objavljeno 10. februarja 2020) 69. Zadnji korak je bil izveden z ujemanjem beljakovin z bazo podatkov KEGG z uporabo DIAMOND (v.0.9.30)70 s poizvedbo in pokritostjo teme ≥70 %.Rezultati so bili dodatno filtrirani v skladu z NCBI Prokaryotic Genome Annotation Pipeline71 na podlagi bitne hitrosti ≥ 50 % največje pričakovane bitne hitrosti (sama povezava).Zaporedja genov so bila uporabljena tudi kot vhod za identifikacijo BGC v genomu z uporabo antiSMASH (v.5.1.0)72 s privzetimi parametri in različnimi eksplozijami grozdov.Vsi genomi in opombe so bili zbrani v OMD skupaj s kontekstualnimi metapodatki, ki so na voljo na spletu (https://microbiomics.io/ocean/).
Podobno kot pri predhodno opisanih metodah12,22 smo uporabili CD-HIT (v.4.8.1) za združevanje >56,6 milijonov genov, ki kodirajo beljakovine, iz genomov bakterij in arhej iz OMD v 95-odstotno identiteto in krajše gene (90-odstotno pokritost)73 do >17,7 milijona genskih skupin.Najdaljše zaporedje je bilo izbrano kot reprezentativni gen za vsako skupino genov.1038 metagenomov je bilo nato primerjanih z >17,7 milijona članov gruče BWA (-a), nastale datoteke BAM pa so bile filtrirane, da so obdržale samo poravnave z ≥95 % odstotno identiteto in ≥45 osnovnimi poravnavami.Dolžinsko normalizirana številčnost genov je bila izračunana tako, da so najprej prešteli vstavke iz najboljše edinstvene poravnave in nato, za mehko preslikane vstavke, dodali delna števila ustreznim ciljnim genom, sorazmerno z njihovim številom edinstvenih vstavkov.
Genomi iz razširjenega OMD (z dodatnimi MAG-ji iz »Ca. Eudormicrobiaceae«, glej spodaj) so bili dodani v bazo podatkov orodij za metagenomsko analizo mOTUs74 (v.2.5.1), da se ustvari razširjena referenčna baza podatkov mOTU.Od desetih uscMG je preživelo le šest genomov z eno kopijo (23.528 genomov).Razširitev baze podatkov je povzročila 4494 dodatnih grozdov na ravni vrste.1038 metagenomov je bilo analiziranih z uporabo privzetih parametrov mOTU (v.2).Profil mOTU ni zaznal skupno 989 genomov v 644 grozdih mOTU (95 % REF, 5 % SAG in 99,9 %, ki pripadajo MarDB).To odraža različne dodatne vire morske izolacije genomov MarDB (večina neodkritih genomov je povezanih z organizmi, izoliranimi iz sedimentov, morskih gostiteljev itd.).Da bi se v tej študiji še naprej osredotočali na okolje odprtega oceana, smo jih izključili iz nadaljnje analize, razen če so bili odkriti ali vključeni v razširjeno bazo podatkov mOTU, ustvarjeno v tej študiji.
Vsi BGC iz MAG, SAG in REF v OMD (glejte zgoraj) so bili združeni z BGC, identificiranimi v vseh metagenomskih ogrodjih (antiSMASH v.5.0, privzeti parametri) in označeni z uporabo BiG-SLICE (v.1.1) (domena PFAM)75.Na podlagi teh lastnosti smo izračunali vse kosinusne razdalje med BGC in jih združili (povprečne povezave) v GCF in GCC z uporabo pragov razdalje 0,2 oziroma 0,8.Ti pragovi so prilagoditev pragov, ki so bili prej uporabljeni z uporabo evklidske razdalje75 skupaj s kosinusno razdaljo, kar ublaži nekatere napake v prvotni strategiji združevanja BiG-SLICE (dodatne informacije).
BGC-ji so bili nato filtrirani, da so ohranili samo ≥5 kb, kodiranih na odrih, da bi zmanjšali tveganje fragmentacije, kot je bilo prej opisano16, in da bi izključili MarDB REF-je in SAG-je, ki jih ni bilo mogoče najti v 1038 metagenomih (glejte zgoraj).Posledica tega je bilo skupno 39.055 BGC, kodiranih z genomom OMD, z dodatnimi 14.106 identificiranimi na metagenomskih fragmentih (tj. niso združeni v MAG).Ti "metagenomski" BGC so bili uporabljeni za oceno deleža potenciala biosinteze morskega mikrobioma, ki ni zajet v zbirki podatkov (dodatne informacije).Vsak BGC je bil funkcionalno označen glede na napovedne vrste izdelkov, opredeljene z anti-SMASH ali grobejšimi kategorijami izdelkov, opredeljenimi v BiG-SCAPE76.Da bi preprečili pristranskost vzorčenja pri kvantifikaciji (taksonomska in funkcionalna sestava GCC/GCF, razdalja GCF in GCC do referenčnih zbirk podatkov in metagenomska številčnost GCF), je bilo z ohranjanjem samo najdaljšega BGC na GCF za vsako vrsto dodatno dedupliciranih 39.055 BGC, kar je povzročilo skupno 17.689 BGC.
Novost GCC in GCF je bila ocenjena na podlagi razdalje med izračunano zbirko podatkov (zbirka RefSeq v BiG-FAM)29 in eksperimentalno preverjeno (MIBIG 2.0)30 BGC.Za vsakega od 17.689 reprezentativnih BGC-jev smo izbrali najmanjšo kosinusno razdaljo do ustrezne baze podatkov.Te najmanjše razdalje so nato povprečne (povprečne) glede na GCF ali GCC, kot je ustrezno.GCF se šteje za novega, če je razdalja do baze podatkov večja od 0,2, kar ustreza idealni ločitvi med (povprečnim) GCF in referenco.Za GCC izberemo 0,4, kar je dvakratni prag, ki ga definira GCF, da zaklenemo dolgoročno razmerje s povezavami.
Metagenomska številčnost BGC je bila ocenjena kot povprečna številčnost njegovih biosintetskih genov (kot je določeno z anti-SMASH), ki so na voljo iz profilov na ravni genov.Metagenomska abundanca vsakega GCF ali GCC je bila nato izračunana kot vsota reprezentativnih BGC (od 17.689).Ti zemljevidi številčnosti so bili nato normalizirani za celično sestavo z uporabo števila mOTU na vzorec, ki je upoštevalo tudi prizadevanja zaporedja (razširjeni podatki, slika 1d).Prevalenca GCF ali GCC je bila izračunana kot odstotek vzorcev z abundanco > 0.
Evklidsko razdaljo med vzorci smo izračunali iz normaliziranega profila GCF.Te razdalje so bile zmanjšane z uporabo UMAP77 in nastale vdelave so bile uporabljene za nenadzorovano združevanje v gruče na podlagi gostote z uporabo HDBSCAN78.Optimalno minimalno število točk za gručo (in s tem število grozdov), ki jih uporablja HDBSCAN, se določi z maksimiranjem kumulativne verjetnosti članstva v gruči.Identificirani grozdi (in naključni uravnoteženi podvzorci teh grozdov za upoštevanje pristranskosti v permutacijski multivariatni analizi variance (PERMANOVA)) so bili testirani glede pomembnosti glede na nezmanjšane evklidske razdalje z uporabo PERMANOVA.Povprečna velikost genoma vzorcev je bila izračunana na podlagi relativne številčnosti mOTU in ocenjene velikosti genoma članov genomov.Zlasti je bila povprečna velikost genoma vsakega mOTU ocenjena kot povprečje velikosti genoma njegovih članov, popravljenih za popolnost (po filtriranju) (na primer, 75 % popoln genom z dolžino 3 Mb ima prilagojeno velikost 4 Mb).za srednje velike genome s celovitostjo ≥70 %.Povprečna velikost genoma za vsak vzorec je bila nato izračunana kot vsota velikosti genoma mOTU, tehtanih z relativno številčnostjo.
Filtriran niz z genomom kodiranih BGC v OMD je prikazan v bakterijskih in arhealnih drevesih GTDB (v ogrodjih ≥5 kb, razen REF in SAG MarDB, ki ju ni mogoče najti v 1038 metagenomih, glejte zgoraj) in njihovih predvidenih kategorijah izdelkov na podlagi filogenetskih položaj genoma (glej zgoraj).Najprej smo zmanjšali podatke po vrstah, pri čemer smo kot reprezentativnega uporabili genom z največ BGC v tej vrsti.Za vizualizacijo so bili predstavniki nadalje razdeljeni v drevesne skupine in ponovno je bil za vsak celični klad kot predstavnik izbran genom, ki vsebuje največje število BGC.Vrste, obogatene z BGC (vsaj en genom z > 15 BGC), smo nadalje analizirali z izračunom Shannonovega indeksa raznolikosti za vrste izdelkov, kodirane v teh BGC.Če so vse predvidene vrste izdelkov enake, se šteje, da kemični hibridi in drugi kompleksni BGC (kot predvideva anti-SMAH) pripadajo isti vrsti izdelka, ne glede na njihov vrstni red v gruči (npr. fuzija protein-bakteriocin in bakteriocin-proteoprotein). telo).hibrid).
Preostala DNK (ocenjena na 6 ng) iz vzorca Malaspina MP1648, ki ustreza biološkemu vzorcu SAMN05421555 in se ujema z metagenomskim bralnim kompletom Illumina SRR3962772 za kratko branje, obdelano v skladu s protokolom sekvenciranja PacBio z ultra nizkim vnosom za uporabo kompleta PacBio SMRTbell pomnoževanje vzorca gDNA komplet (100-980-000) in komplet za pripravo predloge SMRTbell Express 2.0 (100-938-900).Na kratko, preostalo DNK smo razrezali, popravili in očistili (kroglice ProNex) z uporabo Covaris (g-TUBE, 52104).Očiščena DNK je nato izpostavljena pripravi knjižnice, pomnoženju, čiščenju (kroglice ProNex) in izbiri velikosti (>6 kb, Blue Pippin) pred končno stopnjo čiščenja (kroglice ProNex) in sekvenciranjem na platformi Sequel II.
Rekonstrukcija prvih dveh ca.Za MAG Eremiobacterota smo identificirali šest dodatnih ANI >99 % (ti so vključeni v sliko 3), ki so bili prvotno filtrirani na podlagi rezultatov kontaminacije (kasneje identificirani kot podvojitve genov, glejte spodaj).Našli smo tudi pladenj z oznako "Ca".Eremiobacterota« iz različnih študij23 in jih uporabil skupaj z osmimi MAG-ji iz naše študije kot referenco za metagenomske odčitke iz 633 evkariontskih obogatenih (>0,8 µm) vzorcev z uporabo BWA (v.0.7.17) Ref -r1188, – zastavica) za zmanjšano vzorčenje kartiranje (5 milijonov branj).Na podlagi zemljevidov, specifičnih za obogatitev (filtriranih s 95-odstotno identiteto poravnave in 80-odstotno pokritostjo branja), je bilo za sestavljanje izbranih 10 metagenomov (pričakovana pokritost ≥5×) in dodatnih 49 metagenomov (pričakovana pokritost ≥1×) za korelacijo vsebine.Z uporabo istih parametrov kot zgoraj so bili ti vzorci združeni in dodanih je bilo 10 dodatnih 'Ca'.MAG Eremiobacterota je bil obnovljen.Teh 16 MAG (če ne štejemo dveh, ki sta že v zbirki podatkov) poveča skupno število genomov v razširjeni OMD na 34.815.MAG-jem so dodeljeni taksonomski rangi na podlagi njihove genomske podobnosti in položaja v GTDB.18 MAG je bilo z dRep depodvojenih v 5 vrst (intraspecifični ANI >99 %) in 3 rodove (intragenerični ANI 85 % do 94 %) znotraj iste družine79.Predstavniki vrst so bili ročno izbrani na podlagi celovitosti, kontaminacije in N50.Predlagana nomenklatura je navedena v dodatnih informacijah.
Ocenite celovitost in kontaminacijo 'Ca.MAG Eremiobacterota, smo ocenili prisotnost uscMG, kot tudi naborov genov markerjev z eno kopijo, specifičnih za rod in domeno, ki jih uporabljata CheckM in Anvi'o.Identifikacija 2 dvojnikov od 40 uscMG je bila potrjena s filogenetsko rekonstrukcijo (glej spodaj), da se izključi morebitna kontaminacija (to ustreza 5 % na podlagi teh 40 markerskih genov).Dodatna študija petih reprezentativnih MAG 'Ca.Nizka raven kontaminantov v teh rekonstruiranih genomih je bila potrjena za vrste Eremiobacterota z uporabo interaktivnega vmesnika Anvi'o, ki temelji na korelacijah številčnosti in sestave zaporedja (dodatne informacije)59.
Za filogenomsko analizo smo izbrali pet reprezentativnih MAG "Ca".Eudormicrobiaceae«, vse vrste »Ca.Genom Eremiobacterota in članov drugih fil (vključno z UBP13, Armatimonadota, Patescibacteria, Dormibacterota, Chloroflexota, Cyanobacteria, Actinobacteria in Planctomycetota) je na voljo pri GTDB (r89)13.Vsi ti genomi so bili označeni, kot je bilo prej opisano za ekstrakcijo gena markerja z eno kopijo in opombo BGC.Genomi GTDB so bili ohranjeni v skladu z zgornjimi merili celovitosti in kontaminacije.Filogenetska analiza je bila izvedena s potekom dela Anvi'o Phylogenetics59.Drevo je bilo zgrajeno z uporabo IQTREE (v.2.0.3) (privzete možnosti in -bb 1000)80 na poravnavi 39 tandemskih ribosomskih proteinov, ki jih je identificiral Anvi'o (MUSCLE, v.3.8.1551)81.Njegov položaj je bil zmanjšan.za pokrivanje vsaj 50 % genoma82 in Planctomycecota je bila uporabljena kot zunanja skupina na podlagi drevesne topologije GTDB.Eno drevo 40 uscMG je bilo zgrajeno z istimi orodji in parametri.
Uporabili smo Traitar (v.1.1.2) s privzetimi parametri (fenotip, iz nukleotidov)83 za napoved skupnih mikrobnih lastnosti.Raziskali smo potencialni plenilski način življenja, ki temelji na predhodno razvitem plenilskem indeksu84, ki je odvisen od vsebnosti gena, ki kodira beljakovine, v genomu.Natančneje, uporabljamo DIAMOND za primerjavo beljakovin v genomu z bazo podatkov OrthoMCL (v.4)85 z uporabo možnosti –more-sensive –id 25 –query-cover 70 –subject-cover 70 –top 20 IN preštejemo gene, ki ustrezajo označevalni geni za plenilce in neplenilce.Indeks je razlika med številom plenilskih in neplenilskih markacij.Kot dodatno kontrolo smo analizirali tudi genom »Ca«.Faktor Entotheonella TSY118 temelji na njegovi povezavi s Ca.Eudoremicrobium (velika velikost genoma in biosintetski potencial).Nato smo testirali potencialne povezave med markerskimi geni plenilcev in neplenilcev ter biosintetski potencial Ca.Eudormicrobiaceae« in ugotovil, da se največ en gen (iz katere koli vrste markerskega gena, tj. plenilskega/neplenilskega gena) prekriva z BGC, kar nakazuje, da BGC ne zamenjuje signalov plenjenja.Dodatna genomska označba kodiranih replikonov je bila izvedena z uporabo TXSSCAN (v.1.0.2), da se specifično preuči sistem izločanja, pili in flagele86.
Pet reprezentativnih 'Ca's je bilo preslikanih s preslikavo 623 metatranskriptomov iz prokariontskih in evkariontskih obogatitvenih frakcij oceanov Tara 22,40,87 (z uporabo BWA, v.0.7.17-r1188, -a zastavice).Genom Eudormicrobiaceae.Datoteke BAM so bile obdelane s funkcijo FeatureCounts (v.2.0.1)88 po 80-odstotni pokritosti branja in 95-odstotnem filtriranju identitete (z možnostmi featureCounts –primary -O –fraction -t CDS,tRNA -F GTF -g ID -p) število vstavkov na gen.Ustvarjeni zemljevidi so bili normalizirani za dolžino gena in številčnost markerskega gena mOTU (na dolžino normalizirano povprečno število vstavitev za gene s številom vstavitev >0) in logaritmično transformirani na 22,74, da dobimo relativno izražanje na celico vsake genske ravni, kar tudi pojasnjuje variabilnost od vzorca do vzorca med sekvenciranjem.Takšna razmerja omogočajo primerjalno analizo in ublažijo težave s sestavo pri uporabi podatkov o relativni številčnosti.Za nadaljnjo analizo so bili upoštevani samo vzorci z > 5 od 10 markerskih genov mOTU, ki so omogočili odkrivanje dovolj velikega dela genoma.
Normaliziran profil transkriptoma 'Ca.E. taraoceanii je bil izpostavljen zmanjšanju dimenzionalnosti z uporabo UMAP in nastala predstavitev je bila uporabljena za nenadzorovano združevanje v gruče z uporabo HDBSCAN (glej zgoraj) za določitev statusa izražanja.PERMANOVA preizkuša pomembnost razlik med identificiranimi grozdi v prvotnem (ne zmanjšanem) razdaljnem prostoru.Diferencialno izražanje med temi stanji je bilo preizkušeno v celotnem genomu (glej zgoraj) in identificirana je bila 201 pot KEGG v 6 funkcionalnih skupinah, in sicer: BGC, sistem izločanja in flagelarni geni iz TXSSCAN, razgradni encimi (proteaze in peptidaze) ter plenilski in ne- plenilski geni.označevalci plenilskega indeksa.Za vsak vzorec smo izračunali mediano normalizirane ekspresije za vsak razred (upoštevajte, da je sama ekspresija BGC izračunana kot mediana ekspresije biosintetičnih genov za ta BGC) in testirali pomembnost med državami (Kruskal-Wallisov test, prilagojen za FDR).
Sintetični geni so bili kupljeni pri GenScript, PCR primerji pa pri Microsynth.Za pomnoževanje DNA je bila uporabljena polimeraza Phusion podjetja Thermo Fisher Scientific.Za čiščenje DNA so bili uporabljeni plazmidi NucleoSpin, gel NucleoSpin in komplet za čiščenje PCR proizvajalca Macherey-Nagel.Restrikcijski encimi in T4 DNA ligaza so bili kupljeni pri New England Biolabs.Kemikalije, razen izopropil-β-d-1-tiogalaktopiranozida (IPTG) (Biosynth) in 1,4-ditiotreitola (DTT, AppliChem), so bile kupljene pri Sigma-Aldrich in uporabljene brez nadaljnjega čiščenja.Antibiotike kloramfenikol (Cm), spektinomicin dihidroklorid (Sm), ampicilin (Amp), gentamicin (Gt) in karbenicilin (Cbn) smo kupili pri AppliChem.Komponente medija Bacto Tripton in Bacto Yeast Extract so bile kupljene pri BD Biosciences.Tripsin za sekvenciranje je bil kupljen pri Promegi.
Genske sekvence so bile ekstrahirane iz anti-SMASH predvidenega BGC 75.1.E. malaspinii (dodatne informacije).
Geni embA (lokus, MALA_SAMN05422137_METAG-framework_127-gene_5), embM (lokus, MALA_SAMN05422137_METAG-framework_127-gene_4) in embAM (vključno z medgenskimi regijami) so bili sekvencirani kot sintetični konstrukti v pUC57(AmpR) z in brez optimiziranih kodonov ed za izražanje v E kdaj.Gen embA je bil subkloniran v prvo mesto večkratnega kloniranja (MCS1) pACYCDuet-1(CmR) in pCDFDuet-1(SmR) z mesti cepitve BamHI in HindIII.Gena embM in embMopt (kodonsko optimizirana) sta bila subklonirana v MCS1 pCDFDuet-1(SmR) z BamHI in HindIII ter postavljena na drugo mesto večkratnega kloniranja pCDFDuet-1(SmR) in pRSFDuet-1(KanR) (MCS2) z NdeI/ChoI.Kaseta embAM je bila subklonirana v pCDFDuet1(SmR) z mesti cepitve BamHI in HindIII.Gen orf3/embI (lokus, MALA_SAMN05422137_METAG-scaffold_127-gene_3) je bil konstruiran s PCR s prekrivajočo ekstenzijo z uporabo primerjev EmbI_OE_F_NdeI in EmbI_OE_R_XhoI, razgrajen z NdeI/XhoI in vezan v pCDFDuet-1-EmbM (MCS1) z uporabo istega re striktijski encimi (dopolnilo tabela).6).Prebavo in ligacijo z restrikcijskimi encimi smo izvedli v skladu s protokolom proizvajalca (New England Biolabs).

 


Čas objave: 14. marca 2023