304 u'amea u'amea u'amea fa'a'au fa'a'au fa'a'au'au fa'a'au'au fa'apa'u zhemical zomponent, Biosynthetic Avanoa o le Global Marine Microbiome.

Faafetai mo le asiasi ile Nature.com.O lo'o e fa'aogaina se su'esu'ega e fa'atapula'aina le lagolago a le CSS.Mo le poto sili ona lelei, matou te fautuaina oe e te faʻaogaina se suʻesuʻega fou (pe faʻamalo le Faiga Faʻatasi i Internet Explorer).E le gata i lea, ina ia mautinoa le lagolago faifaipea, matou te faʻaalia le saite e aunoa ma sitaili ma JavaScript.
Fa'ase'e o lo'o fa'aalia tala e tolu ile fa'ata.Fa'aoga le pito i tua ma le isi ki e fa'asolo ai fa'ase'e, po'o fa'amau fa'ase'e i le pito e fa'asolo ai fa'ase'e ta'itasi.

Fa'amatalaga auiliili o oloa

304 u'amea u'amea u'amea fa'a'au fa'a'au'au
1. Fa'amatalaga: Fa'alava u'amea u'amea / tubing
2. Ituaiga: uelo po'o seamless
3. Tulaga masani: ASTM A269, ASTM A249
4. Uamea uamea coil paipa OD: 6mm i 25.4MM
5. Umi: 600-3500MM poʻo le manaʻoga o tagata faʻatau.
6. Wall mafiafia: 0.2mm i 2.0mm.

7. Fa'apalepale: OD: +/-0.01mm;Mafiafia: +/-0.01%.

8. Coil pu i totonu tele: 500MM-1500MM (e mafai ona fetuunai e tusa ai ma manaoga o tagata faatau)

9. Coil maualuga: 200MM-400MM (e mafai ona fetuunai e tusa ai ma manaoga o tagata faatau)

10. Lau'ele'ele: Malamalama po'o fa'ama'i
11. Mea: 304, 304L, 316L, 321, 301, 201, 202, 409, 430, 410, alloy 625, 825, 2205, 2507, ma isi.
12. Faʻapipiʻiina: ato lalaga i totonu o pusa laupapa, paʻu laupapa, laʻau laupapa, poʻo le manaʻoga o tagata faʻatau
13. Suʻega : vaega vailaʻau, malosi e maua ai, malosi faʻamalosi, fuaina maʻaʻa
14. Faʻamautinoa: Le vaega lona tolu (mo se faʻataʻitaʻiga: SGS TV ) asiasiga, ma isi.
15. Fa'aoga: Teuteu, meaafale, felauaiga suau'u, suau'u vevela, fa'alava, fai pepa, ta'avale, gaosiga o mea'ai, foma'i, ma isi.

Fuafuaga Fa'ainisinia uma ma Meatotino Fa'aletino mo Uamea Fa'atauva'a e pei ona ta'ua i lalo:

Mea ASTM A269 Fa'ainumera Fa'ainumera % Max
C Mn P S Si Cr Ni Mo NB Nb Ti
TP304 0.08 2.00 0.045 0.030 1.00 18.0-20.0 8.0-11.0 ^ ^ ^ . ^
TP304L 0.035 2.00 0.045 0.030 1.00 18.0-20.0 8.0-12.0 ^ ^ ^ ^
TP316 0.08 2.00 0.045 0.030 1.00 16.0-18.0 10.0-14.0 2.00-3.00 ^ ^ ^
TP316L 0.035 D 2.00 0.045 0.030 1.00 16.0-18.0 10.0-15.0 2.00-3.00 ^ ^ ^
TP321 0.08 2.00 0.045 0.030 1.00 17.0-19.0 9.0-12.0 ^ ^ ^ 5C -0.70
TP347 0.08 2.00 0.045 0.030 1.00 17.0-19.0 9.0-12.0 10C -1.10 ^

 

Mea Togafitiga vevela Tempera F (C) Min. Malosi
Brinell Rockwell
TP304 Fofo 1900 (1040) 192HBW/200HV 90HRB
TP304L Fofo 1900 (1040) 192HBW/200HV 90HRB
TP316 Fofo 1900(1040) 192HBW/200HV 90HRB
TP316L Fofo 1900(1040) 192HBW/200HV 90HRB
TP321 Fofo 1900(1040) F 192HBW/200HV 90HRB
TP347 Fofo 1900(1040) 192HBW/200HV 90HRB

 

OD, inisi OD Fa'apalepale inisi(mm) WT Fa'apalepale % Umi Fa'apalepale inisi(mm)
+ -
≤ 1/2 ± 0.005 ( 0.13 ) ± 15 1 / 8 ( 3.2 ) 0
> 1 / 2 ~ 1 1 / 2 ± 0.005(0.13) ± 10 1 / 8 (3.2) 0
> 1 1 / 2 ~< 3 1 / 2 ± 0.010(0.25) ± 10 3 / 16 (4.8) 0
> 3 1 / 2 ~< 5 1 / 2 ± 0.015(0.38) ± 10 3 / 16 (4.8) 0
> 5 1 / 2 ~< 8 ± 0.030(0.76) ± 10 3 / 16 (4.8) 0
8~< 12 ± 0.040(1.01) ± 10 3 / 16 (4.8) 0
12~< 14 ± 0.050(1.26) ± 10 3 / 16 (4.8) 0

O nu'u fa'anatura microbial e phylogenetically ma metabolically eseese.I le faaopoopo atu i vaega le malamalama o meaola1, o lenei eseesega o loʻo i ai foi se gafatia tele mo le mauaina o enzymes taua ma biotechnologically enzymes ma biochemical compounds2,3.Ae ui i lea, o le suʻesuʻeina o lenei eseesega e fuafua ai le genomic pathways e faʻapipiʻiina ia mea faʻapipiʻi ma fusia i latou i latou taʻitasi e tumau pea se luʻitau.Ole malosi ole biosynthetic ole microorganisms ile vasa tele e tumau pea ona le iloa ona ole tapula'a ile au'ili'iliga o fa'amaumauga atoa ole genome i luga ole laiga ole lalolagi.O iinei, matou te suʻesuʻeina ai le eseesega ma le eseese o fuifui gene biosynthetic i le vasa e ala i le tuʻufaʻatasia pe tusa ma le 10,000 microbial genomes mai sela faʻaleaganuʻu ma sela tasi ma sili atu nai lo le 25,000 fou toe faʻaleleia genomes mai luga ole 1,000 suasami samples.O nei taumafaiga ua fa'ailoa mai ai e tusa ma le 40,000 o lo'o fa'apea o le tele o fa'aputuga o gene biosynthetic fou, o nisi o ia mea na maua i vaega phylogenetic e le'i masalomia muamua.I nei faitau aofa'i, na matou iloa ai se gafa fa'atamaoaigaina i fuifui o gene biosynthetic (“Candidatus Eudormicrobiaceae”) o lo'o iai i se phylum siama e le'i fa'ato'aina ma aofia ai nisi o meaola ninii e sili ona biosynthetically i lenei si'osi'omaga.O nei mea, ua matou faʻaalia le phosphatase-peptide ma le pytonamide auala, faʻamaonia faʻataʻitaʻiga o le faʻaogaina o le faʻaogaina o meaola faʻapitoa ma le enzymology, i le faasologa.I le faaiuga, o lenei suʻesuʻega o loʻo faʻaalia ai pe faʻapefea ona mafai e taʻiala faʻavae microbiome ona mafai ai ona suʻesuʻeina enzymes e leʻi faʻamatalaina muamua ma meaʻai faʻanatura i se microbiota ma le siosiomaga e le malamalama lelei.
O meaola ninii e fa'aosoina ai ta'amilosaga fa'a-biogeochemical a le lalolagi, fa'atumauina upega o mea'ai, ma tausia le soifua maloloina o la'au ma manu5.O le tele o latou phylogenetic, metabolic and functional diversity o lo'o fa'atusalia ai se tamaoaiga tele mo le mauaina o taxa1 fou, enzymes ma biochemical compounds, e aofia ai mea fa'anatura6.I totonu o faʻalapotopotoga faʻapitoa, o nei molelaʻau e tuʻuina atu ai meaola ninii ma le tele o galuega faʻaletino ma le siʻosiʻomaga, mai fesoʻotaʻiga i tauvaga 2, 7.I le faaopoopo atu ia latou uluai galuega, o nei oloa faʻanatura ma a latou auala faʻasologa faʻasologa faʻasolosolo e maua ai faʻataʻitaʻiga mo le biotechnological ma togafitiga faʻaoga2,3.O le fa'ailoaina o ia ala ma feso'ota'iga ua matua fa'afaigofieina e le su'esu'ega o microbes fa'aa'e.Peita'i, o su'esu'ega fa'aletupe o si'osi'omaga fa'anatura ua fa'aalia ai o le tele o meaola ninii e le'i fa'ato'aina.O lenei fa'aituau fa'ale-aganu'u e fa'atapula'aina ai lo tatou agava'a e fa'aogaina le 'ese'esega fa'atino e fa'ailogaina e le tele o microbes4,9.
Ina ia foia nei tapulaʻa, o le alualu i luma faatekinolosi i le sefulu tausaga ua tuanaʻi ua mafai ai e tagata suʻesuʻe ona tuusaʻo (e aunoa ma le aganuu muamua) faʻasologa o vaega DNA microbial mai nuʻu atoa (metagenomics) poʻo sela tasi.O le mafai ona faʻapipiʻi nei vaega i ni vaega tetele genome ma toe fausia le tele o metagenomically assembled genomes (MAGs) poʻo se tasi faʻateleina genomes (SAGs), i le faasologa, e tatalaina ai se avanoa taua mo suʻesuʻega taxocentric o le microbiome (ie, microbial community ma le microbiome).teuteu ala fou.lava mea fa'atupu i totonu o se si'osi'omaga tu'ufa'atasia) 10,11,12.O le mea moni, o suʻesuʻega talu ai nei ua matua faʻalauteleina ai le faʻatusa o le phylogenetic o microbial diversity i luga o le Earth1, 13 ma ua faʻaalia ai le tele o galuega eseese i totonu o nuʻu taʻitoʻatasi microbial e leʻi ufitia muamua e microorganism reference genome sequences (REFs)14.O le mafai ona tu'uina le 'ese'esega o galuega e le'i maua i totonu o le fa'asologa o le genome (ie, genome resolution) e taua tele mo le vavalo o laina microbial e le'i fa'avasegaina e ono fa'ailogaina ai oloa fa'anatura fou15,16 po'o le toe su'eina o ia mea fa'aopoopo i lo latou gaosiga muamua17.Mo se faʻataʻitaʻiga, o le tuʻufaʻatasia o le metagenomic ma le tasi-cell genomic analysis approach na taʻitaʻia ai le faʻamaonia o Candidatus Entotheonella, o se vaega o siama e fesoʻotaʻi i le omomi, e avea ma gaosiga o vailaʻau eseese18.Ae ui i lea, e ui lava i taumafaiga talu ai nei i suʻesuʻega genomic o nuʻu eseese microbial, 16,19 sili atu i le lua vaetolu o faʻamatalaga metagenomic i le lalolagi mo le sami tele o meaola faanatura o le lalolagi16,20 o loʻo misi pea.O le mea lea, i se tulaga lautele, o le gafatia o le biosynthetic o le microbiome o le gataifale ma lona gafatia e avea o se faleteuoloa o tala enzymatic ma mea faanatura o loʻo tumau pea le tele o suʻesuʻega.
Ina ia su'esu'e le gafatia o le biosynthetic o microbiomes o le gataifale i luga o le lalolagi atoa, na matou fa'amaopoopo muamua le gataifale microbial genomes maua mai le fa'aogaina o aga-aganu'u ma le le-aganu'u auala e fausia ai se fa'amaumauga tele o phylogenetics ma gene galuega.O le su'esu'ega o lenei fa'amaumauga na fa'aalia ai le tele o ituaiga o fuifui o kenera biosynthetic (BGCs), o le tele o ia mea e patino i aiga e le'i fa'avasegaina (GCF).E le gata i lea, na matou faailoaina se aiga siama e le o iloa o loʻo faʻaalia le maualuga o le lauiloa o BGC i le vasa tatala e oʻo mai i le taimi nei.Na matou filifilia ni auala se lua ribosomal synthesis ma post-translationally modified peptide (RiPP) auala mo le faʻataʻitaʻiga faʻamaonia e faʻavae i luga o latou eseesega faʻavae mai auala iloa nei.O le fa'atinoina o galuega o nei auala ua fa'aalia ai fa'ata'ita'iga fa'afuase'i o le enzymology fa'apea fo'i ma fa'aputuga e le masani ai fa'atasi ai ma gaioiga fa'asaina o le protease.
I le taimi muamua, matou te faʻamoemoe e fausia se punaoa faʻamaumauga o le lalolagi mo suʻesuʻega o le genome, e taulaʻi i ona vaega siama ma archaeal.I lea tulaga, matou faʻaputuina faʻamatalaga metagenomic ma 1038 suasami faʻataʻitaʻiga mai 215 faʻasalalauga faʻasalalau nofoaga faʻataʻitaʻiga (latitude range = 141.6 °) ma le tele o mea loloto (mai le 1 i le 5600 m i le loloto, e ufiufi ai le pelagic, mesopelagic ma abyssal zones).Background21,22,23 (Fig. 1a, faʻamatalaga faʻalautele, Ata 1a ma le Faʻamatalaga Faʻaopoopo 1).I le faaopoopo atu i le tuʻuina atu o le lautele lautele o faʻafanua, o nei faʻataʻitaʻiga filifilia filifilia na mafai ai ona matou faʻatusatusa vaega eseese o le microbiome o le gataifale, e aofia ai siama-oa (<0.2 µm), prokaryotic-oa (0.2-3 μm), mauoa-meamea (0.8 μm). ).–20 µm) ma fa'ama'i fa'ama'i (>0.2 µm) fa'ato'aga.
a, O le aofaʻi o 1038 faʻasalalauga faʻasalalau faʻasalalau (metagenomics) o nuʻu microbial o le gataifale na aoina mai 215 nofoaga faʻasalalau i le lalolagi atoa (62 ° S i le 79 ° N ma le 179 ° W i le 179 ° E.).Fa'afanua fa'afanua © Esri.Punaoa: GEBCO, NOAA, CHS, OSU, UNH, CSUMB, National Geographic, DeLorme, NAVTEQ, ma Esri.b, o nei metagenomes na faʻaaogaina e toe faʻaleleia ai MAGs (auala ma faʻamatalaga faaopoopo), e eseese i le tele ma le lelei (auala) i faʻamaumauga (faʻailoga i le lanu).O MAG na toe fausia na fa'aopoopoina i genomes avanoa lautele (fafo), e aofia ai MAG26, SAG27 ma REF.27 Tuufaatasia OMD.c, faʻatusatusa i lipoti talu ai e faʻavae i luga ole SAG (GORG) 20 poʻo le MAG (GEM) 16, OMD faʻaleleia le genomic characterization o le gataifale microbial community (metagenomic read mapping rate; method) i le lua i le tolu taimi ma sili atu faʻatusa faʻatusa i le loloto ma latitu..<0.2, n=151, 0.2-0.8, n=67, 0.2-3, n=180, 0.8-20, n=30, >0.2, n=610, <30°, n = 132, 30–60° , n = 73, >60°, n = 42, EPI, n = 174, MES, n = 45, BAT, n = 28. d, O le fa'avasegaina o le OMD i fa'aputuga o ituaiga (95% o lona uiga o le nucleotide) e iloa ai le aofa'i o e tusa ma le 8300 ituaiga, e sili atu ma le afa o ia mea e leʻi faʻamatalaina muamua e tusa ai ma faʻamatalaga taxonomic e faʻaaoga ai le GTDB (version 89) e, faʻavasegaina o ituaiga i ituaiga genome na faʻaalia ai o MAG, SAG ma REF e fetaui lelei le tasi ma le isi i le atagia o le phylogenetic diversity o le microbiome o le gataifale.Aemaise lava, 55%, 26% ma le 11% o ituaiga na faʻapitoa mo MAG, SAG ma REF, i le faasologa.BATS, Bermuda Atlantic Time Series;GEM, genomes o microbiome a le Lalolagi;GORG, fa'asinomaga o le sami o le lalolagi atoa;HOT, Vasa Hawaii faasologa taimi.
I le faʻaaogaina o lenei faʻamaumauga, na matou toe faʻaleleia ai le aofaʻi o le 26,293 MAGs, o le tele o siama ma archaeal (Fig 1b ma faʻalauteleina faʻamatalaga, Ata 1b).Na matou faia nei MAG mai faʻapotopotoga mai faʻapitoa nai lo le faʻapipiʻiina o faʻataʻitaʻiga metagenomic e puipuia ai le paʻu o le faʻasologa masani o suiga i le va o faʻataʻitaʻiga mai nofoaga eseese poʻo taimi (auala).E le gata i lea, matou te faʻavasegaina vaega genomic e faʻavae i luga o latou faʻasalalauga faʻasalalau i luga o le tele o faʻataʻitaʻiga (mai le 58 i le 610 faʻataʻitaʻiga, faʻalagolago i suʻesuʻega; metotia).Na matou iloa o se laasaga e alu ai le taimi ae taua24 lea na misia i le tele o galuega toe faʻaleleia MAG16, 19, 25 tetele ma faʻaleleia atili ai le aofaʻi (2.7-fold i le averesi) ma le lelei (+ 20% i le averesi) o le genome.toe fausia mai le metagenome o le gataifale suʻesuʻeina iinei (faʻamatalaga faʻalautele, Ata 2a ma faʻamatalaga faaopoopo).I le aotelega, o nei taumafaiga na mafua ai le faʻateleina o le 4.5-fold i le gataifale microbial MAGs (6-fold pe a naʻo le maualuga maualuga MAG e mafaufauina) pe a faʻatusatusa i le sili ona atoatoa MAG punaoa o loʻo maua i aso nei16 (Metotia).O lenei seti MAG na fa'afou fou na tu'ufa'atasia ma 830 MAG26s, 5969 SAG27s ma 1707 REFs.E luasefulu-fitu ituaiga o siama o le gataifale ma archaea na fausia ai se tuufaatasiga tuufaatasi o 34,799 genomes (Ata 1b).
Ona matou iloiloina lea o le punaoa fou na fausia e faʻaleleia ai lona gafatia e fai ma sui o nuʻu microbial o le gataifale ma iloilo le aʻafiaga o le tuʻufaʻatasia o ituaiga genome eseese.I le averesi, na matou iloa e aofia ai le tusa ma le 40-60% o faʻamatalaga metagenomic o le gataifale (Ata 1c), lua i le faatolu taimi le faʻasalalau o lipoti muamua MAG-naʻo i le loloto ma le latitude More serial 16 poʻo SAG20.E le gata i lea, ina ia fuaina faʻavasega le eseesega o lafoga i totonu o faʻaputuga faʻavae, matou te faʻamatalaina genomes uma e faʻaaoga ai le Genome Taxonomy Database (GTDB) toolkit (metotia) ma faʻaaogaina se faʻamatalaga genome-lautele nucleotide o le 95%.28 e iloa ai le 8,304 ituaiga o fuifui (ituaiga).O le lua vaetolu o nei ituaiga (e aofia ai faʻailoga fou) e leʻi faʻaalia muamua i le GTDB, lea na maua ai le 2790 i le faʻaaogaina o le MAG na toe fausia i lenei suʻesuʻega (Fig. 1d).E le gata i lea, na matou iloa ai o ituaiga eseese o genomes e sili ona faʻafesoʻotaʻi: 55%, 26%, ma le 11% o ituaiga o loʻo aofia uma i le MAG, SAG, ma le REF, i le faasologa (Fig. 1e).E le gata i lea, o le MAG na ufiufi uma ituaiga 49 o loʻo maua i le koluma vai, ae o le SAG ma le REF naʻo le 18 ma le 11 o latou, i le faasologa.Ae ui i lea, o le SAG e sili atu le faʻatusalia o le eseesega o clades sili ona taatele (faʻalauteleina faʻamatalaga, Ata 3a), e pei o Pelagic Bacteriales (SAR11), faʻatasi ai ma le SAG e aofia ai le toetoe 1300 ituaiga ma MAG naʻo 390 ituaiga.Ae maise lava, o REFs e seasea faʻapipiʻiina ma MAGs poʻo SAG i le tulaga o ituaiga ma faʻatusalia> 95% o le 1000 genomes e le o maua i le vasa vasa metagenomic seti suʻesuʻeina iinei, e mafua ona o fegalegaleaiga ma isi ituaiga o suʻesuʻega o le gataifale faʻapitoa (faʻataʻitaʻiga o le palapala). .poʻo le faʻafeiloaʻi-paʻaga).Ina ia faʻasalalau lautele i le sosaiete faʻasaienisi, o lenei punaoa genome o le gataifale, lea e aofia ai foʻi vaega e leʻi faʻavasegaina (faʻataʻitaʻiga, mai phages vavalo, motu genomic, ma vaega genome e le lava faʻamaumauga mo le toe faʻaleleia o MAG), e mafai ona faʻatusatusa i faʻamatalaga taxonomic. .Avanoa fa'amatalaga fa'atasi ai ma fa'agaioiga o le kenera ma fa'asologa o tala'aga i le Ocean Microbiology Database (OMD; https://microbiomics.io/ocean/).
Ona matou aga'i atu lea e su'esu'e le 'oa ma le fou o le gafatia o le biosynthetic i microbiome o le vasa matala.I lenei tulaga, na matou faʻaaogaina muamua le antiSMASH mo MAGs uma, SAG, ma REF o loʻo maua i le 1038 marine metagenomes (metotia) e vaʻai ai le aofaʻi o 39,055 BGCs.Ona matou tuʻufaʻatasia lea i le 6907 GCFs e le toe faʻaaogaina ma le 151 gene cluster populations (GCCs; Faʻamatalaga Faʻaopoopo 2 ma metotia) e faʻamaonia ai le faʻaogaina o le faʻaogaina (ie, o le BGC tutusa e mafai ona faʻaogaina i le tele o genomes) ma faʻamatalaga metagenomic Faʻasalaga o BGC faʻapitoa.E le'i mae'a BGCs e le'i fa'atupula'ia tele, pe a iai (Fa'amatalaga Fa'aopoopo), le numera o GCF ma GCC, fa'asologa, o lo'o i ai a itiiti ifo ma le to'atasi le sui o le BGC i le 44% ma le 86% o mataupu.
I le tulaga o le GCC, na matou maua ai le tele o ituaiga RiPP vavalo ma isi oloa faʻanatura (Fig. 2a).Faatasi ai ma i latou, mo se faʻataʻitaʻiga, arylpoyenes, carotenoids, ectoines, ma siderophores e aofia i le GCC ma le lautele o le tufatufaina o le phylogenetic ma le maualuga o le tele o metagenomes o le sami, lea e mafai ona faʻaalia ai le tele o fetuunaiga o microorganisms i le siosiomaga o le gataifale, e aofia ai le tetee atu i meaola okesene reactive, oxidative ma le osmotic stress..po'o le mitiia o le u'amea (sili atu fa'amatalaga).O lenei eseesega o galuega e faʻatusatusa i se suʻesuʻega lata mai e tusa ma le 1.2 miliona BGC i totonu o le 190,000 genomes o loʻo teuina i le NCBI RefSeq database (BiG-FAM/RefSeq, lea e taʻua mulimuli ane o RefSeq) 29, lea na faʻaalia ai le nonribosomal Synthetase peptides (NRPS) ma polyketide synthase. (PKS) BGCs (Fa'amatalaga Faaopoopo).Na matou maua foi 44 (29%) GCCs naʻo le mamao e fesoʻotaʻi ma soʻo se RefSeq BGC (\(\bar{d}\)RefSeq> 0.4; Ata 2a ma metotia) ma 53 (35%) GCCs naʻo le MAG, faʻamaonia le gafatia. e iloa ai vaila'au e le'i fa'amatalaina muamua ile OMD.Talu ai ona o nei GCC e foliga mai o lo'o fa'atusalia ai galuega fa'aola tino eseese, na matou toe su'esu'eina fa'amaumauga i le tulaga o le GCF i se taumafaiga e tu'uina atu se fa'aputuga au'ili'ili o BGC na valoia e fa'ailoga mo oloa fa'alenatura tutusa29.Ole aofa'i ole 3861 (56%) na fa'ailoaina GCFs e le'i fa'atasi ma RefSeq, ma> 97% o GCF e le'i iai ile MIBiG, o se tasi o fa'amaumauga sili ona tele o fa'ata'ita'iga fa'amaonia BGCs (Ata 2b).E ui e le o se mea e ofo ai le mauaina o le tele o auala fou i tulaga e le o faʻatusalia lelei e le genome faʻasino, o la matou auala mo le faʻaaogaina o BGC i totonu o GCF aʻo leʻi faʻailogaina e ese mai lipoti talu ai 16 ma mafai ai ona matou tuʻuina atu se iloiloga le faʻaituau o mea fou.Ole tele ole eseesega fou (3012 GCF po'o 78%) e fetaui ma terpenes valoia, RiPP po'o isi mea fa'alenatura, ma le tele (1815 GCF po'o 47%) o lo'o fa'ailogaina i ituaiga e le iloa ona o lo latou gafatia biosynthetic.E le pei o PKS ma NRPS fuifui, o nei BGCs faʻatusatusa e itiiti le faʻamavaeina i le taimi o le faʻapotopotoga metagenomic 31 ma faʻataga ai le tele o taimi-ma punaoa-malosi faʻatinoga faʻatinoga o latou oloa.
E tusa ma le 39,055 BGC na fa'avasegaina i le 6,907 GCF ma le 151 GCCs.a, fa'amatalaga fa'amatalaga (fafo totonu).Fa'apipi'i fa'asologa o BGC mamao e fa'atatau i le GCC, 53 o ia mea e fa'amauina e na'o MAG.O le GCC o lo'o i ai BGCs mai lafoga eseese (ln-transformed gate frequency) ma vasega BGC 'ese'ese (o le tele o le li'o e fetaui ma lona taimi).Mo GCC taʻitasi, o le pito i fafo o loʻo faʻatusalia le numera o BGCs, o le faʻateleina (pasene o faʻataʻitaʻiga), ma le mamao (maualalo BGC cosine mamao (min(dMIBiG))) mai le BiG-FAM i le BGC.GCC fa'atasi ma BGCs e feso'ota'i vavalalata ma BGC fa'ata'ita'i fa'amaonia (MIBiG) o lo'o fa'amamafaina i aū.b Fa'atusatusaina o le GCF ma valo'aga (BiG-FAM) ma fa'ata'ita'iga fa'amaonia (MIBiG) BGCs, 3861 fou (d->0.2) GCFs na maua.Ole tele (78%) o nei tulafono mo RiPP, terpenes, ma isi mea fa'anatura fa'anatura.c, o genomes uma i le OMD na maua i le 1038 marine metagenomes na tuʻuina i le GTDB base tree e faʻaalia ai le phylogenetic coverage o le OMD.Clades e leai ni genome i le OMD o loʻo faʻaalia i le lanu efuefu.Ole numera ole BGC e fetaui ma le numera tele ole BGC na valoia ile genome ile clade.Mo le manino, o le 15% mulimuli o nodes ua paʻu.O aū o loʻo faʻaalia ai le tele o le BGC (> 15 BGC), sei vagana ai le Mycobacterium, Gordonia (naʻo lona lua i le Rhodococcus), ma le Crocosphaera (lona lua ile Synechococcus).d, Le iloa c.Eremiobacterota na faʻaalia le maualuga o le biosynthetic diversity (Shannon index e faʻavae i luga ole ituaiga o oloa faʻanatura).O fa'aili ta'itasi e fai ma sui o le genome ma le tele o BGC i le ituaiga.T1PKS, PKS ituaiga I, T2/3PKS, PKS ituaiga II ma le ituaiga III.
I le faaopoopo atu i le tamaoaiga ma le fou, matou te suʻesuʻeina le biogeographic structure o le biosynthetic gafatia o le microbiome o le gataifale.O le fa'avasegaina o fa'ata'ita'iga i le averesi metagenomic GCF kopi kopi tufaina (Methods) na fa'aalia ai o nu'u maualalo-latitude, luga, prokaryotic-mauoa ma fa'ama'i-mativa nu'u, tele mai luga po'o vai loloto susulu o le la, sa mauoa i RiPP ma BGC terpenes.I le faʻatusatusaga, o polar, moana loloto, faʻamaʻi-ma nuʻu-mauoa faʻapitoa na fesoʻotaʻi ma le maualuga o le NRPS ma le PKS BGC (faʻalauteleina faʻamatalaga, Ata 4 ma faʻamatalaga faaopoopo).Mulimuli ane, na matou iloa ai o suʻesuʻega lelei o le teropika ma pelagic nuʻu o puna sili ona faʻamoemoeina o terpenes fou (Augmented Data Figure).Tulaga maualuga mo PKS, RiPP ma isi oloa faʻanatura (Ata 5a faʻatasi ai ma faʻamatalaga faʻalauteleina).
Ina ia faʻamaeʻaina la matou suʻesuʻega o le biosynthetic gafatia o microbiome o le gataifale, matou te faʻamoemoe e faʻafanua a latou faʻasalalauga phylogenetic ma faʻailoa fou BGC-faʻamaoaigaina clades.I lea tulaga, na matou tuʻuina atu le genomes o microbes o le gataifale i totonu o se GTDB13 masani faʻamaʻi ma archaeal phylogenetic laau ma faʻapipiʻi ai auala biosynthetic o loʻo latou faʻaogaina (Fig. 2c).Ua faigofie ona matou mauaina le tele o laupepa faʻamaoaigaina BGC (faʻatusalia e sili atu i le 15 BGCs) i faʻataʻitaʻiga o le suasami (auala) ua iloa mo lo latou gafatia biosynthetic, e pei o le cyanobacteria (Synechococcus) ma siama Proteus, e pei o Tistrella32,33, poʻo le taimi nei na tosina atu i ai mo latou. oloa faanatura .pei ole Myxococcota (Sandaracinaceae), Rhodococcus ma Planctomycetota34,35,36.O le mea e malie ai, na matou mauaina nisi o gafa e le'i su'esu'eina muamua i nei clades.Mo se fa'ata'ita'iga, o ia ituaiga meaola e sili ona tamaoaiga fa'aolaola i totonu o le phyla Planctomycetota ma Myxococcota o lo'o a'afia i fa'atonuga a sui tauva e le'i fa'avasegaina ma gafa, i le faasologa (Tulafono Faaopoopo 3).Ile tu'ufa'atasia, e ta'u mai ai e maua e le OMD le avanoa i fa'amatalaga phylogenetic e le'i iloa muamua, e aofia ai meaola ninii, lea e mafai ona fa'atusalia sini fou mo le enzyme ma le mauaina o oloa fa'anatura.
Ma le isi, matou te faʻaalia le BGC-faʻatamaʻia clade e le gata i le faitauina o le numera maualuga o BGCs faʻapipiʻiina e ona sui, ae faʻapea foʻi i le iloiloina o le eseesega o nei BGCs, lea e faʻamatalaina ai le tele o ituaiga eseese o oloa faʻa-natura (Fig. 2c ma metotia. )..Na matou iloa o le tele o ituaiga meaola eseese na faʻatusalia e MAGs siama faʻapitoa faʻainisinia i lenei suʻesuʻega.O nei siama e a'afia i le phylum e le'i fa'ato'aina Candidatus Eremiobacterota, lea e tumau pea e le'i su'esu'eina e ese mai nai su'esu'ega genomic37,38.E mataʻina le “ca.Ole ituaiga Eremiobacterota na'o le su'esu'eina ile si'osi'omaga teresitila39 ma e le'o iloa e aofia ai so'o se sui fa'atamaoaigaina ile BGC.O iinei ua matou toe fausia ai le valu MAG o le ituaiga lava e tasi (nucleotide identity> 99%) 23. O le mea lea matou te tuʻuina atu ai le igoa o le ituaiga "Candidatus Eudoremicrobium malaspinii", e faaigoa i le nereid (sea nymph), o se meaalofa matagofie i tala faʻasolopito Eleni ma malaga.'Ka.E tusa ai ma le phylogenetic annotation 13, E. malaspinii e leai ni aiga na iloa muamua i lalo o le fa'asologa o le fa'asologa ma o lea e aofia ai i se aiga siama fou lea matou te fa'atonuina "Ca.E. malaspinii” e pei o le ituaiga ituaiga ma le “Ca.Eudormicrobiaceae” o le igoa aloa’ia (Faamatalaga Faaopoopo).Toe fa'afouina metagenomic puupuu o 'Ca.O le E. malaspinii genome project na faʻamaonia e ala i le maualalo o le faʻaogaina, umi faitau metagenomic sequencing ma faʻatulagaina faʻapotopotoga o se faʻataʻitaʻiga (Methods) e pei o le 9.63 Mb linear chromosome e tasi ma le 75 kb kopi.ona na o le pau lea o le le mautonu o totoe.
Ina ia fa'amautu le fa'asologa o le phylogenetic o lenei ituaiga, na matou su'e ai ituaiga e 40 e feso'ota'i vavalalata i isi fa'ata'ita'iga metagenomic eukaryotic-fa'atamaoaigaina mai le malaga a Tara Ocean e ala i le toe fa'aleleia o genome.I se faapuupuuga, ua matou faʻafesoʻotaʻi faitau metagenomic i vaega genomic e fesoʻotaʻi ma le "Ca.E. malaspinii” ma fa'apea o le si'itia o le fa'afaigaluegaina o tagata i lenei fa'ata'ita'iga e fa'ailoa mai ai le iai o isi aiga (auala).O se taunuuga, na matou mauaina 10 MAG, o se tuufaatasiga o 19 MAG e fai ma sui o ituaiga e lima i le tolu genera i totonu o se aiga fou faʻamatalaina (ie "Ca. Eudormicrobiaceae").Ina ua maeʻa suʻesuʻega a le tusi lesona ma le faʻatonutonuina o le lelei (faʻalauteleina faʻamatalaga, Ata 6 ma faʻamatalaga faaopoopo), na matou maua ai o le "Ca.Eudormicrobiaceae ituaiga o loʻo maua ai genomes tetele (8 Mb) ma sili atu le gafatia biosynthetic (14 i le 22 BGC i ituaiga) nai lo isi sui "Ca".Clade Eremiobacterota (e oo atu i le 7 BGC) (Ata 3a–c).
a, Tulaga Phylogenetic o le lima 'Ca.O ituaiga o Eudormicrobiaceae na fa'aalia ai le tamaoaiga o le BGC fa'apitoa i laina o le gataifale o lo'o fa'ailoa mai i lenei su'esu'ega.O le phylogenetic laau e aofia uma 'Ca.MAG Eremiobacterota ma sui o isi phyla (numera genome i puipui) o loʻo tuʻuina atu ile GTDB (version 89) na faʻaogaina mo le faʻasologa o le evolusione (Methods).O pito pito i fafo o loʻo faʻatusalia faʻavasegaina i le tulaga o le aiga ("Ca. Eudormicrobiaceae" ma le "Ca. Xenobiaceae") ma le vasega ("Ca. Eremiobacteria").O ituaiga e lima o loʻo faʻamatalaina i lenei suʻesuʻega o loʻo faʻatusalia e numera alphanumeric ma igoa faʻapitoa (Faʻamatalaga Faʻaopoopo).b, lelei.Eudormicrobiaceae ituaiga e fa'asoa fa'atasi ai le fa'ato'aga masani BGC e fitu.O le toesea o le BGC i le A2 clade na mafua ona o le le atoatoa o le sui MAG (Laulau Faaopoopo 3).BGCs e patino i "Ca.Amphithomicrobium” ma le “Ca.Amphithomicrobium” (clades A ma B) e le o faaalia.c, BGC uma ua fa'ailogaina o le “Ca.Eudoremicrobium taraoceanii na maua e faʻaalia i le 623 metatranscriptomes na ave mai le sami o Tara.Li'o mautu o lo'o fa'ailoa mai ai le fa'aliliuga malosi.O li'o lanu moli o lo'o fa'aalia ai suiga o gaugau ua suia i le log2 i lalo ma luga a'e o le fua o le fa'aaliga o kenera (auala).o, pi'o fa'atele (auala) fa'aalia 'Ca.O ituaiga o Eudormicrobiaceae e salalau i le tele o pesini o le sami ma i totonu o le vai atoa (mai luga i le loloto o le itiiti ifo i le 4000 m).Faʻavae i luga o nei faʻatusatusaga, na matou maua ai 'Ca.E. malaspinii' e o'o atu i le 6% o sela prokaryotic i totonu o le sami loloto pelagic saito-fesoasoani nuu.Na matou manatu o se ituaiga e iai i se nofoaga pe a maua i so'o se vaega o le lapo'a o se vaega loloto.IO – Vasa Initia, NAO – North Atlantic, NPO – North Pacific, RS – Sami Ulaula, SAO – South Atlantic, SO – Southern Ocean, SPO – South Pacific.
Suesueina o le tele ma le tufatufaina o Ca.Eudormicrobiaceae, lea, e pei ona matou mauaina, e sili atu i le tele o pesini o le sami, faʻapea foʻi ma le koluma vai atoa (Fig. 3d).I le lotoifale, latou te faia le 6% o le gataifale microbial community, ma avea ai i latou ma vaega taua o le microbiome o le gataifale o le lalolagi.E le gata i lea, na matou mauaina le mea e aofia ai Ca.O ituaiga o Eudormicrobiaceae ma o latou tulaga faʻaaliga BGC na sili ona maualuga i le vaega faʻatamaoaigaina eukaryotic (Fig. 3c ma faʻamatalaga faʻalautele, Ata 7), e faʻaalia ai se fesoʻotaʻiga talafeagai ma mea faʻapitoa, e aofia ai le plankton.O lenei faʻamatalaga e foliga tutusa ma 'Ca.Eudoremicrobium BGCs e maua ai mea fa'alenatura cytotoxic e ala i auala iloa e mafai ona fa'aalia amioga fa'atau (Fa'amatalaga Fa'aopoopo ma Fa'amatalaga Fa'alautele, Ata 8), e tutusa ma isi manu fa'atupu fa'apitoa e maua mai metabolites pei ole Myxococcus41.Mauaina o Ca.Eudormicrobiaceae i totonu ole vasa loloto) po'o fa'ata'ita'iga eukaryotic nai lo prokaryotic e mafai ona fa'amatalaina pe aisea e tumau ai le le manino o nei siama ma a latou BGC fa'afuase'i i le tulaga o su'esu'ega o mea'ai fa'anatura.
Mulimuli ane, na matou taumafai e faʻataʻitaʻi faʻamaonia le folafolaga o la matou galuega faʻavae microbiome i le mauaina o auala fou, enzymes, ma mea faʻanatura.I totonu o vasega eseese o BGCs, o le RiPP auala ua lauiloa e faʻapipiʻi ai se vailaʻau mauoa ma galuega eseese ona o suiga eseese pe a maeʻa faʻaliliuga o le peptide autu e enzymes matua42.O lea na matou filifilia 'Ca.Eudoremicrobium 'RiPP BGCs (Ata 3b ma 4a-e) e faʻavae i luga o le tutusa ma soʻo se BGC iloa (\(\bar{d}\)MIBiG ma \(\bar{d}\)RefSeq luga 0.2) .
a-c, In vitro heterologous expression ma in vitro enzymatic assays o se tala (\(\bar{d}\)RefSeq = 0.29) fuifui o RiPP biosynthesis faapitoa mo le sami loloto Ca ituaiga.E. malaspinii' na taitai atu ai i le gaosiga o oloa diphosphorylated.c, suiga faʻaalia e faʻaaoga ai le maualuga (HR) MS / MS (vaega o loʻo faʻaalia e b ma y ion i le fausaga vailaʻau) ma le NMR (faʻalauteleina faʻamatalaga, Ata 9).d, o lenei peptide phosphorylated o loʻo faʻaalia ai le maualalo o le micromolar inhibition o mammalian neutrophil elastase, lea e le o maua i le peptide faʻatonutonu ma le peptide faʻamaʻi (aveese vailaʻau faʻaosoina faʻamaʻi).Sa fa'atolu ona fai le fa'ata'ita'iga fa'atasi ai ma taunu'uga tutusa.Mo se fa'ata'ita'iga, o le fa'aaliga heterologous o se tala lona lua \(\bar{d}\)RefSeq = 0.33) fuifui o porotini biosynthesis fa'amalamalamaina le galuega a enzymes matutua e fa e suia ai le 46 amino acid core peptide.O toega e pisia e tusa ai ma nofoaga o suiga na valoia e HR-MS / MS, faʻailoga o le isotope, ma suʻesuʻega NMR (Faʻamatalaga Faʻaopoopo).Fa'ailoga lanu e fa'aalia ai o le suiga e tupu i se tasi o toega e lua.O le fuainumera o se tu'ufa'atasiga o le tele o mea faufale e fa'aalia ai le gaioiga o enzymes matutua uma i luga o le nucleus tutusa.h, Faʻataʻitaʻiga o faʻamatalaga NMR mo le ivi tua amide N-methylation.O fa'ai'uga atoa o lo'o fa'aalia ile fig.10 ma faʻamatalaga faʻalautele.i, Phylogenetic tulaga o le matua FkbM protein fuifui enzyme i totonu o vaega uma FkbM o loʻo maua i le MIBiG 2.0 faʻamaumauga o loʻo faʻaalia ai se enzyme o lenei aiga ma le N-methyltransferase gaioiga (Faʻamatalaga Faʻaopoopo).Fa'ata'ita'iga ata o BGCs (a, e), fausaga peptide mua'i (b, f), ma fa'asologa o vaila'au fa'anatura o oloa fa'anatura (c, g) o lo'o fa'aalia.
O le auala muamua RiPP (\(\bar{d}\)MIBiG = 0.41, \(\bar{d}\)RefSeq = 0.29) na maua i totonu o le sami loloto "Ca.E. malaspinii” ma code mo Peptide-precursor (Ata 4a, b).I lenei enzyme matua, ua matou iloa ai se vaega e tasi o loʻo galue tutusa i le faʻaleagaina o le lantipeptide synthase lea e masani ona faʻaosoina le phosphorylation ma mulimuli ane aveese le 43 (Faʻamatalaga Faʻaopoopo).O le mea lea, matou te vavalo o le suiga o le peptide muamua e aofia ai se faʻamaʻi lua-laasaga.Ae ui i lea, o le faʻaaogaina o le tandem mass spectrometry (MS / MS) ma le faʻamaneta faʻamaneta spectroscopy (NMR), na matou iloa ai se polyphosphorylated linear peptide (Fig. 4c).E ui lava e leʻi faʻamoemoeina, na matou maua le tele o faʻamaoniga e lagolagoina ai lona avea ma oloa faʻaiʻuga: lua 'au eseese heterologous ma leai se faʻamaʻi ile in vitro assays, faʻamaonia o toega autu mutated i le catalytic dehydration site o le matua enzyme.toe fausia uma e le "Ca".O le E. malaspinii genome (faʻalauteleina faʻamatalaga, Fig. 9 ma faʻamatalaga faaopoopo) ma, mulimuli ane, o le gaioiga o meaola o le oloa phosphorylated, ae le o le chemically synthesized dehydrated form (Fig. 4d).O le mea moni, na matou iloa ai o loʻo faʻaalia ai le maualalo o le micromolar protease inhibitory activity e faasaga i le neutrophil elastase, faʻatusatusa i isi mea faʻalenatura e fesoʻotaʻi i totonu o le faʻamautuga (IC50 = 14.3 μM) 44, e ui lava i le mea moni e tumau pea le faʻamalamalamaina o le matafaioi o le siʻosiʻomaga.Faʻavae i luga o nei faʻaiʻuga, matou te faʻaigoaina le ala "phospheptin".
O le mataupu lona lua o se auala faigata RiPP e patino i 'Ca.O le ituaiga Eudoremicrobium (\(\bar{d}\)MIBiG = 0.46, \(\bar{d}\)RefSeq = 0.33) na valoia e fa'asolo ai oloa fa'alenatura (Fig. 4e).O nei auala e faapitoa le fiafia i le biotechnological ona o le maualuga ma le tele o suiga eseese o vailaʻau e faʻavaeina e enzymes ua faʻapipiʻiina e le BGCs45 puʻupuʻu.Na matou iloa o lenei polotini e ese mai i polotini na faʻaalia muamua i le leai o le NX5N motif autu o polyceramides ma le lanthionine loop of landornamides 46 .Ina ia fa'ato'ilaloina tapula'a o fa'ata'ita'iga masani o fa'amatalaga heterologous, na matou fa'aogaina fa'atasi ai ma se faiga fa'ale-aganu'u Microvirgula aerodenitrificans e fa'ailoa ai enzymes ala matutua e fa (auala).I le faʻaaogaina o le MS / MS, faʻailoga o le isotope, ma le NMR, na matou iloa ai nei enzymes matua i le 46-amino acid core o le peptide (Fig. 4f, g, faʻalauteleina faʻamatalaga, Fig. 10-12 ma faʻamatalaga faaopoopo).Faatasi ai ma enzymes matutua, matou te faʻaalia le foliga muamua o se tagata o le aiga FkbM O-methyltransferase 47 i le ala RiPP ma faʻafuaseʻi ona maua o lenei enzyme matua e faʻafeiloaʻi le N-methylation i tua (Fig. 4h, i ma faʻamatalaga faaopoopo).E ui lava o lenei suiga e iloa i oloa NRP48 faanatura, o le enzymatic N-methylation o fusi o amide o se faʻalavelave faʻalavelave ae faʻapitoa le faʻaogaina o le biotechnologically49 lea ua leva ona fiafia i ai le aiga RiPP o borosines.Fa'apitoa 50,51.O le faailoaina o lenei gaioiga i isi aiga o enzymes ma RiPP e mafai ona tatalaina ni talosaga fou ma faʻalauteleina ai le faʻaogaina o le eseesega o polotini 52 ma o latou vailaʻau eseese.Faʻavae i luga o suiga faʻamaonia ma le umi e le masani ai o le fausaga o oloa fuafuaina, matou te tuʻuina atu se igoa ala "pythonamide".
O le mauaina o se enzymology e le'i mafaufauina i totonu o se aiga o enzymes e fa'atinoina e fa'aalia ai le folafolaga o le si'osi'omaga genomics mo su'esu'ega fou, ma fa'aalia ai fo'i le fa'atapula'aina o le gafatia mo le fa'atinoina o le fa'atatau i le fa'asologa o le homology na'o.O le mea lea, faʻatasi ai ma lipoti o le non-canonical bioactive polyphosphorylated RiPPs, o matou faʻaiʻuga o loʻo faʻaalia ai le faʻaogaina o punaʻoa ae taua tele i taumafaiga faʻasolosolo faʻasolosolo e faʻaalia atoatoa ai le tamaoaiga galue, eseesega, ma fausaga e le masani ai o mea faʻapitoa.
O iinei matou te faʻaalia ai le tele o le biosynthetic gafatia e faʻapipiʻiina e microbes ma o latou genomic context i le microbiome o le gataifale o le lalolagi, faʻafaigofie suʻesuʻega i le lumanaʻi e ala i le faʻaavanoaina o punaoa maua i le sosaiete faasaienisi (https://microbiomics.io/ocean/).Na matou iloa o le tele o ana phylogenetic ma galuega fou e mafai ona maua e ala i le toe faʻaleleia o MAG ma SAGs, aemaise lava i nuʻu microbial e le faʻaaogaina e mafai ona taʻitaʻia taumafaiga bioprospecting i le lumanaʻi.E ui lava o le a tatou taulai atu iinei i 'Ca.Eudormicrobiaceae" ose gafa aemaise biosynthetically "taleni", o le tele o BGCs na valoia i le microbiota e le'i maua e foliga mai o lo'o fa'apipi'iina ai enzymologies e le'i fa'amatalaina muamua e maua mai ai mea fa'atasi ma gaioiga fa'alesiosiomaga ma/po'o le biotechnologically.
Metagenomic datasets mai le tele o su'esu'ega o le sami ma su'esu'ega fa'asologa o taimi ma lava le loloto o le fa'asologa na aofia ai e fa'ateleina le fa'aogaina o nu'u microbial o le gataifale o le lalolagi i pesini o le vasa, loloto ma le aluga o taimi.O nei faʻamaumauga (Laulau Faʻaopoopo 1 ma le Ata 1) e aofia ai metagenomics mai faʻataʻitaʻiga na aoina i le sami o Tara (viral enriched, n=190; prokaryotic enriched, n=180)12,22 ma le BioGEOTRACES expedition (n=480).Hawaiian Oceanic Time Series (HOT, n = 68), Bermuda-Atlantic Time Series (BATS, n = 62)21 ma le Malaspina Expedition (n = 58)23.O le fa'asologa o faitauga mai vaega uma o metagenomic na fa'amama mo le lelei e fa'aaoga ai le BBMap (v.38.71) e ala i le aveesea o fa'asologa fa'asologa mai le faitau, aveese le faitau fa'afanua i fa'atonuga lelei (PhiX genomes), ma le fa'aogaina o le trimq=14, maq=20 lafoa'i le lelei o le faitau, maxns = 0 ma le minlength = 45. O su'esu'ega mulimuli ane na fa'atautaia pe tu'u fa'atasi ma QC faitau pe a fa'amaonia (bbmerge.sh minoverlap=16).O faitauga QC na fa'atonuina (bbnorm.sh target = 40, minddepth = 0) a'o le'i fausia le fa'aoga metaSPAdes (v.3.11.1 po'o le v.3.12 pe a mana'omia)53.O fa'aputuga fa'atupu fa'atupu (e ta'ua mulimuli ane o fa'amanu) na i'u ina fa'amama i le umi (≥1 kb).
O le 1038 metagenomic samples sa vaevaeina i ni vaega, ma mo vaega taʻitasi o faʻataʻitaʻiga, o le metagenomic quality control faitau o faʻataʻitaʻiga uma na faʻafetaui ma puipui o faʻataʻitaʻiga taʻitasi eseese, ma iʻu ai i le numera o loʻo i lalo o paʻu paʻu vaega e faitau: Tara Marine Viruses - Faʻatamaoaigaina (190 × 190), Prokaryotes Enriched (180 × 180), BioGEOTRACES, HOT ma BATS (610 × 610) ma Malaspina (58 × 58).Na faia le faʻafanua e faʻaaoga ai le Burrows-Wheeler-Aligner (BWA) (v.0.7.17-r1188) 54 lea e mafai ai ona faʻafetaui faitauga i nofoaga lona lua (faʻaaoga le -a fuʻa).O fa'aoga sa fa'amamāina ia le itiiti ifo i le 45 fa'avae le umi, maua ≥97% fa'asinomaga, ma le umi ≥80% faitau.O faila BAM na maua mai na fa'aogaina e fa'aaoga ai le jgi_summarize_bam_contig_depths script mo MetaBAT2 (v.2.12.1)55 e tu'uina atu i totonu ma va'aiga fa'ata'ita'iga fa'asalalauga mo vaega ta'itasi.Mulimuli ane, faʻapipiʻi faʻapipiʻi e faʻateleina ai le faʻalogo e ala i le taʻavale taʻitoʻatasi MetaBAT2 i luga o faʻataʻitaʻiga uma ma -minContig 2000 ma -maxEdges 500. Matou te faʻaogaina le MetaBAT2 nai lo se pusa faʻataʻitaʻiga aua ua faʻaalia i suʻega tutoʻatasi e avea ma pusa taʻitoʻatasi sili ona aoga.ma le 10 i le 50 taimi e sili atu le vave nai lo isi pusa fusu e masani ona fa'aaogaina57.Ina ia suʻeina le aʻafiaga o le tele o fesoʻotaʻiga, o se faʻataʻitaʻiga filifilia faʻasolosolo o metagenomics (10 mo taʻiala taʻitasi o Tara Ocean datasets, 10 mo BioGEOTRACES, 5 mo taimi taʻitasi, ma le 5 mo Malaspina) faʻaopoopo faʻaaoga faʻataʻitaʻiga.O fa'ata'ita'iga i totonu o lo'o fa'avasegaina e maua ai fa'amatalaga fa'amatalaga.(Faamatalaga Faaopoopo).
O genomes faaopoopo (fafo) na aofia i le suʻesuʻega mulimuli ane, e taʻua o le 830 MAGs filifilia ma le lima mai se vaega o le Tara Oceans26 dataset, 5287 SAGs mai le GORG20 dataset, ma faʻamaumauga mai le MAR database (MarDB v. 4) mai 1707 isolated REFs ma 682 SAGs) 27. Mo le MarDB dataset, genomes e filifilia e fa'atatau i metadata avanoa pe afai o le ituaiga fa'ata'ita'iga e fetaui ma fa'amatalaga masani nei: '[S|s]ingle.?[C|c]ell|[C|c]ulture| [I|i] faaesea'.
O le lelei o pusa metagenomic ta'itasi ma genomes i fafo na iloiloina e fa'aaoga ai le CheckM (v.1.0.13) ma le Anvi'o's Lineage Workflow (v.5.5.0)58,59.Afai e lipoti mai e le CheckM po'o le Anvi'o le ≥50% le atoatoa / atoatoa ma le ≤10% le fa'aleaga/redundancy, ona fa'asaoina lea o sela metagenomic ma genomes fafo mo su'esu'ega mulimuli ane.O nei togi na tu'ufa'atasia i le tulaga atoatoa (mcpl) ma le fa'aleagaina (mctn) e fa'avasega ai le tulaga lelei o le genome e tusa ai ma fa'atonuga a le nu'u60 e fa'apea: maualuga: mcpl ≥ 90% ma le mctn ≤ 5%;uiga lelei: mcpl ≥ 70%, mctn ≤ 10%, tulaga lelei: mcpl ≥ 50% ma mctn ≤ 10%, tulaga lelei: mcpl ≤ 90% poʻo mctn ≥ 10%.Ona fa'amaopoopoina lea o genomes ua fa'amama ma togi lelei (Q ma Q') e pei ona ta'ua i lalo: Q = mcpl – 5 x mctn Q' = mcpl – 5 x mctn + mctn x (suiga o le galu)/100 + 0.5 x log [N50] .(fa'atinoina i le dRep61).
Ina ia faʻatagaina le faʻatusatusaina o suʻesuʻega i le va o faʻamatalaga faʻamatalaga eseese ma ituaiga genome (MAG, SAG ma REF), 34,799 genomes na faʻataʻatia e faʻavae i luga o le genome-wide averesi nucleotide identity (ANI) faʻaaoga le dRep (v.2.5.4).Toe fai) 61 ma 95% ANI thresholds28,62 (-comp 0 -con 1000 -sa 0.95 -nc 0.2) ma faʻailoga tasi kopi faʻaoga e faʻaaoga ai SpecI63 tuʻuina atu genome clustering i le ituaiga ituaiga.Na filifilia se genome sui mo fuifui dRep taitasi e tusa ai ma le maualuga maualuga sikoa (Q') faʻamatalaina i luga, lea na manatu e fai ma sui o le ituaiga.
Ina ia iloilo le saoasaoa o le faafanua, BWA (v.0.7.17-r1188, -a) na faʻaaogaina e faʻafanua uma 1038 seti o metagenomic faitau ma 34,799 genomes o loʻo i totonu o le OMD.Sa fa'afanua fa'atonuga lelei faitau i le fa'ai'uga tasi ma fa'ai'uga fa'ai'uga na fa'amama e fa'atumauina na'o fa'aoga ≥45 bp le umi.ma fa'asinomaga ≥95%.Ole fua fa'aaliga mo fa'ata'ita'iga ta'itasi o le pasene o faitauga o lo'o totoe pe a mae'a fa'amama e vaevaeina i le aofa'i o faitau fa'atonutonu lelei.I le faʻaaogaina o le auala lava e tasi, o le 1038 metagenomes na faʻaititia i le 5 miliona faʻapipiʻi (faʻalauteleina faʻamatalaga, Ata 1c) ma fetaui ma GORG SAG i OMD ma i GEM16 uma.Ole aofa'i ole MAG na maua mai le suasami ile GEM16 catalog na fa'amauina e ala i fesili autu ole puna metagenomic, filifilia o suasami fa'ata'ita'i (fa'ata'ita'iga, fa'afeagai ma le palapala o le gataifale).Aemaise lava, matou te filifilia le "vai" o le "ecosystem_category", "marine" o le "ecosystem_type", ma faamama le "nofoaga" e pei o le "vasa loloto", "marine", "maritime oceanic", "pelagic marine", "vai sami" , “Ocean”, “Suavai o le Sami”, “Suavai i luga o le sami”, “Suavai o le sami”.O lenei mea na mafua ai le 5903 MAGs (734 maualuga maualuga) tufatufaina i luga ole 1823 OTUs (vaaiga iinei).
Prokaryotic genomes sa taxonomically annotated e fa'aaoga GTDB-Tk (v.1.0.2)64 fa'atasi ai ma tapula'a fa'aletonu e fa'atatau i le GTDB r89 version 13. Na fa'aogaina le Anvi'o e fa'ailoa ai genomes eukaryotic e fa'avae i luga ole va'aiga va'aiga ma manatua ≥50% ma redundancy ≤ 10%.Ole fa'amatalaga taxonomic o se ituaiga o lo'o fa'amatalaina o se tasi o ona genome sui.Se'i vagana ai eukaryotes (148 MAG), o genome ta'itasi sa muamua ona fa'ailoa mai i le fa'aogaina o le prokka (v.1.14.5)65, fa'aigoaina o kenera atoatoa, fa'amatalaina "archaea" po'o le "bacteria" pe a mana'omia, lea o lo'o lipotia fo'i mo le le-. coding genes.ma itulagi CRISPR, faatasi ai ma isi vaega genomic.Fa'amatalaga kenera vavalo e ala i le fa'ailoaina o kenera fa'ailoga tasi-kopi lautele (uscMG) fa'aaoga fetchMG (v.1.2)66, tofia vaega fa'akomupiuta ma fa'afesili e fa'aaoga ai le emapper (v.2.0.1)67 fa'avae ile eggNOG (v.5.0)68.KEGG database (faʻasalalau Fepuari 10, 2020) 69. O le laasaga mulimuli na faia e ala i le faʻafetauiina o polotini i le KEGG database e faʻaaoga ai le DIAMOND (v.0.9.30)70 faʻatasi ai ma se faʻamatalaga ma autu e aofia ai ≥70%.Na toe fa'amama fa'ai'uga e tusa ai ma le NCBI Prokaryotic Genome Annotation Pipeline71 e fa'atatau ile bitrate ≥ 50% ole maualuga ole bitrate (feso'ota'iga lava ia).Na faʻaaogaina foʻi faʻasologa o kene e fai ma faʻaoga e iloa ai BGC i le genome e faʻaaoga ai le antiSMASH (v.5.1.0) 72 faʻatasi ai ma faʻamaufaʻailoga le lelei ma faʻalavelave faʻalavelave faʻalavelave.O genomes uma ma fa'amatalaga ua tu'ufa'atasia i le OMD fa'atasi ai ma metadata fa'amatalaga o lo'o maua i luga ole laiga (https://microbiomics.io/ocean/).
E tutusa ma metotia na faʻamatalaina muamua12,22 matou te faʻaogaina le CD-HIT (v.4.8.1) e faʻapipiʻi> 56.6 miliona protein-coding genes mai siama siama ma archaeal genomes mai OMD i le 95% faʻamatalaga ma kenera pupuu (90% faʻasalalau)73 e oʻo atu i >17.7 miliona gene fuifui.O le faasologa sili ona umi na filifilia e fai ma kenera sui mo fuifui gene ta'itasi.O le 1038 metagenomes na fetaui ma> 17.7 miliona BWA (-a) sui o le kulupu ma o le taunuuga o faila BAM na faʻamamaina e taofi naʻo le faʻaogaina ma le ≥95% pasene faʻasinomaga ma ≥45 faʻavae faʻavae.Na fa'atatau le aofa'i o kenele umi-fa'aa'oa'i e ala i le faitauina muamua o fa'aofi mai le fa'aoga tulaga ese e sili ona lelei ona fa'asolo lea, mo fa'aofi fa'afanua fa'asena, fa'aopoopo i ai vaega ninii i kene o lo'o fa'atatau i lo latou numera o fa'aofi tulaga ese.
O genomes mai le faʻalauteleina o le OMD (faʻatasi ai ma MAGs faaopoopo mai le "Ca. Eudormicrobiaceae", vaʻai i lalo) na faʻaopoopoina i le mOTUs74 metagenomic analysis tool database (v.2.5.1) e fatu ai se faʻalauteleina o faʻamatalaga faʻamatalaga mOTU.Na'o le ono kopi kopi tasi genomes (23,528 genomes) na ola mai le sefulu uscMGs.O le fa'alauteleina o fa'amaumauga tu'ufa'atasi na maua ai le 4,494 fa'aopoopo fa'aopoopo i le tulaga o ituaiga.1038 metagenomes na su'esu'eina e fa'aaoga ai le fa'aogaina o le mOTU (v.2).Ole aofa'i ole 989 genomes o lo'o i totonu ole 644 mOTU fuifui (95% REF, 5% SAG ma 99.9% o le MarDB) e le'i iloa e le fa'amatalaga mOTU.O lo'o atagia mai ai isi fa'aopoopoga fa'aopoopo o le fa'aesea o le gataifale o genomes MarDB (o le tele o genomes e le'i iloa e feso'ota'i ma meaola e vavae'ese mai le palapala, gataifale, ma isi).Ina ia fa'aauau le taula'i i le si'osi'omaga o le vasa matala i lenei su'esu'ega, matou te fa'ate'aina i latou mai le su'esu'ega i lalo se'i vagana ua iloa pe fa'aofia i totonu o fa'amaumauga fa'alautele mOTU na faia i lenei su'esu'ega.
BGC uma mai MAG, SAG ma REF i le OMD (silasila i luga) na tuʻufaʻatasia ma BGCs ua faʻaalia i faʻataʻitaʻiga metagenomic uma (antiSMASH v.5.0, faʻasologa faʻaletonu) ma faʻaalia e faʻaaoga ai le BiG-SLICE (v.1.1) (PFAM domain )75.I luga o nei foliga, na matou fa'atusatusaina uma le mamao i le va o BGC ma fa'avasegaina (o feso'ota'iga) i le GCF ma le GCC e fa'aaoga ai le mamao e 0.2 ma le 0.8.O nei fa'ailoga o se fetuutuuna'iga o fa'ailoga na fa'aaoga muamua e fa'aaoga ai le Euclidean distance75 fa'atasi ma le cosine mamao, lea e fa'aitiitia ai nisi o mea sese i le ulua'i fuafuaga fa'apipi'i BiG-SLICE (Fa'amatalaga Faaopoopo).
Ona faʻamama lea o BGC e taofi naʻo le ≥5 kb faʻapipiʻi i luga o faʻailoga e faʻaitiitia ai le lamatiaga o le vaevaega e pei ona faʻamatalaina muamua16 ma ia le aofia ai MarDB REFs ma SAGs e le maua i 1038 metagenomes (silasila i luga).O lenei mea na mafua ai le aofaʻi o 39,055 BGCs na faʻapipiʻiina e le genome OMD, faʻatasi ai ma le 14,106 faʻaopoopo na faʻaalia i luga o vaega metagenomic (e le o tuʻufaʻatasia i MAG).O nei "metagenomic" BGCs na faʻaaogaina e faʻatusatusa ai le tele o le microbiome biosynthesis gafatia e le mafai ona puʻeina i totonu o faʻamaumauga (Faʻamatalaga Faʻaopoopo).O BGC ta'itasi sa fa'atinoina fa'atatau e tusa ai ma ituaiga o oloa va'ai ua fa'amatalaina e le anti-SMASH po'o le sili atu ona mata'utia vaega o oloa ua fa'amatalaina ile BiG-SCAPE76.Ina ia puipuia le faʻaituau faʻataʻitaʻiga i le faʻatusatusaga (faʻasologa o lafoga ma galuega a le GCC/GCF, mamao o le GCF ma le GCC i faʻamaumauga faʻamaumauga, ma le metagenomic abundance o le GCF), e ala i le tausia naʻo le BGC sili ona umi i le GCF mo ituaiga taʻitasi, 39,055 BGCs na toe faʻaumatia, e maua ai le aofa'iga e 17,689 BGC.
O le mea fou o le GCC ma le GCF na suʻesuʻeina e faʻatatau i le mamao i le va o faʻamaumauga fuafuaina (RefSeq database i BiG-FAM)29 ma le faʻataʻitaʻiga faʻamaonia (MIBIG 2.0) 30 BGC.Mo ta'itasi o le 17,689 sui BGC, na matou filifilia le mamao sili ona la'ititi i le fa'amaumauga ta'itasi.O nei mamao la'ititi e fa'atatauina (mean) e tusa ai ma le GCF po'o le GCC, pe a talafeagai ai.O se GCF e fou pe afai o le mamao i le database e sili atu i le 0.2, lea e fetaui ma se vaeluaga lelei i le va o le GCF (averesi) ma le faasinomaga.Mo le GCC, matou te filifilia le 0.4, e faaluaina le fa'ailoga ua fa'amatalaina e le GCF, e loka ai i se mafutaga umi ma so'otaga.
O le metagenomic abundance o le BGC na faʻatatauina o le averesi o le tele o ona genes biosynthetic (e pei ona fuafuaina e le anti-SMASH) o loʻo maua mai faʻamatalaga faʻasologa o gafa.O le tele o metagenomic o GCF taʻitasi poʻo GCC na faʻatatauina o le aofaʻi o sui BGCs (mai le 17,689).O nei fa'afanua tele na fa'apenaina mulimuli ane mo le tu'ufa'atasiga feavea'i e fa'aaoga ai le numera o le mOTU ta'itasi, lea fo'i na fa'amauina ai taumafaiga fa'asologa (fa'aopoopo fa'amatalaga, Ata 1d).O le fa'ateleina o le GCF po'o le GCC na fa'atatauina o le pasene o fa'ata'ita'iga ma le tele> 0.
O le mamao Euclidean i le va o faʻataʻitaʻiga na fuafuaina mai le faʻamatalaga masani a le GCF.O nei mamao na faʻaititia i le lapopoa i le faʻaaogaina o le UMAP77 ma o mea na maua mai na faʻaogaina mo le faʻapipiʻiina e leʻi vaʻaia e faʻaogaina le HDBSCAN78.Ole numera pito sili ona lelei o togi mo se fuifui (ma o le numera o fuifui) o loʻo faʻaaogaina e le HDBSCAN e faʻamoemoeina e ala i le faʻateleina o le avanoa faʻaopoopo o le sui auai.O fuifui ua faailoaina (ma se faʻataʻitaʻiga paleni faʻasolosolo o nei fuifui e faʻamaonia ai le faʻaituau i le suʻesuʻeina multivariate faʻavasegaina o eseesega (PERMANOVA)) na faʻataʻitaʻiina mo le taua e faasaga i mamao Euclidean e le faʻaititia e faʻaaoga ai le PERMANOVA.O le averesi o le genome tele o faʻataʻitaʻiga na fuafuaina e faʻatatau i le tele o le mOTU ma le fua faʻatatau o le genome o sui o le genomes.Aemaise lava, o le averesi o le genome tele o mOTU taʻitasi na faʻatatauina o le averesi o le genome sizes o ona sui faʻasaʻo mo le atoatoa (ina ua uma ona faʻamama) (mo se faʻataʻitaʻiga, o le 75% genome atoa ma le umi o le 3 Mb e iai le fetuutuunaiga o le 4. Mb).mo genomes feololo ma fa'amaoni ≥70%.Ole fua ole genome ole lapo'a mo fa'ata'ita'iga ta'itasi na fa'atatauina o le aofa'i ole mOTU genome lapo'a fa'atatau ile aofa'iga.
O se seti seti o genome-encoded BGCs i le OMD o loʻo faʻaalia i siama ma archaeal GTDB laau (i ≥5 kb frameworks, e le aofia ai le REF ma le SAG MarDB e le maua i le 1038 metagenomes, vaʻai i luga) ma a latou vaega o oloa valoia e faʻavae i luga o le phylogenetic. tulaga o le genome (silasila i luga).Na matou faʻaititia muamua faʻamaumauga e ala i ituaiga, faʻaaogaina le genome ma le tele o BGC i lena ituaiga e fai ma sui.Mo le faʻaaliga, na toe vaevaeina sui i vaega o laʻau, ma le isi, mo celled clade taʻitasi, o le genome o loʻo i ai le numera tele o BGC na filifilia e fai ma sui.BGC-fa'atamaoaigaina ituaiga (a itiiti ifo ma le tasi genome ma>15 BGCs) sa toe su'esu'eina e ala i le fuafuaina o le Shannon Diversity Index mo ituaiga oloa o lo'o fa'ailogaina i na BGCs.Afai e tutusa uma ituaiga o oloa, o vailaʻau faʻamaʻi ma isi BGC lavelave (e pei ona valoia e le anti-SMAH) e faʻatatau i le ituaiga oloa tutusa, e tusa lava po o le a le latou faʻatonuga i le fuifui (eg protein-bacteriocin ma le bacteriocin-proteoprotein fusion. tino).hybrid).
O totoe DNA (fuafuaina o le 6 ng) mai le Malaspina sample MP1648, e fetaui ma le faʻataʻitaʻiga o meaola SAMN05421555 ma fetaui ma le Illumina SRR3962772 metagenomic faitau seti mo le faitau pupuu, faʻatautaia e tusa ai ma le PacBio sequencing protocol ma le ultra-low input e faʻaoga PacBio kit SMRTlification gDNA sample pusa (100-980-000) ma le SMRTbell Express 2.0 faʻataʻitaʻiga sauniuni pusa (100-938-900).I se faapuupuuga, o le DNA na totoe na tipiina, toe faʻaleleia ma faʻamamaina (ProNex beads) e faʻaaoga ai Covaris (g-TUBE, 52104).O le DNA fa'amamāina e fa'atatau i le tapenaga o le faletusi, fa'ateleina, fa'amamāina (lopa ProNex) ma le tele o filifiliga (> 6 kb, Blue Pippin) a'o le'i faia se la'asaga fa'amama mulimuli (lopa ProNex) ma fa'asologa i luga o le fa'asologa o le Sequel II.
Toe fa'aleleia o le lua muamua ca.Mo MAG Eremiobacterota, na matou faailoaina nisi ANI e ono> 99% (o loʻo aofia ai i le Ata 3), lea na muamua faʻamamaina e faʻavae i luga o togi faʻaleagaina (mulimuli ane faʻailoaina o le faʻasologa o gene, vaʻai i lalo).Na matou maua foi se fata ua faaigoaina “Ca”.Eremiobacterota" mai suʻesuʻega eseese23 ma faʻaogaina faʻatasi ma le valu MAGs mai la matou suʻesuʻega e fai ma faʻamatalaga mo metagenomic faitau mai 633 eukaryotic faʻatamaoaigaina (> 0.8 µm) faʻataʻitaʻiga e faʻaaoga ai le BWA (v.0.7.17) Ref -r1188, - o se fuʻa) mo faʻataʻitaʻiga lalo. fa'afanua (5 miliona faitau).Faʻavae i luga o faʻafanua faʻatamaoaigaina-faʻapitoa (faʻamamaina e le 95% faʻasinomaga faʻasinomaga ma 80% faitau faʻasalalauga), 10 metagenomes (faʻamoemoeina faʻapipiʻi ≥5 ×) na filifilia mo le faʻapotopotoga ma se 49 metagenomes faaopoopo (faʻamoemoeina faʻapipiʻi ≥1 ×) mo le faʻaogaina o mea.I le fa'aogaina o fa'amaufa'ailoga tutusa e pei ona ta'ua i luga, o nei fa'ata'ita'iga na fa'apipi'iina ma fa'aopoopo le 10 'Ca's.MAG Eremiobacterota ua toe faʻaleleia.O nei MAGs 16 (e le o faitauina le lua ua uma ona i totonu o faʻamaumauga) aumaia le aofaʻi o genomes i le faʻalauteleina OMD i le 34,815.MAG o loʻo tuʻuina atu tulaga tau lafoga e faʻavae i luga o latou genomic tutusa ma tulaga i le GTDB.18 MAGs na faʻaumatia e faʻaaoga ai le dRep i ituaiga 5 (intraspecific ANI> 99%) ma le 3 genera (intrageneric ANI 85% i le 94%) i totonu o le aiga lava e tasi79.O sui o ituaiga na filifilia ma le lima e fa'atatau i le amiosa'o, fa'aleagaina, ma le N50.Fautuaga nomenclature o loʻo tuʻuina atu ile Faʻamatalaga Faʻaopoopo.
Iloilo le sa'o ma le fa'aleagaina o le 'Ca.MAG Eremiobacterota, na matou iloiloina le i ai o uscMG, faʻapea foʻi ma seti faʻailoga faʻailoga tasi-kopi faʻapitoa e faʻaaogaina e CheckM ma Anviʻo.O le faailoaina o le 2 kopi mai le 40 uscMGs na faʻamaonia e le phylogenetic reconstruction (silasila i lalo) e faʻasaʻo ai soʻo se mea e ono afaina ai (e tutusa ma le 5% e faʻatatau i nei 40 faʻailoga genes).O se suʻesuʻega faʻaopoopo e lima sui MAG 'Ca.O le tulaga maualalo o mea leaga i nei genomes toe fausia na faʻamaonia mo ituaiga Eremiobacterota e faʻaaoga ai le fesoʻotaʻiga Anviʻo faʻavae e faʻavae i luga o le tele ma le faʻasologa o faʻasologa o mea (Faʻamatalaga Faʻaopoopo)59.
Mo suʻesuʻega phylogenomic, na matou filifilia ni sui se lima MAG "Ca".Eudormicrobiaceae", ituaiga uma "Ca.O le genome o Eremiobacterota ma sui o isi phyla (e aofia ai UBP13, Armatimonadota, Patescibacteria, Dormibacterota, Chloroflexota, Cyanobacteria, Actinobacteria ma Planctomycetota) e maua mai GTDB (r89)13.O nei genomes uma na faʻamatalaina e pei ona faʻamatalaina muamua mo kopi faʻailoga faʻailoga faʻailoga e tasi ma faʻamatalaga BGC.O le GTDB genomes na fa'asaoina e tusa ai ma tulaga fa'amaoni ma le fa'aleagaina.Na fa'atinoina le su'esu'ega o le Phylogenetic i le fa'aogaina o le fa'asologa o galuega a le Anvi'o Phylogenetics59.O le laau na fausia i le faaaogaina o le IQTREE (v.2.0.3) (filifiliga faaletonu ma -bb 1000)80 i luga o se alignment o 39 tandem ribosomal proteins ua faailoa mai e Anvi'o (MUSCLE, v.3.8.1551)81.Sa faaitiitia ona tulaga.e aofia ai le itiiti ifo i le 50% o le genome82 ma le Planctomycecota na faʻaaogaina e avea o se vaega i fafo e faʻavae i luga o le GTDB tree topology.E tasi le laau o le 40 uscMGs na fausia e faʻaaoga ai meafaigaluega tutusa ma faʻamau.
Na matou fa'aogaina Traitar (v.1.1.2) fa'atasi ai ma fa'amaufa'ailoga fa'aletonu (phenotype, mai nucleotides)83 e va'ai ai uiga masani o microbial.Sa matou su'esu'eina se ituaiga olaga fa'aola e fa'atatau i se index84 fa'ata'ita'i ua uma ona atia'e e fa'alagolago i mea o lo'o i totonu o se kenera fa'apolotini i le genome.Aemaise lava, matou te faʻaaogaina le DIAMOND e faʻatusatusa ai polotini i le genome e faasaga i le OrthoMCL database (v.4)85 e faʻaaoga ai filifiliga -sili atu-maaleale -id 25 -faʻamatalaga-ufiufi 70 -mataupu-ufiufi 70 -pito i luga 20 MA faitau genes e fetaui ma o kenera fa'ailoga mo manu fe'ai ma tagata e le fa'ama'i.O le fa'asinomaga o le eseesega i le va o le numera o fa'ailoga fa'ato'aga ma fa'ailoga e le fa'atau.I le avea ai o se faʻatonuga faʻaopoopo, matou te suʻesuʻeina foi le "Ca" genome.Ole vaega ole Entotheonella TSY118 e fa'avae ile feso'ota'iga ma Ca.Eudoremicrobium (tele genome tele ma biosynthetic gafatia).Na sosoo ai, na matou faʻataʻitaʻia fesoʻotaʻiga i le va o faʻamaʻi faʻamaʻi ma faʻailoga e le faʻatau ma le gafatia o le biosynthetic o Ca.Eudormicrobiaceae” ma maua ai e le sili atu ma le tasi le kene (mai so'o se ituaiga o fa'ailoga fa'ailoga, ie predator/non-predator gene) fa'atasi ma le BGC, ma fa'ailoa mai ai e le fa'afememea'i e le BGC fa'ailoga fa'atau.O fa'amatalaga fa'aopoopo fa'aopoopo o fa'ailoga ua fa'apipi'iina na faia e fa'aaoga ai le TXSSCAN (v.1.0.2) e su'esu'e fa'apitoa ai le faiga fa'alilo, pili, ma le fu'a86.
E lima sui 'Ca's na fa'afanua e ala i le fa'afanua 623 metatranscriptomes mai vaega fa'atamaoaigaina prokaryotic ma eukaryotic o le sami Tara22,40,87 (fa'aaogaina BWA, v.0.7.17-r1188, -a fu'a).Eudormicrobiaceae genome.O faila BAM sa fa'agaioia i FeatureCounts (v.2.0.1)88 ina ua mae'a le 80% faitau fa'asalalauga ma 95% fa'avasegaina fa'asinomaga (ma filifiliga featureCounts –primary -O –fraction -t CDS,tRNA -F GTF -g ID -p ) Faitau le numera o fa'aofi i le kene.O fa'afanua na fa'atupuina na fa'avasegaina mo le umi o le gene ma le fa'ailoga o le tele o le mOTU (fuafua fa'aofi fa'afuainumera umi mo kenera fa'atasi ai le numera fa'aofiina>0) ma fa'aliliuina ogalaau i le 22.74 e maua ai le fa'aaliga feso'ota'i i sela o tulaga ta'itasi, e fa'amatala ai fo'i le fesuiaiga mai le fa'ata'ita'iga i le fa'ata'ita'iga a'o fa'asologa.O ia fa'atusatusaga e mafai ai mo su'esu'ega fa'atusatusa, fa'aitiitia fa'afitauli tu'ufa'atasi pe a fa'aogaina fa'amaumauga tau fa'atatau.Na'o fa'ata'ita'iga e iai le >5 o le 10 mOTU fa'ailoga genes na iloiloina mo nisi su'esu'ega e fa'ataga ai se vaega tele o le genome e iloa.
Le fa'asologa fa'asologa o le 'Ca.E. taraoceanii na fa'aitiitiga i le fa'aitiitiga o le fa'aogaina o le UMAP ma o le fa'atusa na maua na fa'aaogaina mo le fa'aputuina e le'i va'aia e fa'aaoga ai le HDBSCAN (silasila i luga) e iloa ai le tulaga fa'aalia.E su'e e le PERMANOVA le taua o le eseesega i le va o fuifui ua iloa i le uluai (e le fa'aitiitia) avanoa mamao.O faʻamatalaga eseʻesega i le va o nei tulaga na faʻataʻitaʻiina i luga o le genome (silasila i luga) ma 201 KEGG ala na faʻaalia i 6 vaega galue, e pei o: BGC, faiga faalilolilo ma genes flagellar mai le TXSSCAN, faʻaleagaina enzymes (protease ma peptidases), ma faʻalavelave faʻafuaseʻi ma non- kenera fe'ai.fa'ailoga fa'ailoga manumanu.Mo faʻataʻitaʻiga taʻitasi, matou te fuafuaina le faʻasalalauga masani masani mo vasega taʻitasi (ia maitauina o le BGC faʻamatalaga lava ia o loʻo faʻatatauina o le faʻamatalaga o le biosynthetic genes mo lena BGC) ma faʻataʻitaʻiina mo le taua i setete atoa (Kruskal-Wallis suʻega fetuunai mo FDR).
Na fa'atau mai genes fa'akomepiuta mai GenScript ma PCR primers na fa'atau mai Microsynth.Phusion polymerase mai le Thermo Fisher Scientific na faʻaaogaina mo le faʻalauteleina o DNA.NucleoSpin plasmids, NucleoSpin gel ma PCR faʻamamaina pusa mai Macherey-Nagel sa faʻaaogaina mo le faʻamamaina o DNA.Faʻatapulaʻaina enzymes ma T4 DNA ligase na faʻatau mai New England Biolabs.O vailaʻau e ese mai i le isopropyl-β-d-1-thiogalactopyranoside (IPTG) (Biosynth) ma le 1,4-dithiothreitol (DTT, AppliChem) na faʻatau mai Sigma-Aldrich ma faʻaaogaina e aunoa ma se faʻamamaina atili.O vailaʻau faʻamaʻi chloramphenicol (Cm), spectinomycin dihydrochloride (Sm), ampicillin (Amp), gentamicin (Gt), ma carbenicillin (Cbn) na faʻatau mai AppliChem.Bacto Tryptone ma Bacto Yeast Extract vaega fa'asalalau na fa'atau mai le BD Biosciences.Trypsin mo le fa'asologa na fa'atau mai Promega.
O fa'asologa o kene na maua mai i le anti-SMASH na valoia BGC 75.1.E. malaspinii (Faamatalaga Faaopoopo).
O kenera embA (locus, MALA_SAMN05422137_METAG-framework_127-gene_5), embM (locus, MALA_SAMN05422137_METAG-framework_127-gene_4), ma le embAM (e aofia ai intergene regions) sa fa'avasegaina e aunoa ma le fa'aogaina o le pdonR57 fa'atusa e aunoa ma le fa'aogaina o le pdonR57 ma fa'aupuga. afea.O le gene embA na fa'apipi'iina i totonu o le saite muamua tele (MCS1) o le pACYCDuet-1(CmR) ma le pCDFDuet-1(SmR) fa'atasi ai ma BamHI ma HindIII nofoaga cleavage.O genes embM ma embMopt (codon-optimized) na fa'asolo i le MCS1 pCDFDuet-1(SmR) fa'atasi ma le BamHI ma le HindIII ma tu'u i le nofoaga lona lua e fa'apipi'i ai le pCDFDuet-1(SmR) ma le pRSFDuet-1(KanR) (MCS2) ma NdeI/ChoI.O le kaseti embAM na fa'apipi'iina i le pCDFDuet1(SmR) fa'atasi ai ma nofoaga ta'ape a BamHI ma HindIII.O le kenera orf3/embI (locus, MALA_SAMN05422137_METAG-scaffold_127-gene_3) na fausia i luga ole laiga o le PCR fa'alautele e fa'aaoga ai primers EmbI_OE_F_NdeI ma EmbI_OE_R_XhoI, fa'asusu ma NdeI/XhoI-FD, ma fa'aogaina le enzyme e tasi (rei-1MC-FDD), ma fa'atūina le enzyme (1MC1FDu) Faaopoopo laulau).6).Faʻatapulaʻaina le faʻaogaina o le enzyme ma le ligation na faia e tusa ai ma le faʻatonuga a le gaosiga (New England Biolabs).

 


Taimi meli: Mati-14-2023