Ви благодариме што ја посетивте Nature.com.Користите верзија на прелистувач со ограничена поддршка за CSS.За најдобро искуство, препорачуваме да користите ажуриран прелистувач (или да го оневозможите режимот на компатибилност во Internet Explorer).Покрај тоа, за да обезбедиме постојана поддршка, ја прикажуваме страницата без стилови и JavaScript.
Лизгачи кои прикажуваат три статии по слајд.Користете ги копчињата за назад и следно за да се движите низ слајдовите или копчињата на контролорот на слајдовите на крајот за да се движите низ секој слајд.
Детален опис на производот
304 Заварена намотана цевка/цевка од нерѓосувачки челик
1. Спецификација: Цевка/цевка од серпентина од нерѓосувачки челик
2. Тип: заварени или безшевни
3. Стандард: ASTM A269, ASTM A249
4. ОД цевка од калем од нерѓосувачки челик: 6мм до 25,4мм
5. Должина: 600-3500MM или според барањето на купувачот.
6. Дебелина на ѕидот: 0,2mm до 2,0mm.
7. Толеранција: ОД: +/-0,01мм;Дебелина: +/-0,01%.
8. Големина на внатрешната дупка на серпентина: 500MM-1500MM (може да се прилагоди според барањата на клиентите)
9. Висина на серпентина: 200MM-400MM (може да се прилагоди според барањата на клиентите)
10. Површина: Светла или обработена
11. Материјал: 304, 304L, 316L, 321, 301, 201, 202, 409, 430, 410, легура 625, 825, 2205, 2507, итн.
12. Пакување: ткаени кеси во дрвен случај, дрвена палета, дрвена осовина или по барање на купувачот
13. Тест: хемиска компонента, цврстина на принос, цврстина на истегнување, мерење на цврстина
14. Гаранција: Инспекција на трето лице (на пример :SGS TV ) итн.
15. Примена: Декорација, мебел, транспорт на нафта, разменувач на топлина, правење огради, правење хартија, автомобил, преработка на храна, медицински итн.
Сите хемиски состав и физички својства за нерѓосувачки челик како подолу:
Материјал | ASTM A269 Хемиски состав % Макс | ||||||||||
C | Mn | P | S | Si | Cr | Ni | Mo | Забелешка | Nb | Ti | |
TP304 | 0,08 | 2.00 часот | 0,045 | 0,030 | 1.00 часот | 18,0-20,0 | 8,0-11,0 | ^ | ^ | ^ . | ^ |
TP304L | 0,035 | 2.00 часот | 0,045 | 0,030 | 1.00 часот | 18,0-20,0 | 8,0-12,0 | ^ | ^ | ^ | ^ |
TP316 | 0,08 | 2.00 часот | 0,045 | 0,030 | 1.00 часот | 16,0-18,0 | 10,0-14,0 | 2.00-3.00 часот | ^ | ^ | ^ |
TP316L | 0,035 Д | 2.00 часот | 0,045 | 0,030 | 1.00 часот | 16,0-18,0 | 10,0-15,0 | 2.00-3.00 часот | ^ | ^ | ^ |
TP321 | 0,08 | 2.00 часот | 0,045 | 0,030 | 1.00 часот | 17,0-19,0 | 9,0-12,0 | ^ | ^ | ^ | 5C -0,70 |
TP347 | 0,08 | 2.00 часот | 0,045 | 0,030 | 1.00 часот | 17,0-19,0 | 9,0-12,0 | 10C -1,10 | ^ |
Материјал | Термичка обработка | Температура F (C) Мин. | Цврстина | |
Бринел | Роквел | |||
TP304 | Решение | 1900 (1040) | 192HBW/200HV | 90 HRB |
TP304L | Решение | 1900 (1040) | 192HBW/200HV | 90 HRB |
TP316 | Решение | 1900 (1040) | 192HBW/200HV | 90 HRB |
TP316L | Решение | 1900 (1040) | 192HBW/200HV | 90 HRB |
TP321 | Решение | 1900 (1040) Ф | 192HBW/200HV | 90 HRB |
TP347 | Решение | 1900 (1040) | 192HBW/200HV | 90 HRB |
ОД, инч | ОД толеранција инч (мм) | WT толеранција % | Должина на толеранција инч (мм) | |
+ | - | |||
≤ 1/2 | ± 0,005 (0,13) | ± 15 | 1/8 (3,2) | 0 |
> 1/2 ~ 1 1/2 | ± 0,005 (0,13) | ± 10 | 1/8 (3,2) | 0 |
> 1 1 / 2 ~< 3 1 / 2 | ± 0,010 (0,25) | ± 10 | 3 / 16 (4,8) | 0 |
> 3 1 / 2 ~< 5 1 / 2 | ± 0,015 (0,38) | ± 10 | 3 / 16 (4,8) | 0 |
> 5 1/2 ~< 8 | ± 0,030 (0,76) | ± 10 | 3 / 16 (4,8) | 0 |
8~< 12 | ± 0,040 (1,01) | ± 10 | 3 / 16 (4,8) | 0 |
12~< 14 | ± 0,050 (1,26) | ± 10 | 3 / 16 (4,8) | 0 |
Природните микробиолошки заедници се филогенетски и метаболички разновидни.Покрај недоволно проучените групи на организми1, оваа разновидност има и богат потенцијал за откривање на еколошки и биотехнолошки значајни ензими и биохемиски соединенија2,3.Сепак, проучувањето на оваа разновидност за да се одредат геномските патишта кои ги синтетизираат таквите соединенија и ги врзуваат за нивните соодветни домаќини останува предизвик.Биосинтетичкиот потенцијал на микроорганизмите во отворен океан останува во голема мера непознат поради ограничувањата во анализата на податоците за резолуцијата на целиот геном на глобално ниво.Овде, ја истражуваме разновидноста и разновидноста на биосинтетичките генски кластери во океанот со интегрирање на околу 10.000 микробни геноми од култивирани клетки и единечни клетки со повеќе од 25.000 ново реконструирани нацрт-геноми од над 1.000 примероци на морска вода.Овие напори идентификуваа околу 40.000 наводни главно нови биосинтетички генски кластери, од кои некои се пронајдени во претходно несомнени филогенетски групи.Кај овие популации, идентификувавме лоза збогатена со биосинтетички генски кластери („Candidatus Eudormicrobiaceae“) кои припаѓаат на некултивирана бактериска група и вклучија некои од биосинтетички најразновидните микроорганизми во оваа средина.Од нив, ги карактеризиравме патиштата на фосфатаза-пептид и питонамид, идентификувајќи случаи на необична структура и ензимологија на биоактивно соединение, соодветно.Како заклучок, оваа студија покажува како стратегиите засновани на микробиом може да овозможат истражување на претходно неопишани ензими и природна храна во слабо разбрана микробиота и средина.
Микробите ги поттикнуваат глобалните биогеохемиски циклуси, ги одржуваат прехранбените мрежи и ги одржуваат растенијата и животните здрави5.Нивната огромна филогенетска, метаболна и функционална разновидност претставува богат потенцијал за откривање на нови таксони1, ензими и биохемиски соединенија, вклучително и природни производи6.Во еколошките заедници, овие молекули им обезбедуваат на микроорганизмите различни физиолошки и еколошки функции, од комуникација до натпреварување 2, 7 .Покрај нивните оригинални функции, овие природни производи и нивните генетски кодирани патеки на производство даваат примери за биотехнолошки и терапевтски апликации2,3.Идентификацијата на таквите патишта и врски е многу олеснета со проучувањето на култивирани микроби.Сепак, таксономските студии на природните средини покажаа дека огромното мнозинство на микроорганизми не се култивирани8.Оваа културна пристрасност ја ограничува нашата способност да ја искористиме функционалната разновидност кодирана од многу микроби4,9.
За да се надминат овие ограничувања, технолошкиот напредок во изминатата деценија им овозможи на истражувачите директно (т.е. без претходна култура) да секвенционираат фрагменти од микробна ДНК од цели заедници (метагеномика) или единечни клетки.Способноста да се соберат овие фрагменти во поголеми фрагменти од геном и да се реконструираат повеќе метагеномски склопени геноми (MAGs) или единечни засилени геноми (SAGs), соодветно, отвора важна можност за таксоцентрични студии на микробиомот (т.е. микробни заедници и микробиомот).поплочи нови патеки.сопствен генетски материјал во дадена средина) 10,11,12.Навистина, неодамнешните студии во голема мера го проширија филогенетското претставување на микробната разновидност на Земјата1, 13 и открија голем дел од функционалната разновидност во одделни микробни заедници кои претходно не беа покриени со референтните геномски секвенци на култивирани микроорганизми (REFs)14.Способноста да се постави неоткриена функционална разновидност во контекст на геномот на домаќинот (т.е. резолуција на геномот) е од клучно значење за предвидување на сè уште некарактеризирани микробни линии кои веројатно кодираат нови природни производи15,16 или за следење на таквите соединенија назад до нивниот оригинален производител17.На пример, комбинираниот пристап на метагеномска и едноклеточна геномска анализа доведе до идентификација на Candidatus Entotheonella, група на метаболички богати бактерии поврзани со сунѓер, како производители на различни потенцијали за лекови18.Сепак, и покрај неодамнешните обиди за геномско истражување на разновидни микробни заедници,16,19 повеќе од две третини од глобалните метагеномски податоци за најголемиот океан на екосистеми на Земјата16,20 сè уште недостасуваат.Така, генерално, биосинтетичкиот потенцијал на морскиот микробиом и неговиот потенцијал како складиште на нови ензимски и природни производи остануваат во голема мера недоволно проучени.
За да го истражиме биосинтетичкиот потенцијал на морските микробиоми на глобално ниво, прво ги здруживме морските микробни геноми добиени со користење на методи зависни од култура и некултурни методи за да создадеме обемна база на податоци за филогенетиката и функцијата на гените.Испитувањето на оваа база на податоци откри широк спектар на биосинтетички генски кластери (BGCs), од кои повеќето припаѓаат на сè уште некарактеризирани семејства на генски кластери (GCF).Дополнително, идентификувавме непознато бактериско семејство кое покажува највисока позната разновидност на BGC во отворен океан досега.Избравме два патеки за рибозомална синтеза и пост-транслационално модифициран пептид (RiPP) за експериментална валидација врз основа на нивните генетски разлики од моментално познатите патишта.Функционалната карактеризација на овие патишта откри неочекувани примери на ензимологија, како и структурно невообичаени соединенија со инхибиторна активност на протеазата.
На почетокот, имавме за цел да создадеме глобален ресурс на податоци за анализа на геномот, фокусирајќи се на неговите бактериски и археални компоненти.За таа цел, обединивме метагеномски податоци и 1038 примероци на морска вода од 215 глобално дистрибуирани места за земање примероци (широчина опсег = 141,6 °) и неколку длабоки слоеви (од 1 до 5600 m во длабочина, покривајќи ги пелагичните, мезопелагичните и амбисалните зони).Позадина21,22,23 (Сл. 1а, проширени податоци, Сл. 1а и дополнителна табела 1).Покрај обезбедувањето широка географска покриеност, овие селективно филтрирани примероци ни овозможија да споредиме различни компоненти на морскиот микробиом, вклучувајќи богати со вируси (<0,2 μm), богати со прокариоти (0,2-3 μm), богати со честички (0,8 μm ).–20 µm) и колонии осиромашени од вируси (>0,2 µm).
a, Вкупно 1038 јавно достапни геноми (метагеномика) на морските микробни заедници собрани од 215 глобално дистрибуирани локации (62°S до 79°N и 179°W до 179°E .).Плочки на карти © Esri.Извори: GEBCO, NOAA, CHS, OSU, UNH, CSUMB, National Geographic, DeLorme, NAVTEQ и Esri.б, овие метагеноми беа користени за реконструкција на MAG (методи и дополнителни информации), кои се разликуваат по количина и квалитет (методи) во сетови на податоци (означени во боја).Реконструираните MAG беа дополнети со јавно достапни (надворешни) геноми, вклучувајќи ги рачно изработените MAG26, SAG27 и REF.27 Состави OMD.в, во споредба со претходните извештаи засновани само на SAG (GORG)20 или MAG (GEM)16, OMD ја подобрува геномската карактеризација на морските микробиолошки заедници (стапка на метагеномско мапирање; метод) за два до три пати со поконзистентна застапеност во длабочина и географска ширина..<0,2, n=151, 0,2-0,8, n=67, 0,2-3, n=180, 0,8-20, n=30, >0,2, n=610, <30°, n = 132, 30-60° , n = 73, >60°, n = 42, EPI, n = 174, MES, n = 45, BAT, n = 28. d, OMD групирањето во кластери на нивоа на видови (95% среден нуклеотиден идентитет) идентификува вкупно приближно 8300 видови, од кои повеќе од половина претходно не биле карактеризирани според таксономските прибелешки со користење на GTDB (верзија 89) e, класификацијата на видовите според типот на геном покажа дека MAG, SAG и REF добро се надополнуваат едни со други во одразот на филогенетската разновидност на морскиот микробиом.Конкретно, 55%, 26% и 11% од видовите беа специфични за MAG, SAG и REF, соодветно.ЛИЛЈАКИ, временска серија Бермудски Атлантик;ГЕМ, геном на микробиомот на Земјата;GORG, глобален референтен геном на океанот;ЖЕШКА, временска серија на Хавајскиот Океан.
Користејќи ја оваа база на податоци, реконструиравме вкупно 26.293 MAG, главно бактериски и археални (сл. 1б и проширени податоци, Сл. 1б).Ги создадовме овие MAG од склопови од одделни наместо здружени метагеномски примероци за да спречиме колапс на варијации на природната секвенца помеѓу примероците од различни локации или временски точки (методи).Дополнително, групиравме геномски фрагменти врз основа на нивните корелации на распространетоста кај голем број примероци (од 58 до 610 примероци, во зависност од анкетата; метод).Откривме дека ова е долг, но важен чекор24 кој беше прескокнат во неколку големи реконструктивни работи MAG16, 19, 25 и значително го подобрува квантитетот (2,7 пати во просек) и квалитетот (+20% во просек) на геном.реконструирано од морскиот метагеном изучуван овде (проширени податоци, Сл. 2а и дополнителни информации).Севкупно, овие напори резултираа со 4,5 пати зголемување на морските микробни МАГ (6 пати ако се земат предвид само висококвалитетните МАГ) во споредба со најсеопфатниот МАГ ресурс достапен денес16 (Методи).Овој новосоздаден MAG сет потоа беше комбиниран со 830 рачно избрани MAG26, 5969 SAG27 и 1707 REF.Дваесет и седум видови на морски бактерии и археи сочинуваа комбинаторна колекција од 34.799 геноми (сл. 1б).
Потоа го оценивме новосоздадениот ресурс за да ја подобриме неговата способност да ги претставува морските микробиолошки заедници и да го процени влијанието на интегрирањето на различни типови геном.Во просек, откривме дека покрива приближно 40-60% од морските метагеномски податоци (слика 1в), два до три пати повеќе од покриеноста на претходните извештаи само за MAG и во длабочина и во ширина More serial 16 или SAG20.Дополнително, за систематско мерење на таксономската разновидност во воспоставените збирки, ги означивме сите геноми користејќи ја алатката (методи) База на податоци за таксономија на геном (GTDB) и користевме просечен нуклеотиден идентитет на геномот од 95%.28 за да се идентификуваат 8.304 видови кластери (видови).Две третини од овие видови (вклучувајќи ги и новите клади) претходно не се појавиле во GTDB, од кои 2790 биле откриени со помош на MAG реконструиран во оваа студија (сл. 1г).Дополнително, откривме дека различните типови на геноми се многу комплементарни: 55%, 26% и 11% од видовите се целосно составени од MAG, SAG и REF, соодветно (сл. 1д).Дополнително, MAG ги опфати сите 49 типови пронајдени во водната колона, додека SAG и REF претставуваа само 18 и 11 од нив, соодветно.Сепак, SAG подобро ја претставува разновидноста на најчестите клади (проширени податоци, Сл. 3а), како што се Pelagic Bacteriales (SAR11), при што SAG покрива речиси 1300 видови, а MAG само 390 видови.Имено, REFs ретко се преклопуваа со MAGs или SAGs на ниво на вид и претставуваа >95% од приближно 1000 геноми кои не се пронајдени во метагеномските множества на отворен океан изучувани овде, главно поради интеракциите со други видови изолирани репрезентативни морски примероци (на пр. седименти). .или домаќин-соработник).За да биде широко достапен за научната заедница, овој ресурс на морски геном, кој исто така вклучува некласифицирани фрагменти (на пр., од предвидени фаги, геномски острови и фрагменти од геном за кои нема доволно податоци за реконструкција на MAG), може да се спореди со таксономски податоци .Пристапете до прибелешките заедно со функцијата на генот и контекстуалните параметри во Базата на податоци за микробиологија на океанот (OMD; https://microbiomics.io/ocean/).
Потоа тргнавме да го истражуваме богатството и новитетот на биосинтетичкиот потенцијал во микробиомите на отворен океан.За таа цел, прво користевме antiSMASH за сите MAGs, SAGs и REFs пронајдени во 1038 морски метагеном (методи) за да предвидиме вкупно 39.055 BGC.Ние потоа ги групиравме во 6907 не-излишни GCF и 151 популации на генски кластери (GCC; Дополнителна табела 2 и методи) за да се земе предвид инхерентниот вишок (т.е. истиот BGC може да биде кодиран во повеќе геноми) и метагеномски податоци Фрагментација на концентрирани BGC.Нецелосните BGC не го зголемија значително, доколку ги има (Дополнителни информации), бројот на GCF и GCC, соодветно, кои содржат најмалку еден недопрен член на BGC во 44% и 86% од случаите.
На ниво на GCC, најдовме широк спектар на предвидени RiPP и други природни производи (сл. 2а).Меѓу нив, на пример, арилполиените, каротеноидите, ектонините и сидерофорите припаѓаат на GCC со широка филогенетска дистрибуција и големо изобилство во океанските метагеноми, што може да укаже на широка адаптација на микроорганизмите кон морската средина, вклучително и отпорност на реактивни видови на кислород, оксидативен и осмотски стрес..или апсорпција на железо (повеќе информации).Оваа функционална разновидност е во контраст со неодамнешната анализа на приближно 1,2 милиони BGC меѓу приближно 190.000 геноми складирани во базата на податоци NCBI RefSeq (BiG-FAM/RefSeq, во понатамошниот текст RefSeq)29, која покажа дека нерибозомалните синтетаза синтетаза пептиди (полиНРПС) (PKS) BGCs (Дополнителни информации).Најдовме и 44 (29%) GCC само далечно поврзани со било кој RefSeq BGC (\(\bar{d}\)RefSeq > 0.4; Сл. 2а и методи) и 53 (35%) GCC само во MAG, истакнувајќи го потенцијалот за откривање на претходно неопишани хемикалии во OMD.Имајќи предвид дека секој од овие GCC најверојатно претставува многу разновидни биосинтетички функции, дополнително ги анализиравме податоците на ниво на GCF во обид да обезбедиме подетална групација на BGCs предвидени да кодираат за слични природни производи29.Вкупно 3861 (56%) идентификувани GCF не се преклопуваат со RefSeq, а >97% од GCF не беа присутни во MIBiG, една од најголемите бази на податоци на експериментално потврдени BGC (Слика 2б).Иако не е изненадувачки да се откријат многу потенцијални нови патишта во поставки кои не се добро претставени со референтниот геном, нашиот метод за дерепликација на BGC во GCF пред бенчмаркирањето се разликува од претходните извештаи 16 и ни овозможува да обезбедиме непристрасна проценка на новитетот.Поголемиот дел од новата разновидност (3012 GCF или 78%) одговара на предвидените терпени, RiPP или други природни производи, а повеќето (1815 GCF или 47%) се кодирани во непознати типови поради нивниот биосинтетички потенцијал.За разлика од кластерите PKS и NRPS, овие компактни BGC имаат помала веројатност да бидат фрагментирани за време на метагеномското склопување 31 и овозможуваат повеќе време и ресурси интензивна функционална карактеризација на нивните производи.
Вкупно 39.055 BGC беа групирани во 6.907 GCF и 151 GCC.а, претставување на податоци (внатрешно надворешно).Хиерархиско групирање на растојанија BGC врз основа на GCC, од кои 53 се фиксирани само со MAG.GCC содржи BGC од различни таксони (ln-трансформирана фреквенција на портата) и различни BGC класи (големината на кругот одговара на нејзината фреквенција).За секој GCC, надворешниот слој го претставува бројот на BGC, распространетоста (процентот на примероци) и растојанието (минимално растојание BGC косинус (min(dMIBiG))) од BiG-FAM до BGC.GCC со BGC тесно поврзани со експериментално потврдени BGC (MIBiG) се означени со стрелки.б Споредувајќи го GCF со предвидените (BiG-FAM) и експериментално потврдените (MIBiG) BGCs, пронајдени се 3861 нови (d–>0,2) GCF.Повеќето (78%) од овие кодираат за RiPP, терпени и други наводни природни производи.в, сите геноми во ОМД пронајдени во 1038 морски метагеноми беа ставени во основното дрво на GTDB за да се покаже филогенетската покриеност на ОМД.Клади без геном во OMD се прикажани во сива боја.Бројот на BGC одговара на најголемиот број на предвидени BGCs по геном во даден клад.За јасност, последните 15% од јазлите се срушени.Стрелките означуваат клади богати со BGC (>15 BGC), со исклучок на Mycobacterium, Gordonia (втор само по Rhodococcus) и Crocosphaera (втор само по Synechococcus).г, Непознат в.Eremiobacerota покажа највисока биосинтетичка разновидност (Шаноновиот индекс врз основа на природен тип на производ).Секоја лента го претставува геномот со најмногу BGC во видот.T1PKS, PKS тип I, T2/3PKS, PKS тип II и тип III.
Покрај богатството и новитетот, ја истражуваме биогеографската структура на биосинтетичкиот потенцијал на морскиот микробиом.Групирањето на примероците според просечната дистрибуција на бројот на копии од метагеномски GCF (Методи) покажа дека заедниците со мала ширина, површински, богати со прокариоти и сиромашни со вируси, главно од површински или подлабоки води осветлени со сонце, се богати со терпени RiPP и BGC.Спротивно на тоа, поларните, длабоко морски заедници, богати со вируси и честички беа поврзани со поголемо изобилство на NRPS и PKS BGC (проширени податоци, Сл. 4 и дополнителни информации).Конечно, откривме дека добро проучените тропски и пелагични заедници се најперспективните извори на нови терпени (Слика со зголемени податоци).Највисок потенцијал за PKS, RiPP и други природни производи (Слика 5а со проширени податоци).
За да ја надополниме нашата студија за биосинтетичкиот потенцијал на морските микробиоми, имавме за цел да ја мапираме нивната филогенетска дистрибуција и да идентификуваме нови клади збогатени со BGC.За таа цел, ги сместивме геномите на морските микроби во нормализирано GTDB13 бактериско и археално филогенетско дрво и ги преклопивме наводните биосинтетички патишта што тие ги кодираат (сл. 2в).Лесно откривме неколку клади збогатени со BGC (претставени со преку 15 BGCs) во примероци од морска вода (методи) познати по нивниот биосинтетички потенцијал, како што се цијанобактериите (Synechococcus) и бактериите Proteus, како Tistrella32,33, или неодамна привлекоа внимание поради нивните природни производи.како што се Myxococcota (Sandaracinaceae), Rhodococcus и Planctomycetota34,35,36.Интересно, најдовме неколку претходно неистражени лоза во овие клади.На пример, оние видови со најбогат биосинтетички потенцијал во phyla Planctomycetota и Myxococcota припаѓале на некарактеризирани кандидатски редови и родови, соодветно (Дополнителна табела 3).Земени заедно, ова сугерира дека ОМД обезбедува пристап до претходно непознати филогенетски информации, вклучително и микроорганизми, кои може да претставуваат нови цели за откривање на ензими и природни производи.
Следно, ја карактеризиравме кладата збогатена со BGC со не само броење на максималниот број на BGC кодирани од неговите членови, туку и со проценка на разновидноста на овие BGCs, што ја објаснува фреквенцијата на различни видови природни кандидати производи (сл. 2c и методи )..Откривме дека биосинтетички најразновидните видови беа претставени со специјално изработени бактериски МАГ во оваа студија.Овие бактерии припаѓаат на некултивираниот род Candidatus Eremiobacerota, кој останува во голема мера неистражен освен неколку геномски студии37,38.Вреди да се одбележи дека „околу.Родот Eremiobacerota е анализиран само во копнена средина39 и не е познато дека вклучува членови збогатени со BGC.Овде реконструиравме осум МАГ од истиот вид (нуклеотиден идентитет > 99%) 23. Затоа го предлагаме името на видот „Candidatus Eudoremicrobium malaspinii“, именувано по нереидата (морска нимфа), прекрасен подарок во грчката митологија и експедиции.'Ка.Според филогенетската прибелешка 13, E. malaspinii нема претходно познати роднини под нивото на секвенца и затоа припаѓа на ново бактериско семејство кое го предлагаме „Ca.E. malaspinii“ како вид вид и „Ca.Eudormicrobiaceae“ како официјално име (Дополнителни информации).Кратка метагеномска реконструкција на 'Ca.Проектот за геном на E. malaspinii беше потврден со многу низок влез, долго прочитано метагеномско секвенционирање и насочено склопување на еден примерок (Методи) како единечен линеарен хромозом од 9,63 Mb со дуплирање од 75 kb.како единствена преостаната нејасност.
За да го утврдиме филогенетскиот контекст на овој вид, баравме 40 тесно поврзани видови во дополнителни метагеномски примероци збогатени со еукариоти од експедицијата на океанот Тара преку насочена реконструкција на геномот.Накратко, ги поврзавме метагеномските читања со геномските фрагменти поврзани со „Ca.E. malaspinii“ и претпостави дека зголемената стапка на регрутирање во овој примерок укажува на присуство на други роднини (методи).Како резултат на тоа, најдовме 10 МАГ, комбинација од 19 МАГ кои претставуваат пет видови во три рода во новодефинираното семејство (т.е. „Ca. Eudormicrobiaceae“).По рачна проверка и контрола на квалитетот (проширени податоци, сл. 6 и дополнителни информации), откривме дека „Ca.Видовите Eudormicrobiaceae претставуваат поголеми геноми (8 Mb) и побогат биосинтетички потенцијал (14 до 22 BGC по вид) од другите членови на „Ca“.Clade Eremiobacerota (до 7 BGC) (сл. 3а-в).
а, Филогенетските позиции на петте 'Ca.Видовите на Eudormicrobiaceae покажаа богатство на BGC специфично за морските линии идентификувани во оваа студија.Филогенетското дрво ги вклучува сите 'Ca.MAG Eremiobacerota и членовите на другите фила (броеви на геном во загради) дадени во GTDB (верзија 89) беа користени за еволутивна позадина (Методи).Најнадворешните слоеви претставуваат класификации на ниво на семејство („Ca. Eudormicrobiaceae“ и „Ca. Xenobiaceae“) и на ниво на класа („Ca. Eremiobacteria“).Петте видови опишани во оваа студија се претставени со алфанумерички кодови и предложени биномни имиња (Дополнителни информации).б, во ред.Видовите Eudormicrobiaceae споделуваат седум заеднички BGC јадра.Отсуството на BGC во кладата А2 се должи на некомплетноста на репрезентативниот MAG (Дополнителна табела 3).BGC се специфични за „Ca.Амфитомикробиум“ и „Ка.Амфитомикробиум“ (клади А и Б) не се прикажани.в, Сите BGC кодирани како „Ca.Откриено е дека Eudoremicrobium taraoceanii се изразува во 623 метатранскриптоми земени од океаните на Тара.Цврстите кругови укажуваат на активна транскрипција.Портокаловите кругови означуваат промени на превиткување со log2 трансформирани под и над стапката на изразување на генот за домаќинство (методи).г, криви на релативно изобилство (методи) кои покажуваат 'Ca.Видовите на Eudormicrobiaceae се широко распространети во повеќето океански басени и во целата водена колона (од површината до длабочина од најмалку 4000 m).Врз основа на овие проценки, откривме дека „Ca.E. malaspinii' сочинува до 6% од прокариотските клетки во длабинските пелагични заедници поврзани со жито.Сметавме дека еден вид е присутен на локација ако е пронајден во која било фракција од големината на дадениот длабински слој.IO – Индиски Океан, НАО – Северен Атлантик, НПО – Северен Пацифик, РС – Црвено Море, САО – Јужен Атлантик, СО – Јужен Океан, СПО – Јужен Пацифик.
Проучување на изобилството и дистрибуцијата на Ca.Eudormicrobiaceae, која, како што откривме, преовладува во повеќето океански басени, како и во целата водена колона (сл. 3г).Локално, тие сочинуваат 6% од морската микробна заедница, што ги прави важен дел од глобалниот морски микробиом.Дополнително, ја најдовме релативната содржина на Ca.Видовите Eudormicrobiaceae и нивните нивоа на изразување на BGC беа највисоки во фракцијата збогатена со еукариоти (сл. 3в и проширени податоци, Сл. 7), што укажува на можна интеракција со честичките, вклучително и планктонот.Оваа опсервација има одредена сличност со 'Ca.Eudoremicrobium BGCs кои произведуваат цитотоксични природни производи преку познати патишта може да покажат предаторско однесување (Дополнителни информации и проширени податоци, слика 8), слично на другите предатори кои конкретно произведуваат метаболити како што е Myxococcus41.Откривање на Ca.Eudormicrobiaceae во помалку достапни (длабоки океански) или еукариотски наместо прокариотски примероци може да објаснат зошто овие бактерии и нивната неочекувана разновидност на BGC остануваат нејасни во контекст на истражување на природната храна.
На крајот, се обидовме експериментално да го потврдиме ветувањето за нашата работа заснована на микробиом во откривањето на нови патишта, ензими и природни производи.Помеѓу различните класи на BGCs, познато е дека RiPP патеката шифрира богата хемиска и функционална разновидност поради различни пост-преведувачки модификации на основниот пептид од зрели ензими42.Затоа избравме две „Ca.Eudoremicrobium' RiPP BGC (слики 3б и 4а-д) се засноваат на истото како и сите познати BGC (\(\bar{d}\)MIBiG и \(\bar{d}\)RefSeq над 0.2) .
a-c, ин витро хетерологно изразување и ин витро ензимски анализи на нов (\(\bar{d}\)RefSeq = 0,29) кластер на биосинтезата на RiPP специфична за видовите Ca длабоко море.E. malaspinii доведе до производство на дифосфорилирани производи.c, модификации идентификувани со користење на MS/MS со висока резолуција (HR) (фрагментација означена со b и y јони во хемиската структура) и NMR (проширени податоци, Сл. 9).г, овој фосфорилиран пептид покажува ниска микромоларна инхибиција на неутрофилната еластаза кај цицачите, која не се наоѓа во контролниот пептид и дехидрирачкиот пептид (дехидрација предизвикана од хемиско отстранување).Експериментот беше повторен три пати со слични резултати.На пример, хетерологното изразување на вториот нов кластер \(\bar{d}\)RefSeq = 0,33) на биосинтеза на протеини ја разјаснува функцијата на четири зрели ензими кои го модифицираат јадрото на пептидот од 46 аминокиселини.Остатоците се обоени според местото на модификација предвидено со HR-MS/MS, означување на изотоп и NMR анализа (Дополнителни информации).Испрекината боја покажува дека модификацијата се јавува кај кој било од двата остатоци.Сликата е компилација од бројни хетерологни конструкции за да се прикаже активноста на сите зрели ензими на истото јадро.h, Илустрација на NMR податоци за N-метилација на амид на 'рбетот.Целосните резултати се прикажани на сл.10 со проширени податоци.i, Филогенетската позиција на зрелиот ензим за кластер на протеини FkbM меѓу сите домени FkbM пронајдени во базата на податоци MIBiG 2.0 открива ензим од оваа фамилија со активност на N-метилтрансфераза (Дополнителни информации).Прикажани се шематски дијаграми на BGCs (a, e), прекурсорски пептидни структури (b, f) и наводни хемиски структури на природни производи (c, g).
Првата патека RiPP (\(\bar{d}\)MIBiG = 0,41, \(\bar{d}\)RefSeq = 0,29) беше пронајдена само кај длабокоморските видови „Ca.E. malaspinii“ и кодови за пептид-прекурсор (сл. 4а, б).Во овој зрел ензим, идентификувавме единствен функционален домен хомологен на доменот на дехидрација на лантипептид синтаза кој вообичаено ја катализира фосфорилацијата и последователното отстранување на 43 (Дополнителни информации).Затоа, предвидуваме дека модификацијата на пептидот прекурсор вклучува таква дехидрација во два чекора.Сепак, користејќи тандемска масена спектрометрија (MS/MS) и спектроскопија на нуклеарна магнетна резонанца (NMR), идентификувавме полифосфорилиран линеарен пептид (сл. 4в).Иако неочекувано, најдовме неколку линии на докази за да го поддржиме тоа што е краен производ: два различни хетерологни домаќини и без дехидрација во ин витро анализите, идентификација на клучните остатоци мутирани во местото на каталитичка дехидрација на зрелиот ензим.сите реконструирани од „Ца“.Геномот на E. malaspinii (проширени податоци, Сл. 9 и дополнителни информации) и, конечно, биолошката активност на фосфорилираниот производ, но не и хемиски синтетизираната дехидрирана форма (сл. 4г).Всушност, откривме дека покажува ниска микромоларна инхибиторна активност на протеазата против неутрофилната еластаза, споредлива со другите сродни природни производи во опсегот на концентрации (IC50 = 14,3 μM) 44 , и покрај фактот што еколошката улога останува да се разјасни.Врз основа на овие резултати, предлагаме да се именува патеката „фосфептин“.
Вториот случај е сложена патека RiPP специфична за 'Ca.Родот Eudoremicrobium (\(\bar{d}\)MIBiG = 0,46, \(\bar{d}\)RefSeq = 0,33) беше предвидено да ги кодира природните протеински производи (сл. 4д).Овие патишта се од особен биотехнолошки интерес поради очекуваната густина и разновидноста на необични хемиски модификации воспоставени од ензимите кодирани од релативно кратките BGCs45.Откривме дека овој протеин се разликува од претходно карактеризираните протеини по тоа што му недостига и главниот NX5N мотив на полицерамиди и лантионинската јамка на ландорнамидите 46 .За да ги надминеме ограничувањата на вообичаените хетерологни шеми на изразување, ги користевме заедно со прилагодениот систем Microvirgula aerodenitrificans за карактеризирање на четири ензими (методи) на зрели патишта.Користејќи комбинација од MS/MS, означување на изотоп и NMR, ги откривме овие зрели ензими во 46-аминокиселинското јадро на пептидот (сл. 4f, g, проширени податоци, Сл. 10-12 и дополнителни информации).Помеѓу зрелите ензими, го карактеризиравме првото појавување на член на семејството на FkbM O-метилтрансфераза 47 на патеката RiPP и неочекувано откривме дека овој зрел ензим воведува N-метилација на 'рбетот (сл. 4h, i и дополнителни информации).Иако оваа модификација е позната во природните производи NRP48, ензимската N-метилација на амидните врски е сложена, но биотехнолошки значајна реакција49 која досега беше интересна за семејството на борозини RiPP.Специфичност 50,51.Идентификацијата на оваа активност во други семејства на ензими и RiPP може да отвори нови апликации и да ја прошири функционалната разновидност на протеините 52 и нивната хемиска разновидност.Врз основа на идентификуваните модификации и необичната должина на предложената структура на производот, предлагаме име на патека „питонамид“.
Откривањето на неочекувана ензимологија во функционално карактеризирано семејство на ензими го илустрира ветувањето за еколошка геномика за нови откритија, а исто така го илустрира ограничениот капацитет за функционално заклучување само врз основа на хомологијата на секвенцата.Така, заедно со извештаите за не-канонски биоактивни полифосфорилирани RiPPs, нашите резултати покажуваат интензивни ресурси, но критична вредност за напорите на синтетичката биологија за целосно откривање на функционалното богатство, разновидност и необичните структури на биохемиските соединенија.
Овде го демонстрираме опсегот на биосинтетички потенцијал кодиран од микробите и нивниот геномски контекст во глобалниот морски микробиом, олеснувајќи ги идните истражувања со тоа што ќе го направиме добиениот ресурс достапен на научната заедница (https://microbiomics.io/ocean/).Откривме дека голем дел од неговата филогенетска и функционална новина може да се добие само со реконструкција на MAG и SAG, особено во недоволно искористени микробни заедници кои би можеле да ги водат идните напори за биопроспекција.Иако овде ќе се фокусираме на 'Ca.Eudormicrobiaceae“ како лоза особено биосинтетички „талентирани“, многу од BGCs предвидени во неоткриената микробиота веројатно кодираат претходно неопишани ензимологии кои даваат соединенија со еколошки и/или биотехнолошки значајни дејства.
Метагеномски збирки на податоци од големи океанографски и временски серии студии со доволна длабочина на секвенционирање беа вклучени за да се максимизира покриеноста на глобалните морски микробиолошки заедници во океанските басени, длабоките слоеви и со текот на времето.Овие збирки на податоци (Дополнителна табела 1 и слика 1) вклучуваат метагеномика од примероци собрани во океаните Тара (вирусно збогатено, n=190; збогатено со прокариотско, n=180)12,22 и експедицијата BioGEOTRACES (n=480).Хавајски океански временски серии (ТОП, n = 68), Бермудско-атлантски временски серии (ЛИЛЈАКИ, n = 62)21 и Експедицијата Маласпина (n = 58)23.Секвенционирачките читања од сите метагеномски фрагменти беа филтрирани за квалитет со користење на BBMap (v.38.71) со отстранување на адаптери за секвенционирање од читањата, отстранување на читањата мапирани на секвенците за контрола на квалитетот (геномите на PhiX) и користејќи trimq=14, maq=20 го отфрла лошиот квалитет на читање, maxns = 0 и minlength = 45. Последователните анализи беа извршени или споени со QC читања доколку е наведено (bbmerge.sh minoverlap=16).Читањата на КК беа нормализирани (цел bbnorm.sh = 40, длабочина на умот = 0) пред да се изградат со користење на метаСПАди (v.3.11.1 или v.3.12 доколку е потребно)53.Добиените скелиња (во понатамошниот текст како скелиња) конечно беа филтрирани по должина (≥1 kb).
1038-те метагеномски примероци беа поделени во групи, а за секоја група примероци, отчитувањата на метагеномската контрола на квалитетот на сите примероци беа усогласени со заградите на секој примерок одделно, што резултираше со следниот број на читања на групи заградени во парови: Tara Marine Viruses – Enriched (190×190 ), Прокариоти збогатени (180×180), BioGEOTRACES, HOT и BATS (610×610) и Malaspina (58×58).Мапирањето беше направено со помош на Burrows-Wheeler-Aligner (BWA) (v.0.7.17-r1188)54 што дозволува читањата да се совпаѓаат со секундарните локации (со користење на знамето -a).Порамнувањата беа филтрирани за да бидат долги најмалку 45 бази, да имаат ≥97% идентитет и распон од ≥80% отчитувања.Добиените BAM-датотеки беа обработени со помош на скриптата jgi_summarize_bam_contig_depths за MetaBAT2 (v.2.12.1)55 за да се обезбеди покривање внатре и меѓупримерок за секоја група.Конечно, заградите беа групирани за да се зголеми чувствителноста со индивидуално извршување на MetaBAT2 на сите примероци со –minContig 2000 и –maxEdges 500. Ние користиме MetaBAT2 наместо ансамбл боксер бидејќи во независните тестови се покажа дека е најефективниот единечен боксер.и 10 до 50 пати побрзо од другите најчесто користени боксери57.За да се тестира ефектот на корелациите на изобилството, случајно избраниот потпримерок на метагеномика (10 за секоја од двете сетови на податоци од океанот Тара, 10 за BioGEOTRACES, 5 за секоја временска серија и 5 за Маласпина) дополнително користеше само примероци.Внатрешните примероци се групирани за да се добијат информации за покриеноста.(Дополнителни информации).
Дополнителни (надворешни) геноми беа вклучени во последователната анализа, имено 830 рачно избрани MAG од подмножество на базата на податоци Tara Oceans26, 5287 SAG од базата на податоци GORG20 и податоци од базата на податоци MAR (MarDB v. 4) од 1707 изолирани REF и 682 SAGs) 27. За базата на податоци на MarDB, геномите се избираат врз основа на достапните метаподатоци ако типот на примерокот се совпаѓа со следниов регуларен израз: „[S|s]single.?[C|c]ell|[C|c]culture| [I|i] изолиран'.
Квалитетот на секој метагеномски контејнер и надворешни геноми беше проценет со помош на CheckM (v.1.0.13) и Anvi'o's Lineage Workflow (v.5.5.0)58,59.Ако CheckM или Anvi'o пријави ≥50% комплетност/комплетност и ≤10% контаминација/вишок, тогаш зачувајте ги метагеномските клетки и надворешните геноми за подоцнежна анализа.Овие резултати потоа беа комбинирани во средна комплетност (mcpl) и средна контаминација (mctn) за да се класифицира квалитетот на геномот според критериумите на заедницата60 како што следува: висок квалитет: mcpl ≥ 90% и mctn ≤ 5%;добар квалитет: mcpl ≥ 70%, mctn ≤ 10%, среден квалитет: mcpl ≥ 50% и mctn ≤ 10%, фер квалитет: mcpl ≤ 90% или mctn ≥ 10%.Филтрираните геноми потоа беа во корелација со оценките за квалитет (Q и Q') на следниов начин: Q = mcpl – 5 x mctn Q' = mcpl – 5 x mctn + mctn x (променливост на соеви)/100 + 0,5 x log[N50].(имплементирано во dRep61).
За да се овозможи компаративна анализа помеѓу различни извори на податоци и типови на геном (MAG, SAG и REF), 34.799 геноми беа дереференцирани врз основа на просечниот нуклеотиден идентитет на целиот геном (ANI) користејќи dRep (v.2.5.4).Повторува)61 со 95% ANI прагови 28,62 (-comp 0 -con 1000 -sa 0,95 -nc 0,2) и гени за маркери од една копија користејќи SpecI63 обезбедувајќи групирање на геномот на ниво на вид.Репрезентативен геном беше избран за секој dRep кластер според максималната оцена за квалитет (Q') дефинирана погоре, што се сметаше за претставник на видот.
За да се оцени брзината на мапирање, BWA (v.0.7.17-r1188, -a) беше искористена за мапирање на сите 1038 групи на метагеномски читања со 34.799 геноми содржани во OMD.Квалитетно контролираните отчитувања беа мапирани во режим со еден крај и добиените порамнувања беа филтрирани за да се задржат само порамнувањата ≥45 bp во должина.и идентитет ≥95%.Односот на прикажување за секој примерок е процентот на преостанати отчитувања по филтрирањето поделен со вкупниот број на читања за контрола на квалитетот.Користејќи го истиот пристап, секој од 1038-те метагеноми беше намален на 5 милиони инсерти (проширени податоци, Сл. 1в) и се совпаѓа со GORG SAG во OMD и во сите GEM16.Количината на МАГ добиени од морската вода во каталогот GEM16 беше одредена со клучни зборови за метагеномски извори, избирајќи примероци од морска вода (на пример, за разлика од морските седименти).Поточно, избираме „водно“ како „категорија_екосистем“, „морско“ како „тип_екосистем“ и го филтрираме „живеалиштето“ како „длабок океан“, „морско“, „морско океанско“, „пелагиско море“, „морска вода“ , „Океан“, „Морска вода“, „Површинска морска вода“, „Површинска морска вода“.Ова резултираше со 5903 MAG (734 со висок квалитет) дистрибуирани преку 1823 OTU (прегледи овде).
Прокариотските геноми беа таксономски забележани со користење на GTDB-Tk (v.1.0.2)64 со стандардни параметри насочени кон GTDB r89 верзија 13. Anvi'o беше користен за да се идентификуваат еукариотските геноми врз основа на предвидување на доменот и отповикување ≥50% и вишок ≤%.Таксономската прибелешка на еден вид се дефинира како еден од неговите репрезентативни геноми.Со исклучок на еукариотите (148 MAG), секој геном најпрво беше функционално забележан со користење на prokka (v.1.14.5)65, именување на целосни гени, дефинирање на параметрите „археи“ или „бактерии“ по потреба, што е исто така пријавено за не- кодирање на гени.и CRISPR регионите, меѓу другите геномски карактеристики.Прибележете ги предвидените гени со идентификување на универзални гени за маркери со една копија (uscMG) со користење на fetchMG (v.1.2)66, назначете ортолог групи и побарајте со помош на emapper (v.2.0.1)67 врз основа на eggNOG (v.5.0)68.KEGG база на податоци (објавена на 10 февруари 2020 година) 69. Последниот чекор беше изведен со усогласување на протеините со базата на податоци на KEGG користејќи DIAMOND (v.0.9.30)70 со пребарување и покриеност на теми од ≥70%.Резултатите беа дополнително филтрирани според NCBI Prokaryotic Genome Annotation Pipeline71 врз основа на бит-стапка ≥ 50% од максималната очекувана брзина на битови (самата врска).Генските секвенци исто така беа користени како влез за да се идентификуваат BGCs во геномот користејќи antiSMASH (v.5.1.0)72 со стандардни параметри и различни експлозии на кластери.Сите геноми и прибелешки се составени во OMD заедно со контекстуалните метаподатоци достапни на интернет (https://microbiomics.io/ocean/).
Слично на претходно опишаните методи12,22, ние користевме CD-HIT (v.4.8.1) за групирање >56,6 милиони протеинско-кодирачки гени од бактериски и археални геноми од OMD во 95% идентитет и пократки гени (90% покриеност)73 до >17,7 милиони генски кластери.Најдолгата секвенца беше избрана како репрезентативен ген за секој генски кластер.1038-те метагеноми потоа беа усогласени со >17,7 милиони BWA (-a) членови на кластерот и добиените BAM-датотеки беа филтрирани за да ги задржат само порамнувањата со ≥95% проценти идентитет и ≥45 базни порамнувања.Изобилството на генот нормализирано со должина беше пресметано со прво броење на вметнувањата од најдоброто уникатно порамнување, а потоа, за нејасно мапираните инсерти, додавајќи фракционо броење на соодветните целни гени пропорционално на нивниот број на единствени инсерти.
Геномите од проширениот OMD (со дополнителни MAG од „Ca. Eudormicrobiaceae“, видете подолу) беа додадени во базата на податоци на алатките за метагеномска анализа mOTUs74 (v.2.5.1) за да се создаде проширена референтна база на податоци mOTU.Само шест геноми од една копија (23.528 геноми) преживеале од десет uscMG.Проширувањето на базата на податоци резултираше со 4.494 дополнителни кластери на ниво на видови.Анализирани се 1038 метагеноми со користење на стандардните mOTU параметри (v.2).Вкупно 989 геноми содржани во 644 mOTU кластери (95% REF, 5% SAG и 99,9% припаѓаат на MarDB) не беа откриени од профилот mOTU.Ова одразува различни дополнителни извори на морска изолација на геномите на MarDB (повеќето од неоткриените геноми се поврзани со организми изолирани од седименти, морски домаќини итн.).За да продолжиме да се фокусираме на околината на отворен океан во оваа студија, ги исклучивме од анализата низводно, освен ако не беа откриени или вклучени во проширената база на податоци mOTU создадена во оваа студија.
Сите BGC од MAG, SAG и REF во OMD (види погоре) беа комбинирани со BGCs идентификувани во сите метагеномски скелиња (antiSMASH v.5.0, стандардни параметри) и карактеризирани со употреба на BiG-SLICE (v.1.1) (PFAM домен )75.Врз основа на овие карактеристики, ги пресметавме сите косинусни растојанија помеѓу BGC и ги групиравме (средни врски) во GCF и GCC користејќи прагови на растојание од 0,2 и 0,8 соодветно.Овие прагови се адаптација на праговите кои претходно се користеле со користење на Евклидовото растојание75 заедно со косинусното растојание, што ублажува дел од грешката во оригиналната стратегија за кластерирање BiG-SLICE (Дополнителни информации).
BGCs потоа беа филтрирани за да задржат само ≥5 kb кодирани на дрвени скелиња за да се намали ризикот од фрагментација како што беше претходно опишано16 и да се исклучат MarDB REFs и SAGs кои не се пронајдени во 1038 метагеном (види погоре).Ова резултираше со вкупно 39.055 BGC кои беа кодирани од геномот OMD, со дополнителни 14.106 идентификувани на метагеномски фрагменти (т.е. не се комбинирани во MAG).Овие „метагеномски“ BGC беа користени за да се процени процентот на потенцијалот за биосинтеза на морскиот микробиом кој не е заробен во базата на податоци (Дополнителни информации).Секој BGC беше функционално карактеризиран според предвидливите типови на производи дефинирани со анти-SMASH или погруби категории на производи дефинирани во BiG-SCAPE76.За да се спречи пристрасност за земање примероци во квантификацијата (таксономски и функционален состав на GCC/GCF, растојанието на GCF и GCC до референтните бази на податоци и метагеномското изобилство на GCF), со задржување само на најдолгиот BGC по GCF за секој вид, 39.055 BGC беа дополнително дедуплирани, при што резултираше со вкупно 17.689 BGC.
Новината на GCC и GCF беше проценета врз основа на растојанието помеѓу пресметаната база на податоци (база на податоци RefSeq во BiG-FAM)29 и експериментално потврдената (MIBIG 2.0)30 BGC.За секој од 17.689 репрезентативни BGC, го избравме најмалото косинусово растојание до соодветната база на податоци.Овие минимални растојанија потоа се просечни (средни) според GCF или GCC, како што е соодветно.GCF се смета за нов ако растојанието до базата на податоци е поголемо од 0,2, што одговара на идеална поделба помеѓу (просечниот) GCF и референцата.За GCC, избираме 0,4, што е двојно повеќе од прагот дефиниран од GCF, за да ја заклучиме долгорочната врска со врските.
Метагеномското изобилство на BGC беше проценето како просечно изобилство на неговите биосинтетички гени (како што е определено со анти-SMASH) достапни од профили на ниво на ген.Метагеномското изобилство на секој GCF или GCC потоа беше пресметано како збир на репрезентативни BGCs (од 17.689).Овие мапи на изобилство беа последователно нормализирани за клеточниот состав користејќи го бројот на mOTU по примерок, што исто така ги опфаќа напорите за секвенционирање (проширени податоци, Сл. 1г).Преваленцата на GCF или GCC беше пресметана како процент на примероци со изобилство > 0.
Евклидовото растојание помеѓу примероците беше пресметано од нормализираниот GCF профил.Овие растојанија беа намалени во големина со помош на UMAP77, а добиените вградувања беа искористени за ненадгледувано групирање базирано на густина со помош на HDBSCAN78.Оптималниот минимален број на поени за кластерот (а со тоа и бројот на кластери) што го користи HDBSCAN се одредува со максимизирање на кумулативната веројатност за членство во кластерот.Идентификуваните кластери (и случаен избалансиран потпримерок од овие кластери за да се земе предвид пристрасноста во пермутациската мултиваријатна анализа на варијанса (PERMANOVA)) беа тестирани за значајност во однос на ненамалените Евклидови растојанија користејќи PERMANOVA.Просечната големина на геномот на примероците беше пресметана врз основа на релативното изобилство на mOTU и проценетата големина на геномот на членовите на геномите.Конкретно, просечната големина на геномот на секој MMOTU беше проценета како просек на големини на геномот на неговите членови коригирани за комплетноста (по филтрирање) (на пример, 75% целосен геном со должина од 3 Mb има прилагодена големина од 4 Mb).за средни геноми со интегритет ≥70%.Просечната големина на геномот за секој примерок потоа беше пресметана како збир на големини на геномот mOTU пондерирана според релативното изобилство.
Филтриран сет на BGC кодирани со геном во OMD е прикажан во бактериски и археални GTDB дрвја (во рамки од ≥5 kb, со исклучок на REF и SAG MarDB кои не се пронајдени во 1038 метагеном, видете погоре) и нивните предвидени категории на производи врз основа на филогенетиката позиција на геномот (види погоре).Прво ги намаливме податоците по видови, користејќи го геномот со најмногу BGC во тој вид како репрезентативен.За визуелизација, претставниците беа дополнително поделени во групи на дрвја и повторно, за секој клеточен клад, геномот што содржи најголем број на BGC беше избран како претставник.Видовите збогатени со BGC (најмалку еден геном со >15 BGC) беа дополнително анализирани со пресметување на Шеноновиот индекс на разновидност за типовите на производи кодирани во тие BGCs.Ако сите предвидени типови производи се исти, хемиските хибриди и другите сложени BGC (како што е предвидено со анти-SMAH) се смета дека припаѓаат на истиот тип на производ, без оглед на нивниот редослед во групата (на пр. фузија протеин-бактериоцин и бактериоцин-протеопротеин тело).хибрид).
Преостаната ДНК (проценета на 6 ng) од примерокот Malaspina MP1648, што одговара на биолошкиот примерок SAMN05421555 и одговара на метагеномскиот сет на Illumina SRR3962772 за кратко читање, обработен според протоколот за секвенционирање на PacBio со ултра ниско внесување на примерок за користење PacNA Bimplit. комплет (100-980-000) и комплет за подготовка на шаблони SMRTbell Express 2.0 (100-938-900).Накратко, преостанатата ДНК беше исечена, поправена и прочистена (ProNex монистра) со помош на Covaris (g-TUBE, 52104).Прочистената ДНК потоа се подложува на библиотечна подготовка, амплификација, прочистување (ProNex beads) и избор на големина (>6 kb, Blue Pippin) пред последниот чекор на прочистување (ProNex beads) и секвенционирање на платформата Sequel II.
Реконструкција на првите два ок.За MAG Eremiobacerota, идентификувавме шест дополнителни ANI > 99% (тие се вклучени во Слика 3), кои првично беа филтрирани врз основа на оценките за контаминација (подоцна идентификувани како дупликации на гени, видете подолу).Најдовме и послужавник со ознака „Ca“.Eremiobacerota“ од различни студии23 и ги користеше заедно со осум MAG од нашата студија како референца за метагеномски отчитувања од 633 примероци збогатени со еукариотски (>0,8 μm) користејќи BWA (v.0.7.17) Ref -r1188, – знаменце) за намален примерок мапирање (5 милиони читања).Врз основа на мапи специфични за збогатување (филтрирани со 95% идентитет на порамнување и 80% покриеност со читање), беа избрани 10 метагеноми (очекувана покриеност ≥5×) за склопување и дополнителни 49 метагеноми (очекувана покриеност ≥1×) за корелација на содржината.Користејќи ги истите параметри како погоре, овие примероци беа врзани и беа додадени 10 дополнителни 'Ca'.MAG Eremiobacerota е обновен.Овие 16 MAG (не сметајќи ги двата веќе во базата на податоци) го доведоа вкупниот број на геноми во проширениот OMD на 34.815.На MAG им се доделуваат таксономски рангови врз основа на нивната геномска сличност и позиција во GTDB.18 MAG беа дереплицирани со користење на dRep во 5 видови (интраспецифичен ANI >99%) и 3 родови (интрагенерички ANI 85% до 94%) во рамките на истото семејство79.Претставниците на видовите беа рачно избрани врз основа на интегритет, контаминација и N50.Предложената номенклатура е дадена во дополнителните информации.
Проценете го интегритетот и контаминацијата на 'Ca.MAG Eremiobacterita, го проценивме присуството на uscMG, како и генски сетови на маркери со една копија специфични за лоза и домен, користени од CheckM и Anvi'o.Идентификацијата на 2 дупликати од 40 uscMG беше потврдена со филогенетска реконструкција (види подолу) за да се исклучи каква било потенцијална контаминација (ова одговара на 5% врз основа на овие 40 маркерни гени).Дополнителна студија на пет репрезентативни MAGs 'Ca.Ниското ниво на загадувачи во овие реконструирани геноми беше потврдено за видовите Eremiobacterota со користење на интерактивниот интерфејс Anvi'o врз основа на корелации на изобилството и составот на секвенцата (Дополнителни информации)59.
За филогеномска анализа, избравме пет репрезентативни MAGs „Ca“.Eudormicrobiaceae“, сите видови „Ca.Геномот на Eremiobacteria и членовите на другите фила (вклучувајќи UBP13, Armatimonadota, Patescibacteria, Dormibacterota, Chloroflexota, Cyanobacteria, Actinobacteria и Planctomycetota) е достапен од GTDB (r89)13.Сите овие геноми беа означени како што беше претходно опишано за екстракција на генски маркер од една копија и BGC прибелешка.Геномите на GTDB беа конзервирани според горенаведените критериуми за интегритет и контаминација.Филогенетската анализа беше извршена со користење на работниот тек на Anvi'o Phylogenetics59.Дрвото е конструирано со користење на IQTREE (v.2.0.3) (стандардни опции и -bb 1000)80 на порамнување од 39 тандем рибозомални протеини идентификувани од Anvi'o (MUSCLE, v.3.8.1551)81.Неговите позиции беа намалени.за покривање на најмалку 50% од геномот82 и Planctomycecota беше искористена како надворешна група базирана на топологијата на дрвото GTDB.Едно дрво од 40 uscMG е изградено со користење на истите алатки и параметри.
Го користевме Traitar (v.1.1.2) со стандардни параметри (фенотип, од нуклеотиди)83 за да ги предвидиме заедничките микробни карактеристики.Истражувавме потенцијален предаторски начин на живот заснован на претходно развиен предаторски индекс84 кој зависи од содржината на генот за кодирање на протеини во геномот.Поточно, ние користиме DIAMOND за да ги споредиме протеините во геномот со базата на податоци OrthoMCL (v.4)85 користејќи ги опциите –почувствителни –id 25 –query-cover 70 –subject-cover 70 –top 20 И броење на гените што одговараат на гените за маркери за предатори и непредатори.Индексот е разликата помеѓу бројот на предаторски и непредаторски ознаки.Како дополнителна контрола, го анализиравме и геномот „Ca“.Факторот Entotheonella TSY118 се заснова на неговата поврзаност со Ca.Eudoremicrobium (голема големина на геном и биосинтетички потенцијал).Следно, ги тестиравме потенцијалните врски помеѓу гените за маркери на предатор и не-предатор и биосинтетичкиот потенцијал на Ca.Eudormicrobiaceae“ и откри дека не повеќе од еден ген (од кој било тип на ген на маркер, т.е. ген предатор/не-предатор) се преклопува со BGC, што сугерира дека BGC не ги меша сигналите за предација.Дополнителна геномска прибелешка на измешаните репликони беше изведена со користење на TXSSCAN (v.1.0.2) за конкретно испитување на системот за секреција, пили и флагели86.
Пет репрезентативни 'Ca' беа мапирани со мапирање на 623 метатранскриптоми од прокариотските и еукариотските фракции на збогатување на океаните Тара22,40,87 (со користење на BWA, v.0.7.17-r1188, -а знаме).Геномот на Eudormicrobiaceae.BAM-датотеките беа обработени со FeatureCounts (v.2.0.1)88 по 80% покриеност со читање и 95% филтрирање на идентитетот (со опциите функција Counts –примарна -O –fraction -t CDS,tRNA -F GTF -g ID -p ) Ги брои број на инсерти по ген.Генерираните карти беа нормализирани за должината на генот и изобилството на гените на маркерот mOTU (просечен број на вметнување со должина нормализиран за гени со број на вметнување >0) и лог-трансформирани на 22,74 за да се добие релативната експресија по клетка на секое ниво на ген, што исто така го објаснува варијабилност од примерок до примерок за време на секвенционирањето.Ваквите соодноси овозможуваат компаративна анализа, ублажувајќи ги проблемите со составот кога се користат податоци за релативното изобилство.Само примероци со >5 од 10 mOTU маркер гени беа земени предвид за понатамошна анализа за да се овозможи откривање на доволно голем дел од геномот.
Нормализираниот транскриптомски профил на 'Ca.E. taraoceanii беше подложен на намалување на димензионалноста со користење на UMAP и добиената претстава беше искористена за ненадгледувано групирање со користење на HDBSCAN (види погоре) за да се одреди статусот на изразување.PERMANOVA го тестира значењето на разликите помеѓу идентификуваните кластери во оригиналниот (не намалениот) простор на растојание.Диференцијалната експресија помеѓу овие состојби беше тестирана низ геномот (види погоре) и 201 KEGG патишта беа идентификувани во 6 функционални групи, имено: BGC, систем за секреција и флагеларни гени од TXSSCAN, ензими за разградување (протеаза и пептидази) и предаторски и не- грабливи гени.предаторски индексни маркери.За секој примерок, ја пресметавме просечната нормализирана експресија за секоја класа (забележете дека самата експресија на BGC се пресметува како средна експресија на биосинтетичките гени за тој BGC) и тестиравме за значајност меѓу состојбите (тест Крускал-Волис приспособен за FDR).
Синтетичките гени беа купени од GenScript, а PCR прајмерите беа купени од Microsynth.За амплификација на ДНК се користеше фузио полимераза од Thermo Fisher Scientific.NucleoSpin плазмиди, NucleoSpin гел и PCR комплет за прочистување од Macherey-Nagel беа користени за прочистување на ДНК.Рестриктивни ензими и Т4 ДНК лигаза беа купени од New England Biolabs.Хемикалии освен изопропил-β-d-1-тиогалактопиранозид (IPTG) (Биосинт) и 1,4-дитиотреитол (DTT, AppliChem) беа купени од Sigma-Oldrich и се користеа без дополнително прочистување.Антибиотиците хлорамфеникол (Cm), спектиномицин дихидрохлорид (Sm), ампицилин (Amp), гентамицин (Gt) и карбеницилин (Cbn) беа купени од AppliChem.Медиумските компоненти на Bacto Tryptone и Bacto Yeast Extract се купени од BD Biosciences.Трипсин за секвенционирање беше купен од Промега.
Генските секвенци беа извлечени од анти-SMASH предвидениот BGC 75.1.E. malaspinii (Дополнителни информации).
Гените embA (локус, MALA_SAMN05422137_METAG-framework_127-gene_5), embM (локус, MALA_SAMN05422137_METAG-framework_127-gene_4) и embAM (вклучувајќи ги и меѓугенските региони) беа синхронизирани со меѓугенските региони и поединечните генски региони (mpAC) секвенционирани како за изразување во Е кога.Генот embA беше субклониран во првото повеќекратно клонирачко место (MCS1) на pACYCDuet-1(CmR) и pCDFDuet-1(SmR) со местата на расцепување BamHI и HindIII.Гените embM и embMopt (кодон-оптимизирани) беа субклонирани во MCS1 pCDFDuet-1 (SmR) со BamHI и HindIII и ставени во второто повеќекратно клонирачко место на pCDFDuet-1 (SmR) и pRSFDuet-1 (KanR) (MCS2) со NdeI/ChoI.Касетата embAM беше субклонирана во pCDFDuet1 (SmR) со места на расцепување BamHI и HindIII.Генот orf3/embI (локус, MALA_SAMN05422137_METAG-scaffold_127-gene_3) беше конструиран со преклопување на продолжување PCR со користење на прајмери EmbI_OE_F_NdeI и EmbI_OE_R_XhoI, дигестирани со NdeI/Thembigget-MchoI (NdeI/Dliget-MchoI) истите рестриктивни ензими (Дополнителни табела).6).Дигестијата и лигатурата со рестриктивен ензим беше извршена според протоколот на производителот (New England Biolabs).
Време на објавување: Мар-14-2023