Un recueil de bactéries et d'archées uniques

Blog

MaisonMaison / Blog / Un recueil de bactéries et d'archées uniques

Jun 01, 2023

Un recueil de bactéries et d'archées uniques

Données scientifiques tome 10,

Données scientifiques volume 10, Numéro d'article : 332 (2023) Citer cet article

1266 accès

22 Altmétrique

Détails des métriques

Les eaux marines pauvres en oxygène appelées zones à minimum d'oxygène (OMZ) ou zones marines anoxiques (AMZ) sont des caractéristiques océanographiques courantes. Ils hébergent à la fois des micro-organismes cosmopolites et endémiques adaptés aux conditions de faible teneur en oxygène. Les interactions métaboliques microbiennes au sein des OMZ et des AMZ entraînent des cycles biogéochimiques couplés entraînant une perte d'azote et la production et la consommation de gaz traces actifs sur le climat. Le réchauffement climatique provoque l'expansion et l'intensification des eaux pauvres en oxygène. Par conséquent, des études axées sur les communautés microbiennes vivant dans des régions pauvres en oxygène sont nécessaires pour surveiller et modéliser les impacts du changement climatique sur les fonctions et les services des écosystèmes marins. Nous présentons ici un recueil de 5 129 génomes amplifiés unicellulaires (SAG) provenant d'environnements marins englobant des profils géochimiques représentatifs OMZ et AMZ. Parmi ceux-ci, 3 570 SAG ont été séquencés à différents niveaux d'achèvement, offrant une perspective résolue par la souche sur le contenu génomique et les interactions métaboliques potentielles au sein des microbiomes OMZ et AMZ. Le regroupement hiérarchique a confirmé que les échantillons provenant de concentrations d'oxygène et de régions géographiques similaires avaient également des compositions taxonomiques analogues, fournissant un cadre cohérent pour l'analyse comparative des communautés.

Les zones déficientes en oxygène sont des caractéristiques océanographiques courantes (Fig. 1) qui surviennent lorsque la demande respiratoire microbienne en oxygène lors de la décomposition de la matière organique dépasse la disponibilité en oxygène. Ces eaux sont définies sur le plan opérationnel en fonction des conditions d'oxygène allant de dysoxique (20 à 90 μM), suboxique (1 à 20 μM), anoxique (moins de 1 μM) ou sulfurique anoxique (pas d'oxygène détectable)1,2. Les zones océaniques de minimum d'oxygène (OMZ) en milieu océanique telles que le gyre subtropical du Pacifique Nord présentent des conditions dysoxiques capables de soutenir le métabolisme anaérobie grâce à la reminéralisation microbienne de la matière organique particulaire en train de couler3 (Fig. 1a). Les OMZ côtières et océaniques à faible teneur en oxygène telles que le nord-est du Pacifique subarctique (NESAP) présentent des conditions suboxiques englobant la transition redox pour la réduction des nitrates (NO3−) (Fig. 1a). Les zones marines anoxiques (AMZ) se différencient davantage par l'accumulation de nitrite (NO2−) avec ou sans accumulation de sulfure (eaux de fond sulfurées et océan ouvert ou zones minimales à faible teneur en oxygène (OMZ), respectivement)4,5,6. Par exemple, les AMZ du Pacifique nord tropical oriental (ETNP) et du Pacifique sud tropical oriental (ETSP) présentent des conditions d'oxygène nanomolaires favorisant la réduction du NO3− en NO2− et des produits azotés encore réduits sans accumulation de sulfure d'hydrogène (H2S) (Fig. 1a). En revanche, les systèmes d'upwelling côtiers tels que l'upwelling de Benguela au large des côtes de la Namibie présentent des changements épisodiques de carence en oxygène, favorisant l'émergence de panaches sulfurés transitoires (Fig. 1a). Des conditions sulfuriques anoxiques sont également présentes dans les fjords côtiers, comme l'inlet Saanich (SI), où les seuils glaciaires limitent la circulation des masses d'eau. Des conditions de fond sulfurique sont également observées dans les mers marginales, telles que la mer Baltique (Fig. 1a).

Profils géochimiques de la zone à minimum d'oxygène (OMZ) et de la zone marine anoxique (AMZ) et carte globale des lieux d'échantillonnage. (a) Les différents profils géochimiques des eaux marines pauvres en oxygène sont schématisés (modifié de Ulloa et al., 2012)4. Les lignes pleines représentent les données observées, tandis que la ligne pointillée représente un événement d'accumulation sporadique. ( b ) Les emplacements d'échantillonnage OMZ et AMZ pour les génomes amplifiés unicellulaires (SAG) sont indiqués. Le nombre total (blanc) et les SAG séquencés (noirs) obtenus à partir de chaque emplacement sont indiqués par un cercle proportionnel au nombre correspondant d'échantillons dans l'ensemble de données. L'océan est coloré en fonction de la valeur statistique moyenne la plus basse pour la concentration d'oxygène signalée pour chaque grille de 1° et 5° dans l'Atlas mondial des océans annuel de la NOAA de 2018119, avec des grilles blanches indiquant les endroits où les données de concentration d'oxygène n'étaient pas disponibles. Les sites d'échantillonnage des eaux médianes océaniques comprennent le gyre subtropical du Pacifique Nord (NPSG) et le gyre subtropical de l'Atlantique Sud (SASG). Les sites d'échantillonnage des OMZ à faible teneur en oxygène comprennent le nord-est du Pacifique subarctique (NESAP). Les sites d'échantillonnage des ZMA comprennent le gyre du Pacifique nord tropical oriental (ETNP) et le gyre du Pacifique sud tropical oriental (ETSP). Les sites des systèmes d'upwelling côtiers avec des fonds sulfurés éphémères comprennent l'upwelling côtier du Pacifique Sud-Est (ESPCU) et l'upwelling côtier de Benguela (Benguela). Les sites d'échantillonnage des bassins de fond sulfurés comprennent l'inlet Saanich (SI) et la mer Baltique. Les coordonnées de géolocalisation et le nombre d'échantillons pour chaque emplacement sont détaillés dans le tableau 1.

Différents profils géochimiques au sein des OMZ et des AMZ créent des gradients écothermodynamiques7 entraînant le cycle biogéochimique couplé du carbone, de l'azote et du soufre par des micro-organismes cosmopolites et endémiques adaptés à la vie dans des conditions de faible teneur en oxygène (examiné dans2,3,4,8). Comprendre comment ces interactions métaboliques contribuent à la perte d'azote et à la production de gaz traces actifs sur le climat est un défi crucial9,10,11,12. Le réchauffement climatique exacerbe le déficit en oxygène de la colonne d'eau par la stratification thermique et les changements dans la circulation de la masse d'eau, entraînant l'expansion et l'intensification de l'OMZ et de l'AMZ13,14,15. D'autres facteurs, notamment des apports excessifs de nutriments (eutrophisation), contribuent également à la carence en oxygène de la mer côtière et marginale15,16,17,18. Les efforts visant à modéliser les cycles biogéochimiques couplés au sein des OMZ et des AMZ en utilisant des approches métagénomiques centrées sur les gènes et résolues sur le génome ont identifié des populations microbiennes clés qui bénéficieraient directement de la disponibilité d'assemblages génomiques améliorés avec une résolution taxonomique accrue19,20.

Le séquençage du fusil de chasse du génome entier indépendant de la culture fournit des informations directes sur la structure et la fonction de la communauté microbienne dans les environnements naturels et artificiels21,22,23,24,25,26,27. À mesure que les technologies de séquençage s'améliorent, il devient possible d'assembler des génomes à partir de métagénomes avec une résolution taxonomique croissante20. Cependant, malgré une dépendance croissante aux génomes assemblés par métagénomes (MAG), plusieurs défis subsistent, notamment la résolution de la microhétérogénéité de la population28, les assemblages de génomes incomplets ou chimériques (résultant soit de l'assemblage soit du binning), du biais de couverture et de la disponibilité limitée de génomes de référence taxonomiquement caractérisés pour validation croisée29,30,31. Les progrès des technologies de tri cellulaire activé par fluorescence (FACS) et de séquençage permettent d'étudier les micro-organismes non cultivés au niveau cellulaire individuel, fournissant des étiquettes taxonomiques plus précises et des éléments génétiques mobiles associés (MGE)32,33,34,35,36,37,38 . Les génomes amplifiés unicellulaires (SAG) et les MGE résultants ont été utilisés pour éclairer le potentiel de codage de la "matière noire microbienne"39, fournir des liens précis entre la taxonomie et la fonction sous-jacente aux cycles biogéochimiques20,21,30,40, et pour évaluer la rationalisation du génome41, fine structure de la population à grande échelle28,37,42 et dynamique virus-hôte43. La publication récente de Global Ocean Reference Genomes Tropics, ou GORG-Tropics, fournit un recueil précieux de SAG définis taxonomiquement contenant plus de 12 000 séquences génomiques partielles provenant d'eaux océaniques euphotiques tropicales et subtropicales44. Bien qu'un petit sous-ensemble de SAG GORG-Tropics ait été collecté dans les eaux « océaniques à faible teneur en oxygène entre les eaux intermédiaires » (2 136 sur 20 288 SAG séquencés)44, les eaux marines pauvres en oxygène restent manifestement sous-représentées, compte tenu de leur impact biogéochimique substantiel sur les fonctions et les services de l'écosystème marin.

Ici, nous présentons un recueil mondial des SAG bactériens et archéens des OMZ et des AMZ. Ce recueil contient 5 129 SAG identifiés taxonomiquement dérivés à l'aide d'une combinaison de méthodes de tri cellulaire ciblées et non ciblées, et isolés d'environnements couvrant toute la gamme des profils géochimiques associés aux eaux marines existantes et pauvres en oxygène4 (Fig. 1). Actuellement, 3 570 de ces SAG ont été séquencés, assemblés et décontaminés, sur la base de normes génomiques établies45 (Fig. 2, S1a-c). Les SAG séquencés et assemblés ont été traités via le Microbial Genome Annotation Pipeline46 pour la prédiction des gènes et l'annotation fonctionnelle, et sont disponibles via la plateforme Integrated Microbial Genome (IMG ; https://img.jgi.doe.gov/)47 ou IMG/ProPortal ( https://img.jgi.doe.gov/proportal). La collection de séquences SAG fournit une ressource inestimable pour déduire les traits métaboliques, résoudre les structures de population et évaluer les tendances spatiales et temporelles des lignées taxonomiques pertinentes au sein des microbiomes OMZ et AMZ.

Vue d'ensemble du flux de travail pour le traitement et la génération de génomes amplifiés unicellulaires (SAG) microbiens. Un schéma plus détaillé est présenté dans les informations supplémentaires (Figure supplémentaire S1-S3) (modifié de Rinke et al., 2013)50.

Des échantillons d'eau de mer d'environ 1 à 2 ml ont été prélevés en double ou en triple lors de diverses croisières océanographiques dans différentes OMZ et eaux anoxiques (Fig. 1 et Tableau 1). Les échantillons ont été placés dans des cryotubes stériles et modifiés avec l'un des cryoprotecteurs suivants : glycine bétaïne (6 % [v/v] concentration finale39,48), glycérol (10 % [v/v] concentration finale28,49) ou glycérol-TE tampon39,50. La collecte d'eau de mer environnementale a été réalisée à l'aide d'une rosette de bouteille Niskin, ou d'un système de profilage de pompe pour la campagne NBP13-05 (ETSP ; N/R Nathaniel B. Palmer, 5-7 juillet 2013), équipé d'un capteur conductivité-température-profondeur profileur, capteur d'O2 dissous, fluorimètre et transmissomètre. Un protocole de collecte d'échantillons modifié a été utilisé lors de la campagne BiG RAPA (ETSP, au large du Chili, 19 novembre 2010, 55 m de profondeur) qui a d'abord été enrichi en sélection sur le pont pour les micro-organismes contenant de la chlorophylle51. Les échantillons en triple ont été passés à travers un maillage de 60 μm et triés à travers un système de cytomètre en flux InfluxTM (BD Biosciences). Environ 4 000 cellules ont été triées dans 1 ml de tampon glycérol-TE stérile. Le tri a été déclenché en fonction de la teneur en pigment des particules dans le canal d'émission rouge (excité par le laser 488), en utilisant la lumière diffusée vers l'avant comme indicateur de la taille des particules. Tous les échantillons ont été cryoconservés dans de l'azote liquide, puis stockés à -80 ° C, avant d'être traités pour la génération de génome amplifié unicellulaire.

Les échantillons ont été décongelés et les cellules microbiennes triées au Bigelow Laboratory for Ocean Sciences' Single Cell Genomics Center (SCGC) ou au Joint Genome Institute (JGI). Les échantillons ont été passés à travers une maille stérile de 40 μm avant que les micro-organismes ne soient triés soit par une procédure d'isolement non ciblée, soit par une sélection spécifique pour les cyanobactéries. Pour l'isolement non cible, les particules microbiennes ont été marquées avec une concentration finale de 5 μM du colorant d'ADN SYTO-9 (Thermo Fisher Scientific). Les cellules microbiennes ont été triées individuellement à l'aide d'un système de cytomètre en flux MoFloTM (Beckman Coulter) ou InFluxTM (BD Biosciences) équipé d'un laser d'excitation à 488 nm et d'un orifice de buse de 70 μm52. Les portes pour l'isolement non ciblé des cellules microbiennes colorées avec SYTO-9 ont été définies sur la base de la fluorescence verte des particules comme indicateur de la teneur en acide nucléique et de la lumière diffusée latéralement comme indicateur de la taille des particules. Pour l'isolement des cellules cyanobactériennes, les portes ont été définies sur la base de l'autofluorescence dans le canal d'émission rouge. Une discrimination améliorée des cellules cyanobactériennes des particules détritiques a été réalisée sur la base du rapport de fluorescence verte (marqueur d'ADN SYTO-9) par rapport à la fluorescence rouge (teneur en chlorophylle). Le cytomètre a été déclenché sur la diffusion latérale en utilisant le mode "single-1 drop". Toutes les cellules individuelles microbiennes ont été triées dans des plaques à 384 puits contenant 600 nL de tampon TE 1X par puits, puis stockées à -80 ° C jusqu'à ce qu'elles soient traitées ultérieurement. Un sous-ensemble de cellules microbiennes, qui ont généré les SAG identifiés par le préfixe « AAA001 » (une partie des SAG collectés au SASG, à 800 m de profondeur), ont été triés en « prepGEMTM Bacteria reaction mix » (ZyGEM)48. Pour les échantillons traités au Bigelow Single Cell Genomics Center, 64 des 384 puits de chaque plaque ont été utilisés comme témoins négatifs (pas de dépôt de gouttelettes) et 3 puits ont reçu 10 cellules chacun pour servir de témoins positifs.

Les cellules individuelles microbiennes triées dans un tampon TE ont été lysées comme décrit précédemment en ajoutant soit du KOH53 froid, soit 700 nl d'un tampon de lyse composé de KOH 0, 4 mM, d'EDTA 10 mM et de dithiothréitol 100 mM. Les échantillons ont été incubés pendant 10 min à 4 ou 20 ° C pour les échantillons lysés avec du KOH froid ou un tampon de lyse, respectivement. Les cellules microbiennes triées dans le «mélange réactionnel de bactéries prepGEMTM» ont d'abord été lysées en suivant les instructions du fabricant, puis traitées par la procédure de lyse froide au KOH48. Les acides nucléiques microbiens ont ensuite été amplifiés du génome entier dans des puits individuels soit par le biais de la traditionnelle "Legacy Multiple Displacement Amplification" (L-MDA39,53) soit en utilisant une polymérase Phi29 plus thermostable via "Whole Genome Amplification-X" (WGA- X52). Les produits de cette procédure sont ici appelés SAG.

Bien que les produits d'amplification du génome unicellulaire générés par WGA-X n'aient pas été présélectionnés sur le plan taxonomique, presque tous les SAG traités à l'aide de L-MDA avec la polymérase non thermostable ont été identifiés sur le plan taxonomique en séquençant les amplicons du gène de l'ARN ribosomique de petite sous-unité (SSU ou ARNr 16 S). Amorces bactériennes (27-F : 5′- AGAGTTTGATCMTGGCTCAG -3′54, 907-R : 5′- CCGTCAATTCMTTTRAGTTT -3′55) et archées (Arc_344F : 5′- ACGGGGYGCAGCAGGGCGCGA -3′56, Arch_915R : 5′- GTGCTCCCCCGCCA ATTCCT -3'57) ont été utilisés. La PCR en temps réel et le séquençage des amplicons résultants ont été effectués comme décrit précédemment39,52. Les séquences d'amplicon du gène d'ARNr SSU résultantes ont été interrogées par rapport à la base de données SILVA v138.158 avec blastn, de BLAST + v2.9.059. Le top blastn hit (c'est-à-dire la couverture, le bit-score et l'identité les plus élevés, ainsi que la valeur e la plus faible) a été utilisé comme classification taxonomique principale pour chaque SAG présélectionné (tableau S1)60. De plus, les séquences d'amplicon du gène ARNr SSU ont été interrogées par rapport à la base de données NCBI-RefSEQ v2021-08-1461. Les meilleurs résultats ont été déterminés à l'aide des mêmes critères que ceux décrits ci-dessus et désignés ici comme les attributions taxonomiques secondaires des SAG (tableau S1)60. Les séquences désignées comme "non classées" n'avaient aucune homologie de séquence significative avec aucune des références de ces bases de données (tableau S1)60.

Deux méthodes ont été utilisées pour attribuer une taxonomie aux SAG. Initialement, les attributions taxonomiques pour les SAG générés par L-MDA ont été effectuées en extrayant les séquences de gènes d'ARNr SSU directement à partir des assemblages du génome entier ou à partir des amplicons décrits ci-dessus. Pour tous les SAG générés par la procédure WGA-X qui n'ont été criblés pour aucun marqueur phylogénétique avant le séquençage du génome, une recherche a été menée pour identifier les séquences de gènes d'ARNr SSU> 500 pb dans l'assemblage du génome (Figure supplémentaire S2). Cette recherche a été effectuée via le système Integrated Microbial Genomes & Microbiome (IMG/M, https://img.jgi.doe.gov/m/) sur la base de son pipeline de prédiction et d'annotation de gènes (voir ci-dessous)45,46. De plus, les séquences d'ARNr SSU ont été récupérées à partir d'un sous-ensemble d'assemblages SAG avec le flux de travail Recovering ribosomal RNA gene sequences with Anvi'o v7.062. Ces séquences de gènes d'ARNr SSU ont été traitées comme décrit ci-dessus pour attribuer une taxonomie (tableau S1)60. Parce que 1 281 SAG n'ont pas fourni suffisamment d'informations sur la séquence du gène de l'ARNr SSU (tableau S2) 70 avec GTDB R07-R207_v271,72,73 données de référence pour l'attribution taxonomique multi-locus. Cela a permis l'identification taxonomique des SAG manquant de séquences de gènes d'ARNr SSU et a offert une référence supplémentaire par rapport à celles attribuées par des séquences de marqueurs phylogénétiques partielles ou complètes. Le nombre d'attributions taxonomiques générées à l'aide des deux méthodes est détaillé dans le tableau S360, les attributions étant disponibles dans le tableau S160.

Les SAG ont été séquencés comme décrit précédemment39,52, et leurs lectures assemblées en contigs à l'aide de SPAdes v2.2.10 à v3.10.074. Les contigs de <2 000 bp ont été retirés des assemblages SAG. L'exhaustivité et les niveaux de contamination des assemblages SAG ont ensuite été déterminés à l'aide de CheckM v1.2.175. Pour se conformer aux normes génomiques établies45, les assemblages dépassant 5 % de contamination estimée ont été exécutés via ProDeGe v2.2 à v2.376 pour éliminer les contigs conflictuels jusqu'à ce qu'il n'y ait aucune amélioration de leurs estimations de contamination. Les niveaux de contamination et d'exhaustivité de ces SAG ont ensuite été réévalués à l'aide de CheckM v1.2.175 et ceux qui dépassaient encore 5 % de contamination ont été décontaminés manuellement via les flux de travail Metagenomics Workflow et Refining MAG bin workflows disponibles dans Anvi'o v562.

Au total, 14 SAG ont dépassé 5 % de contamination après avoir été traités par le pipeline de décontamination ProDeGe76 et la coupe à court contig (tableau S5)60. Ces SAG ont été décontaminés manuellement avec Anvi'o v5 en utilisant les workflows Metagenomics Workflow et Refining MAG bin62. Une base de données contig et le modèle de Markov caché correspondant pour chaque base de données ont été générés pour chacun de ces SAG. La taxonomie de chaque gène a ensuite été attribuée à l'aide de la Centrifuge Database77. Une conservation manuelle supplémentaire de ces SAG a été effectuée en utilisant une couverture différentielle de chaque SAG basée sur les lectures métagénomiques des métagénomes de Saanich Inlet (août 2011 100 m, 150 m et 2012 100 m, 150 m). Projet PRJNA247822)78. Les lectures métagénomiques brutes ont été cartographiées avec bwa v0.7.17-r118879 et samtools v1.6-19-g1c03df680. Des bases de données de profils Anvi ont été générées pour chaque SAG en utilisant les bases de données contig et les fichiers de mappage de lecture. Les contigs individuels ont été supprimés manuellement via l'interface interactive en fonction de l'identité taxonomique, de l'identité moyenne des tétranucléotides et de la faible couverture différentielle. Les nouveaux assemblages ont été exportés sous forme de fichiers fasta et réévalués avec CheckM.

Une fois CheckM exécuté sur tous les assemblages SAG décontaminés, la qualité de chaque SAG a été déterminée sur la base de Bowers et al. 201745. Les SAG qui étaient <50 % d'exhaustivité estimée étaient considérés comme des SAG de faible qualité. Les SAG qui avaient ≥50 % d'exhaustivité estimée et <10 % de contamination estimée étaient considérés comme étant au moins de qualité moyenne. Pour déterminer si un SAG était de haute qualité, en plus d'avoir> 90% d'exhaustivité estimée et <5% de contamination estimée, les SAG doivent avoir des gènes d'ARNr 23 S, 16 S et 5 S et au moins 18 ARNt présents dans l'assemblage final . Pour identifier et quantifier les ARNr et les ARNt, les SAG ont été passés respectivement par Barrnap v0.9 (https://github.com/tseemann/Barrnap)81 et tRNA-SE v2.0.1182. Tous les SAG ayant > 90 % d'exhaustivité estimée et < 5 % de contamination estimée mais manquant un ou plusieurs gènes d'ARNr avec au moins 18 ARNt ont été classés comme de qualité moyenne. Le nombre d'ARNr et d'ARNt, ainsi que les classifications de qualité pour chaque SAG se trouvent dans le tableau S160.

Tous les assemblages de génomes ont été annotés via la plate-forme IMG du Joint Genome Institute et annotés à l'aide du JGI Microbial Genome Annotation Pipeline46. Les systèmes IMG (https://img.jgi.doe.gov/) ou IMG/ProPortal (https://img.jgi.doe.gov/proportal) hébergent toutes les séquences SAG finales assemblées et décontaminées, avec appels de gènes et fonctions annotations accessibles au public via ces portails. Tous les numéros d'accès IMG pour les SAG séquencés sont fournis (tableau S1)60.

Les séquences d'amplicon de gène d'ARNr SSU récupérées couvrant la région variable V4-V5 ont été regroupées à 97% d'identité à l'aide de CD-Hit83,84,85 et des identifiants attribués en fonction d'une séquence représentative de chaque cluster. Sur la base de l'identité taxonomique de ces séquences représentatives, la proportion de SAG associés à chaque grappe a été déterminée par échantillon. Ces proportions ont été utilisées pour calculer les indices de dissemblance de Bray-Curtis à l'aide de la commande vegdist() dans le package vegan R v2.5-786. Les échantillons ont été regroupés en fonction de la dissemblance de Bray-Curtis, en utilisant une méthode de liaison moyenne pour le regroupement hiérarchique à l'aide de la commande hclust dans la base R et visualisés (Fig. 3).

Une évaluation basée sur le SAG de la composition microbienne dans les OMZ. Le dot-plot présente la désignation taxonomique et la proportion de SAG triés de manière anonyme séquencés (point coloré) dans chaque taxon au niveau du phylum et des protéobactéries au niveau de la classe de chaque emplacement. Les points gris sous-jacents représentent les SAG collectés et criblés taxonomiquement, mais pas actuellement séquencés. La taxonomie a été déterminée par les séquences d'amplicon du gène ARNr SSU telles que définies par SILVA v138.1. La couleur des points représente les concentrations d'oxygène dans l'environnement au moment de l'échantillonnage. Les emplacements d'échantillonnage ont été regroupés en fonction de la similarité de la composition taxonomique SAG recueillie à chaque emplacement. L'échelle de regroupement représente la dissemblance de Bray-Curtis parmi la diversité microbienne de chaque emplacement en fonction des informations de séquence SAG. Les barres d'annotation indiquent le mode d'amplification de l'ADN et le type OMZ. Les informations de localisation sont codées par couleur comme indiqué pour la méthode d'amplification de l'ADN, le type OMZ ou AMZ et la concentration en oxygène au moment de l'échantillonnage. Les noms des emplacements d'échantillonnage, sur les pointes du dendrogramme, sont indiqués par « emplacement_profondeur (m)_mois et/ou année de collecte ». Les acronymes de localisation correspondent à : Saanich Inlet (SI), Northeastern Subarctic Pacific (NESAP), North Pacific Subtropical Gyre (NPSG), Eastern Tropical North Pacific (ETNP), Eastern Tropical South Pacific (ETSP), Eastern South Pacific Coastal Upwelling (ESPCU) , l'upwelling côtier de Benguela (Benguela), le gyre subtropical de l'Atlantique Sud (SASG) et la mer Baltique (Baltique).

Fichier 1 : Tableau S1. Échantillons biologiques OMZ SAG avec métadonnées de croisière et de géolocalisation associées. Ce fichier contient toutes les accessions Bioproject et Biosample, les ID de génome IMG, les accessions SRA, les accessions Genbank, les sorties CheckM, les sorties GTDB-tk et les résultats SSU rRNA BLAST peuvent être trouvés dans : Tableau S1_Metadata-template-Bio-Med-SAGdescriptor-OMZ_April_06_2023. xlsx (10.6084/m9.figshare.20481603)60.

Fichier 2 : Tableau S2. Nombre de SAG générés avec chaque méthode d'amplification d'ADN et combien de séquences de gènes d'ARNr SSU récupérables ont été récupérées à partir de chaque ensemble de données. Notez que certains échantillons avaient à la fois des séquences de gène d'ARNr SSU dérivées d'amplicon et de génome entier. Ces informations peuvent être trouvées dans (10.6084/m9.figshare.20539005)60 et : https://github.com/hallamlab/OMZ_SAG_Compendium_Figures/blob/main/Outputs/Table_S2_Summary_Table_WGA_Approach_Mar_21_2023.csv

Fichier 3 : Tableau S3. Nombre de SAG auxquels une taxonomie a été attribuée avec SILVA v138.1 et GTDB-tk v2.1.0 et leurs estimations récapitulatives CheckM % d'exhaustivité et % de contamination. Ces informations peuvent être trouvées dans (10.6084/m9.figshare.20539056)60 et : https://github.com/hallamlab/OMZ_SAG_Compendium_Figures/blob/main/Outputs/Table_S3_QA_QC_Summary_Mar_21_2023.csv

Fichier 4 : Tableau S4. Contact primaire et secondaire pour chaque plaque de 384 micropuits contenant les SAG utilisés dans ce recueil. Ces informations se trouvent dans le tableau S4_PI_Contact_Info.xlsx (10.6084/m9.figshare.20483595)60.

Fichier 5 : Une archive tar compressée en fichier zip contenant les assemblages génomiques (10.6084/m9.figshare.20459526)60.fna - Fichier d'acide nucléique au format multi-fasta

Fichier 6: Une archive tar compressée dans un fichier zip contenant les séquences génomiques du gène de l'ARNr SSU et les séquences partielles d'amplicon du gène de l'ARNr SSU utilisées pour l'attribution taxonomique se trouve dans (10.6084/m9.figshare.20537919)60.fna - Fichier d'acide nucléique au format multi-fasta

Fichier 7 : Tableau S5. Un fichier xlsx contenant la liste des SAG qui ont subi une décontamination manuelle à partir de Saanich Inlet, ainsi que la profondeur d'où ils proviennent. Les profondeurs ont été utilisées pour sélectionner les lectures de métagénome utilisées pour le processus de décontamination manuelle. Ce tableau se trouve dans (10.6084/m9.figshare.20538936)60.

La mise en œuvre précoce des flux de travail SAG impliquait la MDA de cellules individuelles triées de manière anonyme dans un format de plaque à 384 puits, suivie d'une amplification par PCR de marqueurs phylogénétiques sélectionnés, par exemple le gène d'ARNr SSU, pour identifier les SAG d'intérêt pour le séquençage39. Le développement récent de WGA-X couplé au séquençage du génome à faible couverture (LoCoS) fournit un flux de travail plus économique pour identifier des centaines de SAG par échantillon sans biais PCR potentiel52. Des méthodes ciblées de tri basées sur les propriétés spectrales des cellules ou des substrats ont également été appliquées à la sélection et au séquençage SAG, y compris les cyanobactéries et les cellules se liant à des substrats marqués par fluorescence, tels que la cellulose87,88,89. Bien que le gène de l'ARNr SSU reste l'un des marqueurs phylogénétiques les plus largement utilisés et dispose de bases de données bien établies et organisées (par exemple SILVA58), des outils d'attribution phylogénétique multi-locus, tels que GTDB-Tk63,64,65,66,67,68, 69,70 génèrent des résultats tout aussi valables en utilisant plus d'informations. Pour ce recueil, la diversité microbienne a été évaluée à l'aide d'étiquettes taxonomiques et d'informations sur l'abondance des SAG séquencés à l'aide d'approches de tri cellulaire non ciblées. Cependant, tous les SAG n'avaient pas de correspondance pour leur taxonomie de gène d'ARNr SSU en raison soit de leurs séquences d'amplicons trop courtes (188 SAG L-MDA avec des amplicons <500 bp; tableau S2) soit du fait qu'aucun gène d'ARNr SSU n'a été récupéré à partir de l'amplification aléatoire du génome (c'est-à-dire 1 093 SAG WGA-X ; tableau S2). Ainsi, un classificateur taxonomique supplémentaire a été exécuté pour tous les SAG, basé sur l'attribution du génome entier à l'aide de GTDB-Tk63,64,65,66,67,68,69,70. Les deux ensembles de classifications figurent dans le tableau S1. Le regroupement hiérarchique (de 3 217 SAG contenant une séquence d'amplicon de gène d'ARNr V4-V5 SSU attribuable) a révélé une plus grande similitude entre ceux des profondeurs et des emplacements géographiques avec des conditions d'oxygène similaires (Fig. 3), un résultat cohérent avec les observations antérieures2,3,4 ,8. Il convient également de noter que de nombreux SAG amplifiés avec la méthode WGS-X provenaient d'échantillons hautement oxygénés, qui avaient des compositions taxonomiques similaires et donc regroupés. Sur la base de ces informations, les séquences OMZ et AMZ SAG présentées ici devraient servir à compléter les collections SAG précédentes obtenues à partir d'eaux océaniques euphotiques (oxygénées)44,49.

Ce recueil est destiné à combler une lacune critique dans les génomes de référence étiquetés taxonomiquement provenant d'eaux marines pauvres en oxygène. Les séquences SAG incluses ont été traitées à l'aide de flux de travail d'assemblage et de décontamination bien établis. Cependant, des liens vers les données brutes sont également disponibles pour les utilisateurs intéressés par l'utilisation de futures versions logicielles ou la mise en œuvre de flux de travail alternatifs. Toute approche devrait viser à discerner les séquences contaminantes associées au FACS (co-tri de deux cellules ou plus dans un seul puits, contamination environnementale par l'ADN) et WGA (contamination par réactif)90. Il est important de souligner que les séquences SAG contiennent souvent des MGE, y compris des plasmides et des virus43,91,92,93. Ces séquences sont généralement filtrées pendant le processus de décontamination, bien que la différenciation entre les intervalles chromosomiques endogènes tels que les îles ou le prophage des MGE nécessite une curation manuelle minutieuse. Les utilisateurs intéressés par les MGE sont encouragés à travailler avec les données brutes ou les assemblages initiaux avant la décontamination. Notez que les estimations de la contamination de l'assemblage du génome obtenues par CheckM doivent être manipulées avec prudence, car cet outil est susceptible à la fois de surestimer et de sous-estimer l'exhaustivité et la contamination94. Comme décrit ci-dessus, les progrès récents de la MDA utilisant WGA-X ont conduit à une amélioration de l'achèvement du SAG et l'adoption de LoCoS a évité le besoin de cribler l'amplicon du gène ARNr SSU pour sélectionner les SAG d'intérêt pour le séquençage52. Les séquences incluses dans ce recueil comprennent des approches de séquençage SAG plus anciennes et plus contemporaines. Les résultats sont intégrés en présentant le gène de l'ARNr SSU et les attributions taxonomiques multi-locus basées sur SILVA, NCBI et GTDB.

Malgré les améliorations introduites avec WGA-X52, la génomique unicellulaire entraîne invariablement des assemblages génomiques incomplets (Fig. 4, Figure supplémentaire S4). Cette limitation peut être surmontée en partie lorsque plusieurs SAG partageant des niveaux extrêmement élevés d'identité nucléotidique sont obtenus à partir du même échantillon. Ces séquences étroitement liées peuvent être analysées ensemble, permettant une reconstruction métabolique plus complète7,33,42,51, ou utilisées pour générer des assemblages combinés50,95. De plus, des génomes au niveau de la population peuvent être obtenus grâce à des assemblages hybrides combinant des séquences SAG et des séquences métagénomiques96,97. Dans tous les cas, les contigs SAG doivent être filtrés pour éliminer la présence de séquences contaminantes et respecter les normes génomiques établies45. Tous les assemblages SAG signalés ici ont été soigneusement décontaminés, atteignant une contamination inférieure à 5 % pour tous sauf quatre SAG (qui n'avaient qu'entre 5 et 10 % de contamination ; Fig. 4, Figure supplémentaire S4, Tableau S2).

Estimations de l'exhaustivité et de la contamination CheckM des SAG séquencés pour tous les SAG séquencés avec la taille en points représentant la longueur de l'assemblage en paires de mégabases (MBP). Parmi ceux-ci, la ligne continue représente le seuil estimé d'exhaustivité et de contamination pour les SAG de qualité moyenne (> = 50 % d'exhaustivité, < 10 % de contamination) et la ligne pointillée représente le seuil pour les SAG de haute qualité (> 90 % d'exhaustivité, < 5 % de contamination )45. Les parcelles sont colorées en fonction de (a) la région, (b) l'écotype OMZ, (c) la profondeur, (d) le niveau de concentration d'oxygène environnemental, (e) la méthode d'amplification de l'ADN et (f) le groupe taxonomique (niveau de classe pour les protéobactéries, niveau phylum pour les autres taxons) tel que défini par SILVA v138.1. Notez que les SAG > 5 % de contamination estimée ont été exclus de ce chiffre.

De nombreux SAG inclus dans ce recueil n'ont pas été séquencés et l'ADN reste en stockage. Les utilisateurs sont encouragés à identifier les micro-organismes sous-représentés des microbiomes OMZ et AMZ sur la base des informations taxonomiques fournies qui peuvent être priorisées pour le séquençage et partagées avec la communauté des utilisateurs. Dans le même temps, nous reconnaissons qu'il existe également des environnements OMZ et AMZ sous-représentés qui ne sont pas inclus dans ce recueil. Des séquences de la mer Noire, de la mer de Chine méridionale, de la mer d'Oman et du golfe du Bengale, entre autres, fourniraient une représentation plus robuste des eaux marines pauvres en oxygène à utiliser dans des études comparatives et des efforts de modélisation. Enfin, les séquences SAG incluses dans ce recueil peuvent être utilisées comme génomes de référence taxonomiquement caractérisés pour recruter des ensembles de données métagénomiques à partir d'environnements marins, améliorer les méthodes de prédiction des voies29,98,99,100,101,102,103,104,105,106 ou étendre les packages de référence pour l'analyse centrée sur les gènes des marqueurs fonctionnels107.

Les scripts utilisés pour calculer le nombre de SAG, la matrice de dissemblance de Bray-Curtis, conduisent le cluster hiérarchique et génèrent les Figs. 1b, 3, 4, figures supplémentaires S4 à S8 écrites sous R version 4.1.3. Ces scripts utilisent les packages R suivants : tidyverse, egg, vegan, dendexted, sf, rnaturalearth et rnaturalearthdata produiront les tableaux et les figures présentés dans cet article. Un lien direct vers les logiciels et spécifications pertinents est disponible en ligne sur le référentiel Hallam Lab Github https://github.com/hallamlab/OMZ_SAG_Compendium_Figures.

Les logiciels supplémentaires utilisés, y compris les numéros de version, les variables réglables et d'autres paramètres, incluent les éléments suivants :

Trimmomatic 0.35108 : -phred33 AVANT :0 SUIVANT :5 FENÊTRE COULISSANTE :4:15 MINLEN :36

ILLUMINACLIP :Trimmomatic-0.35108 : /adaptateurs/TruSeq. 3-PE.fa:2:3:10 AVANT :3 SUIVANT :3 FENÊTRE COULISSANTE :4:15 MINLEN :36

SPAdes 3.0.0-3.10 74 : --attention--sc--phred-offset 33

ProDeGe v2.3.0 76

CheckM v1.2.175 : checkm lineage_wf --tab_table -x.fna --threads 8 --pplacer_threads 8

CheckM v1.2.175 : checkm qa -o 2 --tab_table

GTDB-Tk v2.1.063,64,65,66,67,68,69,70 : gtdbtk classify_wf --genome_dir --out_dir -x.fna --cpus 8

Nucleotide-Nucleotide BLAST 2.9.0+59 : blastn -query -db -outfmt "6 qacc sacc stitle staxid pident bitscore" -max_target_seqs. 1 -num_threads 4 -out

Nucleotide-Nucleotide BLAST 2.9.0+59 : blastn -query -db -outfmt "6 qacc stitle pident bitscore" -max_target_seqs. 1 -num_threads 4 -out

Anvi'o v562 : anvi-gen-contigs-database -f -o -n

Envi'o v562 : anvi-run-hmms -c

Anvi'o v562 : anvi-get-sequences-for-gene-calls -c -o

Anvi'o v562 : $CENTRIFUGE_BASE/p + h + v/p + h + v gene-calls.fa -S centrifuge_hits.tsv

Anvi'o v562 : anvi-import-taxonomy-for-genes -c -p

BWA v 0.7.17-r118879:indice bwa

BWA v 0.7.17-r118879 : mémoire bwa

Samtools v 1.6-19-g1c03df6 (utilisant htslib 1.6-55-gb065a60)80 : vue samtools -b F 4

Samtools v 1.6-19-g1c03df6 (utilisant htslib 1.6-55-gb065a60)80 : fichier d'index samtools.sorted.bam

Anvi'o v562 : anvi-profile -i -c --min-contig-length 2000 --output.dir --cluster-contigs

Anvi'o v562 : anvi-merge path_to_profile1/PROFILE.db path_to_profile2/PROFILE.db -o --skip-concoct-binning

Anvi'o v562 : anvi-interactive -p

Anvi'o v562 : anvi-summarize -c -p -C

Anvi'o v762 : anvi-gen-contigs-database -f -o

Anvi'o v762 : anvi-run-hmms -c --num-threads 8

Anvi'o v762 : anvi-get-sequences-for-hmm-hits

barrnap81 : barrnap --kingdom bac --threads {threads} --outseq {working_dir}/barrnap/*rRNA.fasta {input.fasta_dir}/$g.fasta > {working_dir}/barrnap/$g.rRNA.gff

barrnap v0.982 : barrnap --kingdom arc --threads {threads} --outseq {working_dir}/barrnap/*rRNA.fasta {input.fasta_dir}/$g.fasta >{working_dir}/barrnap/$g.rRNA .gff

tRNAscan-SE v 2.0.1182 : tRNAscan-SE -B -o {working_dir}/trnascan/$g.output.txt -m {working_dir}/trnascan/$g.stats.txt -b {working_dir}/trnascan/$ g.bed -j {working_dir}/trnascan/$g.gff -a {working_dir}/trnascan/$g.trna.fasta -l {working_dir}/trnascan/$g.log --thread {threads} {input. fasta_dir}/$g.fasta

Revsbech, NP et al. Détermination des concentrations d'oxygène ultra-faibles dans les zones à minimum d'oxygène par le capteur STOX. Limnol. Oceanogr. : Méthodes. 7, 371-381. (2009).

Wright, JJ, Konwar, KM & Hallam, SJ Écologie microbienne des zones minimales d'oxygène en expansion. Nat. Rév. Microbiol. 10, 381–394 (2012).

Article CAS PubMed Google Scholar

Jürgens, K. & Taylor, GT Écologie microbienne et biogéochimie des colonnes d'eau déficientes en oxygène dans Microbial Ecology of the Oceans (eds. Gasol, JM & Kirchman, DL) 231–288 (John Wiley & Sons, 2018).

Ulloa, O., Canfield, DE, DeLong, EF, Letelier, RM & Stewart, FJ Océanographie microbienne des zones minimales d'oxygène anoxique. Proc. Natl. Acad. Sci. États-Unis 109, 15996–16003 (2012).

Article ADS CAS PubMed PubMed Central Google Scholar

Thamdrup, B., Dalsgaard, T. & Revsbech, NP Anoxie fonctionnelle généralisée dans la zone minimale d'oxygène du Pacifique Sud-Est. Deep-Sea Res. Pt. I. 65, 36–45 (2012).

Bristow, LA et al. Oxydation de l'ammonium et des nitrites à des concentrations d'oxygène nanomolaires dans les eaux de la zone à minimum d'oxygène. Proc. Natl. Acad. Sci. États-Unis 113, 10601–10606 (2016).

Article ADS CAS PubMed PubMed Central Google Scholar

Hawley, AK et al. Diverses bactéries Marinimicrobia peuvent médier des cycles biogéochimiques couplés le long de gradients éco-thermodynamiques. Nat. Commun. 8, 1507 (2017).

Article ADS PubMed PubMed Central Google Scholar

Bertagnolli, AD & Stewart, FJ Niches microbiennes dans les zones minimales d'oxygène marin. Nat. Rév. Microbiol. 16, 723–729 (2018).

Article CAS PubMed Google Scholar

Codispoti, LA et al. Les bilans océaniques fixes d'azote et de protoxyde d'azote : des cibles mouvantes à l'entrée de l'anthropocène ? Scientia Marina. 65, 85-105 (2001).

DeVries, T., Deutsch, C., Rafter, PA & Primeau, F. Taux de dénitrification marine déterminés à partir d'un modèle inverse 3D global. Biogéosciences. 10, 2481–2496 (2013).

Naqvi, SWA et al. Hypoxie/anoxie marine comme source de CH4 et N2O. Biogéosciences 7, 2159–2190 (2010).

Thamdrup, B. et al. L'oxydation anaérobie du méthane est un important puits de méthane dans la plus grande zone de minimum d'oxygène de l'océan. Limnol. Océanogr. 64, 2569-2585 (2019).

Stramma, L., Johnson, GC, Sprintall, J. & Mohrholz, V. Expansion des zones à minimum d'oxygène dans les océans tropicaux. Sciences 320, 655–658 (2008).

Article ADS CAS PubMed Google Scholar

Schmidtko, S., Stramma, L. & Visbeck, M. Déclin de la teneur mondiale en oxygène océanique au cours des cinq dernières décennies. Nature 542, 335–339 (2017).

Article ADS CAS PubMed Google Scholar

Carstensen, J., Andersen, JH, Gustafsson, BG & Conley, DJ Désoxygénation de la mer Baltique au cours du siècle dernier. Proc. Natl. Acad. Sci. États-Unis 111, 5628–5633 (2014).

Article ADS CAS PubMed PubMed Central Google Scholar

Diaz, RJ & Rosenberg, R. Propagation des zones mortes et conséquences pour les écosystèmes marins. Sciences 321, 926–929 (2008).

Article ADS CAS PubMed Google Scholar

Malone, TC & Newton, A. La mondialisation de l'eutrophisation culturelle dans l'océan côtier : causes et conséquences. Devant. Mars Sci. 7, 670 (2020).

Woodcroft, BJ et al. Vue centrée sur le génome du traitement du carbone lors de la fonte du pergélisol. Nature 560, 49-54 (2018).

Article ADS CAS PubMed Google Scholar

Louca, S. et al. Intégration de la biogéochimie avec des informations de séquence multiomique dans une zone minimale d'oxygène modèle. Proc. Natl. Acad. Sci. ETATS-UNIS. 113, E5925–E5933 (2016).

Reed, DC, Algar, CK, Huber, JA & Dick, GJ Approche centrée sur les gènes pour intégrer la génomique environnementale et les modèles biogéochimiques. Proc. Natl. Acad. Sci. ETATS-UNIS. 111, 1879-1884 (2014).

Article ADS CAS PubMed PubMed Central Google Scholar

Tyson, GW et al. Structure et métabolisme de la communauté grâce à la reconstruction de génomes microbiens de l'environnement. Nature 428, 37-43 (2004).

Article ADS CAS PubMed Google Scholar

Iverson, V. et al. Démêler les génomes des métagénomes : révéler une classe inculte d'Euryarchaeota marins. Sciences 335, 587–590 (2012).

Article ADS CAS PubMed Google Scholar

Wrighton, KC et al. Fermentation, métabolisme de l'hydrogène et du soufre dans plusieurs phylums bactériens non cultivés. Sciences 337, 1661-1665 (2012).

Article ADS CAS PubMed Google Scholar

Venter, JC et al. Séquençage shotgun du génome environnemental de la mer des Sargasses. Sciences 304, 66-74 (2004).

Article ADS CAS PubMed Google Scholar

Albertsen, M., Hansen, LBS, Saunders, AM, Nielsen, PH & Nielsen, KL Un métagénome d'une communauté microbienne à grande échelle effectuant une élimination biologique améliorée du phosphore. ISME J. 6, 1094-1106 (2012).

Article CAS PubMed Google Scholar

DeLong, EF et al. Génomique communautaire parmi les assemblages microbiens stratifiés à l'intérieur de l'océan. Sciences 311, 496–503 (2006).

Article ADS CAS PubMed Google Scholar

Sunagawa, S. et al. Structure et fonction du microbiome océanique mondial. Sciences 348, 1261359 (2015).

Article PubMed Google Scholar

Kashtan, N. et al. La génomique unicellulaire révèle des centaines de sous-populations coexistantes chez les Prochlorococcus sauvages. Sciences 344, 416-420 (2014).

Article ADS CAS PubMed Google Scholar

Basher, ARMA, McLaughlin, RJ & Hallam, SJ Inférence des voies métaboliques utilisant une classification multi-étiquettes avec des caractéristiques de voies riches. Calcul PLoS. Biol. 16, e1008174 (2020).

Article Google Scholar

Meziti, A. et al. La fiabilité des génomes assemblés par métagénome (MAG) dans la représentation des populations naturelles : aperçu de la comparaison des MAG avec des génomes isolés dérivés du même échantillon fécal. Appl. Environ. Microbiol. 87, e02593-20 (2021).

Sczyrba, A. et al. Évaluation critique de l'interprétation du métagénome - une référence des logiciels de métagénomique. Nat. Méthodes 14, 1063–1071 (2017).

Article CAS PubMed PubMed Central Google Scholar

Saak, CC, Dinh, CB & Dutton, RJ Approches expérimentales pour suivre les éléments génétiques mobiles dans les communautés microbiennes. Microbiol FEMS. Rév. 44, 606–630 (2020).

Article CAS PubMed PubMed Central Google Scholar

Stepanauskas, R. Mise sur écoute des interactions microbiennes par la génomique unicellulaire. Devant. Microbiol. 6, 258 (2015).

Article PubMed PubMed Central Google Scholar

Stepanauskas, R. Génomique unicellulaire : un regard individuel sur les microbes. Courant. Avis. Microbiol. 15, 613–620 (2012).

Rinke, C. Génomique unicellulaire de la matière noire microbienne. Méthodes Mol. Biol. 1849, 99-111 (2018).

Article CAS PubMed Google Scholar

Ishoey, T., Woyke, T., Stepanauskas, R., Novotny, M. & Lasken, RS Séquençage génomique de cellules microbiennes uniques à partir d'échantillons environnementaux. Courant. Avis. Microbiol. 11, 198-204 (2008).

Article CAS PubMed PubMed Central Google Scholar

Bowers, RM et al. Dissection des populations microbiennes dominantes des sources chaudes sur la base d'un échantillonnage à l'échelle de la communauté à une résolution génomique unicellulaire. ISME J. 16, 1337-1347 (2022).

Article CAS PubMed Google Scholar

Woyke, T., Doud, DFR & Schulz, F. La trajectoire du séquençage unicellulaire microbien. Nat. Méthodes 14, 1045–1054 (2017).

Article CAS PubMed Google Scholar

Rinke, C. et al. Obtention de génomes à partir de micro-organismes environnementaux non cultivés à l'aide de la génomique unicellulaire basée sur FACS. Nat. Protocole 9, 1038-1048 (2014).

Article CAS PubMed Google Scholar

Pachiadaki, MG et al. Rôle majeur des bactéries oxydant les nitrites dans la fixation du carbone dans l'océan noir. Sciences 358, 1046-1051 (2017).

Article ADS CAS PubMed Google Scholar

Swan, BK et al. Rationalisation du génome et divergence latitudinale des bactéries planctoniques à la surface de l'océan. Proc. Natl. Acad. Sci. États-Unis 110, 11463–11468 (2013).

Article ADS CAS PubMed PubMed Central Google Scholar

Kashtan, N. et al. Différences fondamentales dans la diversité et la structure génomique des populations entre les Prochlorococcus de l'Atlantique et du Pacifique. ISME J. 11, 1997–2011 (2017).

Article CAS PubMed PubMed Central Google Scholar

Roux, S. et al. Écologie et évolution des virus infectant les bactéries SUP05 non cultivées telles que révélées par la cellule unique et la méta-génomique. Elife 3, e03125 (2014).

Article PubMed PubMed Central Google Scholar

Pachiadaki, MG et al. Cartographier la complexité du microbiome marin grâce à la génomique unicellulaire. Cellule 179, 1623–1635.e11 (2019).

Article CAS PubMed PubMed Central Google Scholar

Bowers, RM et al. Informations minimales sur un génome amplifié unique (MISAG) et un génome assemblé par métagénome (MIMAG) de bactéries et d'archées. Nat. Biotechnol. 35, 725–731 (2017).

Markowitz, VM et al. Version IMG 4 du système intégré d'analyse comparative des génomes microbiens. Nucleic Acids Res. 42, D560–D567 (2014).

Article CAS PubMed Google Scholar

Chen, I.-MA et al. IMG/M v.5.0 : un système intégré de gestion des données et d'analyse comparative pour les génomes microbiens et les microbiomes. Nucleic Acids Res. 47, D666–D677 (2019).

Article CAS PubMed Google Scholar

Swan, BK et al. Potentiel de chimiolithoautotrophie parmi les lignées de bactéries omniprésentes dans l'océan noir. Sciences 333, 1296-1300 (2011).

Article ADS CAS PubMed Google Scholar

Bérubé, PM et al. Génomes unicellulaires de Prochlorococcus, Synechococcus et de microbes sympatriques de divers environnements marins. Sci. Données 5, 180154 (2018).

Article CAS PubMed PubMed Central Google Scholar

Rinke, C. et al. Aperçu de la phylogénie et du potentiel de codage de la matière noire microbienne. Nature 499, 431–437 (2013).

Article ADS CAS PubMed Google Scholar

Plominsky, AM et al. Potentiel métabolique et profils transcriptomiques in situ de groupes microbiens clés jusque-là non caractérisés impliqués dans le cycle couplé du carbone, de l'azote et du soufre dans les zones marines anoxiques. Environ. Microbiol. 20, 2727-2742 (2018).

Article CAS PubMed Google Scholar

Stepanauskas, R. et al. Récupération améliorée du génome et analyses intégrées de la taille des cellules de cellules microbiennes individuelles non cultivées et de particules virales. Nat. Commun. 8, 84 (2017).

Article ADS PubMed PubMed Central Google Scholar

Raghunathan, A. et al. Amplification de l'ADN génomique à partir d'une seule bactérie. Appl. Environ. Microbiol. 71, 3342–3347 (2005).

Page, KA, Connon, SA & Giovannoni, SJ Bactérioplancton d'eau douce représentatif isolé de Crater Lake, Oregon. Appl. Environ. Microbiol. 70, 6542–6550 (2004).

Article ADS CAS PubMed PubMed Central Google Scholar

Stackebrandt, E. & Goodfellow, M. Techniques d'acide nucléique en systématique bactérienne. (John Wiley & Son Limited, 1991).

Chapelle, FH et al. Une communauté microbienne souterraine à base d'hydrogène dominée par les méthanogènes. Nature 415, 312-315 (2002).

Article ADS PubMed Google Scholar

Ohene-Adjei, S., Teather, RM, Ivan, M. & Forster, RJ Établissement de protozoaires post-inoculation et modèles d'association d'archées méthanogènes dans le rumen ovin. Appl. Environ. Microbiol. 73, 4609–4618 (2007).

Article ADS CAS PubMed PubMed Central Google Scholar

Quast, C. et al. Le projet de base de données de gènes d'ARN ribosomal SILVA : amélioration du traitement des données et des outils Web. Nucleic Acids Res. 41, D590–D596 (2013).

Article CAS PubMed Google Scholar

Camacho, C. et al. BLAST+ : architecture et applications. BMC Bioinformatique 10, 421 (2009).

Article PubMed PubMed Central Google Scholar

Anstett, J. et al. Un recueil de génomes amplifiés unicellulaires bactériens et archéens provenant d'eaux marines pauvres en oxygène Figshare https://doi.org/10.6084/m9.figshare.c.6137379.v5 (2022).

O'Leary, NA et al. Base de données de séquences de référence (RefSeq) au NCBI : état actuel, expansion taxonomique et annotation fonctionnelle. Nucleic Acids Res. 44, D733–D745 (2016).

Article PubMed Google Scholar

Eren, AM et al. Anvi'o : une plateforme avancée d'analyse et de visualisation des données 'omiques. Peer J. 3, e1319 (2015).

Chaumeil, P.-A., Mussig, AJ, Hugenholtz, P. & Parks, DH GTDB-Tk v2 : classification adaptée à la mémoire avec la base de données de taxonomie du génome. Bioinformatique 38, 5315–5316 (2022).

Article CAS PubMed PubMed Central Google Scholar

Chaumeil, P.-A., Mussig, AJ, Hugenholtz, P. & Parks, DH GTDB-Tk : une boîte à outils pour classer les génomes avec la Genome Taxonomy Database. Bioinformatique 36, 1925-1927 (2019).

PubMed PubMed Central Google Scholar

Matsen, FA, Kodner, RB & Armbrust, EV pplacer : maximum de vraisemblance en temps linéaire et placement phylogénétique bayésien de séquences sur un arbre de référence fixe. BMC Bioinformatique 11, 538 (2010).

Article PubMed PubMed Central Google Scholar

Jain, C., Rodriguez-R, LM, Phillippy, AM, Konstantinidis, KT & Aluru, S. L'analyse ANI à haut débit des génomes procaryotes 90K révèle des limites d'espèces claires. Nat. Commun. 9, 5114 (2018).

Article ADS PubMed PubMed Central Google Scholar

Hyatt, D. et al. Prodigue : reconnaissance des gènes procaryotes et identification du site d'initiation de la traduction. BMC Bioinformatics 11, 119 (2010).

Article PubMed PubMed Central Google Scholar

Price, MN, Dehal, PS & Arkin, AP FastTree 2 – arbres de vraisemblance approximative pour les grands alignements. PLoS One 5, e9490 (2010).

Eddy, SR Accélération des recherches de profil HMM. Calcul PLoS. Biol. 7, e1002195 (2011).

Article ADS MathSciNet CAS PubMed PubMed Central Google Scholar

Ondov, BD et al. Mash : estimation rapide de la distance du génome et du métagénome à l'aide de MinHash. Génome Biol. 17, 132 (2016).

Article PubMed PubMed Central Google Scholar

Parcs, DH et al. GTDB : un recensement continu de la diversité bactérienne et archéenne grâce à une taxonomie phylogénétiquement cohérente, normalisée et complète basée sur le génome. Nucleic Acids Res. 50, D785–D794 (2022).

Article CAS PubMed Google Scholar

Rinke, C. et al. Une taxonomie archéenne normalisée pour la base de données de taxonomie du génome. Nat Microbiol 6, 946–959 (2021).

Article CAS PubMed Google Scholar

Parcs, DH et al. Une taxonomie complète du domaine à l'espèce pour les bactéries et les archées. Nat. Biotechnol. 38, 1079-1086 (2020).

Article CAS PubMed Google Scholar

Bankevitch, A. et al. SPAdes : un nouvel algorithme d'assemblage du génome et ses applications au séquençage unicellulaire. J. Comput. Biol. 19, 455–477 (2012).

Article MathSciNet CAS PubMed PubMed Central Google Scholar

Parks, DH, Imelfort, M., Skennerton, CT, Hugenholtz, P. & Tyson, GW CheckM : évaluation de la qualité des génomes microbiens récupérés à partir d'isolats, de cellules individuelles et de métagénomes. Génome Res. 25, 1043-1055 (2015).

Article CAS PubMed PubMed Central Google Scholar

Tennessen, K. et al. ProDeGe : un protocole informatique pour la décontamination entièrement automatisée des génomes. ISME J. 10, 269–272 (2016).

Article CAS PubMed Google Scholar

Kim, D., Song, L., Breitwieser, FP & Salzberg, SL Centrifugeuse : classification rapide et sensible des séquences métagénomiques. Génome Res. 26, 1721–1729 (2016).

Article CAS PubMed PubMed Central Google Scholar

Hawley, AK et al. Un recueil d'informations sur les séquences multi-omiques de la colonne d'eau de Saanich Inlet. Sci. Données 4, 170160 (2017).

Article CAS PubMed PubMed Central Google Scholar

Li, H. & Durbin, R. Alignement de lecture rapide et précis avec la transformée de Burrows-Wheeler. Bioinformatique 25, 1754–1760 (2009).

Article CAS PubMed PubMed Central Google Scholar

Li, H. et al. Le format d'alignement/carte de séquence et SAMtools. Bioinformatique 25, 2078-2079 (2009).

Article PubMed PubMed Central Google Scholar

Seemann, T. barrnap 0.9 : prédicteur d'ARN ribosomal bactérien. (Github).

Chan, PP, Lin, BY, Mak, AJ & Lowe, TM tRNAscan-SE 2.0 : détection améliorée et classification fonctionnelle des gènes d'ARN de transfert. Nucleic Acids Res. 49, 9077–9096 (2021).

Article CAS PubMed PubMed Central Google Scholar

Li, W. & Godzik, A. Cd-hit : un programme rapide pour regrouper et comparer de grands ensembles de séquences de protéines ou de nucléotides. Bioinformatique 22, 1658–1659 (2006).

Huang, Y., Niu, B., Gao, Y., Fu, L. & Li, W. CD-HIT Suite : un serveur Web pour regrouper et comparer des séquences biologiques. Bioinformatique 26, 680–682 (2010).

Fu, L., Niu, B., Zhu, Z., Wu, S. & Li, W. CD-HIT : accéléré pour regrouper les données de séquençage de nouvelle génération. Bioinformatique 28, 3150–3152 (2012).

Article CAS PubMed PubMed Central Google Scholar

Site Internet. Oksanen, J. et al. végan : paquet d'écologie communautaire R version 2.5–6 ; https://CRAN.R-project.org/package=vegan (2019).

Martinez-Garcia, M. et al. Capturer des génomes unicellulaires de dégradeurs actifs de polysaccharides : une contribution inattendue de Verrucomicrobia. PLoS One 7, e35314 (2012).

Article ADS CAS PubMed PubMed Central Google Scholar

Ulloa, O. et al. La cyanobactérie Prochlorococcus possède des antennes collectrices de lumière divergentes et peut avoir évolué dans un océan à faible teneur en oxygène. Proc. Natl. Acad. Sci. États-Unis 118, e2025638118 (2021).

Doud, DFR et al. La génomique unicellulaire axée sur la fonction découvre des bactéries dégradant la cellulose de la biosphère rare. ISME J. 14, 659–675 (2020).

Article CAS PubMed Google Scholar

Woyke, T. et al. Décontamination des réactifs MDA pour l'amplification du génome entier d'une seule cellule. PLoS One 6, e26161 (2011).

Article ADS CAS PubMed PubMed Central Google Scholar

Labonté, JM et al. Analyse basée sur la génomique unicellulaire des interactions virus-hôte dans le bactérioplancton marin de surface. ISME J. 9, 2386–2399 (2015).

Roux, S., Hallam, SJ, Woyke, T. & Sullivan, MB Matière noire virale et interactions virus-hôte résolues à partir de génomes microbiens accessibles au public. eLife 4, e08490 (2015).

Martinez-Hernandez, F. et al. La génomique unicellulaire révèle Pelagibacter comme l'hôte putatif de la population virale 37-F6 non cultivée extrêmement abondante dans l'océan. ISME J. 13, 232–236 (2019).

Article CAS PubMed Google Scholar

Becraft, ED et al. Rokubacteria : géants génomiques parmi les phylums bactériens non cultivés. Devant. Microbiol. 8, 2264 (2017).

Article PubMed PubMed Central Google Scholar

Nobu, MK et al. Phylogénie et physiologie du phylum candidat "Atribacteria" (OP9/JS1) déduites de la génomique indépendante de la culture. ISME J. 10, 273–286 (2016).

Article CAS PubMed Google Scholar

Mende, DR, Aylward, FO, Eppley, JM, Nielsen, TN & DeLong, EF Amélioration des génomes environnementaux via l'intégration d'assemblages métagénomiques et unicellulaires. Devant. Microbiol. 7, 143 (2016).

Article PubMed PubMed Central Google Scholar

Kogawa, M., Hosokawa, M., Nishikawa, Y., Mori, K. & Takeyama, H. Obtention de brouillons de génomes de haute qualité à partir de microbes non cultivés par nettoyage et co-assemblage de génomes amplifiés unicellulaires. Sci. Rép. 8, 2059 (2018).

Article ADS PubMed PubMed Central Google Scholar

Konwar, KM, Hanson, NW, Pagé, AP & Hallam, SJ MetaPathways : un pipeline modulaire pour la construction de bases de données de voies/génomes à partir d'informations sur les séquences environnementales. BMC Bioinformatique 14, 202 (2013).

Article PubMed PubMed Central Google Scholar

Hanson, NW, Konwar, KM, Wu, S.-J. & Hallam, SJ MetaPathways v2.0 : Un modèle maître-travailleur pour la construction de bases de données environnementales Pathway/Genome sur des grilles et des nuages. Conférence IEEE 2014. Calcul. Intel. Bioinf. Calcul. Biol. (2014).

Konwar, KM et al. MetaPathways v2.5 : améliorations quantitatives fonctionnelles, taxonomiques et d'utilisabilité. Bioinformatique 31, 3345–3347 (2015).

Article CAS PubMed PubMed Central Google Scholar

Karp, PD, Paley, S. & Romero, P. Le logiciel d'outils de voie. Bioinformatique 18, S225–S232 (2002).

Karp, PD, Latendresse, M. & Caspi, R. L'algorithme de prédiction de voie des outils de voie. Rester. Génome. Sci. 5, 424–429 (2011).

Karp, PD Les bases de données EcoCyc et MetaCyc. Nucleic Acids Res. 28, 56–59 (2000).

Caspi, R. et al. La base de données MetaCyc des voies métaboliques et des enzymes - une mise à jour 2019. Nucleic Acids Res. 48, D445–D453 (2020).

Article CAS PubMed Google Scholar

Basher, ARMA & Hallam, SJ Tirer parti de l'intégration de réseaux hétérogènes pour la prédiction des voies métaboliques. Bioinformatique 37, 822–829 (2021).

Article CAS Google Scholar

Basher, ARMA, McLaughlin, RJ & Hallam, SJ Prédiction des voies métaboliques à l'aide d'une factorisation matricielle non négative avec une précision améliorée. J. Comput. Biol. 28, 1075-1103 (2021).

Morgan-Lang, C. et al. TreeSAPP : le profileur phylogénétique sensible et précis basé sur les arbres. Bioinformatique 36, 4706–4713 (2020).

Bolger, AM, Lohse, M. & Usadel, B. Trimmomatic : un trimmer flexible pour les données de séquence Illumina. Bioinformatique 30, 2114–2120 (2014).

Ganesh, S. et al. Preuve génomique et transcriptomique d'une seule cellule pour l'utilisation de substrats azotés alternatifs par les bactéries anammox. ISME J. 12, 2706–2722 (2018).

Article CAS PubMed PubMed Central Google Scholar

Ganesh, S. et al. Répartition taille-fraction de la transcription des gènes de la communauté et du métabolisme de l'azote dans une zone de minimum d'oxygène marin. ISME J. 9, 2682–2696 (2015).

Article CAS PubMed PubMed Central Google Scholar

Tsementzi, D. et al. Bactérie SAR11 liée à l'anoxie océanique et à la perte d'azote. Nature 536, 179–183 (2016).

Article ADS CAS PubMed PubMed Central Google Scholar

Duret, MT et al. Diversité fractionnée par taille des communautés microbiennes eucaryotes dans la zone minimale d'oxygène du Pacifique nord tropical oriental. Microbiol FEMS. Écol. 91 (2015).

Padilla, CC et al. Bactéries NC10 dans les zones à minimum d'oxygène marin. ISME J. 10, 2067-2071 (2016).

Article CAS PubMed PubMed Central Google Scholar

Henríquez-Castillo, C. et al. La métaomique dévoile la contribution des bactéries Alteromonas au cycle du carbone dans les zones marines à minimum d'oxygène. Devant. Mars Sci. 9, 993667 (2022).

Rii, YM et al. Diversité et productivité des picoeucaryotes photosynthétiques dans des régions biogéochimiquement distinctes de l'océan Pacifique Sud-Est. Limnol. Océanogr. 61, 806–824 (2016).

Annonces d'article Google Scholar

Bœuf, D. et al. La métapangénomique révèle des changements dépendant de la profondeur du potentiel métabolique de la lignée bactérienne marine omniprésente SAR324. Microbiome 9, 172 (2021).

Article CAS PubMed PubMed Central Google Scholar

Landry, Z., Swan, BK, Herndl, GJ, Stepanauskas, R. & Giovannoni, SJ Les génomes SAR202 de l'océan sombre prédisent les voies d'oxydation de la matière organique dissoute récalcitrante. MBio 8 (2017).

Torres-Beltran, M. et al. Recueil d'informations géochimiques sur la colonne d'eau de Saanich Inlet. Sci. Données 4, 170159 (2017).

Article PubMed PubMed Central Google Scholar

Garcia, HE et al. Atlas mondial de l'océan 2018 : oxygène dissous, utilisation apparente d'oxygène et saturation en oxygène. Atlas NOAA NESDIS. 3, 83 (2019).

Télécharger les références

Nous tenons à remercier le capitaine, l'équipage et les scientifiques à bord du RV John Strickland et du NGCC John P. Tully pour leurs efforts extraordinaires sur le terrain pendant de nombreuses années, ainsi que Miranda Harmon-Smith et Tijana Glavina del Rio du DOE Joint Genome Institute ( JGI) pour l'assistance à la maîtrise d'ouvrage. Nous remercions également les nombreux assistants de premier cycle du laboratoire Hallam et le personnel de soutien technique océanique, notamment Jade Shiller et Chris Payne, pour leur soutien dans la collecte et le traitement des échantillons au fil des ans. Remerciements particuliers également aux membres du laboratoire DeLong de l'Université d'Hawaï au département d'océanographie et CMORE de Manoa, au laboratoire Stewart de l'Institut de technologie de Géorgie à l'école des sciences biologiques, au laboratoire Ulloa du Departamento de Oceanografía Universidad de Concepción, au laboratoire Jürgens au Leibniz Institute for Baltic Sea Research et au Bigelow SCGC pour avoir contribué aux SAG utilisés dans cet ensemble de données. Les travaux (Comparative community genome analysis of the Subarctic Pacific Ocean : 10.46936/10.25585/60007478, Microbial Systems Ecology of Expanding Oxygen Minimum Zones in the Eastern Subtropical North Pacific Ocean : 10.46936/10.25585/60000795, Opening a single-cell genomic window on microbial sélection d'écotypes dans les zones minimales d'oxygène marin en expansion : 10.46936/10.25585/60000761, Aller long et aller en profondeur : Séquençage complet du génome unicellulaire de la communauté océanique sur le site d'étude des séries chronologiques modèles en océan ouvert, station ALOHA : 10.46936/10.25585/60000920, Microbien et régulation virale du cycle communautaire du carbone dans diverses zones à faible teneur en oxygène : 10.46936/10.25585/60000893, génomique microbienne unicellulaire de l'océan noir : 10.46936/10.25585/60000688, microbes non cultivés à cellule unique GEBA : 10.46936/10.25585/60007913, génération génomes de référence pour l'écosystème marin recherche : séquençage unicellulaire de clades de bactérioplancton omniprésents et non cultivés : 10.46936/10.25585/60007356, séquençage du génome unicellulaire du bactérioplancton mésopélagique : 10.46936/10.25585/60007269) menée par le US Department of Energy Joint Genome Institute (https://ror. org/04xm1d337), une installation utilisateur du Bureau des sciences du DOE, a été soutenue par le Bureau des sciences du Département américain de l'énergie sous le contrat n° DE-AC02-05CH11231. Ces travaux ont également été réalisés sous les auspices du Comité scientifique de la recherche océanographique (SCOR), des Fondations G. Unger Vetlesen et Ambrose Monell, du Conseil de recherches en sciences naturelles et en génie du Canada, de Génome Colombie-Britannique, de la Fondation canadienne pour l'innovation et l'Institut canadien de recherches avancées par le biais de subventions accordées aux analyses SJH SCGC et RS ont été soutenus par les subventions NSF 1826734, 1441717, 821374, 1335810, 1232982, 0826924; et la Fondation Simons accorde les subventions 510023 et 827839. L'OU a été soutenue par les subventions de l'Agence nationale chilienne pour la recherche et le développement (ANID) ICN12_019 et 1161483.

Alvaro M. Plominski

Adresse actuelle : Marine Biology Research Division, Scripps Institution of Oceanography, University of California San Diego, La Jolla, CA, 92037, États-Unis

Ces auteurs ont contribué à parts égales : Julia Anstett, Alvaro M. Plominsky.

Programme d'études supérieures en sciences et technologie du génome, Centre des sciences du génome, Université de la Colombie-Britannique, Vancouver, Colombie-Britannique, Canada

Julia Anstett et Steven J. Hallam

Département de microbiologie et d'immunologie, Université de la Colombie-Britannique, Vancouver, Colombie-Britannique, V6T 1Z3, Canada

Julia Anstett, Alvaro M. Plominsky et Steven J. Hallam

Daniel K. Inouye Center for Microbial Oceanography: Research and Education, University of Hawaii, Manoa, Honolulu, HI, 96822, USA

Edward F.DeLong

École d'ingénierie, Université de la Colombie-Britannique, Kelowna, Colombie-Britannique, Canada

Alyse Kiesser

Institut Leibniz pour la recherche sur la mer Baltique, Warnemünde, Allemagne

Klaus Jürgens

Programme d'études supérieures en bioinformatique, Université de la Colombie-Britannique, Vancouver, BC, V6T 1Z4, Canada

Connor Morgan-Lang et Steven J. Hallam

Laboratoire Bigelow pour les sciences océaniques, East Boothbay, ME, États-Unis

Ramunas Stepanauskas

École des sciences biologiques, Georgia Institute of Technology, Atlanta, Géorgie, États-Unis

Frank J. Stewart

Center for Microbial Dynamics and Infection, Georgia Institute of Technology, Atlanta, Géorgie, États-Unis

Frank J. Stewart

Département de microbiologie et de biologie cellulaire, Montana State University, Bozeman, MT, États-Unis

Frank J. Stewart

Département d'océanographie, Université de Concepción, Casilla 160-C, 4070386, Concepción, Chili

Osvaldo Ulloa

Millennium Institute of Oceanography, Casilla 1313, 4070386, Concepción, Chili

Osvaldo Ulloa

Department of Energy Joint Genome Institute, Berkeley, Californie, États-Unis

Tanja Woyke & Rex Malmström

Génomique environnementale et biologie des systèmes, Lawrence Berkeley National Laboratory, Berkeley, Californie, États-Unis

Tanja Woyke & Rex Malmström

Institut des sciences de la vie, Université de la Colombie-Britannique, Vancouver, BC, V6T 1Z3, Canada

Steven J. Hallam

Programme de formation ECOSCOPE, Université de la Colombie-Britannique, Vancouver, Colombie-Britannique, V6T 1Z3, Canada

Steven J. Hallam

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

JA, AMP et SJH ont conçu l'étude. EFDL, KJ, RS, FJS, OU et SJH ont collecté des échantillons. JA, AMP, AK, CML, RS, TW et SJH ont analysé les données et/ou fourni une interprétation graphique des données. JA, AMP, AK et SJH ont compilé les données, rédigé le manuscrit et généré les chiffres. Tous les auteurs ont lu et contribué au texte. Les SAG ont été générés au Bigelow Single Cell Genomics Center (SCGC). RS, TW et RM ont fourni le FACS. et des tracés cinétiques générés pour le tri cellulaire et l'amplification de l'ADN. Les cellules triées ont été séquencées au SCGC, au DOE Joint Genome Institute (JGI), au Michael Smith Genome Sciences Centre du Canada, au Georgia Institute of Technology, au BioMicroCenter du MIT, à l'Oregon State University et au Marine Biological Laboratory. JA, CML, AMP ont découpé et assemblé les lectures courtes d'Illumina en contigs pour générer les assemblages SAG. JA (Other Co-Authors) a décontaminé les assemblages. JA a regroupé les séquences d'amplicons. JA et AMP ont compilé des données et généré les chiffres présentés dans cette étude.

Correspondance à Steven J. Hallam.

SJH est co-fondateur de Koonkie Inc., une société de conseil en bioinformatique qui conçoit et fournit des solutions algorithmiques et d'analyse de données évolutives dans le cloud.

Note de l'éditeur Springer Nature reste neutre en ce qui concerne les revendications juridictionnelles dans les cartes publiées et les affiliations institutionnelles.

Libre accès Cet article est sous licence Creative Commons Attribution 4.0 International, qui permet l'utilisation, le partage, l'adaptation, la distribution et la reproduction sur n'importe quel support ou format, à condition que vous accordiez le crédit approprié à l'auteur ou aux auteurs originaux et à la source, fournissez un lien vers la licence Creative Commons et indiquez si des modifications ont été apportées. Les images ou tout autre matériel tiers dans cet article sont inclus dans la licence Creative Commons de l'article, sauf indication contraire dans une ligne de crédit au matériel. Si le matériel n'est pas inclus dans la licence Creative Commons de l'article et que votre utilisation prévue n'est pas autorisée par la réglementation légale ou dépasse l'utilisation autorisée, vous devrez obtenir l'autorisation directement du détenteur des droits d'auteur. Pour voir une copie de cette licence, visitez http://creativecommons.org/licenses/by/4.0/.

Réimpressions et autorisations

Anstett, J., Plominsky, AM, DeLong, EF et al. Un recueil de génomes amplifiés unicellulaires bactériens et archéens provenant d'eaux marines déficientes en oxygène. Sci Data 10, 332 (2023). https://doi.org/10.1038/s41597-023-02222-y

Télécharger la citation

Reçu : 26 août 2022

Accepté : 10 mai 2023

Publié: 27 mai 2023

DOI : https://doi.org/10.1038/s41597-023-02222-y

Toute personne avec qui vous partagez le lien suivant pourra lire ce contenu :

Désolé, aucun lien partageable n'est actuellement disponible pour cet article.

Fourni par l'initiative de partage de contenu Springer Nature SharedIt