Un compendio de bacterias y arqueas únicas

Blog

HogarHogar / Blog / Un compendio de bacterias y arqueas únicas

Jun 01, 2023

Un compendio de bacterias y arqueas únicas

Volumen de datos científicos 10,

Scientific Data volumen 10, Número de artículo: 332 (2023) Citar este artículo

1266 Accesos

22 Altmetric

Detalles de métricas

Las aguas marinas con deficiencia de oxígeno denominadas zonas mínimas de oxígeno (OMZ) o zonas marinas anóxicas (AMZ) son características oceanográficas comunes. Albergan microorganismos cosmopolitas y endémicos adaptados a condiciones de bajo oxígeno. Las interacciones metabólicas microbianas dentro de las OMZ y las AMZ impulsan ciclos biogeoquímicos acoplados que dan como resultado la pérdida de nitrógeno y la producción y el consumo de gases traza activos para el clima. El calentamiento global está provocando que las aguas deficientes en oxígeno se expandan e intensifiquen. Por lo tanto, los estudios centrados en las comunidades microbianas que habitan en regiones con deficiencia de oxígeno son necesarios para monitorear y modelar los impactos del cambio climático en las funciones y servicios de los ecosistemas marinos. Aquí presentamos un compendio de 5129 genomas amplificados de una sola célula (SAG) de entornos marinos que abarcan perfiles geoquímicos representativos de OMZ y AMZ. De estos, 3570 SAG se han secuenciado en diferentes niveles de finalización, lo que proporciona una perspectiva resuelta por tensión sobre el contenido genómico y las posibles interacciones metabólicas dentro de los microbiomas OMZ y AMZ. El agrupamiento jerárquico confirmó que las muestras de concentraciones de oxígeno y regiones geográficas similares también tenían composiciones taxonómicas análogas, lo que proporcionó un marco coherente para el análisis comunitario comparativo.

Las zonas deficientes de oxígeno son características oceanográficas comunes (Fig. 1) que surgen cuando la demanda microbiana de oxígeno respiratorio durante la descomposición de la materia orgánica excede la disponibilidad de oxígeno. Estas aguas se definen operativamente en función de las condiciones de oxígeno que van desde disóxicas (20 a 90 μM), subóxicas (1 a 20 μM), anóxicas (menos de 1 μM) o anóxicas sulfurosas (sin oxígeno detectable)1,2. Las zonas de mínimo de oxígeno en aguas medias oceánicas (OMZ), como el giro subtropical del Pacífico Norte, presentan condiciones disóxicas capaces de soportar el metabolismo anaeróbico a través de la remineralización microbiana de la materia orgánica particulada que se hunde3 (Fig. 1a). Las OMZ costeras y de mar abierto con poco oxígeno, como el Pacífico subártico nororiental (NESAP), presentan condiciones subóxicas que abarcan la transición redox para la reducción de nitrato (NO3−) (Fig. 1a). Las zonas marinas anóxicas (AMZ) se diferencian aún más por la acumulación de nitrito (NO2−) con o sin acumulación de sulfuro (aguas de fondo sulfurosas y mar abierto o zonas mínimas de bajo oxígeno (OMZ), respectivamente)4,5,6. Por ejemplo, las AMZ en el Pacífico norte tropical oriental (ETNP) y el Pacífico sur tropical oriental (ETSP) presentan condiciones de oxígeno nanomolar que respaldan la reducción de NO3− a NO2− y reducen aún más los productos de nitrógeno sin acumulación de sulfuro de hidrógeno (H2S) (Fig. 1a). Por el contrario, los sistemas de afloramiento costero como el afloramiento de Benguela frente a la costa de Namibia presentan cambios episódicos en la deficiencia de oxígeno, lo que favorece la aparición de penachos sulfurosos transitorios (Fig. 1a). Las condiciones sulfurosas anóxicas también están presentes en los fiordos costeros, como la ensenada de Saanich (SI), donde los umbrales glaciales restringen la circulación de la masa de agua. También se observan condiciones de fondo sulfuroso en mares marginales, como el Mar Báltico (Fig. 1a).

Perfiles geoquímicos de zona mínima de oxígeno (OMZ) y zona marina anóxica (AMZ) y mapa global de ubicaciones de muestreo. (a) Se esquematizan los diferentes perfiles geoquímicos de las aguas marinas deficientes en oxígeno (modificado de Ulloa et al., 2012)4. Las líneas sólidas representan datos observados, mientras que la línea discontinua representa un evento de acumulación esporádico. ( b ) Se indican las ubicaciones de muestreo de OMZ y AMZ para genomas amplificados de una sola célula (SAG). El número total (blanco) y los SAG secuenciados (negro) obtenidos de cada ubicación se indican con un círculo proporcional al número correspondiente de muestras en el conjunto de datos. El océano está coloreado de acuerdo con el valor estadístico medio más bajo para la concentración de oxígeno informado para cada cuadrícula de 1° y 5° en el World Ocean Atlas119 anual de la NOAA de 2018, con cuadrículas blancas que indican las ubicaciones donde los datos de concentración de oxígeno no estaban disponibles. Los sitios de muestreo de aguas medias oceánicas incluyen el Giro Subtropical del Pacífico Norte (NPSG) y el Giro Subtropical del Atlántico Sur (SASG). Los sitios de muestreo de las OMZ con poco oxígeno incluyen el Pacífico subártico nororiental (NESAP). Los sitios de muestra de las AMZ incluyen el Giro del Pacífico Norte Tropical Oriental (ETNP) y el Giro del Pacífico Sur Tropical Oriental (ETSP). Los sitios de sistemas de afloramiento costero con fondos sulfurosos efímeros incluyen el afloramiento costero del Pacífico Sur Oriental (ESPCU) y el afloramiento costero de Benguela (Benguela). Los sitios de muestreo de las cuencas de fondo sulfuroso incluyen la ensenada de Saanich (SI) y el mar Báltico. Las coordenadas de geolocalización y el número de muestras para cada ubicación se detallan en la Tabla 1.

Los diferentes perfiles geoquímicos dentro de las OMZ y AMZ crean gradientes ecotermodinámicos7 que impulsan ciclos biogeoquímicos acoplados de carbono, nitrógeno y azufre por parte de microorganismos endémicos y cosmopolitas adaptados para la vida en condiciones de bajo oxígeno (revisado en 2,3,4,8). Comprender cómo estas interacciones metabólicas contribuyen a la pérdida de nitrógeno y la producción de gases traza activos para el clima es un desafío fundamental9,10,11,12. El calentamiento global exacerba la deficiencia de oxígeno en la columna de agua a través de la estratificación térmica y los cambios en la circulación de la masa de agua, lo que da como resultado la expansión e intensificación de OMZ y AMZ13,14,15. Otros factores, incluidos los aportes excesivos de nutrientes (eutrofización), también contribuyen a la deficiencia de oxígeno en el mar costero y marginal15,16,17,18. Los esfuerzos para modelar ciclos biogeoquímicos acoplados dentro de OMZ y AMZ utilizando enfoques metagenómicos centrados en genes y resueltos por genoma han identificado poblaciones microbianas clave que se beneficiarían directamente de la disponibilidad de ensamblajes de genoma mejorados con una mayor resolución taxonómica19,20.

La secuenciación de escopeta del genoma completo independiente del cultivo proporciona información directa sobre la estructura y función de la comunidad microbiana en entornos naturales y diseñados21,22,23,24,25,26,27. A medida que mejoran las tecnologías de secuenciación, es posible ensamblar genomas a partir de metagenomas con una resolución taxonómica creciente20. Sin embargo, a pesar de la creciente dependencia de los genomas ensamblados en metagenomas (MAG), quedan varios desafíos, incluida la resolución de la microheterogeneidad de la población28, ensamblajes de genomas incompletos o quiméricos (resultantes del ensamblaje o la agrupación), el sesgo de cobertura y la disponibilidad limitada de genomas de referencia caracterizados taxonómicamente para validación cruzada29,30,31. Los avances en la clasificación de células activadas por fluorescencia (FACS) y las tecnologías de secuenciación permiten el estudio de microorganismos no cultivados a nivel de células individuales, proporcionando etiquetas taxonómicas más precisas y elementos genéticos móviles asociados (MGE)32,33,34,35,36,37,38 . Los genomas amplificados unicelulares (SAG) y MGE resultantes se han utilizado para iluminar el potencial de codificación de la "materia oscura microbiana"39, proporcionar vínculos precisos entre la taxonomía y la función subyacente a los ciclos biogeoquímicos20,21,30,40 y evaluar la racionalización del genoma41, fino estructura poblacional a escala28,37,42 y dinámica virus-huésped43. La publicación reciente de Global Ocean Reference Genomes Tropics, o GORG-Tropics, proporciona un valioso compendio de SAG definidos taxonómicamente que contienen >12 000 secuencias genómicas parciales de aguas oceánicas eufóticas tropicales y subtropicales44. Aunque un pequeño subconjunto de GORG-Tropics SAG se recopiló de aguas de "aguas medias oceánicas con poco oxígeno" (2136 de 20 288 SAG secuenciados)44, las aguas marinas con deficiencia de oxígeno siguen estando notoriamente subrepresentadas, considerando su impacto biogeoquímico sustancial en las funciones y servicios de los ecosistemas marinos.

Aquí, presentamos un compendio global de SAG bacterianos y arqueales de OMZ y AMZ. Este compendio contiene 5129 SAG identificados taxonómicamente derivados de una combinación de métodos de clasificación de células específicas y no específicas, y aislados de entornos que cubren la gama completa de perfiles geoquímicos asociados con aguas marinas existentes con deficiencia de oxígeno4 (Fig. 1). Actualmente, 3570 de estos SAG han sido secuenciados, ensamblados y descontaminados, según los estándares genómicos establecidos45 (Fig. 2, S1a-c). Los SAG secuenciados y ensamblados se procesaron a través de Microbial Genome Annotation Pipeline46 para la predicción de genes y la anotación funcional, y están disponibles a través de la plataforma Integrated Microbial Genome (IMG; https://img.jgi.doe.gov/)47 o IMG/ProPortal ( https://img.jgi.doe.gov/proportal). La colección de secuencias SAG proporciona un recurso invaluable para inferir rasgos metabólicos, resolver estructuras de población y evaluar tendencias espaciales y temporales de linajes taxonómicos relevantes dentro de los microbiomas OMZ y AMZ.

Descripción general del flujo de trabajo para procesar y generar genomas microbianos amplificados de una sola célula (SAG). Se presenta un esquema más detallado en la información complementaria (Figura complementaria S1-S3) (modificado de Rinke et al., 2013)50.

Se recolectaron aproximadamente 1–2 mL de muestras de agua de mar por duplicado o triplicado durante varios cruceros oceanográficos dentro de diferentes OMZ y aguas anóxicas (Fig. 1 y Tabla 1). Las muestras se colocaron en crioviales estériles y se modificaron con uno de los siguientes crioprotectores: glicina betaína (concentración final al 6% [v/v]39,48), glicerol (concentración final al 10% [v/v]28,49) o glicerol-TE tampón39,50. La recolección de agua de mar ambiental se realizó utilizando una roseta de botella Niskin o un sistema de perfilado de bombas para el crucero NBP13-05 (ETSP; R/V Nathaniel B. Palmer, del 5 al 7 de julio de 2013), equipado con un medidor de conductividad-temperatura-profundidad. perfilador, sensor de O2 disuelto, fluorómetro y transmisómetro. Durante el crucero BiG RAPA (ETSP, frente a las costas de Chile, 19 de noviembre de 2010, 55 m de profundidad) se utilizó un protocolo de recolección de muestras modificado, que primero se enriqueció en cubierta seleccionando microorganismos que contienen clorofila51. Las muestras por triplicado se pasaron a través de una malla de 60 μm de tamaño y se clasificaron a través de un sistema de citómetro de flujo InfluxTM (BD Biosciences). Se clasificaron aproximadamente 4000 células en 1 ml de tampón de glicerol-TE estéril. La clasificación se activó en función del contenido de pigmento de las partículas en el canal de emisión rojo (excitado por el láser 488), utilizando la luz dispersada hacia adelante como indicador del tamaño de las partículas. Todas las muestras se criopreservaron en nitrógeno líquido y luego se almacenaron a -80 °C, antes de ser procesadas para la generación del genoma amplificado de una sola célula.

Las muestras se descongelaron y las células microbianas se clasificaron en el Centro de Genómica de Células Únicas (SCGC) del Laboratorio Bigelow para Ciencias Oceánicas o en el Instituto Conjunto del Genoma (JGI). Las muestras se pasaron a través de una malla estéril de 40 μm antes de clasificar los microorganismos mediante un procedimiento de aislamiento no dirigido o una selección específica para cianobacterias. Para el aislamiento no objetivo, las partículas microbianas se marcaron con una concentración final de 5 μM de la tinción de ADN SYTO-9 (Thermo Fisher Scientific). Las células microbianas se clasificaron individualmente utilizando un sistema de citómetro de flujo MoFloTM (Beckman Coulter) o InFluxTM (BD Biosciences) equipado con un láser de 488 nm para excitación y un orificio de boquilla de 70 μm52. Las puertas para el aislamiento no dirigido de células microbianas teñidas con SYTO-9 se definieron en función de la fluorescencia verde de las partículas como indicador del contenido de ácido nucleico y la luz dispersa lateral como indicador del tamaño de las partículas. Para el aislamiento de células de cianobacterias, las puertas se definieron en función de la autofluorescencia en el canal de emisión rojo. Se realizó una discriminación mejorada de las células cianobacterianas de las partículas detríticas en función de la proporción de fluorescencia verde (etiqueta de ADN SYTO-9) frente a roja (contenido de clorofila). El citómetro se activó en la dispersión lateral usando el modo de "una sola gota". Todas las células individuales microbianas se clasificaron en placas de 384 pocillos que contenían 600 nL de tampón TE 1X por pocillo y luego se almacenaron a -80 °C hasta su posterior procesamiento. Un subconjunto de células microbianas, que generó los SAG identificados con el prefijo 'AAA001' (parte de los SAG recolectados en el SASG, a 800 m de profundidad), se clasificó en la 'mezcla de reacción de bacterias prepGEMTM' (ZyGEM)48. Para las muestras procesadas en el Bigelow Single Cell Genomics Center, 64 de los 384 pocillos de cada placa se utilizaron como controles negativos (sin deposición de gotitas), y 3 pocillos recibieron 10 células cada uno para servir como controles positivos.

Las células individuales microbianas clasificadas en tampón TE se lisaron como se describió anteriormente agregando KOH53 frío o 700 nl de un tampón de lisis que constaba de KOH 0,4 mM, EDTA 10 mM y ditiotreitol52 100 mM. Las muestras se incubaron durante 10 min a 4 o 20 °C para las muestras lisadas con KOH frío o tampón de lisis, respectivamente. Las células microbianas clasificadas en la "mezcla de reacción de bacterias prepGEMTM" se lisaron primero siguiendo las instrucciones del fabricante y luego se procesaron mediante el procedimiento de lisis con KOH en frío48. A continuación, los ácidos nucleicos microbianos se amplificaron en todo el genoma en pocillos individuales a través de la tradicional "amplificación de desplazamiento múltiple heredada" mediada por Phi29 (L-MDA39,53) o utilizando una polimerasa Phi29 más termoestable a través de la "amplificación del genoma completo-X" (WGA- X52). Los productos de este procedimiento se denominan aquí SAG.

Si bien los productos de amplificación del genoma unicelular generados por WGA-X no se preseleccionaron taxonómicamente, casi todos los SAG procesados ​​con L-MDA con la polimerasa no termoestable se identificaron taxonómicamente mediante la secuenciación de amplicones genéticos de subunidades pequeñas de ARN ribosomal (SSU o 16 S rRNA). Cebadores bacterianos (27-F: 5′- AGAGTTTGATCMTGGCTCAG -3′54, 907-R: 5′- CCGTCAATTCMTTTRAGTTT -3′55) y arqueales (Arc_344F: 5′- ACGGGGYGCAGCAGGCGCGA -3′56, Arch_915R: 5′- GTGCTCCCCCGCCAATTCCT -3'57) fueron utilizados. La PCR en tiempo real y la secuenciación de los amplicones resultantes se realizaron como se describió previamente39,52. Las secuencias de amplicón del gen de ARNr de SSU resultantes se compararon con la base de datos SILVA v138.158 con blastn, de BLAST + v2.9.059. El top blastn hit (es decir, la cobertura más alta, la puntuación de bits y la identidad, así como el valor e más bajo) se utilizó como clasificación taxonómica principal para cada SAG preseleccionado (Tabla S1)60. Además, las secuencias de amplicón del gen SSU rRNA se consultaron en la base de datos NCBI-RefSEQ v2021-08-1461. Los principales aciertos se determinaron utilizando los mismos criterios descritos anteriormente y se indican aquí como las asignaciones taxonómicas secundarias de los SAG (Tabla S1)60. Las secuencias indicadas como "Sin clasificar" no tenían una homología de secuencia significativa con ninguna de las referencias dentro de estas bases de datos (Tabla S1)60.

Se utilizaron dos métodos para asignar la taxonomía a los SAG. Inicialmente, las asignaciones taxonómicas para los SAG generados a través de L-MDA se realizaron extrayendo secuencias del gen SSU rRNA directamente de los ensamblajes del genoma completo o de los amplicones descritos anteriormente. Para todos los SAG generados a través del procedimiento WGA-X que no se examinaron en busca de ningún marcador filogenético antes de la secuenciación del genoma, se realizó una búsqueda para identificar las secuencias del gen SSU rRNA> 500 pb dentro del ensamblaje del genoma (Figura complementaria S2). Esta búsqueda se realizó a través del sistema Integrated Microbial Genomes & Microbiome (IMG/M, https://img.jgi.doe.gov/m/) basado en su tubería de predicción y anotación de genes (ver más abajo)45,46. Además, las secuencias de ARNr de SSU se recuperaron de un subconjunto de ensamblajes SAG con el flujo de trabajo Recuperación de secuencias de genes de ARN ribosomal con Anvi'o v7.062. Estas secuencias del gen SSU rRNA se procesaron como se describe anteriormente para asignar la taxonomía (Tabla S1)60. Debido a que 1281 SAG no proporcionaron suficiente información sobre la secuencia del gen SSU rRNA (Tabla S2)60, todos los ensamblajes de SAG también se procesaron a través del Genome Taxonomy Database Tool Kit GTDB-Tk v2.1.063,64,65,66,67,68,69, 70 con datos de referencia GTDB R07-R207_v271,72,73 para asignación taxonómica multilocus. Esto permitió la identificación taxonómica de los SAG que carecían de secuencias del gen SSU rRNA y ofreció una referencia adicional en comparación con las asignadas por secuencias de marcadores filogenéticos parciales o completos. El número de asignaciones taxonómicas que se generaron utilizando ambos métodos se detalla en la Tabla S360, y las asignaciones están disponibles en la Tabla S160.

Los SAG se secuenciaron como se describió anteriormente39,52, y sus lecturas se ensamblaron en contigs utilizando SPAdes v2.2.10 a v3.10.074. Se eliminaron los cóntigos de <2000 pb de los ensamblajes SAG. Luego se determinaron los niveles de integridad y contaminación de los ensamblajes SAG utilizando CheckM v1.2.175. Para cumplir con los estándares genómicos establecidos45, los ensamblajes que superaban el 5 % de contaminación estimada se procesaron a través de ProDeGe v2.2 a v2.376 para eliminar los contigs en conflicto hasta que no hubo mejoras en sus estimaciones de contaminación. Los niveles de contaminación y completitud de estos SAG se volvieron a evaluar con CheckM v1.2.175 y aquellos que aún excedían el 5 % de contaminación se descontaminaron manualmente a través de los flujos de trabajo del contenedor MAG de metagenómica y refinado disponibles en Anvi'o v562.

Un total de 14 SAG excedieron el 5 % de contaminación después de ser procesados ​​a través de la tubería de descontaminación ProDeGe76 y recorte de contig corto (Tabla S5)60. Estos SAG se descontaminaron manualmente con Anvi'o v5 utilizando los flujos de trabajo Metagenómica Workflow y Refining MAG bin62. Se generó una base de datos contig y el modelo oculto de Markov correspondiente para cada base de datos para cada uno de estos SAG. A continuación, se asignó la taxonomía de cada gen mediante la base de datos Centrifuge Database77. La curación manual adicional de estos SAG se llevó a cabo utilizando una cobertura diferencial de cada SAG basada en lecturas metagenómicas de los metagenomas de Saanich Inlet (agosto de 2011 100 m, 150 m y 2012 100 m, 150 m. Biomuestras SAMN05224439, SAMN05224444, SAMN05224441, SAMN05224518, Bio proyecto PRJNA247822)78. Las lecturas metagenómicas sin procesar se mapearon con bwa v0.7.17-r118879 y samtools v1.6-19-g1c03df680. Se generaron bases de datos de perfil Anvi para cada SAG utilizando las bases de datos contig y los archivos de mapeo de lectura. Los contigs individuales se eliminaron manualmente a través de la interfaz interactiva en función de la identidad taxonómica, la identidad de tetranucleótidos promedio y la cobertura diferencial baja. Los nuevos ensamblajes se exportaron como archivos fasta y se volvieron a evaluar con CheckM.

Después de ejecutar CheckM en todos los ensamblajes SAG descontaminados, se determinó la calidad de cada SAG según Bowers et al. 201745. Los SAG que tenían una integridad estimada <50 % se consideraron SAG de baja calidad. Los SAG que tenían ≥50 % de integridad estimada y <10 % de contaminación estimada se consideraron como mínimo de calidad media. Para determinar si un SAG era de alta calidad, además de tener >90 % de integridad estimada y <5 % de contaminación estimada, los SAG deben tener 23 genes S, 16 S y 5 S rRNA y al menos 18 tRNA presentes en el ensamblaje final . Para identificar y cuantificar los rRNA y tRNA, los SAG se pasaron a través de Barrnap v0.9 (https://github.com/tseemann/Barrnap)81 y tRNA-SE v2.0.1182 respectivamente. Cualquier SAG que tuviera > 90 % de integridad estimada y < 5 % de contaminación estimada pero sin uno o más genes de ARNr con al menos 18 ARNt se clasificó como de calidad media. Los recuentos de rRNA y tRNA, así como las clasificaciones de calidad para cada SAG se pueden encontrar en la Tabla S160.

Todos los ensamblajes del genoma se anotaron a través de la plataforma IMG del Joint Genome Institute y se anotaron utilizando el JGI Microbial Genome Annotation Pipeline46. Los sistemas IMG (https://img.jgi.doe.gov/) o IMG/ProPortal (https://img.jgi.doe.gov/proportal) alojan todas las secuencias SAG ensambladas y descontaminadas finales, con llamadas de genes y funcionales. anotaciones disponibles públicamente a través de estos portales. Se proporcionan todos los números de acceso de IMG para SAG secuenciados (Tabla S1)60.

Las secuencias de amplicón del gen SSU rRNA recuperadas que cubren la región variable V4-V5 se agruparon con una identidad del 97 % utilizando CD-Hit83,84,85 y se les asignaron identificadores basados ​​en una secuencia representativa de cada grupo. Con base en la identidad taxonómica de estas secuencias representativas, la proporción de SAG asociados con cada grupo se determinó por muestra. Estas proporciones se usaron para calcular los índices de disimilitud de Bray-Curtis usando el comando vegdist() en el paquete R vegano v2.5-786. Las muestras se agruparon en base a la disimilitud de Bray-Curtis, utilizando un método de vinculación promedio para la agrupación jerárquica utilizando el comando hclust en base R y se visualizaron (Fig. 3).

Una evaluación basada en SAG de la composición microbiana en las OMZ. El gráfico de puntos presenta la designación taxonómica y la proporción de SAG clasificados anónimamente secuenciados (puntos de colores) en cada taxón a nivel de phylum y Proteobacteria a nivel de clase de cada ubicación. Los puntos grises subyacentes representan SAG recopilados y clasificados taxonómicamente, pero no secuenciados actualmente. La taxonomía se determinó mediante secuencias de amplicón del gen SSU rRNA según lo definido por SILVA v138.1. El color del punto representa las concentraciones de oxígeno ambiental en el momento del muestreo. Los lugares de muestreo se agruparon de acuerdo con la similitud de la composición taxonómica SAG recolectada en cada lugar. La escala de agrupamiento representa la disimilitud de Bray-Curtis entre la diversidad microbiana de cada ubicación según la información de la secuencia SAG. Las barras de anotación indican el método de amplificación de ADN y el tipo de OMZ. La información de ubicación está codificada por colores como se muestra para el método de amplificación de ADN, el tipo de OMZ o AMZ y la concentración de oxígeno en el momento del muestreo. Los nombres de las ubicaciones de muestreo, en las puntas del dendrograma, se indican como 'ubicación_profundidad (m)_mes y/o año de recolección'. Los acrónimos de ubicación corresponden a: Ensenada de Saanich (SI), Pacífico subártico nororiental (NESAP), Giro subtropical del Pacífico norte (NPSG), Pacífico norte tropical oriental (ETNP), Pacífico sur tropical oriental (ETSP), Afloramiento costero del Pacífico sur oriental (ESPCU) , el afloramiento costero de Benguela (Benguela), el giro subtropical del Atlántico sur (SASG) y el mar Báltico (Báltico).

Archivo 1: Tabla S1. Muestras biológicas de OMZ SAG con metadatos de geolocalización y crucero asociados. Este archivo contiene todas las accesiones de Bioproject y Biosample, ID de genoma IMG, accesiones de SRA, accesiones de Genbank, salidas de CheckM, salidas de GTDB-tk y resultados de SSU rRNA BLAST que se pueden encontrar en: Table S1_Metadata-template-Bio-Med-SAGdescriptor-OMZ_April_06_2023. xlsx (10.6084/m9.figshare.20481603)60.

Archivo 2: Tabla S2. Número de SAG generados con cada método de amplificación de ADN y cuántas secuencias del gen SSU rRNA recuperables se recuperaron de cada conjunto de datos. Tenga en cuenta que hay algunas muestras que tenían secuencias del gen SSU rRNA derivadas tanto del amplicón como del genoma completo. Esta información se puede encontrar en (10.6084/m9.figshare.20539005)60 y: https://github.com/hallamlab/OMZ_SAG_Compendium_Figures/blob/main/Outputs/Table_S2_Summary_Table_WGA_Approach_Mar_21_2023.csv

Archivo 3: Tabla S3. Número de SAG a los que se les asignó una taxonomía con SILVA v138.1 y GTDB-tk v2.1.0 y su resumen CheckM % de completitud y % de estimación de contaminación. Esta información se puede encontrar en (10.6084/m9.figshare.20539056)60 y: https://github.com/hallamlab/OMZ_SAG_Compendium_Figures/blob/main/Outputs/Table_S3_QA_QC_Summary_Mar_21_2023.csv

Archivo 4: Tabla S4. Contacto primario y secundario para cada placa de 384 micropocillos que contiene los SAG utilizados en este compendio. Esta información se puede encontrar en la Tabla S4_PI_Contact_Info.xlsx (10.6084/m9.figshare.20483595)60.

Archivo 5: un archivo tar comprimido en formato zip que contiene los ensamblajes genómicos (10.6084/m9.figshare.20459526)60.fna: archivo de ácido nucleico en formato multi-fasta

Archivo 6: En (10.6084/m9.figshare.20537919)60.fna – Archivo de ácido nucleico se puede encontrar un archivo tar comprimido zip que contiene las secuencias genómicas del gen SSU rRNA y las secuencias parciales del amplicón del gen SSU rRNA utilizadas para la asignación taxonómica. en formato multi-fasta

Archivo 7: Tabla S5. Un archivo xlsx que contiene la lista de SAG que se sometieron a descontaminación manual desde Saanich Inlet, así como la profundidad desde la que se originaron. Las profundidades se utilizaron para seleccionar las lecturas del metagenoma utilizadas para el proceso de descontaminación manual. Esta tabla se puede encontrar en (10.6084/m9.figshare.20538936)60.

La implementación temprana de los flujos de trabajo SAG involucró MDA de células individuales ordenadas anónimamente en formato de placa de 384 pocillos seguida de amplificación por PCR de marcadores filogenéticos seleccionados, por ejemplo, el gen SSU rRNA, para identificar SAG de interés para la secuenciación39. El desarrollo reciente de WGA-X junto con la secuenciación del genoma de baja cobertura (LoCoS) proporciona un flujo de trabajo más económico para identificar cientos de SAG por muestra sin posibles sesgos de PCR52. Los métodos dirigidos de clasificación basados ​​en las propiedades espectrales de las células o sustratos también se han aplicado a la selección y secuenciación de SAG, incluidas las cianobacterias y las células que se unen a sustratos marcados con fluorescencia, como la celulosa87,88,89. Aunque el gen SSU rRNA sigue siendo uno de los marcadores filogenéticos más utilizados y tiene bases de datos bien establecidas y seleccionadas (p. ej., SILVA58), herramientas de asignación filogenética multilocus, como GTDB-Tk63,64,65,66,67,68, 69,70 generan resultados igualmente válidos usando más información. Para este compendio, la diversidad microbiana se evaluó utilizando etiquetas taxonómicas e información de abundancia para SAG secuenciados utilizando enfoques de clasificación de células no dirigidas. Sin embargo, no todos los SAG coincidieron con su taxonomía del gen SSU rRNA debido a que sus secuencias de amplicón eran demasiado cortas (188 L-MDA SAG con <500 pb amplicones; Tabla S2) o no se recuperó ningún gen SSU rRNA de la amplificación aleatoria del genoma (es decir, 1093 WGA-X SAG; Tabla S2). Por lo tanto, se ejecutó un clasificador taxonómico adicional para todos los SAG, basado en la asignación del genoma completo utilizando GTDB-Tk63,64,65,66,67,68,69,70. Ambos conjuntos de clasificaciones se encuentran en la Tabla S1. El agrupamiento jerárquico (de 3217 SAG que contenían una secuencia de amplicón del gen rRNA V4-V5 SSU asignable) reveló una mayor similitud entre aquellos de profundidades y ubicaciones geográficas con condiciones de oxígeno similares (Fig. 3), un resultado consistente con observaciones anteriores2,3,4 ,8. También se debe tener en cuenta que muchos de los SAG amplificados con el método WGS-X se originaron a partir de muestras altamente oxigenadas, que tenían composiciones taxonómicas similares y, por lo tanto, se agruparon. Con base en esta información, las secuencias SAG de OMZ y AMZ presentadas aquí deberían servir para complementar las colecciones SAG anteriores obtenidas de aguas oceánicas eufóticas (oxigenadas)44,49.

Este compendio pretende llenar un vacío crítico en los genomas de referencia etiquetados taxonómicamente de aguas marinas con deficiencia de oxígeno. Las secuencias SAG incluidas se procesaron utilizando flujos de trabajo de ensamblaje y descontaminación bien establecidos. Sin embargo, los enlaces a los datos sin procesar también están disponibles para los usuarios interesados ​​en usar futuras versiones de software o implementar flujos de trabajo alternativos. Cualquier enfoque debe apuntar a discernir secuencias contaminantes asociadas con FACS (clasificación conjunta de dos o más células en un solo pocillo, contaminación de ADN ambiental) y WGA (contaminación de reactivos)90. Es importante enfatizar que las secuencias SAG a menudo contienen MGE, incluidos plásmidos y virus43,91,92,93. Estas secuencias generalmente se filtran durante el proceso de descontaminación, aunque la diferenciación entre intervalos cromosómicos endógenos, como islas o profagos de MGE, requiere una cuidadosa selección manual. Se alienta a los usuarios interesados ​​en MGE a trabajar con los datos sin procesar o los ensamblajes iniciales antes de la descontaminación. Tenga en cuenta que las estimaciones de contaminación del ensamblaje del genoma obtenidas por CheckM deben manejarse con precaución, ya que esta herramienta es propensa a sobreestimar y subestimar la integridad y la contaminación94. Como se describió anteriormente, los avances recientes en MDA que utilizan WGA-X han llevado a una mejor finalización de SAG y la adopción de LoCoS ha obviado la necesidad de la detección de amplicón del gen SSU rRNA para seleccionar SAG de interés para la secuenciación52. Las secuencias incluidas en este compendio incluyen enfoques de secuenciación SAG más antiguos y más contemporáneos. Los resultados se integran mediante la presentación del gen SSU rRNA y asignaciones taxonómicas de múltiples locus basadas en SILVA, NCBI y GTDB.

A pesar de las mejoras introducidas con WGA-X52, la genómica unicelular invariablemente da como resultado ensamblajes de genoma incompletos (Fig. 4, Figura complementaria S4). Esta limitación se puede superar en parte cuando se obtienen de la misma muestra múltiples SAG que comparten niveles extremadamente altos de identidad de nucleótidos. Estas secuencias estrechamente relacionadas se pueden analizar juntas, lo que permite una reconstrucción metabólica más completa7,33,42,51, o se pueden usar para generar ensamblajes combinados50,95. Además, los genomas a nivel de población se pueden obtener a través de ensamblajes híbridos que combinan secuencias SAG y secuencias metagenómicas96,97. En todos los casos, los contigs SAG deben filtrarse por calidad para eliminar la presencia de secuencias contaminantes y cumplir con los estándares genómicos establecidos45. Todos los ensamblajes de SAG informados aquí se descontaminaron a fondo, alcanzando <5 % de contaminación para todos excepto cuatro SAG (que solo tenían entre 5 y 10 % de contaminación; Fig. 4, Figura complementaria S4, Tabla S2).

Estimaciones de integridad y contaminación de CheckM de los SAG secuenciados para todos los SAG secuenciados con el tamaño de punto que representa la longitud del ensamblaje en Megabase Pairs (MBP). De estos, la línea continua representa el umbral estimado de integridad y contaminación para los SAG de calidad media (> = 50 % de integridad, <10 % de contaminación) y la línea discontinua representa el umbral para los SAG de alta calidad (>90 % de integridad, <5 % de contaminación). )45. Los gráficos están coloreados según (a) región, (b) ecotipo OMZ, (c) profundidad, (d) nivel de concentración de oxígeno ambiental, (e) método de amplificación de ADN y (f) grupo taxonómico (nivel de clase para Proteobacteria, nivel de filo para otros taxones) como se define en SILVA v138.1. Tenga en cuenta que los SAG >5 % de contaminación estimada se han excluido de esta cifra.

Muchos SAG incluidos en este compendio no han sido secuenciados y el ADN permanece almacenado. Se alienta a los usuarios a identificar los microorganismos subrepresentados de los microbiomas OMZ y AMZ en función de la información taxonómica proporcionada que se puede priorizar para la secuenciación y compartir con la comunidad de usuarios. Al mismo tiempo, reconocemos que también hay entornos OMZ y AMZ subrepresentados que no están incluidos en este compendio. Las secuencias del Mar Negro, el Mar de China Meridional, el Mar Arábigo y la Bahía de Bengala, entre otros, proporcionarían una representación más sólida de las aguas marinas con deficiencia de oxígeno para su uso en estudios comparativos y esfuerzos de modelado. Finalmente, las secuencias SAG incluidas en este compendio se pueden usar como genomas de referencia caracterizados taxonómicamente para reclutar conjuntos de datos metagenómicos de ambientes marinos, mejorar los métodos de predicción de vías29,98,99,100,101,102,103,104,105,106 o expandir los paquetes de referencia para el análisis centrado en genes de marcadores funcionales107.

Los scripts utilizados para calcular el número de SAG, la Matriz de disimilitud de Bray-Curtis, conducen el grupo jerárquico y generan las Figs. 1b, 3, 4, Figuras complementarias S4–S8 escritas bajo R versión 4.1.3. Estos scripts utilizan los siguientes paquetes R: tidyverse, egg, vegan, dendexted, sf, rnaturalearth y rnaturalearthdata producirán las tablas y figuras presentadas en este documento. El enlace directo al software y las especificaciones relevantes se puede encontrar en línea en el repositorio de Github de Hallam Lab https://github.com/hallamlab/OMZ_SAG_Compendium_Figures.

El software adicional utilizado, incluidos los números de versión, las variables ajustables y otros parámetros, incluyen lo siguiente:

Trimmomatic 0.35108: -phred33 LÍDER:0 FINAL:5 VENTANA CORREDIZA:4:15 MIN LEN:36

ILLUMINACLIP:Trimmomatic-0.35108: /adaptadores/TruSeq. 3-PE.fa:2:3:10 PRINCIPAL:3 FINAL:3 VENTANA CORREDIZA:4:15 MIN LEN:36

PICAS 3.0.0-3.10 74 : --cuidado--sc--phred-offset 33

ProDeGe v2.3.0 76

CheckM v1.2.175: checkm lineage_wf --tab_table -x.fna --threads 8 --pplacer_threads 8

CheckM v1.2.175: checkm qa -o 2 --tab_table

GTDB-Tk v2.1.063,64,65,66,67,68,69,70: gtdbtk classify_wf --genome_dir --out_dir -x.fna --cpus 8

Nucleotide-Nucleotide BLAST 2.9.0+59: blastn -query -db -outfmt "6 qacc sacc stitle staxid pident bitscore" -max_target_seqs. 1 -num_threads 4 -fuera

Nucleotide-Nucleotide BLAST 2.9.0+59: blastn -query -db -outfmt "6 qacc stitle pident bitscore" -max_target_seqs. 1 -num_threads 4 -fuera

Anvi'o v562: anvi-gen-contigs-base de datos -f -o -n

Envi'o v562: anvi-run-hmms -c

Anvi'o v562: anvi-get-sequences-for-gene-calls -c -o

Anvi'o v562: $CENTRIFUGE_BASE/p + h + v/p + h + v gene-calls.fa -S centrifuge_hits.tsv

Anvi'o v562: anvi-import-taxonomy-for-genes -c -p

BWA v 0.7.17-r118879: índice bwa

BWA v 0.7.17-r118879: memoria bwa

Samtools v 1.6-19-g1c03df6 (usando htslib 1.6-55-gb065a60)80: vista de samtools -b F 4

Samtools v 1.6-19-g1c03df6 (usando htslib 1.6-55-gb065a60)80: archivo de índice de samtools.sorted.bam

Anvi'o v562: anvi-profile -i -c --min-contig-length 2000 --output.dir --cluster-contigs

Anvi'o v562: anvi-merge ruta_al_perfil1/PERFIL.db ruta_al_perfil2/PERFIL.db -o --skip-concoct-binning

Anvi'o v562: anvi-interactivo -p

Anvi'o v562: anvi-resumir -c -p -C

Anvi'o v762: anvi'o-gen-contigs-database -f -o

Anvi'o v762: anvi-run-hmms -c --num-threads 8

Anvi'o v762: anvi-get-sequences-for-hmm-hits

barrnap81: barrnap --kingdom bac --threads {threads} --outseq {dir_trabajo}/barrnap/*rRNA.fasta {input.fasta_dir}/$g.fasta > {dir_trabajo}/barrnap/$g.rRNA.gff

barrnap v0.982: barrnap --kingdom arc --threads {threads} --outseq {dir_trabajo}/barrnap/*rRNA.fasta {input.fasta_dir}/$g.fasta >{dir_trabajo}/barrnap/$g.rRNA .gff

tRNAscan-SE v 2.0.1182: tRNAscan-SE -B -o {dir_trabajo}/trnascan/$g.output.txt -m {dir_trabajo}/trnascan/$g.stats.txt -b {dir_trabajo}/trnascan/$ g.bed -j {dir_trabajo}/trnascan/$g.gff -a {dir_trabajo}/trnascan/$g.trna.fasta -l {dir_trabajo}/trnascan/$g.log --thread {subprocesos} {entrada. fasta_dir}/$g.fasta

Revsbech, NP et al. Determinación de concentraciones de oxígeno ultrabajas en zonas de mínimo de oxígeno por el sensor STOX. Limnol. Oceanogr.: Métodos. 7, 371-381. (2009).

Wright, JJ, Konwar, KM & Hallam, SJ Ecología microbiana de las zonas de expansión mínima de oxígeno. Nat. Rev. Microbiol. 10, 381–394 (2012).

Artículo CAS PubMed Google Académico

Jürgens, K. & Taylor, GT Ecología microbiana y biogeoquímica de columnas de agua con deficiencia de oxígeno en Microbial Ecology of the Oceans (eds. Gasol, JM & Kirchman, DL) 231–288 (John Wiley & Sons, 2018).

Ulloa, O., Canfield, DE, DeLong, EF, Letelier, RM & Stewart, FJ Oceanografía microbiana de zonas de mínimo de oxígeno anóxico. proc. nacional Academia ciencia EE. UU. 109, 15996–16003 (2012).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Thamdrup, B., Dalsgaard, T. & Revsbech, NP Anoxia funcional generalizada en la zona de mínimo oxígeno del Pacífico Sur Oriental. Res. de aguas profundas. pinta I. 65, 36–45 (2012).

Bristow, LA et al. Oxidación de amonio y nitrito a concentraciones nanomolares de oxígeno en aguas de zona mínima de oxígeno. proc. nacional Academia ciencia EE. UU. 113, 10601–10606 (2016).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Hawley, AK et al. Diversas bacterias Marinimicrobia pueden mediar ciclos biogeoquímicos acoplados a lo largo de gradientes eco-termodinámicos. Nat. común 8, 1507 (2017).

Artículo ADS PubMed PubMed Central Google Scholar

Bertagnolli, AD & Stewart, FJ Nichos microbianos en zonas de mínimo oxígeno marino. Nat. Rev. Microbiol. 16, 723–729 (2018).

Artículo CAS PubMed Google Académico

Codispoti, LA et al. Los presupuestos oceánicos fijos de nitrógeno y óxido nitroso: ¿Objetivos móviles a medida que ingresamos al antropoceno? Ciencia Marina. 65, 85–105 (2001).

DeVries, T., Deutsch, C., Rafter, PA y Primeau, F. Tasas de desnitrificación marina determinadas a partir de un modelo inverso tridimensional global. Biogeociencias. 10, 2481–2496 (2013).

Naqvi, SWA et al. Hipoxia/anoxia marina como fuente de CH4 y N2O. Biogeociencias 7, 2159–2190 (2010).

Thamdrup, B. et al. La oxidación anaeróbica de metano es un importante sumidero de metano en la zona de mínimo de oxígeno más grande del océano. Limnol. Oceanogr. 64, 2569–2585 (2019).

Stramma, L., Johnson, GC, Sprintall, J. & Mohrholz, V. Expansión de las zonas de mínimo oxígeno en los océanos tropicales. Ciencia 320, 655–658 (2008).

Artículo ADS CAS PubMed Google Scholar

Schmidtko, S., Stramma, L. y Visbeck, M. Disminución del contenido global de oxígeno oceánico durante las últimas cinco décadas. Naturaleza 542, 335–339 (2017).

Artículo ADS CAS PubMed Google Scholar

Carstensen, J., Andersen, JH, Gustafsson, BG & Conley, DJ Desoxigenación del Mar Báltico durante el último siglo. proc. nacional Academia ciencia EE. UU. 111, 5628–5633 (2014).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Diaz, RJ & Rosenberg, R. Propagación de zonas muertas y consecuencias para los ecosistemas marinos. Ciencia 321, 926–929 (2008).

Artículo ADS CAS PubMed Google Scholar

Malone, TC & Newton, A. La globalización de la eutrofización cultural en el océano costero: causas y consecuencias. Frente. Ciencia de marzo. 7, 670 (2020).

Woodcroft, BJ y col. Visión centrada en el genoma del procesamiento de carbono en el permafrost descongelado. Naturaleza 560, 49–54 (2018).

Artículo ADS CAS PubMed Google Scholar

Louca, S. et al. Integración de biogeoquímica con información de secuencias multiómicas en un modelo de zona mínima de oxígeno. proc. nacional Academia ciencia EE.UU. 113, E5925–E5933 (2016).

Reed, DC, Algar, CK, Huber, JA y Dick, GJ Enfoque centrado en los genes para integrar la genómica ambiental y los modelos biogeoquímicos. proc. nacional Academia ciencia EE.UU. 111, 1879–1884 (2014).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Tyson, GW y col. Estructura comunitaria y metabolismo a través de la reconstrucción de genomas microbianos del medio ambiente. Naturaleza 428, 37–43 (2004).

Artículo ADS CAS PubMed Google Scholar

Iverson, V. et al. Desenredando genomas de metagenomas: revelando una clase no cultivada de Euryarchaeota marina. Ciencia 335, 587–590 (2012).

Artículo ADS CAS PubMed Google Scholar

Wrighton, KC y col. Fermentación, hidrógeno y metabolismo del azufre en múltiples filos bacterianos no cultivados. Ciencia 337, 1661–1665 (2012).

Artículo ADS CAS PubMed Google Scholar

Venter, JC et al. Secuenciación aleatoria del genoma ambiental del Mar de los Sargazos. Ciencia 304, 66–74 (2004).

Artículo ADS CAS PubMed Google Scholar

Albertsen, M., Hansen, LBS, Saunders, AM, Nielsen, PH y Nielsen, KL Un metagenoma de una comunidad microbiana a gran escala que lleva a cabo una eliminación biológica de fósforo mejorada. ISME J. 6, 1094–1106 (2012).

Artículo CAS PubMed Google Académico

DeLong, EF et al. Genómica comunitaria entre ensamblajes microbianos estratificados en el interior del océano. Ciencia 311, 496–503 (2006).

Artículo ADS CAS PubMed Google Scholar

Sunagawa, S. et al. Estructura y función del microbioma oceánico global. Ciencia 348, 1261359 (2015).

Artículo PubMed Google Académico

Kashtan, N. et al. La genómica unicelular revela cientos de subpoblaciones coexistentes en Prochlorococcus salvaje. Ciencia 344, 416–420 (2014).

Artículo ADS CAS PubMed Google Scholar

Basher, ARMA, McLaughlin, RJ & Hallam, SJ Inferencia de vías metabólicas usando clasificación de etiquetas múltiples con características de vías ricas. Cómputo PLoS. Biol. 16, e1008174 (2020).

Artículo Google Académico

Meziti, A. et al. La confiabilidad de los genomas ensamblados en metagenoma (MAG) en la representación de poblaciones naturales: información al comparar MAG con genomas aislados derivados de la misma muestra fecal. aplicación Reinar. Microbiol. 87, e02593-20 (2021).

Sczyrba, A. et al. Evaluación crítica de la interpretación del metagenoma: un punto de referencia del software de metagenómica. Nat. Métodos 14, 1063–1071 (2017).

Artículo CAS PubMed PubMed Central Google Scholar

Saak, CC, Dinh, CB & Dutton, RJ Enfoques experimentales para rastrear elementos genéticos móviles en comunidades microbianas. FEMS Microbiol. Rev. 44, 606–630 (2020).

Artículo CAS PubMed PubMed Central Google Scholar

Stepanauskas, R. Escuchas telefónicas en interacciones microbianas mediante genómica unicelular. Frente. Microbiol. 6, 258 (2015).

Artículo PubMed PubMed Central Google Académico

Stepanauskas, R. Genómica de células individuales: una mirada individual a los microbios. actual Opinión Microbiol. 15, 613–620 (2012).

Rinke, C. Genómica unicelular de materia oscura microbiana. Métodos Mol. Biol. 1849, 99–111 (2018).

Artículo CAS PubMed Google Académico

Ishoey, T., Woyke, T., Stepanauskas, R., Novotny, M. & Lasken, RS Secuenciación genómica de células microbianas individuales de muestras ambientales. actual Opinión Microbiol. 11, 198–204 (2008).

Artículo CAS PubMed PubMed Central Google Scholar

Bowers, RM et al. Disección de las poblaciones microbianas dominantes de las aguas termales en función del muestreo de toda la comunidad con resolución genómica unicelular. ISME J. 16, 1337–1347 (2022).

Artículo CAS PubMed Google Académico

Woyke, T., Doud, DFR & Schulz, F. La trayectoria de la secuenciación microbiana de una sola célula. Nat. Métodos 14, 1045–1054 (2017).

Artículo CAS PubMed Google Académico

Rinke, C. et al. Obtención de genomas a partir de microorganismos ambientales no cultivados mediante genómica unicelular basada en FACS. Nat. Protocolo 9, 1038–1048 (2014).

Artículo CAS PubMed Google Académico

Pachiadaki, MG et al. Papel principal de las bacterias oxidantes de nitrito en la fijación de carbono en el océano oscuro. Ciencia 358, 1046–1051 (2017).

Artículo ADS CAS PubMed Google Scholar

Cisne, BK et al. Racionalización del genoma predominante y divergencia latitudinal de bacterias planctónicas en la superficie del océano. proc. nacional Academia ciencia EE. UU. 110, 11463–11468 (2013).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Kashtan, N. et al. Diferencias fundamentales en la diversidad y estructura genómica de la población entre Prochlorococcus del Atlántico y del Pacífico. ISME J. 11, 1997–2011 (2017).

Artículo CAS PubMed PubMed Central Google Scholar

Roux, S. et al. Ecología y evolución de los virus que infectan bacterias SUP05 no cultivadas según lo revelado por la genómica unicelular y metagenómica. Elife 3, e03125 (2014).

Artículo PubMed PubMed Central Google Académico

Pachiadaki, MG et al. Trazando la complejidad del microbioma marino a través de la genómica unicelular. Celda 179, 1623–1635.e11 (2019).

Artículo CAS PubMed PubMed Central Google Scholar

Bowers, RM et al. Información mínima sobre un genoma amplificado único (MISAG) y un genoma ensamblado en metagenoma (MIMAG) de bacterias y arqueas. Nat. Biotecnología. 35, 725–731 (2017).

Markowitz, VM et al. Versión IMG 4 del sistema integrado de análisis comparativo de genomas microbianos. Ácidos Nucleicos Res. 42, D560–D567 (2014).

Artículo CAS PubMed Google Académico

Chen, I.-MA et al. IMG/M v.5.0: un sistema integrado de gestión de datos y análisis comparativo para genomas microbianos y microbiomas. Ácidos Nucleicos Res. 47, D666–D677 (2019).

Artículo CAS PubMed Google Académico

Cisne, BK et al. Potencial de quimiolitoautotrofia entre linajes de bacterias omnipresentes en el océano oscuro. Ciencia 333, 1296–1300 (2011).

Artículo ADS CAS PubMed Google Scholar

Berubé, PM et al. Genomas unicelulares de Prochlorococcus, Synechococcus y microbios simpátricos de diversos ambientes marinos. ciencia Datos 5, 180154 (2018).

Artículo CAS PubMed PubMed Central Google Scholar

Rinke, C. et al. Información sobre la filogenia y el potencial de codificación de la materia oscura microbiana. Naturaleza 499, 431–437 (2013).

Artículo ADS CAS PubMed Google Scholar

Plominsky, AM et al. Potencial metabólico y perfiles transcriptómicos in situ de grupos microbianos clave previamente no caracterizados involucrados en ciclos acoplados de carbono, nitrógeno y azufre en zonas marinas anóxicas. Reinar. Microbiol. 20, 2727–2742 (2018).

Artículo CAS PubMed Google Académico

Stepanauskas, R. et al. Recuperación mejorada del genoma y análisis integrados del tamaño celular de células microbianas individuales sin cultivar y partículas virales. Nat. común 8, 84 (2017).

Artículo ADS PubMed PubMed Central Google Scholar

Raghunathan, A. et al. Amplificación de ADN genómico a partir de una sola bacteria. aplicación Reinar. Microbiol. 71, 3342–3347 (2005).

Page, KA, Connon, SA y Giovannoni, SJ Bacterioplancton de agua dulce representativo aislado de Crater Lake, Oregón. aplicación Reinar. Microbiol. 70, 6542–6550 (2004).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Stackebrandt, E. & Goodfellow, M. Técnicas de ácido nucleico en sistemática bacteriana. (John Wiley & Son Limited, 1991).

Chapelle, FH et al. Una comunidad microbiana del subsuelo a base de hidrógeno dominada por metanógenos. Naturaleza 415, 312–315 (2002).

Artículo ADS PubMed Google Scholar

Ohene-Adjei, S., Teather, RM, Ivan, M. & Forster, RJ Establecimiento de protozoos posteriores a la inoculación y patrones de asociación de arqueas metanogénicas en el rumen ovino. aplicación Reinar. Microbiol. 73, 4609–4618 (2007).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Quast, C. et al. El proyecto de base de datos de genes de ARN ribosomal SILVA: procesamiento de datos mejorado y herramientas basadas en la web. Ácidos Nucleicos Res. 41, D590–D596 (2013).

Artículo CAS PubMed Google Académico

Camacho, C. et al. BLAST+: arquitectura y aplicaciones. BMC Bioinformática 10, 421 (2009).

Artículo PubMed PubMed Central Google Académico

Anstett, J. et al. Un compendio de genomas amplificados unicelulares de bacterias y arqueas de aguas marinas con deficiencia de oxígeno Figshare https://doi.org/10.6084/m9.figshare.c.6137379.v5 (2022).

O'Leary, NA et al. Base de datos de secuencias de referencia (RefSeq) en NCBI: estado actual, expansión taxonómica y anotación funcional. Ácidos Nucleicos Res. 44, D733–D745 (2016).

Artículo PubMed Google Académico

Eren, AM et al. Anvi'o: una plataforma avanzada de análisis y visualización de datos ómicos. PeerJ. 3, e1319 (2015).

Chaumeil, P.-A., Mussig, AJ, Hugenholtz, P. & Parks, DH GTDB-Tk v2: clasificación compatible con la memoria con la base de datos de taxonomía del genoma. Bioinformática 38, 5315–5316 (2022).

Artículo CAS PubMed PubMed Central Google Scholar

Chaumeil, P.-A., Mussig, AJ, Hugenholtz, P. & Parks, DH GTDB-Tk: un juego de herramientas para clasificar genomas con la base de datos de taxonomía del genoma. Bioinformática 36, ​​1925-1927 (2019).

PubMed PubMed Central Google Académico

Matsen, FA, Kodner, RB & Armbrust, EV pplacer: probabilidad máxima de tiempo lineal y colocación filogenética bayesiana de secuencias en un árbol de referencia fijo. BMC Bioinformática 11, 538 (2010).

Artículo PubMed PubMed Central Google Académico

Jain, C., Rodriguez-R, LM, Phillippy, AM, Konstantinidis, KT y Aluru, S. El análisis ANI de alto rendimiento de genomas procarióticos de 90K revela límites claros entre especies. Nat. común 9, 5114 (2018).

Artículo ADS PubMed PubMed Central Google Scholar

Hyatt, D. et al. Pródigo: reconocimiento de genes procarióticos e identificación del sitio de inicio de la traducción. BMC Bioinformática 11, 119 (2010).

Artículo PubMed PubMed Central Google Académico

Price, MN, Dehal, PS & Arkin, AP FastTree 2: árboles de probabilidad máxima aproximada para alineaciones grandes. PLoS One 5, e9490 (2010).

Eddy, SR Búsquedas aceleradas de perfil HMM. Cómputo PLoS. Biol. 7, e1002195 (2011).

Artículo ADS MathSciNet CAS PubMed PubMed Central Google Scholar

Ondov, BD et al. Mash: estimación rápida de la distancia del genoma y metagenoma utilizando MinHash. Genoma Biol. 17, 132 (2016).

Artículo PubMed PubMed Central Google Académico

Parques, DH et al. GTDB: un censo continuo de la diversidad de bacterias y arqueas a través de una taxonomía filogenéticamente coherente, normalizada por rangos y basada en el genoma completo. Ácidos Nucleicos Res. 50, D785–D794 (2022).

Artículo CAS PubMed Google Académico

Rinke, C. et al. Una taxonomía arqueológica estandarizada para la base de datos de taxonomía del genoma. Nat Microbiol 6, 946–959 (2021).

Artículo CAS PubMed Google Académico

Parques, DH et al. Una taxonomía completa de dominio a especie para Bacteria y Archaea. Nat. Biotecnología. 38, 1079–1086 (2020).

Artículo CAS PubMed Google Académico

Bankevich, A. et al. SPAdes: un nuevo algoritmo de ensamblaje del genoma y sus aplicaciones a la secuenciación unicelular. J. Cómputo. Biol. 19, 455–477 (2012).

Artículo MathSciNet CAS PubMed PubMed Central Google Scholar

Parks, DH, Imelfort, M., Skennerton, CT, Hugenholtz, P. & Tyson, GW CheckM: evaluación de la calidad de los genomas microbianos recuperados de aislamientos, células individuales y metagenomas. Genoma Res. 25, 1043–1055 (2015).

Artículo CAS PubMed PubMed Central Google Scholar

Tennessee, K. et al. ProDeGe: un protocolo computacional para la descontaminación totalmente automatizada de genomas. ISME J. 10, 269–272 (2016).

Artículo CAS PubMed Google Académico

Kim, D., Song, L., Breitwieser, FP y Salzberg, SL Centrífuga: clasificación rápida y sensible de secuencias metagenómicas. Genoma Res. 26, 1721-1729 (2016).

Artículo CAS PubMed PubMed Central Google Scholar

Hawley, AK et al. Un compendio de información de secuencias multiómicas de la columna de agua de entrada de Saanich. ciencia Datos 4, 170160 (2017).

Artículo CAS PubMed PubMed Central Google Scholar

Li, H. & Durbin, R. Alineación de lectura corta rápida y precisa con la transformada de Burrows-Wheeler. Bioinformática 25, 1754–1760 (2009).

Artículo CAS PubMed PubMed Central Google Scholar

Li, H. et al. El formato de mapa/alineación de secuencias y SAMtools. Bioinformática 25, 2078–2079 (2009).

Artículo PubMed PubMed Central Google Académico

Seemann, T. barrnap 0.9: Predictor de ARN ribosomal bacteriano. (Github).

Chan, PP, Lin, BY, Mak, AJ & Lowe, TM tRNAscan-SE 2.0: detección mejorada y clasificación funcional de genes de ARN de transferencia. Ácidos Nucleicos Res. 49, 9077–9096 (2021).

Artículo CAS PubMed PubMed Central Google Scholar

Li, W. & Godzik, A. Cd-hit: un programa rápido para agrupar y comparar grandes conjuntos de proteínas o secuencias de nucleótidos. Bioinformática 22, 1658–1659 (2006).

Huang, Y., Niu, B., Gao, Y., Fu, L. & Li, W. CD-HIT Suite: un servidor web para agrupar y comparar secuencias biológicas. Bioinformática 26, 680–682 (2010).

Fu, L., Niu, B., Zhu, Z., Wu, S. & Li, W. CD-HIT: acelerado para agrupar los datos de secuenciación de próxima generación. Bioinformática 28, 3150–3152 (2012).

Artículo CAS PubMed PubMed Central Google Scholar

Sitio web. Oksanen, J. et al. vegano: Paquete de Ecología Comunitaria Paquete R versión 2.5–6; https://CRAN.R-project.org/package=vegan (2019).

Martínez-García, M. et al. Captura de genomas de células individuales de degradadores de polisacáridos activos: una contribución inesperada de Verrucomicrobia. PLoS One 7, e35314 (2012).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Ulloa, O. et al. La cianobacteria Prochlorococcus tiene antenas captadoras de luz divergentes y puede haber evolucionado en un océano con poco oxígeno. proc. nacional Academia ciencia EE. UU. 118, e2025638118 (2021).

Doud, DFR et al. La genómica unicelular impulsada por funciones descubre bacterias degradadoras de celulosa de la biosfera rara. ISME J. 14, 659–675 (2020).

Artículo CAS PubMed Google Académico

Woyke, T. et al. Descontaminación de reactivos MDA para la amplificación del genoma completo de una sola célula. PLoS One 6, e26161 (2011).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Labonté, JM et al. Análisis basado en la genómica unicelular de las interacciones virus-huésped en el bacterioplancton de la superficie marina. ISME J. 9, 2386–2399 (2015).

Roux, S., Hallam, SJ, Woyke, T. & Sullivan, MB Materia oscura viral e interacciones virus-huésped resueltas a partir de genomas microbianos disponibles públicamente. eLife 4, e08490 (2015).

Martínez-Hernández, F. et al. La genómica unicelular descubre a Pelagibacter como el huésped putativo de la extremadamente abundante población viral 37-F6 no cultivada en el océano. ISME J. 13, 232–236 (2019).

Artículo CAS PubMed Google Académico

Becraft, ED et al. Rokubacteria: gigantes genómicos entre los filos bacterianos no cultivados. Frente. Microbiol. 8, 2264 (2017).

Artículo PubMed PubMed Central Google Académico

Nobu, MK et al. Filogenia y fisiología del filo candidato "Atribacteria" (OP9/JS1) deducidas de la genómica independiente del cultivo. ISME J. 10, 273–286 (2016).

Artículo CAS PubMed Google Académico

Mende, DR, Aylward, FO, Eppley, JM, Nielsen, TN y DeLong, EF Genomas ambientales mejorados a través de la integración de ensamblajes metagenómicos y unicelulares. Frente. Microbiol. 7, 143 (2016).

Artículo PubMed PubMed Central Google Académico

Kogawa, M., Hosokawa, M., Nishikawa, Y., Mori, K. y Takeyama, H. Obtención de borradores de genomas de alta calidad a partir de microbios no cultivados mediante la limpieza y el ensamblaje conjunto de genomas amplificados de una sola célula. ciencia Rep. 8, 2059 (2018).

Artículo ADS PubMed PubMed Central Google Scholar

Konwar, KM, Hanson, NW, Pagé, AP y Hallam, SJ MetaPathways: una canalización modular para construir bases de datos de rutas/genomas a partir de información de secuencias ambientales. BMC Bioinformática 14, 202 (2013).

Artículo PubMed PubMed Central Google Académico

Hanson, NW, Konwar, KM, Wu, S.-J. & Hallam, SJ MetaPathways v2.0: Un modelo maestro-trabajador para la construcción de la base de datos del Genoma/Vía ambiental en cuadrículas y nubes. 2014 Conferencia IEEE. computar Intel. Bioinf. computar Biol. (2014).

Konwar, KM et al. MetaPathways v2.5: mejoras cuantitativas funcionales, taxonómicas y de usabilidad. Bioinformática 31, 3345–3347 (2015).

Artículo CAS PubMed PubMed Central Google Scholar

Karp, PD, Paley, S. & Romero, P. El software de herramientas de ruta. Bioinformática 18, S225–S232 (2002).

Karp, PD, Latendresse, M. & Caspi, R. El algoritmo de predicción de vías de herramientas de vías. Pararse. genoma ciencia 5, 424–429 (2011).

Karp, PD Las bases de datos EcoCyc y MetaCyc. Ácidos Nucleicos Res. 28, 56–59 (2000).

Caspi, R. et al. La base de datos MetaCyc de rutas metabólicas y enzimas: una actualización de 2019. Ácidos Nucleicos Res. 48, D445–D453 (2020).

Artículo CAS PubMed Google Académico

Basher, ARMA & Hallam, SJ Aprovechamiento de la incorporación de redes heterogéneas para la predicción de vías metabólicas. Bioinformática 37, 822–829 (2021).

Artículo CAS Google Académico

Basher, ARMA, McLaughlin, RJ & Hallam, SJ Predicción de la vía metabólica usando factorización de matriz no negativa con precisión mejorada. J. Cómputo. Biol. 28, 1075–1103 (2021).

Morgan-Lang, C. et al. TreeSAPP: el perfilador filogenético sensible y preciso basado en árboles. Bioinformática 36, ​​4706–4713 (2020).

Bolger, AM, Lohse, M. y Usadel, B. Trimmomatic: un recortador flexible para datos de secuencia de Illumina. Bioinformática 30, 2114–2120 (2014).

Ganesh, S. et al. Evidencia genómica y transcriptómica de células individuales para el uso de sustratos de nitrógeno alternativos por bacterias anammox. ISME J. 12, 2706–2722 (2018).

Artículo CAS PubMed PubMed Central Google Scholar

Ganesh, S. et al. Partición de fracciones de tamaño de la transcripción de genes comunitarios y el metabolismo del nitrógeno en una zona de mínimo de oxígeno marino. ISME J. 9, 2682–2696 (2015).

Artículo CAS PubMed PubMed Central Google Scholar

Tsementzi, D. et al. Bacteria SAR11 vinculada a la anoxia oceánica y la pérdida de nitrógeno. Naturaleza 536, 179–183 (2016).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Duret, MT y col. Diversidad fraccionada por tamaño de comunidades microbianas eucarióticas en la zona mínima de oxígeno del Pacífico norte tropical oriental. FEMS Microbiol. Ecol. 91 (2015).

Padilla, CC et al. Bacterias NC10 en zonas de mínimo oxígeno marino. ISME J. 10, 2067–2071 (2016).

Artículo CAS PubMed PubMed Central Google Scholar

Henríquez-Castillo, C. et al. Metaomics revela la contribución de las bacterias Alteromonas al ciclo del carbono en zonas marinas con mínimo de oxígeno. Frente. Ciencia de marzo. 9, 993667 (2022).

Rii, YM et al. Diversidad y productividad de picoeucariotas fotosintéticos en regiones biogeoquímicamente distintas del Océano Pacífico Sudeste. Limnol. Oceanogr. 61, 806–824 (2016).

Artículo ANUNCIOS Google Académico

Boeuf, D. et al. La metapangenómica revela cambios dependientes de la profundidad en el potencial metabólico del omnipresente linaje bacteriano marino SAR324. Microbioma 9, 172 (2021).

Artículo CAS PubMed PubMed Central Google Scholar

Landry, Z., Swan, BK, Herndl, GJ, Stepanauskas, R. & Giovannoni, SJ Los genomas SAR202 del océano oscuro predicen vías para la oxidación de materia orgánica disuelta recalcitrante. MBio 8 (2017).

Torres-Beltrán, M. et al. Un compendio de información geoquímica de la columna de agua de la entrada de Saanich. ciencia Datos 4, 170159 (2017).

Artículo PubMed PubMed Central Google Académico

García, HE et al. World Ocean Atlas 2018: Oxígeno disuelto, utilización aparente de oxígeno y saturación de oxígeno. Atlas de la NOAA NESDIS. 3, 83 (2019).

Descargar referencias

Nos gustaría agradecer al capitán, la tripulación y los científicos a bordo del RV John Strickland y CCGS John P. Tully por sus extraordinarios esfuerzos en el campo durante muchos años, y a Miranda Harmon-Smith y Tijana Glavina del Rio en el DOE Joint Genome Institute ( JGI) para el apoyo a la gestión de proyectos. También agradecemos a los muchos ayudantes de pregrado en el laboratorio de Hallam y al personal de soporte técnico en alta mar, incluidos Jade Shiller y Chris Payne, por su apoyo en la recolección y el procesamiento de muestras a lo largo de los años. Un agradecimiento especial también a los miembros del laboratorio DeLong en la Universidad de Hawai'i en el Departamento de Oceanografía de Manoa y CMORE, el laboratorio de Stewart en la Escuela de Ciencias Biológicas del Instituto de Tecnología de Georgia, el laboratorio de Ulloa en el Departamento de Oceanografía de la Universidad de Concepción, el laboratorio de Jürgens en el Instituto Leibniz para la Investigación del Mar Báltico y Bigelow SCGC por contribuir con los SAG utilizados en este conjunto de datos. El trabajo (Análisis comparativo del genoma comunitario del océano Pacífico subártico: 10.46936/10.25585/60007478, Microbial Systems Ecology of Expanding Oxygen Minimal Zones in the Eastern Subtropical North Pacific Ocean: 10.46936/10.25585/60000795, Opening a single-cell genomic window on microbial selección de ecotipos en la expansión de zonas mínimas de oxígeno marino: 10.46936/10.25585/60000761, Going long and going deep: Comprehensive open ocean community single cell genoma sequencing at the model open ocean time series study site, station ALOHA: 10.46936/10.25585/60000920, Microbial and regulación viral del ciclo del carbono comunitario en diversas zonas de bajo oxígeno: 10.46936/10.25585/60000893, genómica microbiana de una sola célula del océano oscuro: 10.46936/10.25585/60000688, microbios unicelulares no cultivados GEBA: 10.46936/10.25585/60007913, Generación de genomas de referencia para ecosistemas marinos investigación: Secuenciación de células individuales de clados de bacterioplancton no cultivados y ubicuos: 10.46936/10.25585/60007356, Secuenciación del genoma de células individuales del bacterioplancton mesopelágico: 10.46936/10.25585/60007269) realizada por el Instituto Conjunto del Genoma del Departamento de Energía de EE. UU. (https://ror. org/04xm1d337), una instalación para usuarios de la Oficina de Ciencias del DOE, fue apoyada por la Oficina de Ciencias del Departamento de Energía de EE. UU. operada bajo el Contrato No. DE-AC02-05CH11231. Este trabajo también se realizó bajo los auspicios del Comité Científico de Investigación Oceanográfica (SCOR), las Fundaciones G. Unger Vetlesen y Ambrose Monell, el Consejo de Investigación de Ingeniería y Ciencias Naturales de Canadá, Genome British Columbia, la Fundación Canadiense para la Innovación y el Instituto Canadiense de Investigación Avanzada a través de subvenciones otorgadas a SJH SCGC análisis y RS fueron apoyados por subvenciones NSF 1826734, 1441717, 821374, 1335810, 1232982, 0826924; y las subvenciones de la Fundación Simons 510023 y 827839. OU recibió el apoyo de las subvenciones ICN12_019 y 1161483 de la Agencia Nacional de Investigación y Desarrollo (ANID) de Chile.

Álvaro M. Plominsky

Dirección actual: División de Investigación de Biología Marina, Instituto Scripps de Oceanografía, Universidad de California San Diego, La Jolla, CA, 92037, EE. UU.

Estos autores contribuyeron por igual: Julia Anstett, Alvaro M. Plominsky.

Programa de Posgrado en Ciencias y Tecnología del Genoma, Centro de Ciencias del Genoma, Universidad de Columbia Británica, Vancouver, Columbia Británica, Canadá

Julia Anstett y Steven J. Hallam

Departamento de Microbiología e Inmunología, Universidad de Columbia Británica, Vancouver, Columbia Británica, V6T 1Z3, Canadá

Julia Anstett, Álvaro M. Plominsky y Steven J. Hallam

Centro Daniel K. Inouye para Oceanografía Microbiana: Investigación y Educación, Universidad de Hawái, Manoa, Honolulu, HI, 96822, EE. UU.

Edward F. DeLong

Escuela de Ingeniería, Universidad de Columbia Británica, Kelowna, BC, Canadá

alyse kiesser

Instituto Leibniz para la Investigación del Mar Báltico, Warnemünde, Alemania

Klaus Jurgens

Programa de Posgrado en Bioinformática, Universidad de British Columbia, Vancouver, BC, V6T 1Z4, Canadá

Connor Morgan-Lang y Steven J. Hallam

Laboratorio Bigelow de Ciencias Oceánicas, East Boothbay, ME, EE. UU.

Ramunas Stepanauskas

Facultad de Ciencias Biológicas, Instituto de Tecnología de Georgia, Atlanta, GA, EE. UU.

franco j stewart

Centro de Infección y Dinámica Microbiana, Instituto de Tecnología de Georgia, Atlanta, GA, EE. UU.

franco j stewart

Departamento de Microbiología y Biología Celular, Universidad Estatal de Montana, Bozeman, MT, EE. UU.

franco j stewart

Departamento de Oceanografía, Universidad de Concepción, Casilla 160-C, 4070386, Concepción, Chile

osvaldo ulloa

Instituto Milenio de Oceanografía, Casilla 1313, 4070386, Concepción, Chile

osvaldo ulloa

Instituto Conjunto del Genoma del Departamento de Energía, Berkeley, CA, EE. UU.

Tanja Woyke y Rex Malmström

Genómica Ambiental y Biología de Sistemas, Laboratorio Nacional Lawrence Berkeley, Berkeley, CA, EE. UU.

Tanja Woyke y Rex Malmström

Instituto de Ciencias de la Vida, Universidad de Columbia Británica, Vancouver, BC, V6T 1Z3, Canadá

Steven J Hallam

Programa de capacitación ECOSCOPE, Universidad de Columbia Británica, Vancouver, BC, V6T 1Z3, Canadá

Steven J Hallam

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

JA, AMP y SJH concibieron el estudio. EFDL, KJ, RS, FJS, OU y SJH recogieron muestras. JA, AMP, AK, CML, RS, TW y SJH analizaron los datos y/o proporcionaron una interpretación gráfica de los datos. JA, AMP, AK y SJH compilaron datos, escribieron el manuscrito y generaron las cifras. Todos los autores han leído y contribuido al texto. Los SAG se generaron en el Bigelow Single Cell Genomics Center (SCGC). RS, TW y RM proporcionaron el FACS. y gráficos de cinética generados para la clasificación de células y la amplificación de ADN. Las células clasificadas se secuenciaron en el SCGC, el Instituto Conjunto del Genoma (JGI) del DOE, el Centro de Ciencias del Genoma Michael Smith de Canadá, el Instituto de Tecnología de Georgia, el BioMicroCenter del MIT, la Universidad Estatal de Oregón y el Laboratorio de Biología Marina. JA, CML, AMP recortaron y ensamblaron las lecturas cortas de Illumina en contigs para generar los ensamblajes SAG. JA (Otros coautores) descontaminaron las asambleas. JA agrupó las secuencias de amplicón. JA y AMP recopilaron datos y generaron las cifras que se muestran en este estudio.

Correspondencia a Steven J. Hallam.

SJH es cofundador de Koonkie Inc., una empresa de consultoría de bioinformática que diseña y proporciona soluciones escalables de análisis de datos y algoritmos en la nube.

Nota del editor Springer Nature se mantiene neutral con respecto a los reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

Acceso abierto Este artículo tiene una licencia internacional Creative Commons Attribution 4.0, que permite el uso, el intercambio, la adaptación, la distribución y la reproducción en cualquier medio o formato, siempre que se otorgue el crédito correspondiente al autor o autores originales y a la fuente. proporcionar un enlace a la licencia Creative Commons e indicar si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la regulación legal o excede el uso permitido, deberá obtener el permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.

Reimpresiones y permisos

Anstett, J., Plominsky, AM, DeLong, EF et al. Un compendio de genomas amplificados unicelulares de bacterias y arqueas de aguas marinas con deficiencia de oxígeno. Datos científicos 10, 332 (2023). https://doi.org/10.1038/s41597-023-02222-y

Descargar cita

Recibido: 26 Agosto 2022

Aceptado: 10 de mayo de 2023

Publicado: 27 mayo 2023

DOI: https://doi.org/10.1038/s41597-023-02222-y

Cualquier persona con la que compartas el siguiente enlace podrá leer este contenido:

Lo sentimos, un enlace para compartir no está disponible actualmente para este artículo.

Proporcionado por la iniciativa de intercambio de contenido Springer Nature SharedIt