Serveur d'impression

Une unité de covarying clairsemée décrivant le développement sain et altéré du microbiote intestinal chez l'homme – Bien choisir son serveur d impression

Par Titanfall , le 29 août 2019 - 57 minutes de lecture

Malnutrition et réparation alimentaire

La malnutrition chez les enfants s'accompagne d'un retard de croissance et d'une immaturité du microbiote intestinal. Même après une intervention thérapeutique avec des aliments complémentaires commerciaux standard, les enfants peuvent ne pas s'épanouir. Gehrig et al. et Raman et al. suivi des paramètres métaboliques chez les enfants bangladais en bonne santé et chez ceux qui se remettent d’une malnutrition aiguë sévère. Les auteurs ont étudié les interactions entre le régime alimentaire thérapeutique, le développement du microbiote et le rétablissement de la croissance. Les régimes ont ensuite été conçus à l'aide de modèles de porc et de souris pour inciter le microbiote à atteindre un état de post-sevrage mature susceptible de favoriser la croissance d'un enfant. Celles-ci ont d'abord été testées chez des souris inoculées avec un microbiote intestinal caractéristique de l'âge. Les régimes conçus entraînent la maturation du microbiote des enfants et mettent leurs profils métabolique et de croissance sur une trajectoire plus saine.

Science, ce numéro p. eaau4732, p. eaau4735

Résumé structuré

INTRODUCTION

Les écosystèmes tels que le microbiote intestinal humain sont généralement décrits par une «liste de pièces» avec énumération des éléments qui le composent. En conséquence, l'abondance des composants communautaires est couramment utilisée comme mesure pour relier sa configuration aux caractéristiques de son habitat et à l'état biologique de l'hôte. Bien que cette approche ait fourni de nombreuses informations, la structure et la fonction des systèmes biologiques sont émergentes et résultent de l'action collective de parties constituantes plutôt que de chacune de ces parties agissant isolément. Cette caractéristique exige une approche différente pour décrire la forme d'un microbiote, une approche prenant en compte les abondances ainsi que les interactions entre les membres.

RAISONNEMENT

En empruntant aux domaines de l’éconophysique et de l’évolution des protéines, où l’identification de la covariation conservée a permis de mieux comprendre l’organisation des systèmes dynamiques complexes, nous avons recherché des caractéristiques parmi la complexité apparemment insoluble des communautés microbiennes de l’intestin humain, qui pourrait servir de assembler et fonctionner.

RÉSULTATS

Un flux de travail statistique a été mis au point pour identifier la covariance conservée de taxon bactérien dans les communautés intestinales de membres sains d'une cohorte de naissance bangladaise qui ont fourni des échantillons de selles tous les mois entre les mois postnatals 1 à 60. Les résultats ont révélé un «écogroupe» de 15 taxa bactériens qui présentait une covariation constante à l’âge de 20 mois et au-delà. Les taxons des écogroupes ont également décrit le développement du microbiote intestinal chez les membres en bonne santé des cohortes de naissance résidant au Bangladesh, en Inde et au Pérou, dans une mesure comparable à ce qui est obtenu lorsque l'on considère tous les taxons bactériens détectés; Cette découverte suggère que le réseau des écogroupes est une caractéristique générale conservée de l'organisation du microbiote. En outre, l’écogroupe a fourni un cadre permettant de caractériser l’état de développement perturbé du microbiote chez les enfants bangladais souffrant de malnutrition aiguë sévère (SAM) et de malnutrition aiguë modérée (MAM), ainsi qu’un indicateur quantitatif permettant de définir l’efficacité des traitements thérapeutiques dirigés par rapport au microbiote. les aliments dans la reconfiguration de leurs communautés intestinales vers un état observé chez des enfants en bonne santé et du même âge vivant au même endroit. Ces résultats soulignent l’importance de l’écogroupe en tant que descripteur, à la fois pour des utilisations fondamentales et pratiques. Un consortium de taxons d’écogroups cultivés, introduit dans des porcelets gnotobiotiques, a reconstitué les changements dans leurs abondances relatives observés dans les communautés humaines alors que les animaux passaient d’une alimentation laitière exclusive à un état totalement sevré consommant un régime alimentaire typique du Bangladesh. Ce schéma de changement était en corrélation avec la représentation d'un ensemble de voies métaboliques rares dans les génomes de ces organismes et, à l'état totalement sevré, avec leur expression.

CONCLUSION

L'écogroupe représente une caractéristique simplifiée de l'organisation de la communauté et des composants pouvant jouer un rôle clé dans l'assemblage et le fonctionnement de la communauté. Alors que le microbiote intestinal est constamment confronté à des problèmes environnementaux, «intégrer» un réseau maigre de taxons hétérogènes dans un cadre plus vaste d’organismes variant de manière indépendante pourrait représenter une solution architecturale élégante développée par la nature pour maintenir la robustesse tout en permettant l’adaptation. L’approche utilisée pour identifier et caractériser le réseau maigre de taxons d’écogroupes covarying est, en principe, généralisable à une grande variété d’écosystèmes.

L'écogroupe est une description concise de la forme du microbiote.

(Haut) Diagramme de réseau des taxons de covariance où la couleur du nœud (taxon) indique un écogroupe (vert) ou non (écogroupe (gris)), la taille du nœud indique le nombre de taxons mutuellement covariants et la connexion entre les nœuds indique la covariance entre deux taxons. (En bas) La mesure de la représentation des taxons de l'écogroupe révèle que les enfants atteints de MAS traités avec des aliments thérapeutiques standard ont un profil d'écogroupe similaire à celui des enfants atteints de MAM non traitée, indiquant des perturbations persistantes dans leur communauté intestinale par rapport aux enfants en bonne santé. En revanche, les enfants atteints de MAM traités avec un aliment thérapeutique conçu pour cibler le microbiote (MDCF-2) ont un profil d'écogroupe qui chevauche presque entièrement celui d'enfants en bonne santé.

Abstrait

Caractériser l'organisation du microbiote intestinal humain est un défi de taille compte tenu du nombre d'interactions possibles entre ses composants. En utilisant une approche statistique initialement appliquée aux marchés financiers, nous avons mesuré la covariance conservée dans le temps entre les taxons bactériens dans le microbiote de membres sains d'une cohorte de naissance bangladaise échantillonnée entre 1 et 60 mois. Les résultats ont révélé un «écogroupe» de 15 taxons bactériens covarying décrivant de manière concise le développement du microbiote chez des enfants en bonne santé de ce pays et d’autres pays à faible revenu, ainsi qu’un moyen de surveiller la réparation communautaire chez les enfants sous-alimentés traités avec des aliments thérapeutiques. Les caractéristiques de la dynamique des populations d’écogroupes ont été récapitulées chez les porcelets gnotobiotiques alors qu’ils passaient d’une alimentation au lait exclusive à un état totalement sevré consommant un régime alimentaire représentatif du Bangladesh.

D'innombrables études sur le fonctionnement des systèmes biologiques ont souligné l'importance de caractériser les interactions entre leurs composants (15). Définir les communautés microbiennes de cette manière peut présenter un défi apparemment insoluble (13, 6). Par exemple, le tractus gastro-intestinal d'un être humain adulte en bonne santé héberge plusieurs espèces, avec plusieurs variants d'une même espèce au niveau de la souche, qui peuvent engager des interactions d'ordre supérieur avec d'autres membres de la communauté. En utilisant un nombre d'espèces conservateur de 100, le nombre de termes nécessaires pour représenter mathématiquement toutes les interactions d'espèce à espèce possibles (paires et ordre supérieur) est d'environ 1030. Une question centrale est de savoir comment identifier les interactions biologiquement importantes entre les composants afin de réduire le nombre de caractéristiques nécessaires à la caractérisation des propriétés de la communauté microbienne, telles que l’assemblage pendant la période postnatale ou les réponses temporelles à diverses perturbations.

L’analyse de cooccurrence a été utilisée pour décrire une organisation communautaire mais sa capacité à décrire les interactions entre microbes est limitée (7, 8). Des approches récemment développées se sont concentrées sur la définition des interactions microbilles à l’aide de données transversales (9, dix), bien que ces méthodes ne soient pas explicitement conçues pour traiter la conservation temporelle de ces interactions dans des études longitudinales, par exemple. Nous nous sommes donc tournés vers des approches développées dans les domaines de l’éconophysique et de l’évolution des protéines. L’application du concept de covariance statistique associée à des techniques analytiques de décomposition de la matrice a permis d’identifier des secteurs économiques co-fluctuants et des réseaux coopératifs d’acides aminés présentant un intérêt fonctionnel (1113). La présomption sous-jacente est que la covariation conservée est une covariation qui peut être informative sur l'organisation de systèmes dynamiques complexes.

Dans cet esprit, nous avons développé un flux de travail informatique pour calculer la covariance conservée dans le temps des taxons bactériens de l'intestin au fil du temps chez les membres d'une cohorte de naissance bangladaise en bonne santé, échantillonnés tous les mois pendant les cinq premières années postnatales. Les résultats ont révélé un réseau de 15 bactéries covarying que nous appelons un «écogroupe». Les taxons de l'écogroupe ne décrivent pas seulement le développement microbien de l'intestin en bonne santé chez les enfants résidant au Bangladesh, ainsi que dans plusieurs autres pays à revenu faible ou intermédiaire; ils distinguent également le microbiote des enfants bangladais souffrant de malnutrition aiguë modérée et grave non traitée et le degré de reconfiguration de ces communautés vers un état de santé en réponse à plusieurs interventions alimentaires thérapeutiques. La colonisation de porcelets exempts de germes avec un consortium de taxons d’écogroupes et leur suivi pendant la transition de l’alimentation au lait exclusive par sevrage à un régime représentatif consommé par des enfants bangladais récapitulent les caractéristiques d’un développement communautaire sain et révèlent des caractéristiques génomiques microbiennes et des attributs métaboliques exprimés Succession.

Identifier l'écogroupe

Trente-six membres d'une cohorte de naissance avec des scores anthropométriques toujours sains vivant dans le district de Mirpur à Dhaka, au Bangladesh, ont été soumis à un échantillonnage fécal mensuel pour les 60 premiers mois de la vie postnatale[scoreZpourlatailleenfonctiondel'âge(HAZ)–092±119(moyenne±DS);scoreZdepoidspourlataille(WHZ)–048±133;[height-for-ageZscore(HAZ)–092±119(mean±SD);weight-for-heightZscore(WHZ)–048±133;n = 1961 échantillons fécaux, 55 ± 4 échantillons prélevés par individu; tableau S1]. Au Bangladesh, la durée médiane d'allaitement est de 4 mois, alors que le processus de sevrage est long, avec une médiane de 25 mois (14). Les échantillons prélevés moins fréquemment, ou seulement après 36 mois, de 19 autres enfants de Mirpur ont également été inclus dans notre analyse (HAZ, –0,58 ± 1,12; WHZ, –0,25 ± 0,96; n = 25,7 ± 10,5 échantillons par enfant). Amplicons générés à partir de la région variable 4 (V4) de la bactérie 16S Les gènes d'ARNr présents dans ces 2455 échantillons de selles ont été séquencés et les lectures résultantes ont été attribuées à des unités taxonomiques opérationnelles présentant au moins 97% d'identité de séquence nucléotidique (97% d'identificateurs OTU) (15, 16) (fig. S1). Au total, 118 UTO avec ID à 97% étaient représentées avec une abondance relative d'au moins 0,001 (0,1%) dans au moins deux des échantillons recueillis au cours de la période de 60 mois.

Une première description générale du développement du microbiote dans cette cohorte a été obtenue en appliquant UniFrac non pondéré et pondéré pour calculer la dissimilarité phylogénétique globale entre les communautés intestinales des 36 enfants échantillonnés tous les mois de 1 à 60 mois et de 49 échantillons fécaux recueillis lors d'une étude précédente auprès de 12 adultes non apparentés. , âgé de 23 à 41 ans, résidant à Mirpur (17). Cette mesure indique que la distance moyenne «nourrisson / enfant à adulte» diminue pour passer de «adulte à adulte» à 3 ans (fig. S2, A et B). La diversité alpha a également augmenté jusqu'à atteindre un niveau comparable à celui d'un adulte au cours de cette période (fig. S2, C et D). Comme description supplémentaire du développement communautaire, nous avons utilisé le 16S Jeu de données ADNr pour construire un modèle dérivé de forêts aléatoires (RF) clairsemées comprenant des taxons discriminants pour l'âge (fig. S3, A à E). L’âge du microbiote peut être calculé en notant les fractions d’abondance de ces taxons discriminatoires pour l’âge dans un échantillon donné, obtenues à un moment donné (14). L’application du modèle généré par RF a révélé un degré élevé de corrélation entre l’âge du microbiote et l’âge chronologique (R2 = 0,8) (fig. S3C). Bien que ces approches fournissent des mesures du développement de la communauté, elles ne caractérisent pas les interactions entre les membres de la communauté au cours de ce processus.

L'analyse en composantes principales (ACP) appliquée aux taxons présents dans des échantillons fécaux mensuels permet de caractériser mathématiquement l'organisation du microbiote intestinal en définissant des composantes principales (vecteurs propres). Le résultat de la PCA est une liste classée des principales composantes (spectre de la composante principale ou «spectre électronique»), chaque composante principale comportant un pourcentage de variance des données. Suivre le spectre des composantes principales dans le temps offre une description de l’organisation temporelle en évolution du microbiote intestinal. L'approche utilisée, la PCA itérative (iPCA), est décrite à la fig. S4A. Pour chaque mois, nous avons créé une matrice dans laquelle les lignes étaient des échantillons de matières fécales et les colonnes comprenaient les 118 taxons décrits ci-dessus. Dans l'exemple présenté, le point temporel 1 prend en compte les données d'abondance fractionnaires mensuelles du mois 1 et un point temporel de référence. La dissimilarité entre les deux points de temps est reflétée dans la composante principale principale (PC1). Le système est considéré comme "stable" au moment où l’ajout des données des mois suivants contribue négligeable à la variance; mathématiquement, c'est lorsque la valeur propre de PC1 atteint une asymptote.

Nous avons effectué iPCA sur des données mensuelles jointes de manière séquentielle avec le mois 36 pris comme référence (fig. S4B). Le mois 36 a été choisi sur la base des résultats des mesures de dissimilarité phylogénétique et de diversité présentées à la fig. S2[notezquedesétudestransversalesprécédentesutilisantcesmesuresavaientégalementindiquéqu'uneconfigurationsemblableàcelled'unadulteavaitétéatteinteàcemomentprécis;parexemple([notethatpreviouscross-sectionalstudiesusingthesemetricshadalsoindicatedthatanadult-likeconfigurationwasachievedbythistimepoint;eg(18)]. iPCA a révélé que le vingtième mois et au-delà signifiaient une période de variation structurelle minimale du microbiote intestinal (fig. S4B). Cette conclusion a été étayée par l’utilisation du tout dernier point de l’étude longitudinale de 5 ans comme référence (fig. S4C). Par conséquent, nous avons pu concevoir un flux de travail permettant de calculer une covariance reproductible (covariance conservée dans le temps dans un assemblage de communauté mature, par opposition à une covariance transitoire pouvant survenir lors de l’assemblage de communauté) en utilisant les mois 20 à 60 sans avoir à faire des hypothèses a priori l'importance de tout taxon. Pour chaque mois couvrant les 20 à 60 mois postnatals, nous avons calculé la covariance entre les 118 taxons de tous les individus afin de générer des matrices mensuelles de covariance taxon-taxon (19) (voir fig. 1A, fig. S5 et tableau S2A). Les matrices ont été moyennées selon une matrice taxon-taxon unique (<Cpoubelleje,j>t) qui représentait une définition de la covariance cohérente où je et j sont des taxons bactériens et t désigne le mois (Fig. 1B et tableau S2B). L'ACP réalisée sur cette matrice a révélé que PC1 englobait 80% de la variance des données (figure 1C; voir le texte complémentaire pour une analyse de sensibilité du flux de travail). Un groupe de 15 taxons de covarying représentait les 20% supérieurs de toutes les projections de taxons le long de PC1 (figure 1C; voir le tableau S3 pour connaître les différents seuils de seuil). Ils comprennent les OTU attribuées Bifidobacterium longum, un autre membre de Bifidobacterium, Faecalibacterium prausnitzii, membre de Clostridiales, Prevotella copri, Streptococcus thermophilus, et Lactobacillus ruminisqui sont toutes des souches bactériennes discriminantes en fonction de l’âge identifiées à partir de l’analyse par radiofréquence de bactéries 16S Les ensembles de données d'ADNr générés à partir de membres en bonne santé de cette cohorte bangladaise (fig. S3D).

Fig. 1 Définir un réseau de taxons bactériens («écogroupe») clairsemé et constamment convoité chez des enfants bangladais en bonne santé.

(UNE) Flux de travail. Gauche: 16S Séquençage d'ADNr d'échantillons de microbiote fécal prélevés chaque mois auprès de membres en bonne santé de la cohorte de naissance des mois 20 à 60 ans après la naissance. Une matrice est créée pour chaque rangée, où les lignes sont des taxons et les colonnes, des échantillons de selles. Centre: Des matrices de covariance taxon-taxon sont calculées pour chaque mois. Droite: Les matrices mensuelles de covariance taxon-taxon sont normalisées par rapport à la valeur de covariance mensuelle maximale. Si une valeur de covariance mensuelle normalisée pour une donnée (je, j) la paire taxon-taxon se situe dans les 10% supérieurs ou inférieurs de toutes les valeurs de covariance mensuelles, elle est convertie en «1»; sinon, on lui attribue un «0». Cette matrice de covariance binarisée est définie comme Cpoubelleje,j. Concaténation Cpoubelleje,j pour tous les mois crée une matrice en trois dimensions, (Cpoubelleje,j)t. (B) Matrice de covariance taxon-taxon conservée temporairement. Les valeurs de covariance binarisées pour chaque (je, j) paire de taxa dans (Cpoubelleje,j)t sont moyennés sur tous les mois pour donner une valeur de covariance pondérée dans le temps pour chaque paire taxon-taxon (<Cpoubelleje,j>t). Dans la limite où deux taxons sont toujours proches l'un de l'autre, <Cpoubelleje,j>t = 1. Si deux taxons ne se rencontrent jamais, <Cpoubelleje,j>t = 0. La matrice illustrée illustre un couplage conservé dans le temps et clairsemé, de nombreux taxons ne montrant aucune covariance constante (<Cpoubelleje,j>t 0; pixels blancs), mais quelques-uns présentent un degré élevé de covariance conservée (<Cpoubelleje,j>t ≥ 0,5; pixels rouge foncé). (C) Composition eigend de la matrice de covariance conservée dans le temps. Notez que 80% de la variance des données dans <Cpoubelleje,j>t peut être représenté par un seul composant principal. L'histogramme montre les projections de taxons le long de PC1; les données sont ajustées à une distribution généralisée des valeurs extrêmes (ligne rouge). L'application d'un seuil de 20% à cette distribution identifie 15 taxons qui sont reproduits de manière reproductible dans le temps. () Échantillons de matières fécales des mois postnatals 50 à 60 indiqués sur un espace PCA ordonné par les 15 taxons indiqués en (C). Les cartes thermiques illustrent l'abondance fractionnelle des taxons responsables de la variance le long de chaque composante principale. La boîte bleue située dans la partie gauche de la projection le long de PC1 met en évidence le sous-ensemble d’enfants en bonne santé qui présentent une forte P. copri relatif à B. longum. (E) Représentation graphique du réseau de covariants clairsemés de 15 taxons (nœuds verts). Voir le texte pour plus de détails.

Les résultats de la PCA réalisés sur des données générées à partir de 478 échantillons prélevés sur des enfants échantillonnés aux mois postnatals 50 à 60 fournissent une illustration de la covariation statistique entre ces taxons: PC1 révèle que B. longum (OTU 559527) et L. ruminis (OTU 1107027) positivement covary les uns avec les autres et négativement covary avec deux P. copri souches (OTU 840914 et 588929); PC2 documente comment deux F. prausnitzii OTU (514940 et 851865) positivement covary les uns avec les autres et négativement covary avec S. gallolyticus (OTU 349024) et E. coli (OTU 1111294); PC3 révèle que les deux P. copri OTUs négativement covary avec les deux F. prausnitzii OTU (Fig. 1D).

La figure 1E fournit une représentation graphique de ce réseau de taxons covarying. Chaque nœud vert représente l’une des 15 OTU présentant un degré élevé de covariance conservée entre les mois 20 et 60. Deux nœuds sont reliés par un bord si leur valeur de covariance moyennée dans le temps (<Cpoubelleje,j>t de la Fig. 1B) se situe dans les 20% supérieurs de toutes ces valeurs. La taille du nœud est proportionnelle au nombre de connexions (bords) présentes. Les nœuds verts sont collectivement convaires les uns avec les autres. En revanche, les noeuds gris représentent des taxons qui sont covary avec des noeuds verts mais pas les uns avec les autres (figure 1E). Les nœuds verts constituent une écostructure «isolée»; ses membres présentent une covariation intragroupe significative (fig. S6 et tableau S2C). Nous avons choisi le terme «écogroupe» pour refléter la covariation statistique collective conservée de ce réseau maigre de 15 organismes.

Développement du microbiote dans d'autres cohortes de naissance

Nous avons demandé si les composants de l'écogroupe fournissaient une description concise du développement postnatal du microbiote chez les membres en bonne santé de la cohorte bangladaise et, dans l'affirmative, si les changements dans la représentation de ces taxons suivent un schéma commun à d'autres cohortes en bonne santé représentant différentes. lieux géographiques et caractéristiques anthropologiques (20). De plus, nous avons postulé que si les taxons d’écogroupe sont des biomarqueurs informatifs du développement communautaire normal, ils pourraient être utiles pour caractériser le développement altéré et / ou la mesure dans laquelle la réparation de la communauté est réalisée en fonction de diverses interventions thérapeutiques (21).

Trois matrices différentes ont été créées, chaque rangée représentant un échantillon fécal prélevé sur un individu à un mois donné de la cohorte bangladaise en bonne santé et les colonnes, soit (i) les 118 taxons, (ii) les 15 taxons d’écogroupe, ou (iii) les 103 taxons hors écogroupe. La PCA a été réalisée sur les lignes de ces matrices; Des échantillons de matières fécales ont été tracés sur les trois premiers composants principaux. Le panneau de gauche de la figure 2A montre les résultats obtenus en considérant la représentation fractionnée de tous les 118 taxons dans les échantillons de selles prélevés aux mois 4, 10 et 20 après la naissance. Il existe une variation importante dans la structure de la communauté intestinale au premier mois après la naissance, par la large distribution le long de PC1, mais cette variation converge au 4e mois (Fig. 2A, fig. S7, A et B et tableau S2D). Par la suite, les modifications de la structure du microbiote fécal sont décrites par un mouvement de droite à gauche le long de PC1, avec une variance mineure observée le long de PC2 et de PC3. Un mouvement minimal le long de PC1 est observé après le mois 20 (fig. S7C), conformément aux résultats obtenus par iPCA sur les fig. S4, B et C. (Notamment, les enfants de cette cohorte avaient terminé le sevrage au 23e mois; voir la fig. S8 pour une description de la nature et du moment de leurs transitions alimentaires.) Les taxons de l'écogroupe récapitulent la variance décrite par PC1, PC2 et PC3. De plus, les taxons de l'écogroupe capturent (i) la variation interpersonnelle importante observée au mois 1 postnatal, (ii) la convergence ultérieure vers un B. longum– microbiote prédominant au 4 e mois après la naissance et iii) aux changements temporels observés aux 10 et 20 mois après la naissance (Fig. 2, A et B, fig. S7, A et B, panneaux du milieu et tableau S2E). En revanche, les 103 autres taxa non écogroupes fournissent une représentation moins informative des modifications du développement du microbiote, comme le montre le fait que PC1, PC2 et PC3 capturent chacun ≤ 10% de la variance (Fig. 2A et Fig. S7). , A et B, panneaux de droite). L’importance des taxons à faible abondance moyenne et aux écarts types importants, tels que P. copri (Fig. 2B, encadré), est souvent négligé quand ils sont considérés isolément. Cependant, l’analyse de la covariation taxon-taxon peut révéler des relations entre les espèces membres, comme illustré par P. copri et B. longum (Fig. 1D, boîte bleue).

Fig. 2 Caractérisation du développement sain du microbiote intestinal dans la cohorte de naissance du Bangladesh.

(UNE) Des espaces PCA ont été créés. Chaque point dans les espaces représente un échantillon fécal décrit par tous les taxons présents dans une fraction d'abondance supérieure à 0,001 (0,1%) (118 taxons), des taxons d'écogroupe (15) ou des non-écogroupes (103). La distribution spatiale des échantillons fécaux dans chaque espace PCA est indiquée pour les mois postnatals indiqués. (B) Graphique à barres illustrant l’abondance fractionnaire moyenne des taxa d’écogroupes en fonction du mois postnatal (voir tableau S2E). Encadré: Abondance fractionnaire moyenne (± ET) de P. copri en fonction du temps.

Pour déterminer dans quelle mesure l’écogroupe est un descripteur généralisable du microbiote chez les nourrissons et les enfants présentant un phénotype de croissance saine, nous nous sommes tournés vers le réseau de sites d’étude MAL-DE situé dans les pays à revenu faible et intermédiaire (20, 21). Des échantillons fécaux ont été collectés mensuellement pendant les deux premières années postnatales, ce qui a permis de générer des modèles de développement communautaire normal générés par 30 taxons et générés par RF, à partir de membres de cohortes de naissance résidant à Loreto, au Pérou (zone périurbaine) et à Vellore, en Inde (zone urbaine). ) (texte complémentaire, fig. S9 et tableau S4). Notre capacité à identifier un réseau de taxons de substitution dans la cohorte Mirpur dépendait d'une étude de séries chronologiques à haute résolution qui s'étendait bien au-delà du mois au cours duquel le microbiote était considéré comme «stable» (mois 20). Cette durée d'échantillonnage ne s'est pas produite sur ces autres sites MAL-DE, ce qui nous a empêchés d'identifier la covariance conservée parmi les taxons. Cependant, pour tester dans quelle mesure les 15 taxons d’écogroupe identifiés dans la cohorte Mirpur pourraient caractériser le développement du microbiote des enfants vivant dans ces pays, nous avons créé deux matrices dans lesquelles chaque rangée correspond à un échantillon de microbiote fécal provenant des cohortes indiennes ou péruviennes et les colonnes étaient toutes taxons identifiés dans les échantillons péruvien et indien ou seulement les 15 taxons d’écogroupe identifiés dans la cohorte de naissance du Bangladesh. La PCA a été réalisée sur les lignes de ces matrices et la même analyse a été effectuée comme décrit pour la cohorte de naissance bangladaise en bonne santé. Les résultats montrent que les taxons des écogroupes identifiés parmi les membres de la cohorte bangladaise en santé fournissent également une description concise du développement communautaire des membres sains de ces deux autres cohortes de naissance; c’est-à-dire que (i) ils capturent la variance décrite par PC1, PC2 et PC3 par rapport à la prise en compte de tous les taxons, et (ii) les changements dans leurs abondances fractionnaires ont suivi des schémas temporels similaires à ceux documentés dans la cohorte du Bangladesh (fig. S10 et table S2F).

Écogroupe dans la malnutrition aiguë avant et après le traitement

Les enfants bangladais souffrant de malnutrition aiguë ont perturbé le développement du microbiote; leurs communautés intestinales apparaissent plus jeunes que celles d'individus chronologiquement appariés (14, 21). Nous avons examiné si les taxons des écogroupes constituaient un moyen utile de caractériser le microbiote des enfants atteints de malnutrition aiguë modérée ou grave (MAM et SAM, respectivement) avant et après les interventions thérapeutiques basées sur les aliments. Dans le document d'accompagnement, Gehrig et al. décrivent 63 enfants de Mirpur âgés de 12 à 18 mois ayant reçu un diagnostic de MAM et qui ont été inscrits à un essai d'alimentation contrôlée randomisé en double aveugle portant sur différents aliments complémentaires dirigés contre le microbiote (MDCF) (21). Des échantillons de matières fécales ont été collectés pendant 9 semaines à intervalles hebdomadaires. Les deux premières semaines comprenaient une période d'observation avant traitement. Au cours des quatre semaines suivantes, les enfants ont reçu soit un des trois MDCF, soit un complément alimentaire prêt à l'emploi (RUSF), représentant une forme de traitement conventionnel qui, contrairement aux MDCF, n'était pas conçu pour cibler des membres spécifiques du microbiote intestinal et réparer l'immaturité de la communauté. Les deux dernières semaines représentent la période d'observation post-traitement. Au total, nous avons identifié 945 UTO à ID 97% présentant une abondance fractionnelle d’au moins 0,001 (0,1%) dans au moins deux échantillons de selles prélevés sur un ou plusieurs participants avant, pendant et après le traitement (n = 531 échantillons). Gehrig et al. (21) décrivent également un autre essai portant sur 54 enfants bangladais hospitalisés atteints de MAS, âgés de 6 à 36 mois, dans lequel chaque participant a été traité avec l'un des trois aliments thérapeutiques standard, puis suivi sur une période de 12 mois après sa sortie. Au total, nous avons identifié 944 UTO avec ID à 97% présentant une abondance fractionnelle d’au moins 0,001 dans au moins deux échantillons de selles prélevés sur un ou plusieurs participants à cet essai (n = 618 échantillons).

Une matrice a été créée comprenant (i) tous les échantillons de selles de l’essai SAM, (ii) des échantillons de prétraitement provenant d’enfants atteints de MAM inscrits dans les quatre bras de l’essai MDCF, (iii) des échantillons de MAM obtenus 2 semaines après le traitement avec l’un des deux trois MDCF ou RUSF, et (iv) des échantillons de selles d'enfants bangladais en bonne santé appariés selon l'âge (tableau S5). Chaque ligne de la matrice était un échantillon de matières fécales, chaque colonne était un taxon d’écogroupe et chaque élément de la matrice était l’abondance fractionnelle d’un taxon d’écogroupe dans un échantillon de matières fécales particulier. La PCA a été réalisée sur les lignes de cette matrice. Les centroïdes de chaque cohorte ont été calculés et représentés graphiquement sur l'espace PCA (Fig. 3A). Au moment de la sortie, après avoir reçu des aliments thérapeutiques standard, le microbiote des enfants atteints de MAS restait dans un état de réparation incomplète: Bien qu’il y ait eu une certaine amélioration un mois après la sortie, il n’y avait que très peu d’améliorations supplémentaires évidentes à 6 ou 12 mois, après quoi fois leur microbiote ressemblait à celui des enfants non traités atteints de MAM (Fig. 3A). Les microbiotes des enfants atteints de MAM traités avec MDCF-1, MDCF-3 et RUSF se sont regroupés, alors que le microbiote de ceux traités avec MDCF-2 ressemblait beaucoup à celui d'enfants en bonne santé. Notamment, le MDCF-2 était également différent parmi les quatre types de traitement en provoquant des modifications du protéome plasmatique indiquant une amélioration de l'état de santé, notamment des modifications des biomarqueurs et des médiateurs du métabolisme, de la croissance osseuse, du développement du système nerveux central et de la fonction immunitaire[voir([see(21) pour plus de détails].

Fig. 3 Les taxons des écogroupes définissent la réponse du microbiote des enfants atteints de MAS et de MAM à diverses interventions nutritionnelles.

(UNE) Les centroïdes de chaque cohorte indiquée sont tracés sur un espace PCA. Les flèches indiquent la progression temporelle de la reconfiguration du microbiote chez les enfants atteints de MAS traités par un traitement conventionnel et les enfants atteints de MAM traités avec un RUSF ou un MDCF. (B) La décomposition matricielle des axes illustrés en (A) met en évidence les taxons importants pour la variance des échantillons fécaux observée le long de chaque composante principale. (C et ) Abondance fractionnaire moyenne des taxa d’écogroupes identifiés en (B) dans le microbiote fécal des membres des cohortes SAM et MAM en fonction du traitement (voir tableau S2G).

La PCA mesure l’effet du traitement sur le microbiote intestinal en prenant en compte une constellation de changements dans l’abondance fractionnelle des taxons d’écogroupe, en partant du principe que les abondances fractionnelles ainsi que la covariation de ces taxons sont importantes pour caractériser la configuration de la communauté. Le panneau de gauche de la figure 3B montre que la relation entre les représentations fractionnaires de B. longum (OTU 559527) et E. coli (OTU 1111294) détermine la position du microbiote le long de PC1 sur la figure 3A. Les panneaux central et droit de la figure 3B montrent que la relation entre les représentations fractionnaires de B. longum, E. coli, S. gallolyticus (OTU 349024), et P. copri (OTU 588929 et 840914) détermine la position le long de PC2, tandis que la position le long de PC3 reflète la relation entre les abondances de S. gallolyticus et les deux P. copri OTU. B. longum, S. gallolyticus, et E. coli sont les taxons prédominants des écogroupes représentés dans le microbiote des enfants atteints de MAS non traitée (Fig. 3C et tableau S2G). Le traitement entraîne un mouvement de leur microbiote le long des PC1 et PC3 sur la figure 3A; ce mouvement est associé à une diminution de B. longum, S. gallolyticus, et E. coli (Fig. 3C et tableau S2G). Les différences entre le microbiote d'enfants en bonne santé et d'enfants atteints de MAS avant et pendant les 12 mois suivant le traitement avec des aliments thérapeutiques standard se manifestent par des différences dans leurs positions respectives le long des PC1 et PC3 (Fig. 3A). Ces différences signifient une réparation incomplète de l’état «sain» et soulignent la nécessité de réduire encore l’abondance fractionnelle de B. longum (associé à un mouvement à droite de PC1) ainsi qu’à une diminution supplémentaire de l’abondance fractionnelle de S. gallolyticus et augmente de P. copri (associé à un mouvement positif le long de PC3). La représentation de B. longum, P. copri, S. gallolyticus, et E. coli dans le microbiote d'enfants âgés de 12 à 18 mois atteints de MAM non traitée explique leur projection positive le long des PC1 et PC3 par rapport au microbiote des enfants atteints de MAS non traitée (figure 3A). Parmi les aliments thérapeutiques testés, MDCF-2 était associé de manière unique à un mouvement positif le long de PC1 (Fig. 3A); cela correspond à une diminution de l'abondance fractionnelle de B. longum (Fig. 3D et tableau S2G) et une réparation plus complète de la communauté.

Deux autres méthodes, SparCC et SPIEC-EASI, ont été utilisées pour décrire l’organisation du microbiote (9, dix). Ces méthodes étant conçues pour des études transversales, nous les avons adaptées (voir texte complémentaire) afin de pouvoir comparer leur capacité à identifier (i) les aspects conservés dans le temps de l’organisation communautaire et (ii) le degré de microbiote de SAM et de MAM. réparé avec différentes interventions basées sur l'alimentation avec l'approche que nous avions utilisée pour identifier l'écogroupe. SparCC identifies a subset of ecogroup taxa that describe healthy gut microbiota development in members of the 5-year healthy Bangladeshi cohort study (fig. S11, A and B). SparCC clearly separates the microbiota of children with untreated SAM from healthy controls and shows that treatment with standard therapeutic foods fails to repair their microbiota to a healthy state, or even to a state seen in children with untreated MAM. Compared to the approach described in Fig. 1A, SparCC does not as clearly separate MAM from healthy or (by extension) the differential effects of MDCF treatment, although it does place MDCF-2–treated microbiota closest to that of healthy children (fig. S11C). One explanation is that P. copri does not contribute as prominently to the collective group of correlated taxa identified by SparCC (fig. S11 and table S6, A and B). SPIEC-EASI identifies P. copri and other Prevotella OTUs as key microbes (fig. S12, A and B, and table S6, C to E). However, SPIEC-EASI does not provide as informative a description of the temporal pattern of healthy gut microbial development as does the ecogroup taxa [note the relative lack of movement over time of community configuration from right to left along PC1 in fig. S12C compared to Fig. 2A (ecogroup taxa) and fig. S11B (SparCC)]. The 15 interacting taxa identified by SPIEC-EASI separate untreated and treated SAM and MAM microbiota from one another and from healthy (fig. S12D). As with the two other approaches, although less clearly than with the ecogroup taxa, SPIEC-EASI shows that MDCF-2 is most effective in changing the configuration of the MAM-associated microbiota toward a healthy state relative to MDCF-1, MDCF-3, and RUSF. Together, these findings provide support for considering temporally conserved taxon-taxon covariance when characterizing the microbiota of children with undernutrition prior to and after various therapeutic interventions.

Ecogroup taxa in a gnotobiotic piglet model of postnatal Bangladeshi dietary transitions

Our observations raise questions about the nature of the interactions among B. longum, P. copri, and other ecogroup taxa during postnatal development as a function of the dietary transitions that occur when children progress from exclusive milk feeding to complementary feeding to a fully weaned state. To address this issue, we colonized germ-free piglets with ecogroup taxa and tracked the dynamics of consortium members over time. We turned to gnotobiotic piglets rather than mice because the former have physiologic and metabolic qualities more similar to that of humans (22). Piglets were derived as germ-free at birth and were fed an irradiated sow’s-milk replacement (Soweena) for the first four postnatal days (fig. S13A). Piglets (n = 5) were then colonized, by oral gavage, with a consortium of seven cultured, sequenced B. longum strains recovered from the fecal microbiota of children living in Mirpur, Bangladesh as well as three other countries (Peru, Malawi, and the United States) (fig. S13A). On the basis of their genome sequences (table S7), six strains were classified as B. longum sous-espèce infantis and one as B. longum sous-espèce longum. The gavage mixture also contained two Bifidobacterium breve strains, which we used as comparators to delineate factors that contribute to the fitness of the B. longum strains, given the phylogenetic similarity of their genomes. Beginning on postnatal day 4, a diet representative of that consumed by 18-month-old children living in Mirpur[Mirpur-18([Mirpur-18(21)]was added to food bowls containing Soweena. On postnatal day 7, piglets were gavaged with a second consortium consisting of 16 additional cultured sequenced ecogroup taxa (fig. S13A) representing 13 of the 15 species shown in Fig. 1C. During postnatal days 5 to 22, the amount of Mirpur-18 added to food bowls was progressively increased while the amount of Soweena was decreased; once a fully weaned state was achieved on day 22, animals were monotonously fed the Mirpur-18 diet until they were euthanized on postnatal day 29. Piglets increased their weight by 185 ± 31% (mean ± SD) between postnatal days 7 and 29.

To define features in ecogroup strains that relate to their fitness during the series of dietary transitions that mimic those experienced by children living in Mirpur, we performed short-read shotgun sequencing of community DNA prepared from rectal swabs obtained at 11 time points spanning experimental days 5 to 29 (fig. S13A) and along the length of the gut at the time of euthanasia. The results are presented in Fig. 4A and table S2H. After gavage of remaining ecogroup members, the representation of all B. longum strains diminished rapidly. From postnatal day 8 to day 22, as the animals were being weaned, S. gallolyticus, E. coli, E. avium, L. salivarius, et P. copri exhibited distinct patterns of temporal change in their representation. After the animals were fully weaned, there was a pronounced increase in P. copri, which became the dominant member of the cecal, colonic, and fecal microbiota (Fig. 4A and fig. S13B). The relationship between the abundances of P. copri et B. longum is comparable in these piglets to that observed in the healthy Bangladeshi children who were used to evaluate the microbiota configurations of untreated and treated children with MAM and SAM (Fig. 3, C and D).

Fig. 4 Distinguishing genomic features related to the fitness landscape of ecogroup strains in gnotobiotic piglets.

(UNE) Average fractional abundances of strains plotted over time (see table S10). The summary of the experimental design shows when the various taxa were first introduced by gavage and how the diet changed over time. See fig. S13A for complete strain designations. (B) Genome features that distinguish among strains whose average fractional abundances in the fecal microbiota of piglets was ≥0.001 between postnatal days 8 and 22. These distinguishing features are mcSEED metabolic phenotypes color-coded according to whether they are predicted to endow the host strain with prototrophy for amino acids and B vitamins or the capacity to utilize the indicated carbohydrate. Strains are hierarchically clustered according to the representation of these metabolic pathways. (C) Heat map depicting the fractional representation of the strains shown in (B) at the indicated time points. Strains are hierarchically clustered according to the mcSEED metabolic phenotypes in (B). Note that the pattern of clustering defined by phenotypes also clusters strains by their fitness.

The representations of 81 mcSEED metabolic modules (see methods) in strain genomes were used to make in silico predictions about their capacity to synthesize amino acids and B vitamins, utilize a variety of carbohydrates, and generate short-chain fatty acids. Predicted phenotypes were scored as either a “1” or a “0” signifying auxotrophy or prototrophy in the case of amino acid and B-vitamin biosynthesis, or the ability or inability to utilize various carbohydrates (table S8). PCA of a “binary phenotype matrix” of all strains present at a fractional representation of ≥0.001 in fecal samples collected from postnatal day 8 to day 18 identified 14 carbohydrate utilization pathways, plus the capacity to synthesize cysteine, folate, and pantothenate as genomic features that distinguish these strains from each other (table S9). Hierarchical clustering by these predicted metabolic phenotypes also grouped these strains by their fitness (Fig. 4, B and C).

We performed microbial RNA-seq using cecal contents to characterize the expression of genes encoding components of mcSEED metabolic modules present within the ecogroup strains.[Thefractionalrepresentationsofthesestrainsinthececumandfecesatthetimeofeuthanasiawerehighlycorrelated([Thefractionalrepresentationsofthesestrainsinthececumandfecesatthetimeofeuthanasiawerehighlycorrelated(r2 = 0.98; table S10).]Figure S14A illustrates the workflow used to generate a mcSEED “enrichment matrix” (ME) that signifies the extent to which the aggregate transcript levels of components of a given mcSEED metabolic module in a given bacterial strain quantitatively differ from that of a reference strain. Parce que P. copri had the highest fractional representation on postnatal day 29, it was used as the reference (fig. S14B and table S2I). PCA was performed on the mcSEED enrichment matrix (Fig. 5A and table S11A). The results revealed that the transcriptomes of Bifidobacterium strains cluster together and are distinct from those of P. copri, E. coli, B. luti, et E. avium. Moreover, the distribution of strains along PC1 based on their mcSEED enrichment profiles correlated with their fractional representation (fitness) in the cecal and fecal microbiota (Fig. 5A, inset).

Fig. 5 Distinguishing features of mcSEED metabolic module expression related to the fitness of ecogroup strains in weaned gnotobiotic piglets.

See fig. S13A for full strain designations. (UNE) The transcriptomes of cecal community members were classified on the basis of gene assignments to 81 mcSEED metabolic modules (see count matrix in fig. S14B). Each strain is plotted on the first two principal components of the enrichment matrix in fig. S14B. The inset shows that fractional representation (fitness) of strains correlates with their expression profiles as judged by position along PC1. (B) Singular value decomposition (SVD, fig. S14C) identifies which among the 81 expressed metabolic modules most distinguish the indicated strains in the cecal community and Mirpur-18 diet contexts (fig. S14D). (C) Expressed discriminatory metabolic modules identified by SVD in (B) are shown as complete or incompletely represented in the genomes of the indicated strains by red pixels (predicted prototrophy for the amino acid or the ability to utilize the carbohydrate shown) or by white pixels (auxotrophy or the inability to utilize the carbohydrate). Strains and metabolic modules are hierarchically clustered.

To identify which expressed components of mcSEED metabolic modules contribute to the differences in the fractional representation, we required a way to relate the principal components of the rows (metabolic modules) and columns (strains) of the mcSEED enrichment matrix. To do so, we used singular value decomposition (SVD; fig. S14, C and D). Relative to P. copri, the most distinguishing features of the Bifidobacterium transcriptomes were markedly reduced or absent expression of pathways involved in (i) biosynthesis of cysteine, tyrosine, tryptophan, and asparagine; (ii) utilization of several carbohydrates (xylose and β-xylosides plus galacturonate/glucuronate/glucuronide); (iii) biosynthesis of queuosine; and (iv) uptake of cobalt related to cobalamin biosynthesis (Fig. 5B and tables S2J and S11B). Moreover, expression of four of these pathways (cysteine and asparagine biosynthesis; xylose/β-xyloside and galacturonate/glucuronate/glucuronide utilization) exclusively differentiate P. copri, B. luti, E. coli, et E. avium from all nine Bifidobacterium species and the other five strains whose transcripts were represented in the community metatranscriptome (Fig. 5B).

The biological significance of expression of these distinguishing mcSEED metabolic modules demanded a further contextualization based on whether these systems were complete or incompletely represented in the strain genomes. Figure 5C shows that all of the Bifidobacterium strains contain complete metabolic pathways for tyrosine, asparagine, and tryptophan biosynthesis but do not contain complete metabolic pathways for cysteine biosynthesis; utilization pathways for galactose, xylose, and glucuronides; and B-vitamin synthetic pathways for queuosine and cobalamin. In contrast, E. coli et B. luti have mcSEED binary phenotype profiles similar to that of P. copri and contain complete metabolic pathways for cysteine biosynthesis and xylose utilization (table S2J). These results indicate that genomic features of the Bifidobacterium strains examined limit their ability to thrive in the context of the Mirpur-18 diet and a community that contains the other ecogroup strains. In contrast, the fact that P. copri and other ecogroup strains contain and express these metabolic pathways provides support for their importance in maintaining their fitness under these conditions. As such, the feature-reduction approach used here provides a rationale for testing nutritional interventions that target these pathways in ecogroup members in children at risk for, or who already have, perturbed microbiota development.

Conclusions

We have developed a statistical approach to identify a group of 15 covarying bacterial taxa that we term an ecogroup. We found that the ecogroup is a conserved structural feature of the developing gut microbiota of healthy members of several birth cohorts residing in different countries. Moreover, the ecogroup can be used to distinguish the microbiota of children with different degrees of undernutrition (SAM, MAM) and to quantify the ability of their gut communities to be reconfigured toward a healthy state with a MDCF. Studies of gnotobiotic piglets subjected to a set of dietary transitions designed to model those experienced by members of the Bangladeshi healthy birth cohort demonstrate that temporal changes in the fitness of ecogroup taxa can occur in the absence of other gut community members. These observations suggest that the approach used to identify the ecogroup may be useful in characterizing microbial community organization in members of other longitudinally sampled (human) cohorts.

A critical feature of biological systems is that they function reliably, yet adapt when faced with environmental fluctuations (23, 24). An architecture of sparse but tight coupling enables rapid evolution to new functions in proteins (25, 26). Studies of macro-ecosystems such as ant colonies have argued that adaptive behaviors are dependent on proper network organization (27). The gut microbiota must satisfy the constraints of survival: namely, withstanding insult and maintaining functionality (robustness) while still having the capacity for plasticity. “Embedding” a sparse network of covarying taxa in a larger framework of independently varying organisms could represent an elegant architectural solution developed by nature to maintain robustness while enabling adaptation.

Les méthodes

Human studies

A previously completed NIH birth cohort study (“Field Studies of Amebiasis in Bangladesh”; ClinicalTrials.gov identifier NCT02734264) was conducted at the International Centre for Diarrhoeal Disease Research, Bangladesh (icddr,b). Anthropometric data and fecal samples were collected monthly from enrollment through postnatal month 60. Informed consent was obtained from the mother or guardian of each child. The research protocol was approved by the institutional review boards of the icddr,b and the University of Virginia, Charlottesville.

In the case of the MAL-ED birth cohort study (“Interactions of Enteric Infections and Malnutrition and the Consequences for Child Health and Development”; ClinicalTrials.gov identifier NCT02441426), anthropometric data and fecal samples were collected every month from enrollment to 24 months of age. The study protocol was approved by institutional review boards at each of the study sites.

The accompanying paper by Gehrig et al. (21) describes studies that enrolled (i) Bangladeshi children with MAM in a double-blind, randomized, four-group, parallel assignment interventional trial study of microbiota-directed complementary food (MDCF) prototypes conducted in Dhaka, Bangladesh (ClinicalTrials.gov identifier NCT03084731); (ii) a reference cohort of age-matched healthy children from the same community; and (iii) a subcohort of 54 children with SAM who were treated with one of three different therapeutic foods and followed for 12 months after discharge with serial anthropometry and biospecimen collection (“Development and Field Testing of Ready-to-Use Therapeutic Foods Made of Local Ingredients in Bangladesh for the Treatment of Children with SAM”; ClinicalTrials.gov identifier NCT01889329). The research protocols for these studies were approved by the Ethical Review Committee at the icddr,b. Informed consent was obtained from the mother/guardian of each child. Use of biospecimens and metadata from each of the human studies for the analyses described in this report was approved by the Washington University Human Research Protection Office (HRPO).

Collection and storage of fecal samples and clinical metadata

Fecal samples were placed in a cold box with ice packs within 1 hour of production by the donor and collected by field workers for transport back to the lab (NIH Birth Cohort, MAL-ED study). For the “Development and Field Testing of Ready-to-Use Therapeutic Foods Made of Local Ingredients in Bangladesh for the Treatment of Children with SAM” study, the healthy reference cohort, and the MDCF trial, samples were flash-frozen in liquid nitrogen–charged dry shippers (CX-100, Taylor-Wharton Cryogenics) shortly after their production by the infant or child. Biospecimens were subsequently transported to the local laboratory and transferred to –80°C freezers within 8 hours of collection. Samples were shipped on dry ice to Washington University and archived in a biospecimen repository at –80°C.

Sequencing bacterial V4-16S rDNA amplicons and assigning taxonomy

Methods used for isolation of DNA from frozen fecal samples, generation of V4-16S rDNA amplicons, sequencing of these amplicons, clustering of sequencing reads into 97% ID OTUs, and assigning taxonomy are described in Gehrig et al. (21).

Generation of RF-derived models of gut microbiota development

We produced RF-derived models of gut microbiota development from the Peruvian, Indian, and “aggregate” V4-16S rDNA datasets generated from 22, 14, and 28 healthy participants, respectively (see supplementary text for a description of the aggregate dataset). Model building for each birth cohort was initiated by regressing the relative abundance values of all identified 97%ID OTUs in all fecal samples against the chronologic age of each donor at the time each sample was procured (R package “randomForest,” ntree = 10,000). For each country site, OTUs were ranked on the basis of their feature importance scores, calculated from the observed increases in mean square error (MSE) when values for that OTU were randomized. Feature importance scores were determined over 100 iterations of the algorithm. To determine how many OTUs were required to create a RF-based model comparable in accuracy to a model comprising all OTUs, we performed an internal 100-fold cross-validation where models with sequentially fewer input OTUs were compared to one another. Limiting the country-specific models to the top 30 ranked OTUs had only minimal impact on accuracy (within 1% of the MSE obtained with all OTUs). In addition to calculating the R2 of the chronological age versus predicted microbiota age for reciprocal cross-validation of the RF-derived models, we also calculated the mean absolute error (MAE) and root mean square error (RMSE) for the application of each model to each dataset to further assess model quality (table S12).

Comparing OTUs with DADA2 amplicon sequence variants (ASVs) (fig. S1)

Each OTU in the ecogroup and each OTU in the sparse RF-derived models that had 100% sequence identity to an ASV was identified; each of these OTUs was defined as a “primary OTU sequence” and the ASV as the “correct ASV sequence.” The primary OTU sequence was then mutated according to the maximum sequence variance accepted by QIIME for a ≥97%ID OTU (i.e., ≤3%) to create a library of 1000 derivative sequences. Each sequence in the library was then compared to a database of all ASVs produced from DADA2 analysis (28) of all 16S rDNA datasets generated from all birth cohorts described in this report and in Gehrig et al. (21). The ASV with the maximum sequence identity to each member of each library of 1000 derivative sequences was noted. If this ASV matched the correct ASV sequence, the OTU derivative sequence in the library was assigned a “1”; otherwise it was assigned a “0”. An average over all 1000 derivative sequences in a given library was then calculated. This process was iterated 10 separate times, creating 10 trials of 1000 derived sequences for each OTU. An average over all 10 trials was then calculated, thereby defining the probability of an OTU being ascribed to the correct ASV given the accepted sequence “entropy” of QIIME (15). The results demonstrated that V4-16S rDNA sequences comprising a 97%ID OTU generated by QIIME map directly to the single ASV sequence deduced by DADA2.

Studies of gnotobiotic piglets

Experiments involving gnotobiotic piglets were performed under the supervision of a veterinarian using protocols approved by the Washington University Animal Studies Committee.

Diets

Piglets were initially bottle-fed with an irradiated sow’s milk replacement (Soweena Litter Life, Merrick; catalog number C30287N). Soweena powder (120-g aliquots in vacuum-sealed sterilized packets) was gamma-irradiated (>20 Gy) and reconstituted as a liquid solution in the gnotobiotic isolator (120 g per liter of autoclaved water). The procedure for producing Mirpur-18 is detailed in Gehrig et al. (21).

Husbandry

Feeding: The protocol used for generating germ-free piglets was based on our previous publication (29) with modifications (21). Piglets were fed at 3-hour intervals for the first 3 postnatal days, at 4-hour intervals from postnatal days 4 to 8, and at 6-hour intervals from postnatal day 9 to the end of the experiment. Introduction of solid foods began on postnatal day 4 and weaning was accomplished by day 22. Each gnotobiotic isolator was equipped with four stainless steel bowls and one 2-gallon waterer; each 2-gallon waterer (Valley Vet, Maryville, KS; catalog number 17544) was equipped with two 0.5-inch nipples (Valley Vet, catalog number 17352). During the first 3 days after birth, all four bowls were filled with Soweena. From days 4 to 12, at each feeding, one bowl was filled with Mirpur-18 while the remaining three bowls were filled with Soweena. On day 12, one bowl of milk was replaced with a bowl of water. From day 15 to day 19, each daytime feeding consisted of placement of two bowls of water and two bowls of Mirpur-18. In nighttime, one bowl of water was replaced with Soweena (i.e., each isolator at each feeding had two bowls of Mirpur-18, one bowl of water, and one bowl of Soweena). From postnatal days 20 and 21, only one bowl was provided with Soweena, and the amount of milk added was reduced by one half each day during this period. On day 22, the last bowl of milk was replaced with a bowl of water, thereby completing the weaning process. After weaning, two bowls of fresh sterilized water and two bowls of fresh Mirpur-18 were introduced into each isolator every 6 hours to enable ad libitum feeding. The 2-gallon waterer was replenished with fresh sterilized water every 2 to 3 days. Mirpur-18 consumption was monitored by noting the amount of input food required to maintain a filled bowl during a 24-hour period. Piglets were weighed daily using a sling (catalog number 887600; Premier Inc., Charlotte, NC). Environmental enrichment was provided within the isolators including plastic balls for “rooting” activity and rubber hoses and stainless steel toys for chewing and manipulating. The behavior and health status of the piglets were monitored every 3 to 4 hours throughout the day and night during the first 13 postnatal days and then every 6 hours until the time of euthanasia on day 29.

Bacterial genome assembly, annotation, in silico metabolic reconstructions, and phenotype predictions: Barcoded, paired-end genomic libraries were prepared for each bacterial isolate, and the libraries were sequenced (Illumina MiSeq instrument; paired-end 150- or 250-nt reads). Reads were demultiplexed and assembled; contigs with greater than 10× coverage were initially annotated using Prokka (30) followed by annotation at various levels by mapping protein sequences to the Prokaryotic Peptide Sequence database of the Kyoto Encyclopedia of Genes and Genomes (KEGG) as described in Gehrig et al. (21). Additional annotations were based on SEED, a genomic integration platform that includes a growing collection of complete and nearly complete microbial genomes with draft annotations performed by the RAST server (31). SEED contains a set of tools for comparative genomic analysis, annotation, curation, and in silico reconstruction of microbial metabolism. Microbial Community SEED (mcSEED) is an application of the SEED platform that we have used for manual curation of a large and growing set of bacterial genomes representing members of the human gut microbiota (currently ~2600). mcSEED subsystems (32) are user-curated lists/tables of specific functions (enzymes, transporters, transcriptional regulators) that capture current (and ever-expanding) knowledge of specific metabolic pathways, or groups of pathways, projected onto this set of ~2600 genomes. mcSEED pathways are lists of genes comprising a particular metabolic pathway or module; they may be more granular than a subsystem, splitting it into certain aspects (e.g., uptake of a nutrient separately from its metabolism). mcSEED pathways are presented as lists of assigned genes and their annotations in table S7. As detailed in Gehrig et al. (21), predicted phenotypes are generated from the collection of mcSEED subsystems represented in a microbial genome and the results described in the form of a binary phenotype matrix (BPM; prototrophy or auxotrophy for an amino acid or B vitamin; the ability to utilize specific carbohydrates and/or generate short-chain fatty acid products of fermentation). Table S7 presents the supporting evidence for assigning a given phenotype to an organism.

Colonization: Bacterial strains were cultured under anaerobic conditions in pre-reduced Wilkins-Chalgren anaerobe broth (Oxoid Inc.) or MegaMedium (21, 33). Methods used for sequencing, assembling, and annotating bacterial genomes are described in Gehrig et al. (21). An equivalent mixture of each B. longum strain or additional ecogroup strain was prepared by adjusting the volumes of each culture based on optical density (OD600) readings. An equal volume of pre-reduced PBS containing 30% glycerol was added to the mixture and aliquots were frozen and stored at –80°C until use. Each piglet received an intragastric gavage (Kendall Kangaroo 2.7 mm diameter feeding tube; catalog number 8888260406, Covidien, Minneapolis, MN) of 11 ml of a solution containing the bacterial consortia listed in fig. S13A and Soweena (1:10 v/v). The fecal microbiota was sampled using rectal swabs on the days indicated in fig. S13A.

Euthanasia and assessment of community composition along the length of the intestine: Euthanasia was performed on experimental day 29 according to American Veterinary Medical Association (AVMA) guidelines. The small intestine was divided into 20 sections of equal length; the first 1 cm of the 1st, 5th, 10th, 15th, and 20th sections were opened with an incision, and luminal contents were harvested with sterile cell scraper (Falcon; catalog number 353085). Luminal contents were also harvested from the cecum, proximal colon (10 cm of the mid-spiral region), and distal colon (10 cm from the anus). Methods for isolation of DNA from luminal and fecal samples, and short-read shotgun sequencing of community DNA samples (COPRO-seq), are all detailed in Gehrig et al. (21).

Microbial RNA-seq: Isolation of RNA from cecal contents harvested from piglets at the time of euthanasia, depletion of ribosomal rRNA (Ribo-Zero Kit, Illumina), and bacterial RNA purification were performed (21). Double-stranded complementary DNA and indexed Illumina libraries were prepared using the SMARTer Stranded RNA-seq kit (Takara Bio USA). Libraries were analyzed with a Bioanalyzer (Agilent) to determine fragment size distribution and then sequenced[IlluminaNextSeqplatform;75-ntunidirectionalreads;369(±54)×10[IlluminaNextSeqplatform;75-ntunidirectionalreads;369(±54)×106 reads per sample (mean ± SD); n = 5 samples]. Fluorescence was not measured from the first four cycles of sequencing, as this library preparation strategy introduces three nontemplated deoxyguanines. Transcripts were quantified (34), normalized (transcripts per kilobase per million reads; TPM), and then aggregated according to their representation in mcSEED and KEGG subsystems/pathway modules (21).

References and Notes

  1. A direct comparison of these OTUs and amplicon sequence variants (ASVs) identified using a bioinformatic pipeline designed to reduce sequencing errors disclosed good agreement between the two methods (fig. S1 and methods). Therefore, we retained OTU designations for this study.
  2. Each monthly covariance matrix was normalized against the highest covariance value for that month (see fig. S5, A to D, and table S2A for the example of month 60). Because some taxon-taxon covariance values are zero as a result of the absence of a taxon (e.g., fig. S5C), fitting a probability distribution over all of the covariance values becomes a practical constraint. Therefore, we retained the nonzero values across months 20 to 60, yielding 80 of the original 118 taxa. Values in the normalized covariance matrix for each month were then fit to a t-location scale probability distribution because the monthly normalized covariance histograms were significantly heavy-tailed (e.g., fig. S5D). Given our desire to identify which taxon-taxon covariance values were consistently in the tails of these probability distributions over time, the elements in each monthly covariance matrix were binarized to a “1” if they fell within the top or bottom 10% and a “0” if their values were within the remaining 80% of the probability distribution; this isolated the most covarying taxon-taxon pairs[[(Cpoubelleje,j)t, où je et j are bacterial taxa and t designates the month]. Monthly binarized covariance matrices were then averaged over time to create an 80 × 80 covariance matrix that signifies temporally conserved taxon-taxon covariation (Cpoubelleje,jt, Fig. 1B).
Remerciements: We are indebted to the families of study subjects for their active participation and assistance. We thank the staff and investigators at icddr,b for their contributions to the recruitment and enrollment of participants in the 5-year Bangladeshi birth cohort study plus the interventional studies of children with SAM and MAM, as well as the collection of biospecimens and data. We also thank the study team members and health care workers involved in the MAL-ED birth cohort studies; M. Gottlieb, D. Lang, K. Tountas, and M. McGrath, who provided invaluable assistance in coordinating the MAL-ED collaboration and providing access to key clinical datasets; M. Meier, S. Deng, and J. Hoisington-López for superb technical assistance; D. O’Donnell, J. Serugo, and M. Talcott for their indispensable help with gnotobiotic piglet husbandry; and R. Olson for technical support with the mcSEED-based genome analysis and subsystem curation. Funding: Supported by the Bill & Melinda Gates Foundation as part of the Breast Milk, Gut Microbiome, and Immunity (BMMI) Project. The 5-year birth cohort study of Bangladeshi children was funded by NIH grant AI043596 (W.A.P.). A.S.R. is a postdoctoral fellow supported by Washington University School of Medicine Physician Scientist Training Program and in part by NIH grant DK30292. D.A.R., A.A.A., and S.A.L. were supported by Russian Science Foundation grant 19-14-00305. J.I.G. is the recipient of a Thought Leader award from Agilent Technologies. Author contributions: R.H. and W.A.P. designed and oversaw the 5-year birth cohort study; they, together with T.A., were responsible for coordinating various aspects of biospecimen and metadata collection. S.H., M.M., R.H., W.A.P., and T.A. (Bangladesh), M.N.K. (Peru), G.K. (India), P.O.B. (South Africa), and A.A.M.L. (Brazil) oversaw the MAL-ED studies. S.H., I.M., M.I., M.M., and T.A. were responsible for studies involving the SAM and MAM cohorts. J.L.G. and S.S. generated 16S rDNA datasets from human fecal samples. M.J.B. managed the repository of biospecimens and associated clinical metadata used for the studies described above. H.-W.C. performed the experiments with gnotobiotic piglets with the assistance of A.S.R. S.V., and M.C.H. D.A.R., A.A.A., S.A.L., and A.L.O. performed in silico metabolic reconstructions based on the genome sequences of bacterial strains introduced into gnotobiotic piglets. A.S.R. conceived the mathematical approach and wrote all of the computational workflow for identifying ecogroup taxa, performed the sensitivity analysis of the workflow, compared the SparCC and SPIEC-EASI algorithms with the workflow, and undertook the analyses of gut microbial communities from subjects enrolled in the SAM, MDCF, Peruvian, and Indian cohort studies as well as the gnotobiotic piglet experiment, with J.L.G., S.V., M.J.B., and J.I.G. contributing in various supportive ways. A.S.R. and J.I.G. wrote the paper. Competing interests: J.I.G. is a co-founder of Matatu Inc., a company characterizing the role of diet-by-microbiota interactions in animal health. W.A.P. serves as a consultant to TechLab Inc., a company that makes diagnostic tests for enteric infections and has served as a consultant for Perrigo Nutritionals LLC, which produces infant formula. Data and materials availability: Bacterial V4-16S rDNA sequences in raw format (prior to postprocessing and data analysis), shotgun datasets generated from cultured bacterial strains, and COPRO-seq and microbial RNA-seq datasets obtained from gnotobiotic piglets have been deposited at the European Nucleotide Archive under study accession number PRJEB27068. Code has been archived at Zenodo (35). Fecal specimens from the MAL-ED birth cohorts in Bangladesh (icddr,b, Dhaka), Brazil (Federal University of Ceará, Fortaleza), India (Christian Medical College, Vellore), Peru (JHSPH/AB PRISMA), South Africa (University of Venda), and from the NIH birth cohort and SAM/MDCF studies at icddr,b, were provided to Washington University under material transfer agreements. This work is licensed under a Creative Commons Attribution 4.0 International (CC BY 4.0) license, which permits unrestricted use, distribution, and reproduction in any medium, provided the original work is properly cited. To view a copy of this license, visit http://creativecommons.org/licenses/by/4.0/. This license does not apply to figures/photos/artwork or other content included in the article that is credited to a third party; obtain authorization from the rights holder before using such material.

Click to rate this post!
[Total: 0 Average: 0]

Commentaires

Laisser un commentaire

Votre commentaire sera révisé par les administrateurs si besoin.