Serveur d'impression

Le gel et la disponibilité de l'eau structurent la diversité évolutive des arbres à travers les Amériques – Bien choisir son serveur d impression

Le 10 juin 2020 - 33 minutes de lecture

Abstrait

Le cours historique de la diversification évolutive façonne la répartition actuelle de la biodiversité, mais les principales forces qui entravent la diversification sont encore un sujet de débat. Nous dévoilons la structure évolutive des assemblages d'espèces d'arbres à travers les Amériques pour évaluer si une incapacité à se déplacer ou une incapacité à évoluer est la contrainte prédominante dans la diversification des plantes et la biogéographie. Nous trouvons un fossé fondamental dans la composition de la lignée d'arbres entre les environnements tropicaux et extratropicaux, défini par l'absence ou la présence de températures glaciales. Au sein des néotropiques, nous découvrons une nouvelle division évolutive entre les forêts humides et sèches. Nos résultats démontrent que les lignées d'arbres américaines ont tendance à conserver leurs relations environnementales ancestrales et que le conservatisme de niche phylogénétique est la principale force structurant la distribution de la biodiversité des arbres. Notre étude établit l'importance omniprésente du conservatisme de niche pour l'assemblage communautaire, même à l'échelle intercontinentale.

INTRODUCTION

Un défi central en biogéographie et macroévolution est de comprendre les principales forces qui ont conduit à la diversification de la vie et à l'assemblage des communautés écologiques. La diversification était-elle confinée à l'intérieur des continents et caractérisée par l'adaptation des lignées à différents environnements majeurs (c.-à-d. La commutation des biomes), ou les lignées avaient-elles tendance à se disperser sur de grandes distances tout en conservant leur niche environnementale ancestrale (c.-à-d. Le conservatisme de la niche phylogénétique)? Classiquement, les tentatives de définir des régions biogéographiques sur la base de distributions partagées de plantes et d'animaux étayent la première hypothèse, selon laquelle les modèles à grande échelle peuvent s'expliquer par une diversification évolutive confinée régionalement, plutôt que par une dispersion à longue distance (13). Cependant, des études récentes sur la distribution des lignées végétales à l'échelle mondiale ont documenté des niveaux élevés de dispersion intercontinentale[parexemple([parexemple([eg([eg(48)]et a révélé que les lignées ont tendance à conserver leurs biomes ancestraux lors de la dispersion (9, dix). Ces résultats récents suggèrent que les associations environnementales de lignées peuvent être la principale force organisant le cours de la diversification, mais une lacune clé dans les connaissances réside dans les études comparant le degré de similitude évolutive entre les assemblages d'espèces à grande échelle géographique. Profitant des progrès récents dans la disponibilité de données à grande échelle sur la biodiversité et la génomique et de méthodes d'analyse appropriées (11), nous dévoilons la structure évolutive de la diversité des assemblages d'arbres à l'échelle intercontinentale.

Avec des chaînes de haute montagne s'étendant du nord au sud à travers les latitudes et une mosaïque d'environnements contrastés, les Amériques représentent un laboratoire naturel pour enquêter sur les forces évolutives derrière l'assemblage des communautés et la distribution moderne de la biodiversité. Ici, nous examinons la composition phylogénétique des assemblages d'arbres angiospermes à travers les Amériques comme moyen de déterminer si la limitation de la dispersion ou le conservatisme de niche phylogénétique ont eu un impact plus important sur la composition évolutive actuelle des assemblages d'arbres. Si les lignées ont tendance à conserver leur niche environnementale alors qu'elles se diversifient dans l'espace, nous nous attendrions à ce que les grands groupes évolutifs soient limités à des régimes environnementaux spécifiques. Cela conduit à la prédiction que la composition de la lignée des assemblages des régions extratropicales dans les deux hémisphères devrait être plus similaire les uns aux autres que les assemblages qui se produisent dans les régions tropicales intermédiaires. De plus, nous prévoyons que les assemblages provenant d'environnements tropicaux secs devraient présenter une plus grande similitude dans la composition de la lignée d'arbres les uns par rapport aux assemblages provenant d'environnements humides avec lesquels ils peuvent être spatialement contigus (12). Alternativement, si la diversification est restreinte dans l'espace et que le changement de biome est courant, alors le principal groupe évolutif des assemblages devrait être séparé géographiquement. Ainsi, nous prédirions que les assemblages d'Amérique du Sud (qui ont été physiquement isolés à travers le Cénozoïque) constitueraient un groupe et que les assemblages d'Amérique du Nord et d'Amérique centrale en constitueraient un autre.

Pour tester l'importance relative du conservatisme de niche phylogénétique par rapport à la limitation de la dispersion, nous avons analysé les données d'environ 10000 assemblages d'arbres avec une nouvelle phylogénie au niveau du genre calibrée dans le temps qui comprend 1358 genres (~ 90% des genres d'arbres échantillonnés par assemblage). Nous avons évalué la similitude dans la composition de la lignée parmi les assemblages en utilisant des analyses de clustering et des ordinations basées sur la longueur de branche phylogénétique partagée. Ensuite, nous avons identifié les lignées d'indicateurs pour chaque grand groupe dans l'analyse des clusters et exploré les corrélats géographiques et environnementaux de la distribution des principaux clusters évolutifs. Nous avons en outre évalué dans quelle mesure les variables climatiques par rapport à la position géographique pouvaient classer les sites en différents groupes évolutifs. Si les variables climatiques fournissent un meilleur moyen de distinguer les groupes que les variables géographiques, cela soutiendrait l'idée que le conservatisme phylogénétique est plus important que la limitation de la dispersion pour déterminer la distribution des lignées évolutives, tandis que l'inverse tient si les variables géographiques fonctionnent mieux. Enfin, nous avons estimé la diversité évolutive unique (c'est-à-dire la somme des branches phylogénétiques des lignées restreintes à des groupes individuels) par rapport à la diversité évolutive partagée (c'est-à-dire la somme des branches phylogénétiques partagées) entre les groupes évolutifs (pour plus de détails, voir la section Matériaux et méthodes).

RÉSULTATS

Nous montrons que la composition évolutive de la lignée des assemblages d'arbres américains est structurée principalement par le conservatisme de niche phylogénétique. Les deux principaux groupes (K = 2) ont une structure tropique-extratropique (Fig. 1). Le groupe extratropical n'est pas limité géographiquement, mais comprend des assemblages d'arbres tempérés d'Amérique du Nord et du sud de l'Amérique du Sud, reliés par un couloir de haute altitude aux basses latitudes (Fig.1, A et B). La structure tropicale-extratropique de la diversité évolutive des arbres montre une forte correspondance (correspondance à 97%, fig. S1) avec l'absence versus l'occurrence de températures glaciales au cours d'une année typique (voir Fig. 1, C et D). Nous observons que la plupart de la diversité évolutive, mesurée en tant que longueur de branche phylogénétique sommée, se produit dans les tropiques, mais qu'il existe une diversité évolutive unique limitée aux extratropiques (~ 10% du total; Fig.2B et fig.S3A). Les analyses d'ordination et de clades indicateurs ont révélé que la ségrégation tropiques-extratropiques est associée à la distribution de clades spécifiques, tels que les Fagales, qui comprend les chênes (Quercus), hêtres (Fagus), coihues (Nothofagus), et leurs proches (figure 3 et tableaux S1 et S2).

Fig. 1 Les relations géographiques, évolutives et environnementales des deux principaux groupes évolutifs (de K = 2 analyse de clustering).

(UNE) Répartition géographique des assemblages d'arbres angiospermes et leur affiliation avec les tropiques (n = 7145) ou extratropicale (n = 2792) groupe évolutif. (B) Répartition des assemblages sur l'élévation et la latitude, montrant que le groupe extratropical est en grande partie limité aux altitudes élevées aux basses latitudes. (C et ) Répartition des assemblages sur les deux premiers axes d'une ordination basée sur la composition évolutive avec des assemblages en (C) colorés selon l'appartenance au groupe et en (D) pour savoir s'ils subissent ou non des températures glaciales au cours d'une année régulière[de([de([from([from(50)]. mètres, au-dessus du niveau de la mer.

Fig.2 Les relations géographiques, évolutives et environnementales entre quatre groupes évolutifs (de K = 4 analyse de regroupement).

(UNE) Répartition géographique des assemblages d'arbres angiospermes et leur affiliation avec l'un des quatre groupes évolutifs. (B) Diagramme d'Euler représentant la quantité d'histoire évolutive, quantifiée en diversité phylogénétique (PD) (en millions d'années), limitée à chaque cluster par rapport à celle partagée entre les clusters. (C) Répartition des assemblages à des températures extrêmes (température minimale du mois le plus froid) et disponibilité de l'eau [maximum climatological water deficit (CWD)]. Les lignes représentent le 95e quantile de la densité de points pour chaque groupe.

Fig. 3 Ordination phylogénétique des assemblages d'arbres en fonction de leur composition de lignée évolutive.

Les couleurs dans l'intrigue principale représentent les groupes de K = 4 analyses de regroupement et les différents symboles représentent les principales formations végétales. Le graphique du sous-ensemble montre les clades les plus fortement associés aux deux premiers axes de l'ordination évolutive.

Sur la base de deux analyses différentes (méthodes Elbow et Silhouette; voir Matériaux et méthodes pour une discussion sur la sélection optimale K), des grappes de K = 3 et K = 4 groupes sont également pris en charge en tant que divisions informatives supplémentaires (fig. S2), et chacun de leurs principaux groupes capture une diversité évolutive unique substantielle (fig. 2B, fig. S3 et tableau S2). Dans K = 3, les principaux groupements extratropicaux regroupaient les assemblages d'Amérique du Nord et de l'extrême sud de l'Amérique du Sud, tandis que les autres assemblages du sud tempéré de l'Amérique du Sud et des tropiques andines étaient regroupés avec des assemblages des régions tropicales et subtropicales arides ou semi-arides (fig. S4). Le troisième groupe était formé par les tropiques humides (fig. S4). Pour K = 4, les extratropiques ont été divisés en un groupe nord-américain largement tempéré et un deuxième groupe qui rejoint les sites subtropicaux d'Amérique du Sud et d'Amérique centrale avec les forêts tempérées du sud et les sites de haute altitude dans les Andes (figure 2A). Sous les tropiques, il existe un groupe regroupant des assemblages trouvés dans des conditions toujours humides et chaudes, et un deuxième groupe d'assemblages qui s'étendent dans des zones plus sèches et subtropicales (Fig. 2C et fig. S5A), y compris la plupart des assemblages de forêts tropicales sèches (Fig 2A et tableau S3). Nous nous référons aux quatre groupes d'assemblages dans K = 4 comme les groupes extratropicaux nordiques, extratropicaux méridionaux, tropicaux humides et tropicaux secs.

Se concentrer sur le K = 4 analyses, nous avons constaté que les variables climatiques fonctionnent nettement mieux que les variables géographiques dans la classification des assemblages individuels en groupes évolutifs, soutenant la prééminence du conservatisme de niche phylogénétique par opposition à la limitation de la dispersion dans la structuration de la distribution de la biodiversité dans les assemblages d'arbres. Un modèle climatique simple avec les précipitations annuelles moyennes (MAP), la température annuelle moyenne (MAT), le déficit climatique maximal en eau (CWD) et la saisonnalité des températures (TS) a réussi à classer 86,4% des assemblages, en moyenne, dans le bon groupe évolutif. Un modèle géographique simple, selon lequel les assemblages sud-américains devraient appartenir à un groupe distinct des assemblages d'Amérique du Nord et d'Amérique centrale, et avec la latitude et la longitude comme variables d'entrée, a classé 76,0% des assemblages correctement en moyenne. L'ajout de latitude et de longitude peut même surestimer l'importance de la géographie étant donné que la latitude et la longitude sont corrélées aux variations climatiques. Dans le classement climatique pour K = 4 groupes, les variables de température dépassent les variables de précipitations en tant que variables de classification les plus importantes[signifieunediminutiondel'indexGiniunefoisexclu([signifieunediminutiondel'indexGiniunefoisexclu([meandecreaseinGiniindexwhenexcluded([meandecreaseinGiniindexwhenexcluded(13); pour TS, 2728; MAT, 1565; MAP, 1064; et CWD, 936]. Lorsqu'elles se concentrent uniquement sur les tropiques, ces variables climatiques classent correctement les sites 83,6% du temps, la variable la plus importante étant CWD (diminution moyenne d'un indice de Gini de 792), suivie de MAT (722), TS (643) et CARTE (642). Lorsqu'elles se concentrent uniquement sur les extratropiques, ces variables climatiques classent correctement les sites 98,4% du temps. TS était de loin la variable la plus importante (diminution moyenne d'un indice de Gini de 719), ce qui est conforme aux recherches antérieures montrant que les zones tempérées de l'hémisphère sud sont moins saisonnières que les zones tempérées de l'hémisphère nord (14, 15). TS a été suivi en importance par CWD (157), MAP (92) et MAT (75). Des analyses avec des modèles linéaires généralisés suggèrent que le MAP est la variable climatique la plus importante pour distinguer les assemblages dans les groupes tropicaux humides des tropicaux secs et que TS est le plus important pour distinguer les deux groupes extratropicaux (fig. S6).

DISCUSSION

Nos résultats démontrent que la structure évolutive tropicale-extratropique de la diversité des arbres est principalement associée au seuil environnemental de présence contre l'absence de températures de congélation (Fig. 1, A et B, et fig. S1). Ce modèle est cohérent avec les preuves documentant que seules les lignées d'angiospermes qui étaient capables d'évoluer des traits pour éviter une embolie induite par le gel irradiaient dans des latitudes élevées (16). De plus, nous avons déterminé qu'une partie unique et appréciable de la diversité évolutive totale des angiospermes est limitée aux assemblages extratropicaux, comme le confirme le registre fossile (17, 18). Collectivement, ces preuves suggèrent que le conservatisme phylogénétique des lignées des extratropiques a une pertinence majeure pour la diversification des angiospermes dans les Amériques. Kerkhoff et al. (19) ont estimé que dans la région extratropicale (définie par eux comme des zones au nord de 23 ° N et au sud de 23 ° S), les lignées angiospermes produisaient des descendants extratropicaux au moins 90% du temps. Étant donné que certaines zones soumises à une congélation régulière à des altitudes élevées dans les latitudes équatoriales peuvent être mieux classées comme extratropicales, comme le démontrent ici nos résultats (Fig.1), le conservatisme phylogénétique extratropical pourrait même être supérieur à celui trouvé par Kerkhoff et al. (19).

Nous suggérons que le conservatisme extratropical a une importance majeure dans la biogéographie des Amériques. Le soulèvement relativement récent des Andes aurait créé de nouveaux environnements, avec des températures de congélation régulières, aux basses latitudes. Des températures glaciales auraient filtré la dispersion dans ce nouvel habitat, permettant aux lignées extratropicales de se déplacer à la fois du nord et du sud vers les latitudes équatoriales (20, 21), mais limitant l'immigration de lignées en provenance de plaines et d'environnements sans gel. Le pollen fossile montre l'arrivée dans les Andes du Nord de genres d'arbres provenant des forêts tempérées de l'hémisphère Nord, notamment Juglans (Juglandaceae), Alnus (Betulaceae), et Quercus (Fagaceae), à ​​environ 2,2 millions d'années (Ma), 1,0 Ma et 300 000 ans, respectivement, et l'arrivée de genres du sud, notamment Weinmannia (Cunoniaceae) et Drymis (Winteraceae), à ​​la fin du Pliocène et du Pléistocène (1,5–3,2 Ma) (20, 22). De même, les preuves phylogénétiques montrent une récente diversification dans les Andes de lignées qui semblent provenir des extratropiques, notamment Lupinus (Fabaceae) (23), Adoxaceae / Valerianceae (24, 25), et Gunnera (Gunneraceae) (26).

Nos résultats indiquent également une fracture évolutive humide / sèche au sein des néotropiques. Les assemblages de groupes tropicaux humides détiennent la plus grande diversité évolutive, à la fois globale et unique pour eux, malgré l'occupation de l'étendue climatique la plus restreinte de K = 4 groupes (Fig.2, B et C). Les assemblages de groupes tropicaux secs, en revanche, s'étendent sur un espace climatique plus large, mais détiennent globalement moins de diversité évolutive (Fig. 2, B et C). Cette asymétrie dans l'accumulation de diversité peut refléter un conservatisme phylogénétique pour une niche d'angiospermes ancestrale putative humide et chaude (27), ou pourrait résulter d'un environnement favorable dans les régions tropicales humides qui peuvent être occupées par n'importe quelle lignée d'angiospermes, même celles qui se produisent également dans des conditions plus fraîches ou plus sèches (28, 29). Quoi qu'il en soit, la similitude de la composition de la lignée des forêts tropicales sèches étendues mais distribuées de façon discontinue (12) indique leur histoire évolutive distincte. Les forêts tropicales sèches ont été décrites comme ayant une dispersion limitée (par exemple, 12), mais cela se réfère à la capacité des taxons constituants à persister localement sur des échelles de temps évolutives, inhibant ainsi l'immigration. Cependant, même un faible taux de dispersion et d'immigration parmi les régions de forêt sèche tropicale américaine suffit à maintenir la cohésion floristique. Un tel isolement évolutif de la flore forestière sèche a déjà été suggéré par des études sur les Leguminosae (12, 30), et est montré ici comme étant évident à l'échelle évolutive de toutes les espèces d'arbres angiospermes.

Nos résultats aident également à clarifier le statut évolutif controversé des régions de savane et de Chaco dans les régions néotropiques. Nous constatons que les savanes du sud (la région de Cerrado au Brésil) sont plus évolutives liées aux forêts tropicales humides que les forêts sèches (figure 2A et figure S4), comme suggéré précédemment pour des clades spécifiques (30, 31). Cependant, les savanes tropicales du nord (c'est-à-dire les Llanos du Venezuela et de la Colombie et celles d'Amérique centrale) sont divisées dans leurs liens d'évolution entre les groupes tropicaux humides et tropicaux secs (figure 3 et tableau S3). Cela peut refléter l'écologie distincte de nombreuses savanes du nord[parexemplelessavaneshydrologiquesdeLlanosare([parexemplelessavaneshydrologiquesdeLlanosare([egtheLlanosarehydrologicalsavannas([egtheLlanosarehydrologicalsavannas(32)]et suggèrent une histoire évolutive divergente pour les savanes du nord et du sud. Nos résultats peuvent également aider à résoudre les débats autour des affinités évolutives du Chaco[parexemple([parexemple([eg([eg(33, 34)], en montrant que cette région géographiquement définie abrite un mélange de lignées extratropicales et tropicales (Fig. 2).

Plus largement, nos analyses indiquent systématiquement des liens évolutifs entre les assemblages dans les zones saisonnièrement sèches et saisonnières froides (Fig. 2 et fig. S4). Par exemple, lorsque nous considérons K = 3 groupes évolutifs, un seul groupe «sec et frais» fusionne, y compris les extratropiques du sud de l'Amérique du Sud, les forêts sèches tropicales saisonnières et les forêts de pins et de chênes mexicains, les deux autres groupes étant le groupe des forêts tropicales humides et un groupe largement nordique, extratropical groupe (fig. S4). Dans le même esprit, le groupe extratropical sud de la K = 4 le regroupement comprend également des forêts subtropicales dans les régions arides et semi-arides du Chili, du Mexique et ailleurs (Fig.2), tandis que le groupe tropical sec comprend des assemblages d'arbres se produisant dans des zones fraîches à haute altitude, principalement dans la forêt atlantique sud du Brésil ( Fig.2). Quand on considère K = 5 groupes évolutifs, ces sites frais, qui sont également plus humides que le reste du groupe sec tropical, se sont séparés pour former un cinquième groupe qui comprend également des sites à plus haute altitude dans les Andes, les hautes terres de Guyane, l'Amérique centrale et la Caraïbes (fig. S5).

Nous montrons que la composition évolutive des assemblages d'arbres dans les Amériques est déterminée principalement par la présence contre l'absence de températures glaciales, divisant les régions tropicales des régions extratropicales. Sous les tropiques, nous trouvons une subdivision évolutive supplémentaire parmi les assemblages connaissant des conditions humides par rapport aux conditions saisonnières sèches. Ces résultats démontrent que le conservatisme de niche phylogénétique est la principale force organisant la diversification, l'assemblage communautaire et, par conséquent, la biogéographie des angiospermes. Les espèces d'arbres qui peuvent habiter les zones soumises à des températures glaciales et / ou des environnements soumis à un stress hydrique saisonnier appartiennent à un ensemble restreint de lignées phylogénétiques, ce qui confère une identité évolutive unique aux forêts extratropicales et aux forêts tropicales sèches des Amériques. Bien que notre étude se limite aux arbres du Nouveau Monde, nous suggérons que la biodiversité végétale à l'échelle mondiale peut être structurée de manière évolutive suivant un modèle tropical-extratropique, tandis que la diversité sous les tropiques peut être structurée principalement autour d'un modèle humide-sec. Ces résultats plaident fortement pour l'intégration des concepts de conservatisme extratropical et de conservatisme tropical-sec dans notre compréhension des tendances macroévolutionnaires mondiales et des modèles biogéographiques.

MATÉRIAUX ET MÉTHODES

Ensemble de données d'assemblage d'arbres

Notre ensemble de données d'assemblage d'arbres a été dérivé en combinant la base de données NeoTropTree (NTT) (35) avec des parcelles sélectionnées du programme Forest Inventory and Analysis (FIA) du U.S.Forest Service (36), consulté le 17 juillet 2018 via le package BIEN (37). Les sites de la base de données NTT sont définis par un seul type de végétation dans une zone circulaire d'un rayon de 5 km et contiennent des enregistrements d'arbres et d'espèces arborescentes, c'est-à-dire des plantes autonomes avec des tiges pouvant atteindre plus de 3 m de hauteur[seewwwneotroptreeinfoand([seewwwneotroptreeinfoand([seewwwneotroptreeinfoand([seewwwneotroptreeinfoand(38) pour plus de détails]. Chaque parcelle FIA ​​échantillonne des arbres d'un diamètre ≥12,7 cm à hauteur de poitrine dans quatre sous-parcelles (chacune mesurant 168,3 m2) espacés de 36,6 m. Nous avons agrégé les parcelles de l'ensemble de données FIA dans des zones de 10 km de diamètre, pour mettre en parallèle la structure spatiale de la base de données NTT. Nous avons exclu tous les sites qui avaient moins de cinq genres d'angiospermes, car les analyses préliminaires suggéraient que ces sites manquaient d'informations suffisantes pour être placés en toute confiance dans les ordinations évolutives et les regroupements décrits ci-dessous. Par conséquent, l'ensemble de données FIA a été considérablement réduit et certaines régions avec une faible diversité d'angiospermes n'ont pas d'échantillons dans notre étude. Cette procédure a produit un ensemble de données total de 9937 assemblages d'arbres répartis sur les principaux gradients environnementaux et géographiques des Amériques.

Arbre phylogénétique au niveau du genre

Nous avons obtenu des séquences du rbcTerre tapisGène K plastid pour 1358 genres d'arbres angiospermes, de GenBank (www.ncbi.nlm.nih.gov/genbank/), s'appuyant sur les efforts phylogénétiques antérieurs à grande échelle pour les angiospermes dans les néotropiques (39, 40). Les séquences ont été alignées à l'aide du logiciel MAFFT (41). Les «extrémités irrégulières» des séquences pour lesquelles la plupart des genres manquaient de données ont été supprimées manuellement de l'alignement.

Nous avons estimé une phylogénie de vraisemblance maximale pour les genres dans le logiciel RAxML v8.0.0 (42) sur le serveur Web CIPRES (www.phylo.org). Nous avons contraint les relations au niveau de l'ordre dans l'arbre, suite à la phylogénie de Gastauer et al. (43), qui est basée sur la topologie proposée par le groupe Angiosperm Phylogeny Group IV. Nous avons concaténé les deux marqueurs chloroplastiques suivant un modèle général réversible dans le temps + gamma d'évolution de séquence. Nous avons inclus des séquences de Nymphaea alba (Nymphaeaceae) en tant que groupe externe. Nous avons utilisé une analyse bootstrap de probabilité maximale pour évaluer le soutien des relations dans la phylogénie. La plupart des relations plus profondes dans la phylogénie avaient des valeurs de support élevées (> 70 support bootstrap), ce qui est attendu étant donné que les relations ordinales étaient fixes. Les nœuds plus récents de la phylogénie avaient un support inférieur avec les relations des genres au sein des familles ayant des valeurs de support bootstrap moyennes de ~ 60. Cependant, nous avons confirmé que les relations des familles au sein des ordres et des genres au sein des familles correspondaient généralement à celles des analyses phylogénétiques plus détaillées (avec des marqueurs génétiques plus variables), en particulier les études énumérées dans le tableau S4. Les faibles valeurs de soutien sont probablement attribuables à la variabilité relativement faible du tapisK et rbcMarqueurs L au sein des familles d'angiospermes.

Nous avons calibré temporellement la phylogénie du maximum de vraisemblance à l'aide de l'arborescence logicielle PL (44). Nous avons implémenté des contraintes d'âge pour 320 nœuds internes[niveaufamilialousupérieurà([niveaufamilialousupérieurà([familylevelorhigherfrom([familylevelorhigherfrom(45)]et pour 123 noeuds de tige de genres (d'après les âges d'une étude documentaire; tableau S4). Le paramètre de lissage de la vitesse (lambda) a été fixé à 10 sur la base d'une procédure de validation croisée. La phylogénie datée finale peut être trouvée dans les matériaux supplémentaires.

Analyse de distance phylogénétique et regroupement

Nous avons utilisé le seul complément de l'indice Phylosor (c'est-à-dire 1 – Phylo-Sorensen) pour construire une matrice de dissemblances phylogénétiques entre les parcelles en fonction des données de présence-absence des genres. L'indice Phylosor additionne la longueur totale des branches des clades partagés entre sites (46) par rapport à la somme des longueurs de branche des deux sites

Complément de PhyloSorensen ij=1BLij/0,5*(BLje+BLj)

où BLij est la somme de la longueur de branche phylogénétique partagée entre les sites je et jet BLje et BLj sont la somme de la longueur des branches des phylogénies comprenant uniquement des genres à l'intérieur des sites je et j, respectivement. Ainsi, si toutes les branches sont partagées entre deux parcelles, alors la mesure de dissimilarité prend la valeur 0. Si aucune branche n'est partagée entre les parcelles (c'est-à-dire que les parcelles comprennent deux clades réciproquement monophylétiques), alors la mesure de dissimilarité prendra une valeur de 1. Cette métrique a été estimée à l'aide de la fonction phylosor.query () dans PhyloMeasures (47) pour R. Les analyses avec le seul complément de la mesure de similitude phylogénétique Unifrac ont donné des résultats très similaires et ne sont pas présentés ici.

Nous avons utilisé K-moyen de regroupement pour explorer les principaux groupes, en termes de (dis) similitude dans l'ensemble de données d'assemblage d'arbres, selon les mesures de dissimilarité Phylosor. Les analyses préliminaires utilisant des approches de regroupement hiérarchique n'ont pas produit de regroupements cohérents. le K-signifie que l'algorithme de clustering nécessite le nombre de groupes / clusters (K) à préciser à l'avance. Pour estimer la meilleure valeur pour K, le nombre optimal de clusters pour expliquer parcimonieusement la variance de l'ensemble de données, nous avons utilisé la méthode Elbow et une approche basée sur la largeur moyenne de Silhouette (fig. S2). La méthode Elbow évalue comment la somme totale des carrés intra-cluster (TSS) change en fonction du nombre de clusters. Chaque cluster supplémentaire abaisse le TSS, et le coude de la courbe est formé lorsque l'ajout d'un autre cluster ne parvient pas à abaisser le TSS sensiblement par rapport aux augmentations précédentes du nombre de cluster. D'autre part, l'analyse de la largeur de la silhouette détermine dans quelle mesure chaque assemblage s'intègre dans son groupe / cluster évolutif assigné, avec des valeurs plus élevées indiquant que le site est plus proche de la composition «médiane» (c.-à-d., Le centre de gravité) de son groupe assigné par rapport à sa proximité avec la composition «médiane» des autres groupes. Plus la largeur de silhouette moyenne est élevée dans tous les assemblages, meilleur est le regroupement. Les analyses du coude suggèrent quelque chose de K = 3 à K = 5 pour être le meilleur regroupement, et l'analyse de la largeur de la silhouette pointe vers K = 2 pour être le meilleur clustering. Sur la base de ces résultats, nous avons sélectionné K = 2 (Fig.1), K = 3 (fig. S4), K = 4 (Fig.2), et K = 5 (fig. S5) pour une analyse et une interprétation supplémentaires. Aucune donnée géographique ou environnementale n'a été utilisée pour éclairer les analyses de regroupement (48). le K-le regroupement des moyens a été réalisé avec la fonction kmeans () dans la base R (R Core Development Team, 2016).

De plus, nous avons effectué une ordination évolutive des assemblages d'arbres en fonction de leur composition de lignée phylogénétique, en suivant les protocoles développés par Pavoine (49). Nous avons spécifiquement utilisé une analyse évolutive des principaux composants, implémentée avec la fonction evopca () dans le package «adiv» (49), avec une transformation Hellinger du genre par matrice de sites, car il s'agit d'une approche puissante pour détecter les modèles phylogénétiques le long des gradients, tout en permettant également le positionnement des sites et des clades dans un espace d'ordination (11). Les deux premiers axes expliquaient 9,6 et 6,7% de la variation des données, les axes suivants expliquant chacun <5,5%.

Correspondance entre les résultats du clustering et les variables environnementales

Nous avons testé la corrélation entre nos K = 2 résultats de regroupement et huit délimitations différentes des tropiques, selon Feeley et Stroud (50). Ces délimitations étaient les suivantes: (C1) toutes les zones comprises entre 23,4 ° S et 23,4 ° N; (C2) toutes les zones ayant un bilan énergétique net positif; (C3) toutes les zones où MAT ne varie pas avec la latitude; (C4) toutes les zones où les températures ne descendent pas en dessous de zéro au cours d'une année typique; (C5) toutes les zones où la température mensuelle moyenne n'est jamais inférieure à 18 ° C; (C6) toutes les zones où la «biotempérature» moyenne annuelle ≥24 ° C; (C7) toutes les zones où la plage annuelle de température est inférieure à la plage de température quotidienne moyenne; et (C8) toutes les zones où la saisonnalité des précipitations dépasse TS. Nous avons calculé la correspondance entre notre cluster binaire (c'est-à-dire tropical par rapport à extratropical) et chacune de ces délimitations comme la proportion de sites où les délimitations correspondaient.

Pour évaluer si le K = 4 le regroupement est principalement influencé par le climat ou la géographie, nous avons déterminé la proportion d'assemblages qui peuvent être correctement classés dans leur groupe évolutif par des variables environnementales par rapport aux variables spatiales, en utilisant une approche d'arbre de classification forestière aléatoire13). Les variables explicatives du modèle environnemental étaient MAT, MAP et TS du jeu de données Worldclim (51) et CWD maximum de Chave et al. (52). Pour le modèle géographique, nous avons utilisé une division de base entre l'Amérique du Sud et l'Amérique du Nord et l'Amérique centrale, car cela reflète l'isolement géographique historique de l'Amérique du Sud. Nous avons également inclus la latitude et la longitude comme variables explicatives dans ce modèle géographique de base. Nous avons exclu les sites des Caraïbes des deux modèles car il n'était pas certain de les regrouper dans le modèle géographique. Même les inclure n'aurait pas changé les résultats de manière substantielle car ils ne représentent que 2,4% des sites dans notre base de données d'assemblage totale. Ces analyses ont été implémentées avec la fonction randomForest () dans le package "randomForest" (13).

Pour explorer la meilleure variable climatique pour expliquer les divisions entre les groupes au sein des tropiques et des extratropiques, nous avons utilisé un modèle mixte avec une réponse binomiale (tropical sec contre tropical humide pour les tropiques et extratropical nord versus extratropical sud pour les extratropiques). Pour tenir compte de l'autocorrélation spatiale, nous avons regroupé les assemblages dans des cellules de grille de 1 ° × 1 ° et incorporé le facteur de cellule de grille à plusieurs niveaux comme effet aléatoire. Nous avons implémenté le modèle mixte avec la fonction glmer () du package lme4 (53). Pour déterminer la meilleure variable climatique, nous avons comparé les modèles basés sur le critère d'information Akaike (AIC). En tant que variables candidates, nous nous sommes concentrés sur les mêmes variables que dans l'analyse forestière aléatoire, MAT, MAP, TS et CWD.

PD partagé contre PD unique

Étant donné que l'estimation Phylosor de la (dis) similitude évolutive ne peut pas distinguer la variation associée aux différences de PD totale ou de richesse phylogénétique, par rapport à la variation associée au renouvellement phylogénétique en soi, nous avons mesuré la PD partagée et unique associée à chaque groupe pour la K = 2, K = 3, et K = 4 analyses de regroupement. Dans un premier temps, nous avons estimé l'association des genres à chaque groupe par une analyse des espèces indicatrices suivant de Caceres et al. (54). Plus précisément, nous avons utilisé la fonction multipatt () dans les indicspecies du package R (55) pour permettre aux genres d'être associés à plusieurs groupes (lorsque K > 2). La sortie de la fonction multipatt comprend l'indice statistique, qui est fonction de la spécificité (la probabilité qu'un site enquêté appartient au groupe de sites cible étant donné que le genre a été trouvé) et la fidélité (la probabilité de trouver le genre dans les sites appartenant au groupe de sites donné). Nous avons construit des phylogénies élaguées en excluant les genres avec une spécificité supérieure à 0,6 pour un groupe ou une combinaison de groupes, afin d'estimer la PD totale trouvée dans chaque groupe ou combinaison de groupes sans leurs indicateurs spécifiques. Ensuite, nous avons soustrait ces totaux du total pour la phylogénie complète et non élaguée afin de déterminer la quantité de diversité phylogénétique restreinte à chaque groupe ou combinaison de groupes. Enfin, nous avons estimé le PD partagé dans tous les groupes comme celui qui n'était pas limité à un groupe particulier ou à une combinaison de groupes. Nous ajustons ces différents totaux de PD sous forme de zones dans un diagramme d'Euler avec la fonction euler () dans le package «eulerr» (56) pour le K = 2 et K = 3 clustering et avec la fonction Venn () dans le package «venn» (57) pour le K = 4 regroupement.

Lignées d'indicateurs pour les clusters

To further characterize the composition of the evolutionary groups, we conducted an indicator analysis to determine the evolutionary clades most strongly associated with each group. We created a site × node matrix, which consists of a presence/absence matrix for each internal node in the phylogeny and ran an indicator analysis for the nodes. We selected the highest-level, independent (i.e., non-nested) nodes with the highest stat values to present in tables S1 and S2. The indicator node analysis was carried out with function multipatt() in the R Package indicspecies (55).

This is an open-access article distributed under the terms of the Creative Commons Attribution license, which permits unrestricted use, distribution, and reproduction in any medium, provided the original work is properly cited.

RÉFÉRENCES ET NOTES

  1. A. R. Wallace, The Geographical Distribution of Animals: With a Study of the Relations of Living and Extinct Faunas as Elucidating the Past Changes of the Earth’s Surface (Harper Brothers, 1876), vol. 1.

  2. A. Takhtajan, Floristic Regions of the World (University of California Press, 1986), vol. 581.

  3. B. Schrire, M. Lavin, G. Lewis, in Plant Diversity and Complexity Patterns: Local, Regional and Global Dimensions, B. H. Friis, Ed. (Biologiske Skrifter, 2004), vol. 55, pp. 375–422.

  4. R. T. Pennington, G. P. Lewis, J. A. Ratter, in Neotropical Savannas and Seasonally Dry Forests (CRC Press, 2006), pp. 17–45.

  5. M. Maechler, P. Rousseeuw, A. Struyf, M. Hubert, K. Hornik, cluster: Cluster Analysis Basics and Extensions (2019). R package version 2.1.0—For new features, see the ‘Changelog’ file (in the package source).

  6. S. Pavoine, adiv: Analysis of Diversity (2018) R package version 1.2.

  7. M. De Caceres, F. Jansen, Indicspecies: Relationship Between Species and Groups of Sites (R package, 2016).

  8. J. Larsson, Eulerr: Area-Proportional Euler and Venn Diagrams with Ellipses (R package version 3.1, 2018).

  9. A. Dusa, Venn: Draw Venn Diagrams (R package version 1.7, 2018).

  10. F. A. Carvalho, S. S. Renner, in Molecular Phylogeny, Biogeography and an E-Monograph of the Papaya Family (Caricaceae) as an Example of Taxonomy in the Electronic Age (Springer, 2015), pp. 49–81.

Remerciements: We thank E. Manson, D. Coenen, and C. Pertusi for help in the mining of genetic sequences from GenBank. Financement: CONICYT PIA APOYO CCTE AFB170008 and a Leverhulme Trust Research Fellowship RF-2015-653. R.A.S. was supported by a Newton International Fellowship from The Royal Society and by Conicyt PFCHA/Postdoctorado Becas Chile/2017 No. 3140189; K.G.D. and T.R.B. were both supported by Leverhulme International Academic Fellowships. R.T.P., T.R.B., K.G.D., and D.M.N. were supported by NERC Grant NE/I028122/1. Les contributions de l'auteur: R.A.S. and K.G.D. designed the study and carried out the analyses. R.A.S., K.G.D., F.C.d.S., and D.M.N. built the phylogeny. A.T.O.-F. compiled the NTT dataset. R.A.S., K.G.D., and R.T.P. wrote the manuscript with input from all the coauthors. Intérêts concurrents: Les auteurs déclarent n'avoir aucun intérêt concurrent. Disponibilité des données et du matériel: All data needed to evaluate the conclusions in the paper are present in the paper and/or the Supplementary Materials. Additional data related to this paper may be requested from the authors.

Commentaires

Laisser un commentaire

Votre commentaire sera révisé par les administrateurs si besoin.