Non classé

IBM introduit la mise en miroir actif-actif dans la base de données Db2 for i

Le 24 avril 2019 - 11 minutes de lecture

24 avril 2019

Timothy Prickett Morgan

En tant que plate-forme qui approche ses 40 ans de déploiement au sein d’entreprises qui ne peuvent se permettre des temps morts avec leurs systèmes essentiels à la mission – le System / 38 ainsi que l’AS / 400 et ses suites font partie du même continuum – il Il n’est donc pas surprenant que les systèmes de milieu de gamme IBM exécutant RPG et COBOL possèdent certains des logiciels de clustering les plus sophistiqués – et peut-être le seul centré sur les applications – jamais développés.

Parallèlement au lancement d’IBM i 7.4 cette semaine, Big Blue déploie un nouveau type de mise en cluster de bases de données, appelé Db2 Mirror, destiné aux clients qui ne peuvent courir aucun risque de perte de temps dans leurs systèmes de traitement de transactions. Db2 Mirror est une fonctionnalité supplémentaire à la base de données Db2 for i et est disponible uniquement sur les systèmes Power8 et Power9 exécutant IBM i 7.4. Il est également un peu différent des outils de clustering à haute disponibilité vendus par Maxava, Syncsort (qui a acheté Vision Solutions, qui a acquis ses rivaux iTera en 2006 et Lakeview Technology en 2007), et DataMirror (acheté par IBM en 2007 puis vendu à Rocket Software en 2012) et nous essayons franchement de comprendre à quel point elles sont différentes.

Ce que nous pouvons vous dire, c'est que Db2 Mirror crée ce que l'on appelle un cluster de base de données actif-actif sur deux ordinateurs. Ce qui diffère des configurations active-passive utilisées par de nombreuses techniques de clustering haute disponibilité de niveau entreprise. Dans le premier cas, un groupe de deux machines est disponible pour effectuer un travail. Ce travail peut parfois être unique et parfois les machines sont configurées de manière à ce que les transactions soient validées sur une paire de machines à peu près au même moment.

Cette configuration de Db2 Mirror est légèrement différente des machines à tolérance de pannes de Tandem Computers et Stratus Technologies, mais elle s’inspire clairement de celle-ci. Elle s’inspire également des technologies de clustering de bases de données créées par IBM, telles que Sysplex et Parallel Sysplex pour. l’ordinateur central System z (qui a commencé en 1990) ainsi que les Real Application Clusters (RAC) d’Oracle, dérivés du logiciel TruCluster créé par Digital Equipment pour sa plate-forme Tru64 Unix et lui-même basé sur le logiciel VAXCluster pour Système d'exploitation VMS et base de données RDB pour la plate-forme VAX. La base de données distribuée Db2 PureScale d’IBM, qui était une extension de base de données parallèle distribuée de la base de données Db2 d’IBM pour AIX et Linux, avait sans doute une certaine inspiration; elle a été étendue à 128 noeuds de serveur dans un cluster, bien au-delà des 32 ordinateurs centraux d’un système parallèle. Sysplex et les huit nœuds d'un cluster Oracle RAC. Et n'oublions pas que lorsque IBM avait des difficultés à faire évoluer son matériel avec la technologie NUMA au milieu des années 1990, il a créé DB2 Multisystem pour créer une configuration de clustering sans partage similaire à certains égards (mais certainement pas à tous) à Tandem, Stratus et Oracle. Parallel Server, prédécesseur d'Oracle RAC. IBM PowerHA effectue la réplication sur disque de données via des baies de stockage en miroir et des réseaux à haut débit plutôt que la réplication de base de données via la journalisation distante sur une paire de serveurs, qui fait partie de la tuyauterie d'OS / 400, i5 / OS et IBM i 1999.

Il existe de nombreuses façons de traiter les clusters à haute disponibilité au niveau système et au niveau base de données, et aucun d'entre nous n'a le temps de toutes les explorer, aussi fascinant soit-il. Disons simplement que Db2 Mirror est une nouvelle façon de procéder, selon Steve Will, architecte en chef d’IBM i, en développement depuis trois ans et parce que certains clients clés d’IBM i ont réclamé la mise en cluster active-active de bases de données. la plate-forme pour leur permettre d'avoir une disponibilité continue – ou autant que vous pouvez vous attendre avec deux machines en miroir au niveau de la base de données au sein d'un seul centre de données.

«Db2 Mirror n’est pas basé sur un journal», explique Will. “Dans Db2 Mirror, lorsque vous associez deux systèmes, chaque opération de base de données a lieu aux bases de les deux systèmes exactement au même moment. Ainsi, si vous effectuez une mise à jour de table et que votre application pointe sur la base de données, cette opération de base de données ne termine pas cette mise à jour tant qu'elle n'est pas parvenue aux deux systèmes. Ce n'est pas une solution de réplication physique comme avec PowerHA. Une situation similaire se produirait avec PowerHA, mais vous auriez dû placer cette base de données dans un pool de stockage auxiliaire indépendant (iASP) qui devrait être répliqué de l'autre côté. Mais de l’autre côté, cette base de données n’était pas disponible pour faire un travail actif contre elle. Il y a donc une différence ici avec Db2 Mirror. Nous ne dépendons pas des journaux. Vous pouvez avoir des ASP indépendants, c’est bien, mais nous ne dépendons pas d’ASP indépendants. Vous n’êtes pas obligé d’accéder à la base de données de quelque manière que ce soit, style ancien ou nouveau, etc.

Compte tenu de la quantité de clusters active-active existant dans le monde, vous pouvez l'obtenir pour les systèmes Windows Server et Linux exécutant la plupart des bases de données relationnelles modernes. De plus, il existe des bases de données distribuées parallèles vraiment astucieuses inspirées des travaux réalisés par des hypercalculateurs tels que Google. , Facebook, Microsoft et Amazon également disponibles en open source – vous auriez peut-être pensé que la base de données Db2 for i au cœur de la plate-forme IBM i pourrait depuis longtemps bénéficier de la mise en cluster actif-actif. Mais il y avait un véritable problème: l'architecture de stockage à un niveau du System / 38, l'AS / 400 et leurs suites.

Avec le stockage à un niveau, le système d’exploitation considère la capacité de la mémoire principale, du disque et maintenant du stockage flash comme un continuum unique d’espace mémoire adressable et élimine les différences en ce qui concerne la base de données. Cette architecture est vraiment géniale et unique au monde, et jusqu’à présent, seul IBM a réussi à la faire fonctionner, et seulement dans sa gamme de serveurs de milieu de gamme. Cela alourdit le système, mais simplifie radicalement la programmation, caractéristique de l’AS / 400 et de ses progénitures. Mais la mise en miroir active / active gêne un peu le stockage à un seul niveau, car cela revient à demander à deux personnes différentes de partager les mêmes souvenirs sans perdre la raison.

Selon Will, les technologies de clustering actif-actif de Unix, Windows Server et Linux ont un temps un peu plus facile.

«Une partie de la raison est la façon dont ils se regroupent puis s’échelonnent. En réalité, ces technologies transfèrent le système de fichiers sur les périphériques de stockage plus que nous ne le pouvons. Une des raisons, sur le plan architectural, du fait qu’IBM i n’était pas encore actif-actif auparavant, c’est que nous voulions pouvoir conserver l’architecture de magasin à un niveau, mais nous ne pouvions pas l’étendre sur plusieurs systèmes. Nous devions trouver un moyen de faire cela, où chaque système avait toujours son propre espace d'adressage, car ce magasin à un seul niveau est la façon dont nous faisons notre système de fichiers. Personne d'autre n'a un tel système de fichiers. Donc, ils n’ont pas à s’inquiéter pour ça. au lieu de cela, ils ont des systèmes de stockage hiérarchiques, ils doivent passer du temps à faire du verrouillage et toutes sortes d’autres choses que nous n’avons pas. Il n’ya rien de mal à cela, c’est juste leur architecture. Mais nous avions besoin que la couche base de données coordonne toutes les opérations afin que chaque opération puisse être mise en miroir dans le cluster. Et plus vous auriez de nœuds, moins il serait probable que nous puissions atteindre les objectifs de performance de bon nombre de nos grands clients. »

C'est pourquoi Db2 Mirror est limité à une paire de systèmes, du moins dans sa version initiale. Ce qui va bien. Les clients qui ont besoin de plus de temps de traitement peuvent acheter des systèmes avec plus de sockets et une mise en cluster de mémoire partagée en utilisant des techniques NUMA au niveau du matériel. Et ceux qui ont besoin de plus que cela peuvent utiliser Db2 Multisystem pour partitionner leurs tables de base de données et les exécuter sur un cluster de 32 machines fonctionnant en parallèle dans une configuration sans partage similaire à celles des machines Tandem et Stratus. Db2 Mirror n’est pas une question d’échelle, mais de disponibilité continue, mais il est amusant d’envisager un énorme cluster IBM i comptant jusqu’à 32 noeuds exécutant Db2 Multisystem pour augmenter les performances des machines en mettant à l’échelle le matériel, puis en utilisant Db2 Mirror pour en créer un autre. ensemble de 32 nœuds qui le rend disponible en permanence. L'esprit tourne. . . .

Db2 Mirror nécessite la nouvelle version IBM i 7.4, que nous rapportons ailleurs dans ce numéro, mais les clients ne sont pas obligés de l'acheter ni de l'installer plus que ce qui leur était nécessaire pour acheter Db2 Multisystem depuis plus de dix ans. Comme Db2 Multisystem, Db2 Mirror est intégré à la plate-forme et à la base de données, mais il s’agit d’un produit sous licence distincte, dans le cas présent coûtant 20 000 USD par cœur. Les versions IBM i 7.4 et Db2 Mirror seront disponibles à partir du 21 juin, date du 31e anniversaire de l’AS / 400.

Nous allons approfondir l'architecture et obtenir des commentaires sur Db2 Mirror de la part des vendeurs de logiciels de haute disponibilité basés sur des techniques de journalisation à distance. Ce que nous pouvons dire maintenant, c’est que Db2 Mirror nécessite un adaptateur Ethernet haut débit reliant les deux machines prenant en charge le protocole RoMA (RDMA over Converged Ethernet), qui est un clone des techniques d’accès direct à la mémoire à distance intégrées à la commutation InfiniBand il ya 20 ans. . Cela permet aux machines d’accéder à la mémoire les unes des autres à distance, mais la distance est limitée à environ 1 kilomètre. Cela signifie que Db2 Mirror pourrait être bon pour une disponibilité continue au sein d'un centre de donnéesToutefois, la prise en charge de la reprise après sinistre ne fonctionne pas dans un centre de données distant, qu’il s’agisse d’un cloud exécuté par un fournisseur de services ou de celui exploité par une entreprise elle-même.

HISTOIRES APPARENTÉES

Les systèmes cognitifs / 500 2018 Edition

Un futur hypothétique IBM i System

PureApplication Systems reçoit Power7 +, mais pas IBM i

Appliance PureData aux Big Blue Pits contre l’Exadata d’Ellison

Annonces IBM Preps Big Data, Cloud «Project Sparta»

Oracle a construit un AS / 400 moderne et nuageux

DB2 pour i: le cœur battant de la plate-forme IBM i

Oracle-Sun Exadata V2, voici iDatabase V1

HP et Oracle lancent la base de données, et IBM peut donc avec i

Le système iWant, édition 2007

Oubliez Oracle 10g. Parlons de i5 / OS V5g

DB2 / 400: le cœur d'un cluster de supercalculateurs?

Futurs serveurs iSeries, partie 2

Commentaires

Laisser un commentaire

Votre commentaire sera révisé par les administrateurs si besoin.