Qu'est-ce qu'une implémentation de cluster galera stable à l'échec et évolutive?

Context: Nous utilisons un cluster MariaDB Gallera avec (seulement) 2 noeuds maîtres pour une application Web. La nuit dernière, nous avons eu une panne de courant et maintenant, nous ne semblons pas récupérer datatables et nous avons découvert que la database était corrompue sur les deux nœuds. Notre printing initiale sur cette configuration était si un noeud descendait, l'autre agissant rapidement comme nœud principal.

Mes questions sont,

  1. Existe-t-il un moyen de configurer un cluster de sorte qu'il y ait toujours un nœud de sauvegarde qui sera répliqué automatiquement si l'un des noeuds descend? Spécialement en cas de panne de courant.

  2. Quelle serait la mise en œuvre correcte du cluster de galeries?

2 Solutions collect form web for “Qu'est-ce qu'une implémentation de cluster galera stable à l'échec et évolutive?”

Nous utilisons un cluster Galera avec 5 nœuds dotés d'un équilibreur de charge devant eux, qui vérifie continuellement tous les nœuds. Notre configuration est que nous n'avons qu'un des noeuds desservant une cible d'écriture et de lecture pour les connections à partir de l'équilibreur de charge et que les autres nœuds sont en veille chaude. Mais, bien sûr, Galera prend également en charge la lecture et l'écriture multi-maisortingse, afin que vous puissiez régler cela à votre convenance.

La taille minimale du cluster doit être de trois, puisqu'il s'agit d'un nombre impair pour éviter une situation cérébrale divisée lorsque la connection entre les noeuds diminue pour quelque raison que ce soit. (Vous pouvez également utiliser un arbitre, mais l'installation plus simple consiste simplement à utiliser au less 3 nœuds de cluster appropriés.) Nous utilisons 5 noeuds, pour permettre des mises à niveau plus faciles sur le cluster et augmenter la résilience.

Galera prend également en charge un cluster sur WAN, mais cela nécessite un réglage supplémentaire dans les parameters du server pour ne pas ébranler les performances du server. Généralement, un cluster avec 3 nœuds possédant un réseau et une puissance redondants devrait être adapté aux applications.

Une chose que vous n'avez pas mentionnée dans votre question est le type de moteur de database que vous utilisez sur votre cluster Galera. En voyant que vous avez eu la corruption, je pense que c'est probablement MyISAM? Si c'est le cas, vous devez migrer vers InnoDB, car MyISAM n'est pas pris en charge par Galera. Il a également d'autres avantages, comme une écriture plus résiliente qui évite la corruption de données, même dans le cas improbable où le cluster devrait se briser et qu'il faut restaurer la database.

La réponse à la première question, comme pour la plupart des problèmes informatiques, est: oui, si vous avez suffisamment de ressources et de time. Si le cluster se trouve dans une sorte d'environnement de centre de données, on pourrait espérer une sorte d'interface de gestion hors bande, comme les NIC de gestion dédiées et / ou un système KVM.

Les solutions modernes de gestion de datacenter, telles que les systèmes de gestion de Datacenter Manager ou Ratitan Datacenter d' Intel, offrent aux users la possibilité de configurer des stratégies pour redémarrer automatiquement les systèmes après une panne de courant, envoyer des notifications et potentiellement même commencer à faire tourner des nœuds sans basure sur le site ou basés sur le cloud. Cependant, il existe potentiellement un excellent coût et un niveau d'expertise nécessaire pour configurer et configurer tous les aspects de ce type de filet de security, il nécessite beaucoup d'équipement et des tests et des préparatifs approfondis sont difficiles sans perte d'arrêt.

Un autre outil de gestion de nœud commun est Nagios, qui permet de gérer et de contrôler l'alimentation à distance.

En plus des options de gestion hors bande et hors bande, la configuration d'un server de gestion de configuration à l'aide d'un outil CM, comme Salt ou Chef , permettrait de s'assurer que les nœuds sont correctement configurés et simplifie considérablement la tâche de provisionnement de nouveaux nœuds, même dans des environnements étranges ou éloignés. Les exigences de stockage et de database, ainsi que l'environnement de réseau, aideront à déterminer l'architecture de cluster appropriée, en particulier en ce qui concerne le stockage, l'alimentation et les sauvegardes. Dans certains cas, il pourrait être utile de générer des clones kickstart ou une sorte d'aide d'installation similaire, comme AutoYaST sur les systèmes SUSE. TipoddGMdMMdMMMMMMdiceeadiceAeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaidenceidence Daea Da Marco Daea Daea DaeaF Daea Daea Daea Daea Daea Da Marco MarcoAFMMMM DaFMMMF DaFMMagesAeaTM DaFMMMMMF Da MandMM DaFMMMM

Dd illustréadMaché Ajonet ChamonetAachéleaMacheaúeaeaeaAachea aleeaeaeaeaea aledeaeaeaeaeaea aledeaeaeaea aledea aleeaea aleea aleeaea aleea aleeaea aleea aleeaea aleea aleeaea aleeaea aleea aleeaea aleea aleeaea aleea aleeaea aleea aleeaea aleea aleea aleeaea aleea aleea aleea aleea aleea aleea aleea aleea aleea aleea aleea aleea aleea aleea ale L'utilisation de KIWI vous permettra de créer des images qui peuvent être déployées dans divers scénarios, y compris comme machines virtuelles, sur PXE, DVD / USB amorçables et plus encore. NE MarcoAFeaAeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaeafeeaeaeaeaeaeaeaeaeaficeeteridenceeaeaeaeaeaeaeaeaeaeaeaeaeaeaeaagetereaeaeaidenceeaeaeaeaeaeaeaageaeaeaeaidenceeaeaeaeaeaeaageteridenceeaeaeaeaeaeaeaeaageteridence laieea afeaeaeaeaeaeaeaeaeaea

Être plus spécifique à propos de la deuxième question est difficile sans connaître les longueurs que vous jugerez acceptables. L'installation et les ressources requirejses pour un cluster multi-sites à haute disponibilité avec des sauvegardes distantes supplémentaires, un basculement automatique et une récupération sont radicalement différentes de celles requirejses pour un cluster où "haute disponibilité" signifie que si le bâtiment du cluster réside le pouvoir et l'internet, il doit fonctionner. Espérons que certaines de ces informations sont utiles.

  • Solutions MySQL HA
  • Existe-t-il un moyen simple de merge une réplication 2-way-MySQL cassée
  • Comment configurer la réplication MySQL avec un temps d'arrêt minimal
  • Erreur du server de réplication MySQL
  • Empêchez-vous d'écrire des écritures sans réplication sur l'esclave MySQL?
  • Réplication MySQL cassée en binlog pas dans l'ordre chronologique
  • mysql best practices with replication of mysql db (grant storage)
  • greping plusieurs lignes de MySQL binlog
  • Réplication sécurisée de MySQL; SSL ou SSH tunneling?
  • Comment puis-je sauvegarder et répliquer une grande base de données MySQL?
  • Problème MySQL Master-Master Replication Thread esclave
  • Les astuces du serveur de linux et windows, tels que ubuntu, centos, apache, nginx, debian et des sujets de rĂ©seau.