QUORUMディスクとフェンシングウォーズとは何ですか?


こんにちは皆さん。今回は、コメントで尋ねられた読者の1人(Danielle)の質問に詳細に答えることを考えました。これは、維持する責任がクラスター化された環境にあるときにもこの問題に直面した可能性があるためです。

以下はダニエル・ベロが尋ねた質問です。

「質問があります。仮想環境にフェンス仮想デバイスを設定しようとしましたが、機能しません。構成の一部で、障害後にノードがクラスターに戻らないためです。だから私はクォーラムディスクを追加しました、そして最後に私のクラスターは正常に動作します(ノードがダウンし、障害がクラスターに戻った後)、それで私の質問は:仮想のフェンスデバイスとクォーラムディスクの違いは何ですか環境?"

以下のクラスタリングの以前の記事シリーズを参照することで、フェンシングデバイスとは何かを参照できます。

  1. Fencing and Adding a Failover to Clustering – Part 3

まず、クォーラムディスクとは何かを見てみましょう。

Quorum Diskとは何ですか?

クォーラムディスクは、クラスター構成のストレージタイプです。これは、クラスター化された環境に関連するデータを保持するデータベースのように機能し、クォーラムディスクの役割は、どのノードをALIVE状態に維持するかをクラスターに通知することです。これにより、他のすべてのノードからデータの読み取り/書き込みを同時に行うことができます。

ノード間で接続が切断されると(1つのノードまたは複数のノードの場合があります)、クォーラムは接続のないノードを分離し、サービスをアクティブなノードで稼働させ続けます。接続されていないノードをクラスターからアウトオブサービスにします。

それでは、質問に移りましょう。これは、2つのノードがあり、1つがダウンした環境のように見えます。ダニエルが直面した状況は、アクティブな2つのノード間の「フェンシング戦争」のようです。

構成にクォーラムディスクが追加されていないクラスター環境があるとします。このクラスターには2つのノードがあり、現在1つのノードに障害が発生しています。この特定のシナリオでは、ノード1とノード2の間の接続が完全に失われます。

次に、ノード1は、ノード2への接続を確立できないためにノード2が失敗したことを確認し、ノード1はノード2をフェンスすることを決定します。同時に、ノード2は、ノード1への接続を確立できず、ノード2が決定したため、ノード1が失敗したことを確認します。ノード1もフェンスします。

ノード1はノード2をフェンスダウンしているため、クラスター化されているサービスとリソースを引き継ぎます。ノード2にはこの状況を確認するためのクォーラムディスクがないため、ノード2は、ノード1に接続しなくても、サーバー内のすべてのサービスを再起動できます。

前に述べたように、ノード2はノード2からノード1への接続を認識できないため、ノード1もフェンスします。次に発生するのは、ノード1の状態もチェックするクォーラムがないため、ノード1がサーバー内のすべてのサービスを再起動することです。

これはフェンシング戦争として識別されます

これで、エンジニアがサービスを手動で停止するか、サーバーがシャットダウンされるか、ノード間でネットワーク接続が正常に確立されるまで、このサイクルは永遠に続きます。ここで、クォーラムディスクが役立ちます。クォーラム構成の投票プロセスは、上記のサイクルの原因を防ぐメカニズムです。

  1. Clustered environments are used everywhere for the safety of data and services to give end users maximum uptime and live data experience.
  2. A fence device is used in clustered environments to isolate a node whose state is unknown to other nodes. Cluster will use fence device to automatically fence (remove) the failed node and keep the services up and running and start the failover over processes.
  3. A quorum disk is not essential to have in a clustered environment, but better to have one in a 2 node cluster to avoid fencing wars.
  4. It’s not a problem having a quorum disk in a cluster where there are more than 2 nodes but it’s less likely are the chances of happening a fencing war in a this particular environment. Hence, it’s less important to have a quorum disk in a 3 or more node cluster than a 2 node cluster.
  5. By the way it’s good to have a quorum disk in a multi node cluster environment, so that you can execute user customized health checks for among the nodes.

重要:クォーラムにノードを追加できる制限があることに注意してください。最大16個のノードを追加できます。

あなたが記事を楽しんだことを望みます。より便利なLinuxテクニカルガイドについては、tecmintと連絡を取り合ってください。