Pacemakerのフェールオーバー後のノード組込みについて (Linux-ha-jp) - Linux-HA Japan

辻さん

こんにちは、山内です。

5)が正常に終わっているとのことですので、マスターに昇格したスレーブとの同期は正しく実行されていると思いますので、
再起動して、スレーブ起動しようとしているpacemakerのリソース起動中に何か起きていると思われます。

RAが２度startされているとのことですが、ログなど拝見出来ればなにかわかるかも知れません。

以下の点、とりあえず、確認して見た方が良いかと思います。
1)STONITHは組み込まれていると思いますが、マスターノードは正常にフェンシング終了して、再起動しているでしょうか？
2)corosync/pacemakerのsystemdの自動起動が有効になっていたりしませんでしょうか？

以上、よろしくお願いいたします。

> ----- Original Message -----
> 
> From: "辻　真吾" <tsuji****@ryobi*****>
> To: "LINUX-HA" <linux****@lists*****>
> Cc: "d-ike****@ryobi*****" <d-ike****@ryobi*****>
> Date: 2022/06/03 金 16:29
> Subject: [Linux-ha-jp] Pacemakerのフェールオーバー後のノード組込みについて
> 
> 
> 初めて投稿させていただきます。
> 辻と申します。
> 
> DBサーバ(PostgreSQLレプリケーション構成)を
> Pacemaker+Corosyncを使用してHAクラスタ構成としています。
> 
> クラスタ構成において、フェールオーバーを発生させて、
> その後に、ダウンさせたノードの組込みを実施したところ、
> 組込みに失敗するという事象が発生しております。
> 
> 初期状態のノードを以下の構成として、実施した手順を記載いたします。
>   - マスターノード：ノード1
>   - スレーブノード：ノード2
> 
> 実施手順
>  1. ノード1のpostgresプロセスをkill
>  2. ノード2がマスターに昇格
>  3. ノード1のpacemaker、corosyncをsystemctlで停止
>  4. ノード1でテーブル空間のディレクトリ配下とPGDATAのディレクトリを削除
>  5. ノード1でpg_basebackupを実施
>     $ /usr/pgsql-14/bin/pg_basebackup -h <ノード2> -D $PGDATA -Xs -P -n
>  6. ノード1のcorosync、pacemakerをsystemctlで起動
>     → ここでノード1が"sync"状態になる想定ですが、
>        実際には起動処理が実施された後に、
>        停止状態に遷移してしまいます。※
> 
>   ※
>   手順6の起動を実施した際に、RAのpgsqlでstart処理が二度呼ばれています。
>   一度目のstartは正常終了していますが、二度目のstartが異常終了して、
>   停止状態に遷移しています。
> 
> 使用しているバージョンは以下の通りです。
> corosync ： 3.1.5-1
> pacemaker： 2.1.0-8
> pcs      ： 0.10.10-4
> PotgreSQL： 14.1
> 
> 原因と対処方法などをご存じの方がおられましたら、ご教授ください。
> よろしくお願いいたします。
> 
> _______________________________________________
> Linux-ha-japan mailing list
> Linux****@lists*****
> https://lists.osdn.me/mailman/listinfo/linux-ha-japan
>

Linux-HA Japan Forkpm_logconv-cspm_diskdpm_logconv-hbpm_extrasdocpm_crmgenvm-ctlpm_kvm_tools

[Linux-ha-jp] Pacemakerのフェールオーバー後のノード組込みについて

Linux-HA Japan
Fork
pm_logconv-cs
pm_diskd
pm_logconv-hb
pm_extras
doc
pm_crmgen
vm-ctl
pm_kvm_tools