[Linux-ha-jp] Pacemakerのフェールオーバー後のノード組込みについて

Back to archive index
renay****@ybb***** renay****@ybb*****
2022年 6月 4日 (土) 09:20:04 JST


辻さん

こんにちは、山内です。

5)が正常に終わっているとのことですので、マスターに昇格したスレーブとの同期は正しく実行されていると思いますので、
再起動して、スレーブ起動しようとしているpacemakerのリソース起動中に何か起きていると思われます。

RAが2度startされているとのことですが、ログなど拝見出来ればなにかわかるかも知れません。

以下の点、とりあえず、確認して見た方が良いかと思います。
1)STONITHは組み込まれていると思いますが、マスターノードは正常にフェンシング終了して、再起動しているでしょうか?
2)corosync/pacemakerのsystemdの自動起動が有効になっていたりしませんでしょうか?

以上、よろしくお願いいたします。

> ----- Original Message -----
> 
> From: "辻 真吾" <tsuji****@ryobi*****>
> To: "LINUX-HA" <linux****@lists*****>
> Cc: "d-ike****@ryobi*****" <d-ike****@ryobi*****>
> Date: 2022/06/03 金 16:29
> Subject: [Linux-ha-jp] Pacemakerのフェールオーバー後のノード組込みについて
> 
> 
> 初めて投稿させていただきます。
> 辻と申します。
> 
> DBサーバ(PostgreSQLレプリケーション構成)を
> Pacemaker+Corosyncを使用してHAクラスタ構成としています。
> 
> クラスタ構成において、フェールオーバーを発生させて、
> その後に、ダウンさせたノードの組込みを実施したところ、
> 組込みに失敗するという事象が発生しております。
> 
> 初期状態のノードを以下の構成として、実施した手順を記載いたします。
>   - マスターノード:ノード1
>   - スレーブノード:ノード2
> 
> 実施手順
>  1. ノード1のpostgresプロセスをkill
>  2. ノード2がマスターに昇格
>  3. ノード1のpacemaker、corosyncをsystemctlで停止
>  4. ノード1でテーブル空間のディレクトリ配下とPGDATAのディレクトリを削除
>  5. ノード1でpg_basebackupを実施
>     $ /usr/pgsql-14/bin/pg_basebackup -h <ノード2> -D $PGDATA -Xs -P -n
>  6. ノード1のcorosync、pacemakerをsystemctlで起動
>     → ここでノード1が"sync"状態になる想定ですが、
>        実際には起動処理が実施された後に、
>        停止状態に遷移してしまいます。※
> 
>>   手順6の起動を実施した際に、RAのpgsqlでstart処理が二度呼ばれています。
>   一度目のstartは正常終了していますが、二度目のstartが異常終了して、
>   停止状態に遷移しています。
> 
> 使用しているバージョンは以下の通りです。
> corosync : 3.1.5-1
> pacemaker: 2.1.0-8
> pcs      : 0.10.10-4
> PotgreSQL: 14.1
> 
> 原因と対処方法などをご存じの方がおられましたら、ご教授ください。
> よろしくお願いいたします。
> 
> _______________________________________________
> Linux-ha-japan mailing list
> Linux****@lists*****
> https://lists.osdn.me/mailman/listinfo/linux-ha-japan
> 



Linux-ha-japan メーリングリストの案内
Back to archive index