乾 真聡
masat****@kccs*****
2018年 9月 6日 (木) 17:31:04 JST
井上さん 乾です。 ありがとうございます。 monitorはstatusが実行されるんですね。スクリプト見ると確かにPIDファイルをチェックしてます。 再度検証して確認してみます。 以上、よろしくお願い致します。 On Thu, 6 Sep 2018 08:12:50 +0000 井上 和徳 <inoue****@intel*****> wrote: > 乾さん > > こんにちは、井上です。 > > > monitor処理で何を確認しているのかわかっていないのですが、添付のログから何かわかりません > > "lsb:httpd"なので、monitor時には /etc/init.d/httpd の "status)" の処理が > 実行されます。(PIDチェックだと思います) > > ログも見ましたが、推測されている通り startはOK / monitorでエラー検知 > (httpdが"not running")が発生していますね。 > > 停止していた元稼働系ホスト起動時=httpd起動時の動作を確認してみるのが、 > 解決の糸口になるかと思います。 > > 以上です。 > > > -----Original Message----- > > From: linux****@lists***** > > [mailto:linux****@lists*****] On Behalf Of 乾 真聡 > > Sent: Wednesday, September 05, 2018 5:54 PM > > To: linux****@lists***** > > Subject: Re: [Linux-ha-jp] Pacemakerのcloneリソースの動きについて質問 > > > > 高塚様 > > > > お世話になっております。乾と申します。 > > > > 再度スプリットブレイン時の動作を確認し、ログを取得しました。 > > やはり、apacheの自動起動を無効にすると待機系側を組み込んだ際に、待機系側の > > apacheリソースがfail状態になります。 > > ただ、プロセス自体は起動しており、リソース上でfailになっていました。 > > 恐らくstart処理は効いていて、monitor処理で異常が起きているのではないかと思っ > > ております。 > > monitor処理で何を確認しているのかわかっていないのですが、添付のログから何かわ > > かりません > > でしょうか? > > > > 以上、よろしくお願い致します。 > > > > > > On Wed, 05 Sep 2018 11:31:08 +0900 > > 乾 真聡 <masat****@kccs*****> wrote: > > > > > 高塚様 > > > > > > 返信いただきありがとうございます。助かります。 > > > > > > xinetdについてはSSHをxinetd制御としており、sshdが停止したらリソースを対向 > > サーバへ > > > 切り替えるという動きとしたかったので入れております。 > > > > > > xinetdを自動起動にしているのは検証を行っており、最悪ログインできなくなってし > > まうことを > > > 避けたかったためです。 > > > 可能であれば、chkconfigによる自動起動はしないようにしたいと考えています。 > > > > > > ログやcrm_mon結果を確認したのですが、なぜfaileになるかわからないといった状 > > 況です。 > > > clone設定したプロセスの自動起動を有効にした場合、運用上なにかデメリットはあ > > りますでしょうか? > > > > > > 以上、よろしくお願い致します。 > > > > > > On Wed, 5 Sep 2018 10:28:20 +0900 > > > TAKATSUKA Haruka <haruk****@sraos*****> wrote: > > > > > > > 高塚と申します。 > > > > > > > > インラインで記載します。 > > > > > > > > On Wed, 05 Sep 2018 09:41:21 +0900 > > > > 乾 真聡 <masat****@kccs*****> wrote: > > > > > > > > > お世話になっております。 > > > > > > > > > > 質問させていただいておりますが、いかがでしょうか? > > > > > 何かしら反応いただけると幸いです。 > > > > > > > > > > 以上、よろしくお願い致します。 > > > > > > > > > > On Fri, 31 Aug 2018 17:46:40 +0900 > > > > > 乾 真聡 <masat****@kccs*****> wrote: > > > > > > > > > > > お世話になっております。 > > > > > > > > > > > > cloneリソースの動きについて質問させてください。 > > > > > > Pacemakerリソース設定として以下<リソース設定>を設定しています。 > > > > > > > > > > > > xinetdとhttpdはclone設定しておりますが、xinetdはchkconfigの自動起動 > > が有効、httpdは無効となっております。 > > > > > > そこで、以下の手順でスプリットブレインを発生させ、復旧させます。 > > > > > > > > > > > > <検証手順> > > > > > > ・スプリットブレインを発生(ネットワーク遮断) > > > > > > ・ping_checkの動作により待機系ホストのPacemakerプロセスを停止。稼働 > > 系ホストは稼働系として起動し続ける。 > > > > > > ・稼働系ホストを停止し、両系停止状態とする。 > > > > > > ・ネットワーク復旧 > > > > > > ・待機系ホストのPacemakerを起動させる。待機系ホストは稼働系として起 > > 動する。 > > > > > > ・停止していた元稼働系ホストを起動させる。 > > > > > > ★・xinetdは両ホストで起動するが、httpdは待機系ホストで起動せず、monitor > > 処理でfailedとなる。 > > > > > > > > > > > > httpdの自動起動を有効にして上記検証を実施したところ、monitor処理でfailed > > にならず起動してきました。 > > > > > > > > > > > > > > <質問内容> > > > > > > ★の部分について、cloneリソースの動きについて質問となりますが、httpd > > が起動していないと、Pacemaker起動タイミングで > > > > > > failedとなるのは正しい動きでしょうか? > > > > > > > > → ログや crm_mon出力から httpdが起動しなかった理由を調べましょう。 > > > > ただし、何であれスプリットブレインが生じた場合からの復帰は手動操作による > > > > 対応が必要と考えたほうが良いです。 > > > > > > > > > > Pacemakerでプロセス起動制御している認識なので自動起動は無効にする必要 > > があるのかと思いましたが、違いますでしょうか? > > > > > > > > → 通常そうします。 > > > > xinetd を自動起動有効にしたのは、そうしないと OS起動に不都合があった > > > > といったあたりでしょうか。xinetd を Pacemaker管理する事例は私は > > > > みたことがありませんでした。反応がないのは、皆さん同様だったのでは > > > > ないでしょうか。 > > > > > > > > > > <リソース設定> > > > > > > ※IP等はXXXに修正しています > > > > > > -------------------------------------------------------------------- > > > > > > node 1: test-bru-web01 \ > > > > > > attributes standby=off > > > > > > node 2: test-bru-web02 \ > > > > > > attributes standby=off > > > > > > primitive EIP EIP \ > > > > > > params elastic_ip=XXXXXX allocation_id=XXXXX \ > > > > > > op start interval=0s timeout=60s \ > > > > > > op monitor interval=30s timeout=30s \ > > > > > > op stop interval=0 timeout=60s > > > > > > primitive httpd lsb:httpd \ > > > > > > op start interval=0s timeout=60s \ > > > > > > op monitor interval=30s timeout=30s \ > > > > > > op stop interval=0s timeout=60s > > > > > > primitive ip-XXX IPaddr \ > > > > > > params ip=XXX nic=eth0 cidr_netmask=24 \ > > > > > > op monitor interval=30s timeout=30s > > > > > > primitive ping_check anything \ > > > > > > params binfile="/usr/local/script/pacemaker/ping_check.sh" \ > > > > > > op monitor interval=30s timeout=30s on-fail=restart > > > > > > primitive replace-route_test-ap lsb:replace-route_test-ap \ > > > > > > op monitor interval=30s timeout=30s > > > > > > primitive vipcheck VIPcheck \ > > > > > > params target_ip=XXX count=3 wait=3 \ > > > > > > op start interval=0 timeout=60 on-fail=restart \ > > > > > > op stop interval=0 timeout=60 on-fail=ignore \ > > > > > > op monitor interval=10 timeout=60 on-fail=restart start-delay=0 > > > > > > primitive xinetd lsb:xinetd \ > > > > > > op start interval=0s timeout=60s \ > > > > > > op monitor interval=30s timeout=30s \ > > > > > > op stop interval=0s timeout=60s > > > > > > group group1 vipcheck ip-XXX replace-route_test-ap EIP > > > > > > clone cln_httpd httpd > > > > > > clone cln_ping_check ping_check > > > > > > clone cln_xinetd xinetd > > > > > > location rsc_location group1 \ > > > > > > rule 200: #uname eq test-bru-web01 \ > > > > > > rule 100: #uname eq test-bru-web02 > > > > > > colocation rsc_colocation1 inf: group1 cln_xinetd > > > > > > colocation rsc_colocation2 inf: group1 cln_httpd > > > > > > property cib-bootstrap-options: \ > > > > > > have-watchdog=false \ > > > > > > dc-version=1.1.16-1.el6-94ff4df \ > > > > > > no-quorum-policy=ignore \ > > > > > > stonith-enabled=false \ > > > > > > have-watchdog=false \ > > > > > > cluster-infrastructure=corosync \ > > > > > > last-lrm-refresh=1535701464 \ > > > > > > maintenance-mode=false > > > > > > rsc_defaults rsc-options: \ > > > > > > resource-stickiness=INFINITY \ > > > > > > migration-threshold=1 > > > > > > -------------------------------------------------------------------- > > > > > > > > > > > > > > > > > > ┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏ > > > > > > 京セラコミュニケーションシステム株式会社 > > > > > > ITインフラソリューション部 > > > > > > 東京ITインフラソリューション1B > > > > > > 乾 真聡 > > > > > > TEL:03-5765-8877 (代表) > > > > > > e-mail:masat****@kccs***** > > > > > > ┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏ > > > > > > > > > > ┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏ > > > > > 京セラコミュニケーションシステム株式会社 > > > > > ITインフラソリューション部 > > > > > 東京ITインフラソリューション1B > > > > > 乾 真聡 > > > > > TEL:03-5765-8877 (代表) > > > > > e-mail:masat****@kccs***** > > > > > ┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏ > > > > > > > > > > _______________________________________________ > > > > > Linux-ha-japan mailing list > > > > > Linux****@lists***** > > > > > https://lists.osdn.me/mailman/listinfo/linux-ha-japan > > > > > > > > > > > > > ______________________________________________________________________ > > > > 高塚 遥 haruk****@sraos***** SRA OSS, Inc. http://www.sraoss.co.jp > > > > 〒171-0022 東京都豊島区南池袋2-32-8 > > > > > > > > _______________________________________________ > > > > Linux-ha-japan mailing list > > > > Linux****@lists***** > > > > https://lists.osdn.me/mailman/listinfo/linux-ha-japan > > > > > > ┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏ > > > 京セラコミュニケーションシステム株式会社 > > > ITインフラソリューション部 > > > 東京ITインフラソリューション1B > > > 乾 真聡 > > > TEL:03-5765-8877 (代表) > > > e-mail:masat****@kccs***** > > > ┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏ > > > > ┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏ > > 京セラコミュニケーションシステム株式会社 > > ITインフラソリューション部 > > 東京ITインフラソリューション1B > > 乾 真聡 > > TEL:03-5765-8877 (代表) > > e-mail:masat****@kccs***** > > ┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏ > > _______________________________________________ > Linux-ha-japan mailing list > Linux****@lists***** > https://lists.osdn.me/mailman/listinfo/linux-ha-japan ┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏ 京セラコミュニケーションシステム株式会社 ITインフラソリューション部 東京ITインフラソリューション1B 乾 真聡 TEL:03-5765-8877 (代表) e-mail:masat****@kccs***** ┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏┏