[Linux-ha-jp] pacemakerが正常に起動できません。

Back to archive index

よしばー kitab****@gmail*****
2015年 6月 5日 (金) 09:26:50 JST


山内様

御世話になっております。
北林です。

お忙しいなか、本当に返信ありがとうございます。
後ほど改めて返信させて頂きます。

よろしくお願い致します。



2015/06/04 renay****@ybb***** <renay****@ybb*****>:
> 北林さん
>
> こんにちは、山内です。
>
> やはり、手元の環境では再現しないようです。
>
> 最初に頂いたログを見た所・・・
> どうやら、corosyncが正常に上がっていない為に、pacemakerがcorosyncに接続できない状態が発生しています。
>
> 発生した時(発生したあたりでもOK)の/var/log/messagesの内容についても、もし可能であれば、開示頂けますでしょうか?
>
> また、start pacemaker.combinedでの起動失敗の発生時、
>
> 1)corosyncのプロセスが起動しているか?(psコマンド)
> 2)起動している場合、corosync-cfgtool -sの実行結果はどうなるか?
>
> も確認していただければ。。と思います。
>
>
> 以上です。
>
>
>
> ----- Original Message -----
>> From: "renay****@ybb*****" <renay****@ybb*****>
>> To: "linux****@lists*****" <linux****@lists*****>
>> Cc:
>> Date: 2015/6/4, Thu 12:48
>> Subject: Re: [Linux-ha-jp] pacemakerが正常に起動できません。
>>
>> 北林さん
>>
>> こんにちは、山内です。
>>
>> はい、北林さんの提示されている順番でOKです。
>>
>> 以上です。
>>
>>
>> ----- Original Message -----
>>>  From: よしばー <kitab****@gmail*****>
>>>  To: renay****@ybb*****; linux****@lists*****
>>>  Cc:
>>>  Date: 2015/6/4, Thu 12:12
>>>  Subject: Re: [Linux-ha-jp] pacemakerが正常に起動できません。
>>>
>>>  山内様
>>>
>>>  御世話になっております。
>>>  北林です。
>>>  ご回答ありがとうございます。
>>>
>>>  何度も申しわけありません、
>>>  起動、停止の順は
>>>  (起動)
>>>  #initctl start corosync
>>>  #initctl start pacemaker
>>>  (停止)
>>>  #initctl stop pacemaker
>>>  #initctl stop corosync
>>>
>>>  でよろしいでしょうか。
>>>
>>>  2015/06/04 renay****@ybb***** <renay****@ybb*****>:
>>>>   北林さん
>>>>
>>>>
>>>>   こんにちは、山内です。
>>>>
>>>>   1,2,3共に基本的な動作に違いはありません。
>>>>
>>>>   起動・停止を簡易にしているのが、pacemaker.combinedという認識でOKです。
>>>>
>>>>
>>>>   pacemaker.combinedで起動できない件ですが、手元のRHEL6.5(VM)では今の所、再現しません。
>>>>
>>>>   何かわかりましたら、ご連絡します。
>>>>
>>>>   以上です。
>>>>
>>>>
>>>>
>>>>   ----- Original Message -----
>>>>>   From: よしばー <kitab****@gmail*****>
>>>>>   To: renay****@ybb*****; linux****@lists*****
>>>>>   Cc:
>>>>>   Date: 2015/6/4, Thu 11:36
>>>>>   Subject: Re: [Linux-ha-jp] pacemakerが正常に起動できません。
>>>>>
>>>>>   山内様
>>>>>
>>>>>   何度も申しわけありません。
>>>>>   北林です。
>>>>>   追加で質問がございます。
>>>>>
>>>>>   【1】
>>>>>   pacemakerを起動した後、
>>>>>   以下の設定をpacemakerに読み込ませたいのですが、
>>>>>   #initctl start corosync
>>>>>   #initctl start pacemaker
>>>>>   で、pacemakerを起動させた場合でも可能なのでしょうか。
>>>>>
>>>>>
>>>>>   手順①#vi 0604.crm
>>>>>   ===========================
>>>>>   (設定内容)
>>>>>   node 1: first
>>>>>   node 2: second
>>>>>   primitive vipcheck ocf:heartbeat:VIPcheck \
>>>>>           params \
>>>>>                   target_ip="172.16.87.233" \
>>>>>                   count=3 \
>>>>>                   wait=5 \
>>>>>           op start   interval=0  timeout=60
>> on-fail="restart"
>>>  \
>>>>>           op stop    interval=0  timeout=60
>> on-fail="ignore"
>>>  \
>>>>>           op monitor interval=10 timeout=60
>> on-fail="restart"
>>>>>   start-delay=0
>>>>>   primitive tomcat ocf:heartbeat:tomcat \
>>>>>           params \
>>>>>
>>>  java_home="/usr/lib/jvm/java-1.7.0-openjdk.x86_64"
>>>>>   \
>>>>>                   catalina_home="/var/lib/tomcat" \
>>>>>           op start   interval=0  timeout=60
>> on-fail="restart"
>>>  \
>>>>>           op stop    interval=0  timeout=120
>> on-fail="ignore"
>>>  \
>>>>>           op monitor interval=10 timeout=30
>> on-fail="restart"
>>>>>   primitive apache ocf:heartbeat:apache \
>>>>>           op start   interval=0  timeout=40
>> on-fail="restart"
>>>  \
>>>>>           op stop    interval=0  timeout=60
>> on-fail="ignore"
>>>  \
>>>>>           op monitor interval=10 timeout=20
>> on-fail="restart"
>>>>>   primitive vip ocf:heartbeat:IPaddr2 \
>>>>>           params ip="172.16.87.233" \
>>>>>           op start   interval=0  timeout=20
>> on-fail="restart"
>>>  \
>>>>>           op stop    interval=0  timeout=20
>> on-fail="ignore"
>>>  \
>>>>>           op monitor interval=10 timeout=20
>> on-fail="restart"
>>>>>   group web-group \
>>>>>           vipcheck tomcat apache vip
>>>>>   location rsc_location-1 web-group \
>>>>>       rule 200: #uname eq first \
>>>>>       rule 100: #uname eq second
>>>>>   property cib-bootstrap-options: \
>>>>>           no-quorum-policy=ignore \
>>>>>           stonith-enabled=false
>>>>>   rsc_defaults rsc-options: \
>>>>>           resource-stickiness=INFINITY \
>>>>>           migration-threshold=1
>>>>>   ===========================
>>>>>   手順②#crm configure load update 0604.crm
>>>>>
>>>>>
>>>>>   【2】
>>>>>   #initctl start corosync
>>>>>   #initctl start pacemaker
>>>>>   でpacemakerを起動させた場合でも、
>>>>>   #initctl start pacemaker.combinedで起動させた場合と
>>>>>   障害が起こった後の、ノードの切り替え方は同じでしょうか。
>>>>>
>>>>>   (#crm resource cleanup ○○
>>>>>   #crm resource move ○○
>>>>>   #crm resource unmove ○○等)
>>>>>
>>>>>   【3】
>>>>>   その他、
>>>>>   #initctl start corosync
>>>>>   #initctl start pacemaker
>>>>>   でpacemakerを起動させた場合と
>>>>>   #initctl start pacemaker.combined
>>>>>   でpacmakerで起動させた場合で、操作方法等に違いはありますでしょうか。
>>>>>   (#initctl start corosync
>>>>>   #initctl start pacemakerの起動・停止の順番など)
>>>>>
>>>>>   以上です。
>>>>>   長くなり申しわけありません。
>>>>>
>>>>>   よろしくお願い致します。
>>>>>
>>>>>   2015/06/04 よしばー <kitab****@gmail*****>:
>>>>>>    山内様
>>>>>>
>>>>>>    御世話になっております。
>>>>>>    北林です。
>>>>>>    返信ありがとうございます。
>>>>>>
>>>>>>    回答させて頂きます。
>>>>>>
>>>>>>    【1】環境(OS,libqb,corosynのバージョン)
>>>>>>    OS:RHEL6.5
>>>>>>    libqb:0.17.1-1el6
>>>>>>    corosync:2.3.4-1.el6
>>>>>>
>>>>>>    【2】pacemaker.combinedは利用せずに個別の起動は可能か
>>>>>>    ①initctl start corosync ⇒可能
>>>>>>    ②initctl start pacemaker ⇒可能
>>>>>>
>>>>>>    #crm_mon -fADコマンドの結果、
>>>>>>    両ノードの状態が「Online」になっていることを確認出来ました。
>>>>>>
>>>>>>    【3】pacemaker.combinedのファイル
>>>>>>    これは、
>>>>>>    /etc/init/pacemaker.combined.confでよろしいでしょうか。
>>>>>>
>>>>>>    #view /etc/init/pacemaker.combined.conf
>>>>>>    (内容)
>>>>>>    # pacemaker-corosync - High-Availability cluster
>>>>>>    #
>>>>>>    # Starts Corosync cluster engine and Pacemaker cluster
>> manager.
>>>>>>
>>>>>>    stop on runlevel [0123456]
>>>>>>    kill timeout 3600
>>>>>>    respawn
>>>>>>
>>>>>>    env prog=pacemakerd
>>>>>>    env rpm_sysconf=/etc/sysconfig/pacemaker
>>>>>>    env rpm_lockfile=/var/lock/subsys/pacemaker
>>>>>>    env deb_sysconf=/etc/default/pacemaker
>>>>>>    env deb_lockfile=/var/lock/pacemaker
>>>>>>
>>>>>>    script
>>>>>>        [ -f "$rpm_sysconf" ] && . $rpm_sysconf
>>>>>>        [ -f "$deb_sysconf" ] && . $deb_sysconf
>>>>>>        exec $prog
>>>>>>    end script
>>>>>>
>>>>>>    pre-start script
>>>>>>        # setup the software watchdog which corosync uses.
>>>>>>        # rewrite according to environment.
>>>>>>        modprobe softdog soft_margin=60
>>>>>>        pidof corosync || start corosync
>>>>>>
>>>>>>        # if you use corosync-notifyd, uncomment the line below.
>>>>>>        #start corosync-notifyd
>>>>>>
>>>>>>        # give it time to fail.
>>>>>>        sleep 2
>>>>>>        pidof corosync || { exit 1; }
>>>>>>    end script
>>>>>>
>>>>>>    post-start script
>>>>>>        [ -f "$rpm_sysconf" ] && . $rpm_sysconf
>>>>>>        [ -f "$deb_sysconf" ] && . $deb_sysconf
>>>>>>        [ -z "$LOCK_FILE" -a -d /etc/sysconfig ]
>> &&
>>>>>   LOCK_FILE="$rpm_lockfile"
>>>>>>        [ -z "$LOCK_FILE" -a -d /etc/default ]
>> &&
>>>>>   LOCK_FILE="$deb_lockfile"
>>>>>>        touch $LOCK_FILE
>>>>>>        pidof $prog > /var/run/$prog.pid
>>>>>>    end script
>>>>>>
>>>>>>    post-stop script
>>>>>>        [ -f "$rpm_sysconf" ] && . $rpm_sysconf
>>>>>>        [ -f "$deb_sysconf" ] && . $deb_sysconf
>>>>>>        [ -z "$LOCK_FILE" -a -d /etc/sysconfig ]
>> &&
>>>>>   LOCK_FILE="$rpm_lockfile"
>>>>>>        [ -z "$LOCK_FILE" -a -d /etc/default ]
>> &&
>>>>>   LOCK_FILE="$deb_lockfile"
>>>>>>        rm -f $LOCK_FILE
>>>>>>        rm -f /var/run/$prog.pid
>>>>>>
>>>>>>        # if you use watchdog of corosync, uncomment the line
>> below.
>>>>>>        pidof corosync || false
>>>>>>
>>>>>>        pidof crmd || stop corosync
>>>>>>
>>>>>>        # if you want to reboot a machine by watchdog of corosync
>> when
>>>>>>        # pacemakerd disappeared unexpectedly, uncomment the line
>>
>>>  below
>>>>>>        # and invalidate above "respawn" stanza.
>>>>>>        #pidof crmd && killall -q -9 corosync
>>>>>>
>>>>>>        # if you use corosync-notifyd, uncomment the line below.
>>>>>>        #stop corosync-notifyd || true
>>>>>>    end script
>>>>>>
>>>>>>
>>>>>>    以上です。
>>>>>>
>>>>>>    #initctl start corosync
>>>>>>    #initctl start pacemaker
>>>>>>    でもpacemakerを起動させることが出来るのを確認致しましたが、やはり
>>>>>>    #initctl start pacemaker.combined
>>>>>>    で起動させたいです。
>>>>>>
>>>>>>    お手数をおかけし申しわけありませんが、知恵を頂けませんでしょうか。
>>>>>>
>>>>>>    よろしくお願い致します。
>>>>>>
>>>>>>    2015/06/04 renay****@ybb*****
>>>  <renay****@ybb*****>:
>>>>>>>    北林さん
>>>>>>>
>>>>>>>
>>>>>>>    こんにちは、山内です。
>>>>>>>
>>>>>>>    すいません。もう1点・・・
>>>>>>>
>>>>>>>    念の為、pacemaker.combinedのファイルも開示して頂けますでしょうか?
>>>>>>>
>>>>>>>    以上です。
>>>>>>>
>>>>>>>
>>>>>>>    ----- Original Message -----
>>>>>>>>    From: "renay****@ybb*****"
>>>>>   <renay****@ybb*****>
>>>>>>>>    To: "linux****@lists*****"
>>>>>   <linux****@lists*****>;
>>>>>>>>    linux-ha-japan
>> <linux****@lists*****>
>>>>>>>>    Cc:
>>>>>>>>    Date: 2015/6/4, Thu 08:22
>>>>>>>>    Subject: Re: [Linux-ha-jp] pacemakerが正常に起動できません。
>>>>>>>>
>>>>>>>>    北林さん
>>>>>>>>
>>>>>>>>    こんにちは、山内です。
>>>>>>>>
>>>>>>>>    RAID1の設定は関係ないと思われます。
>>>>>>>>
>>>>>>>>    ちなみに、環境(OS,libqb,corosynのバージョン)など確認して頂けますでしょうか?
>>>>>>>>
>>>>>>>>    後1点、pacemaker.combinedは利用せずに個別の起動は可能でしょうか?
>>>>>>>>
>>>>>>>>    ①initctl start corosync
>>>>>>>>    ②initctl start pacemaker
>>>>>>>>
>>>>>>>>    以上です。
>>>>>>>>
>>>>>>>>
>>>>>>>>    ----- Original Message -----
>>>>>>>>>     From: よしばー <kitab****@gmail*****>
>>>>>>>>>     To: linux-ha-japan
>>>  <linux****@lists*****>
>>>>>>>>>     Cc:
>>>>>>>>>     Date: 2015/6/3, Wed 15:53
>>>>>>>>>     Subject: Re: [Linux-ha-jp] pacemakerが正常に起動できません。
>>>>>>>>>
>>>>>>>>>     いつも御世話になっております。
>>>>>>>>>     北林です。
>>>>>>>>>     何度も申しわけありません。
>>>>>>>>>
>>>>>>>>>     先程質問させて頂いたサーバの環境ですが、
>>>>>>>>>     2台でクラスタ構成を組もうと思っていて、
>>>>>>>>>     なおかつ、それぞれRAID1の設定がしてあります。
>>>>>>>>>
>>>>>>>>>     なにか関係があるのでしょうか。
>>>>>>>>>
>>>>>>>>>     お手数をおかけし申しわけありません。
>>>>>>>>>     今までと全く同じ手順で行っているのに、
>>>>>>>>>     なぜここでエラーが起きるのかわからず困惑しています。
>>>>>>>>>
>>>>>>>>>     よろしくお願い致します。
>>>>>>>>>
>>>>>>>>>
>>>>>>>>>     2015/06/03 よしばー
>> <kitab****@gmail*****>:
>>>>>>>>>>      いつも御世話になっております。
>>>>>>>>>>      北林です。
>>>>>>>>>>
>>>>>>>>>>      Pacemaker-1.1.12を使ったクラスタ構成において、
>>>>>>>>>>      以下のエラーが発生いたしました。
>>>>>>>>>>      お手数をおかけし申しわけありませんが、ご教授頂けないでしょうか。
>>>>>>>>>>
>>>>>>>>>>      設定方法は、以下を参考にしています。
>>>>>>>>>>
>>>>>
>> http://linux-ha.osdn.jp/wp/wp-content/uploads/OSC-Tokyo2014Fall.pdf
>>>>>>>>>>
>>>>>>>>>>      ①#initctl start pacemaker.combined が使えない。
>>>>>>>>>>
>>>>>>>>>>      初期設定を行い、initctl start
>>>  pacemaker.combinedコマンドを入力しますと、
>>>>>>>>>>      【initctl: Job failed to start】
>>>>>>>>>>      とpacemakerを起動することが出来ません。
>>>>>>>>>>      この場合、何が原因と考えられるのでしょうか。
>>>>>>>>>>
>>>>>>>>>>      ②①の続きに、試しに#initctl start pacemakeとうってみると、
>>>>>>>>>>      プロセスは起動するものの、
>>>>>>>>>>       #crm_mon -fADコマンドをうっても
>>>>>>>>>>      【Attempting connection to the
>>>  cluster...】のまま動きがありません。
>>>>>>>>>>
>>>>>>>>>>      この際の、pacemaker.logの内容は以下です。
>>>>>>>>>>
>>>>>>>>>>      ▼pacemaker.log
>>>>>>>>>>
>>>>>>>>>>      Jun 03 13:32:12 [4600] first pacemakerd:
>>
>>>  info:
>>>>>   mcp_read_config:
>>>>>>>>>>        cmap connection setup failed:
>> CS_ERR_LIBRARY.
>>>  Retrying
>>>>>   in 2s
>>>>>>>>>>      Jun 03 13:32:14 [4600] first pacemakerd:
>>
>>>  info:
>>>>>   mcp_read_config:
>>>>>>>>>>        cmap connection setup failed:
>> CS_ERR_LIBRARY.
>>>  Retrying
>>>>>   in 3s
>>>>>>>>>>      Jun 03 13:32:17 [4600] first pacemakerd:
>>
>>>  info:
>>>>>   mcp_read_config:
>>>>>>>>>>        cmap connection setup failed:
>> CS_ERR_LIBRARY.
>>>  Retrying
>>>>>   in 4s
>>>>>>>>>>      Jun 03 13:32:21 [4600] first pacemakerd:
>>
>>>  info:
>>>>>   mcp_read_config:
>>>>>>>>>>        cmap connection setup failed:
>> CS_ERR_LIBRARY.
>>>  Retrying
>>>>>   in 5s
>>>>>>>>>>      Jun 03 13:32:26 [4600] first pacemakerd:
>>>  warning:
>>>>>   mcp_read_config:
>>>>>>>>>>        Could not connect to Cluster
>> Configuration
>>>  Database
>>>>>   API, error 2
>>>>>>>>>>      Jun 03 13:32:26 [4600] first pacemakerd:
>>>  notice: main:
>>>>>>>>>>    Could
>>>>>>>>>>      not obtain corosync config data, exiting
>>>>>>>>>>      Jun 03 13:32:26 [4600] first pacemakerd:
>>
>>>  info:
>>>>>   crm_xml_cleanup:
>>>>>>>>>>        Cleaning up memory from libxml2
>>>>>>>>>>      Jun 03 13:32:26 [4612] first pacemakerd:
>>
>>>  info:
>>>>>   crm_log_init:
>>>>>>>>>>        Changed active directory to
>>>>>   /var/lib/heartbeat/cores/root
>>>>>>>>>>      Jun 03 13:32:26 [4612] first pacemakerd:
>>
>>>  info:
>>>>>   crm_ipc_connect:
>>>>>>>>>>        Could not establish pacemakerd
>> connection:
>>>  Connection
>>>>>   refused
>>>>>>>>>>    (111)
>>>>>>>>>>      Jun 03 13:32:26 [4612] first pacemakerd:
>>
>>>  info:
>>>>>   mcp_read_config:
>>>>>>>>>>        cmap connection setup failed:
>> CS_ERR_LIBRARY.
>>>  Retrying
>>>>>   in 1s
>>>>>>>>>>      Jun 03 13:32:27 [4612] first pacemakerd:
>>
>>>  info:
>>>>>   mcp_read_config:
>>>>>>>>>>        cmap connection setup failed:
>> CS_ERR_LIBRARY.
>>>  Retrying
>>>>>   in 2
>>>>>>>>>>
>>>>>>>>>>      以上です。
>>>>>>>>>>
>>>>>>>>>>      pacemakerを正常に起動させるためにはどうすればよろしいでしょうか。
>>>>>>>>>>
>>>>>>>>>>      お手数をおかけ致しますが、
>>>>>>>>>>      よろしくお願い致します。
>>>>>>>>>>
>>>>>>>>>
>>>>>>>>>
>>>>>>>>>     _______________________________________________
>>>>>>>>>     Linux-ha-japan mailing list
>>>>>>>>>    Linux****@lists*****
>>>>>>>>>
>> http://lists.osdn.me/mailman/listinfo/linux-ha-japan
>>>>>>>>>
>>>>>>>>
>>>>>>>>    _______________________________________________
>>>>>>>>    Linux-ha-japan mailing list
>>>>>>>>    Linux****@lists*****
>>>>>>>>    http://lists.osdn.me/mailman/listinfo/linux-ha-japan
>>>>>>>>
>>>>>>>
>>>>>>>    _______________________________________________
>>>>>>>    Linux-ha-japan mailing list
>>>>>>>    Linux****@lists*****
>>>>>>>    http://lists.osdn.me/mailman/listinfo/linux-ha-japan
>>>>>>>
>>>>>>
>>>>>
>>>>
>>>>   _______________________________________________
>>>>   Linux-ha-japan mailing list
>>>>   Linux****@lists*****
>>>>   http://lists.osdn.me/mailman/listinfo/linux-ha-japan
>>>>
>>>
>>
>> _______________________________________________
>> Linux-ha-japan mailing list
>> Linux****@lists*****
>> http://lists.osdn.me/mailman/listinfo/linux-ha-japan
>>
>
> _______________________________________________
> Linux-ha-japan mailing list
> Linux****@lists*****
> http://lists.osdn.me/mailman/listinfo/linux-ha-japan
>



Linux-ha-japan メーリングリストの案内
Back to archive index