[Linux-ha-jp] pacemakerが正常に起動できません。

Back to archive index

renay****@ybb***** renay****@ybb*****
2015年 6月 4日 (木) 15:30:37 JST


北林さん

こんにちは、山内です。

やはり、手元の環境では再現しないようです。

最初に頂いたログを見た所・・・
どうやら、corosyncが正常に上がっていない為に、pacemakerがcorosyncに接続できない状態が発生しています。

発生した時(発生したあたりでもOK)の/var/log/messagesの内容についても、もし可能であれば、開示頂けますでしょうか?

また、start pacemaker.combinedでの起動失敗の発生時、

1)corosyncのプロセスが起動しているか?(psコマンド)
2)起動している場合、corosync-cfgtool -sの実行結果はどうなるか?

も確認していただければ。。と思います。 


以上です。



----- Original Message -----
> From: "renay****@ybb*****" <renay****@ybb*****>
> To: "linux****@lists*****" <linux****@lists*****>
> Cc: 
> Date: 2015/6/4, Thu 12:48
> Subject: Re: [Linux-ha-jp] pacemakerが正常に起動できません。
> 
> 北林さん
> 
> こんにちは、山内です。
> 
> はい、北林さんの提示されている順番でOKです。
> 
> 以上です。
> 
> 
> ----- Original Message -----
>>  From: よしばー <kitab****@gmail*****>
>>  To: renay****@ybb*****; linux****@lists*****
>>  Cc: 
>>  Date: 2015/6/4, Thu 12:12
>>  Subject: Re: [Linux-ha-jp] pacemakerが正常に起動できません。
>> 
>>  山内様
>> 
>>  御世話になっております。
>>  北林です。
>>  ご回答ありがとうございます。
>> 
>>  何度も申しわけありません、
>>  起動、停止の順は
>>  (起動)
>>  #initctl start corosync
>>  #initctl start pacemaker
>>  (停止)
>>  #initctl stop pacemaker
>>  #initctl stop corosync
>> 
>>  でよろしいでしょうか。
>> 
>>  2015/06/04 renay****@ybb***** <renay****@ybb*****>:
>>>   北林さん
>>> 
>>> 
>>>   こんにちは、山内です。
>>> 
>>>   1,2,3共に基本的な動作に違いはありません。
>>> 
>>>   起動・停止を簡易にしているのが、pacemaker.combinedという認識でOKです。
>>> 
>>> 
>>>   pacemaker.combinedで起動できない件ですが、手元のRHEL6.5(VM)では今の所、再現しません。
>>> 
>>>   何かわかりましたら、ご連絡します。
>>> 
>>>   以上です。
>>> 
>>> 
>>> 
>>>   ----- Original Message -----
>>>>   From: よしばー <kitab****@gmail*****>
>>>>   To: renay****@ybb*****; linux****@lists*****
>>>>   Cc:
>>>>   Date: 2015/6/4, Thu 11:36
>>>>   Subject: Re: [Linux-ha-jp] pacemakerが正常に起動できません。
>>>> 
>>>>   山内様
>>>> 
>>>>   何度も申しわけありません。
>>>>   北林です。
>>>>   追加で質問がございます。
>>>> 
>>>>   【1】
>>>>   pacemakerを起動した後、
>>>>   以下の設定をpacemakerに読み込ませたいのですが、
>>>>   #initctl start corosync
>>>>   #initctl start pacemaker
>>>>   で、pacemakerを起動させた場合でも可能なのでしょうか。
>>>> 
>>>> 
>>>>   手順①#vi 0604.crm
>>>>   ===========================
>>>>   (設定内容)
>>>>   node 1: first
>>>>   node 2: second
>>>>   primitive vipcheck ocf:heartbeat:VIPcheck \
>>>>           params \
>>>>                   target_ip="172.16.87.233" \
>>>>                   count=3 \
>>>>                   wait=5 \
>>>>           op start   interval=0  timeout=60 
> on-fail="restart" 
>>  \
>>>>           op stop    interval=0  timeout=60 
> on-fail="ignore" 
>>  \
>>>>           op monitor interval=10 timeout=60 
> on-fail="restart"
>>>>   start-delay=0
>>>>   primitive tomcat ocf:heartbeat:tomcat \
>>>>           params \
>>>>                  
>>  java_home="/usr/lib/jvm/java-1.7.0-openjdk.x86_64"
>>>>   \
>>>>                   catalina_home="/var/lib/tomcat" \
>>>>           op start   interval=0  timeout=60  
> on-fail="restart" 
>>  \
>>>>           op stop    interval=0  timeout=120 
> on-fail="ignore" 
>>  \
>>>>           op monitor interval=10 timeout=30  
> on-fail="restart"
>>>>   primitive apache ocf:heartbeat:apache \
>>>>           op start   interval=0  timeout=40 
> on-fail="restart" 
>>  \
>>>>           op stop    interval=0  timeout=60 
> on-fail="ignore" 
>>  \
>>>>           op monitor interval=10 timeout=20 
> on-fail="restart"
>>>>   primitive vip ocf:heartbeat:IPaddr2 \
>>>>           params ip="172.16.87.233" \
>>>>           op start   interval=0  timeout=20 
> on-fail="restart" 
>>  \
>>>>           op stop    interval=0  timeout=20 
> on-fail="ignore" 
>>  \
>>>>           op monitor interval=10 timeout=20 
> on-fail="restart"
>>>>   group web-group \
>>>>           vipcheck tomcat apache vip
>>>>   location rsc_location-1 web-group \
>>>>       rule 200: #uname eq first \
>>>>       rule 100: #uname eq second
>>>>   property cib-bootstrap-options: \
>>>>           no-quorum-policy=ignore \
>>>>           stonith-enabled=false
>>>>   rsc_defaults rsc-options: \
>>>>           resource-stickiness=INFINITY \
>>>>           migration-threshold=1
>>>>   ===========================
>>>>   手順②#crm configure load update 0604.crm
>>>> 
>>>> 
>>>>   【2】
>>>>   #initctl start corosync
>>>>   #initctl start pacemaker
>>>>   でpacemakerを起動させた場合でも、
>>>>   #initctl start pacemaker.combinedで起動させた場合と
>>>>   障害が起こった後の、ノードの切り替え方は同じでしょうか。
>>>> 
>>>>   (#crm resource cleanup ○○
>>>>   #crm resource move ○○
>>>>   #crm resource unmove ○○等)
>>>> 
>>>>   【3】
>>>>   その他、
>>>>   #initctl start corosync
>>>>   #initctl start pacemaker
>>>>   でpacemakerを起動させた場合と
>>>>   #initctl start pacemaker.combined
>>>>   でpacmakerで起動させた場合で、操作方法等に違いはありますでしょうか。
>>>>   (#initctl start corosync
>>>>   #initctl start pacemakerの起動・停止の順番など)
>>>> 
>>>>   以上です。
>>>>   長くなり申しわけありません。
>>>> 
>>>>   よろしくお願い致します。
>>>> 
>>>>   2015/06/04 よしばー <kitab****@gmail*****>:
>>>>>    山内様
>>>>> 
>>>>>    御世話になっております。
>>>>>    北林です。
>>>>>    返信ありがとうございます。
>>>>> 
>>>>>    回答させて頂きます。
>>>>> 
>>>>>    【1】環境(OS,libqb,corosynのバージョン)
>>>>>    OS:RHEL6.5
>>>>>    libqb:0.17.1-1el6
>>>>>    corosync:2.3.4-1.el6
>>>>> 
>>>>>    【2】pacemaker.combinedは利用せずに個別の起動は可能か
>>>>>    ①initctl start corosync ⇒可能
>>>>>    ②initctl start pacemaker ⇒可能
>>>>> 
>>>>>    #crm_mon -fADコマンドの結果、
>>>>>    両ノードの状態が「Online」になっていることを確認出来ました。
>>>>> 
>>>>>    【3】pacemaker.combinedのファイル
>>>>>    これは、
>>>>>    /etc/init/pacemaker.combined.confでよろしいでしょうか。
>>>>> 
>>>>>    #view /etc/init/pacemaker.combined.conf
>>>>>    (内容)
>>>>>    # pacemaker-corosync - High-Availability cluster
>>>>>    #
>>>>>    # Starts Corosync cluster engine and Pacemaker cluster 
> manager.
>>>>> 
>>>>>    stop on runlevel [0123456]
>>>>>    kill timeout 3600
>>>>>    respawn
>>>>> 
>>>>>    env prog=pacemakerd
>>>>>    env rpm_sysconf=/etc/sysconfig/pacemaker
>>>>>    env rpm_lockfile=/var/lock/subsys/pacemaker
>>>>>    env deb_sysconf=/etc/default/pacemaker
>>>>>    env deb_lockfile=/var/lock/pacemaker
>>>>> 
>>>>>    script
>>>>>        [ -f "$rpm_sysconf" ] && . $rpm_sysconf
>>>>>        [ -f "$deb_sysconf" ] && . $deb_sysconf
>>>>>        exec $prog
>>>>>    end script
>>>>> 
>>>>>    pre-start script
>>>>>        # setup the software watchdog which corosync uses.
>>>>>        # rewrite according to environment.
>>>>>        modprobe softdog soft_margin=60
>>>>>        pidof corosync || start corosync
>>>>> 
>>>>>        # if you use corosync-notifyd, uncomment the line below.
>>>>>        #start corosync-notifyd
>>>>> 
>>>>>        # give it time to fail.
>>>>>        sleep 2
>>>>>        pidof corosync || { exit 1; }
>>>>>    end script
>>>>> 
>>>>>    post-start script
>>>>>        [ -f "$rpm_sysconf" ] && . $rpm_sysconf
>>>>>        [ -f "$deb_sysconf" ] && . $deb_sysconf
>>>>>        [ -z "$LOCK_FILE" -a -d /etc/sysconfig ] 
> &&
>>>>   LOCK_FILE="$rpm_lockfile"
>>>>>        [ -z "$LOCK_FILE" -a -d /etc/default ] 
> &&
>>>>   LOCK_FILE="$deb_lockfile"
>>>>>        touch $LOCK_FILE
>>>>>        pidof $prog > /var/run/$prog.pid
>>>>>    end script
>>>>> 
>>>>>    post-stop script
>>>>>        [ -f "$rpm_sysconf" ] && . $rpm_sysconf
>>>>>        [ -f "$deb_sysconf" ] && . $deb_sysconf
>>>>>        [ -z "$LOCK_FILE" -a -d /etc/sysconfig ] 
> &&
>>>>   LOCK_FILE="$rpm_lockfile"
>>>>>        [ -z "$LOCK_FILE" -a -d /etc/default ] 
> &&
>>>>   LOCK_FILE="$deb_lockfile"
>>>>>        rm -f $LOCK_FILE
>>>>>        rm -f /var/run/$prog.pid
>>>>> 
>>>>>        # if you use watchdog of corosync, uncomment the line 
> below.
>>>>>        pidof corosync || false
>>>>> 
>>>>>        pidof crmd || stop corosync
>>>>> 
>>>>>        # if you want to reboot a machine by watchdog of corosync 
> when
>>>>>        # pacemakerd disappeared unexpectedly, uncomment the line 
> 
>>  below
>>>>>        # and invalidate above "respawn" stanza.
>>>>>        #pidof crmd && killall -q -9 corosync
>>>>> 
>>>>>        # if you use corosync-notifyd, uncomment the line below.
>>>>>        #stop corosync-notifyd || true
>>>>>    end script
>>>>> 
>>>>> 
>>>>>    以上です。
>>>>> 
>>>>>    #initctl start corosync
>>>>>    #initctl start pacemaker
>>>>>    でもpacemakerを起動させることが出来るのを確認致しましたが、やはり
>>>>>    #initctl start pacemaker.combined
>>>>>    で起動させたいです。
>>>>> 
>>>>>    お手数をおかけし申しわけありませんが、知恵を頂けませんでしょうか。
>>>>> 
>>>>>    よろしくお願い致します。
>>>>> 
>>>>>    2015/06/04 renay****@ybb***** 
>>  <renay****@ybb*****>:
>>>>>>    北林さん
>>>>>> 
>>>>>> 
>>>>>>    こんにちは、山内です。
>>>>>> 
>>>>>>    すいません。もう1点・・・
>>>>>> 
>>>>>>    念の為、pacemaker.combinedのファイルも開示して頂けますでしょうか?
>>>>>> 
>>>>>>    以上です。
>>>>>> 
>>>>>> 
>>>>>>    ----- Original Message -----
>>>>>>>    From: "renay****@ybb*****"
>>>>   <renay****@ybb*****>
>>>>>>>    To: "linux****@lists*****"
>>>>   <linux****@lists*****>;
>>>>>>>    linux-ha-japan 
> <linux****@lists*****>
>>>>>>>    Cc:
>>>>>>>    Date: 2015/6/4, Thu 08:22
>>>>>>>    Subject: Re: [Linux-ha-jp] pacemakerが正常に起動できません。
>>>>>>> 
>>>>>>>    北林さん
>>>>>>> 
>>>>>>>    こんにちは、山内です。
>>>>>>> 
>>>>>>>    RAID1の設定は関係ないと思われます。
>>>>>>> 
>>>>>>>    ちなみに、環境(OS,libqb,corosynのバージョン)など確認して頂けますでしょうか?
>>>>>>> 
>>>>>>>    後1点、pacemaker.combinedは利用せずに個別の起動は可能でしょうか?
>>>>>>> 
>>>>>>>    ①initctl start corosync
>>>>>>>    ②initctl start pacemaker
>>>>>>> 
>>>>>>>    以上です。
>>>>>>> 
>>>>>>> 
>>>>>>>    ----- Original Message -----
>>>>>>>>     From: よしばー <kitab****@gmail*****>
>>>>>>>>     To: linux-ha-japan 
>>  <linux****@lists*****>
>>>>>>>>     Cc:
>>>>>>>>     Date: 2015/6/3, Wed 15:53
>>>>>>>>     Subject: Re: [Linux-ha-jp] pacemakerが正常に起動できません。
>>>>>>>> 
>>>>>>>>     いつも御世話になっております。
>>>>>>>>     北林です。
>>>>>>>>     何度も申しわけありません。
>>>>>>>> 
>>>>>>>>     先程質問させて頂いたサーバの環境ですが、
>>>>>>>>     2台でクラスタ構成を組もうと思っていて、
>>>>>>>>     なおかつ、それぞれRAID1の設定がしてあります。
>>>>>>>> 
>>>>>>>>     なにか関係があるのでしょうか。
>>>>>>>> 
>>>>>>>>     お手数をおかけし申しわけありません。
>>>>>>>>     今までと全く同じ手順で行っているのに、
>>>>>>>>     なぜここでエラーが起きるのかわからず困惑しています。
>>>>>>>> 
>>>>>>>>     よろしくお願い致します。
>>>>>>>> 
>>>>>>>> 
>>>>>>>>     2015/06/03 よしばー 
> <kitab****@gmail*****>:
>>>>>>>>>      いつも御世話になっております。
>>>>>>>>>      北林です。
>>>>>>>>> 
>>>>>>>>>      Pacemaker-1.1.12を使ったクラスタ構成において、
>>>>>>>>>      以下のエラーが発生いたしました。
>>>>>>>>>      お手数をおかけし申しわけありませんが、ご教授頂けないでしょうか。
>>>>>>>>> 
>>>>>>>>>      設定方法は、以下を参考にしています。
>>>>>>>>> 
>>>>   
> http://linux-ha.osdn.jp/wp/wp-content/uploads/OSC-Tokyo2014Fall.pdf
>>>>>>>>> 
>>>>>>>>>      ①#initctl start pacemaker.combined が使えない。
>>>>>>>>> 
>>>>>>>>>      初期設定を行い、initctl start 
>>  pacemaker.combinedコマンドを入力しますと、
>>>>>>>>>      【initctl: Job failed to start】
>>>>>>>>>      とpacemakerを起動することが出来ません。
>>>>>>>>>      この場合、何が原因と考えられるのでしょうか。
>>>>>>>>> 
>>>>>>>>>      ②①の続きに、試しに#initctl start pacemakeとうってみると、
>>>>>>>>>      プロセスは起動するものの、
>>>>>>>>>       #crm_mon -fADコマンドをうっても
>>>>>>>>>      【Attempting connection to the 
>>  cluster...】のまま動きがありません。
>>>>>>>>> 
>>>>>>>>>      この際の、pacemaker.logの内容は以下です。
>>>>>>>>> 
>>>>>>>>>      ▼pacemaker.log
>>>>>>>>> 
>>>>>>>>>      Jun 03 13:32:12 [4600] first pacemakerd:    
> 
>>  info:
>>>>   mcp_read_config:
>>>>>>>>>        cmap connection setup failed: 
> CS_ERR_LIBRARY.  
>>  Retrying
>>>>   in 2s
>>>>>>>>>      Jun 03 13:32:14 [4600] first pacemakerd:    
> 
>>  info:
>>>>   mcp_read_config:
>>>>>>>>>        cmap connection setup failed: 
> CS_ERR_LIBRARY.  
>>  Retrying
>>>>   in 3s
>>>>>>>>>      Jun 03 13:32:17 [4600] first pacemakerd:    
> 
>>  info:
>>>>   mcp_read_config:
>>>>>>>>>        cmap connection setup failed: 
> CS_ERR_LIBRARY.  
>>  Retrying
>>>>   in 4s
>>>>>>>>>      Jun 03 13:32:21 [4600] first pacemakerd:    
> 
>>  info:
>>>>   mcp_read_config:
>>>>>>>>>        cmap connection setup failed: 
> CS_ERR_LIBRARY.  
>>  Retrying
>>>>   in 5s
>>>>>>>>>      Jun 03 13:32:26 [4600] first pacemakerd:  
>>  warning:
>>>>   mcp_read_config:
>>>>>>>>>        Could not connect to Cluster 
> Configuration 
>>  Database
>>>>   API, error 2
>>>>>>>>>      Jun 03 13:32:26 [4600] first pacemakerd:  
>>  notice: main:
>>>>>>>>>    Could
>>>>>>>>>      not obtain corosync config data, exiting
>>>>>>>>>      Jun 03 13:32:26 [4600] first pacemakerd:    
> 
>>  info:
>>>>   crm_xml_cleanup:
>>>>>>>>>        Cleaning up memory from libxml2
>>>>>>>>>      Jun 03 13:32:26 [4612] first pacemakerd:    
> 
>>  info:
>>>>   crm_log_init:
>>>>>>>>>        Changed active directory to
>>>>   /var/lib/heartbeat/cores/root
>>>>>>>>>      Jun 03 13:32:26 [4612] first pacemakerd:    
> 
>>  info:
>>>>   crm_ipc_connect:
>>>>>>>>>        Could not establish pacemakerd 
> connection: 
>>  Connection
>>>>   refused
>>>>>>>>>    (111)
>>>>>>>>>      Jun 03 13:32:26 [4612] first pacemakerd:    
> 
>>  info:
>>>>   mcp_read_config:
>>>>>>>>>        cmap connection setup failed: 
> CS_ERR_LIBRARY.  
>>  Retrying
>>>>   in 1s
>>>>>>>>>      Jun 03 13:32:27 [4612] first pacemakerd:    
> 
>>  info:
>>>>   mcp_read_config:
>>>>>>>>>        cmap connection setup failed: 
> CS_ERR_LIBRARY.  
>>  Retrying
>>>>   in 2
>>>>>>>>> 
>>>>>>>>>      以上です。
>>>>>>>>> 
>>>>>>>>>      pacemakerを正常に起動させるためにはどうすればよろしいでしょうか。
>>>>>>>>> 
>>>>>>>>>      お手数をおかけ致しますが、
>>>>>>>>>      よろしくお願い致します。
>>>>>>>>> 
>>>>>>>> 
>>>>>>>> 
>>>>>>>>     _______________________________________________
>>>>>>>>     Linux-ha-japan mailing list
>>>>>>>>    Linux****@lists*****
>>>>>>>>    
> http://lists.osdn.me/mailman/listinfo/linux-ha-japan
>>>>>>>> 
>>>>>>> 
>>>>>>>    _______________________________________________
>>>>>>>    Linux-ha-japan mailing list
>>>>>>>    Linux****@lists*****
>>>>>>>    http://lists.osdn.me/mailman/listinfo/linux-ha-japan
>>>>>>> 
>>>>>> 
>>>>>>    _______________________________________________
>>>>>>    Linux-ha-japan mailing list
>>>>>>    Linux****@lists*****
>>>>>>    http://lists.osdn.me/mailman/listinfo/linux-ha-japan
>>>>>> 
>>>>> 
>>>> 
>>> 
>>>   _______________________________________________
>>>   Linux-ha-japan mailing list
>>>   Linux****@lists*****
>>>   http://lists.osdn.me/mailman/listinfo/linux-ha-japan
>>> 
>> 
> 
> _______________________________________________
> Linux-ha-japan mailing list
> Linux****@lists*****
> http://lists.osdn.me/mailman/listinfo/linux-ha-japan
> 




Linux-ha-japan メーリングリストの案内
Back to archive index