renay****@ybb*****
renay****@ybb*****
2015年 6月 4日 (木) 15:30:37 JST
北林さん こんにちは、山内です。 やはり、手元の環境では再現しないようです。 最初に頂いたログを見た所・・・ どうやら、corosyncが正常に上がっていない為に、pacemakerがcorosyncに接続できない状態が発生しています。 発生した時(発生したあたりでもOK)の/var/log/messagesの内容についても、もし可能であれば、開示頂けますでしょうか? また、start pacemaker.combinedでの起動失敗の発生時、 1)corosyncのプロセスが起動しているか?(psコマンド) 2)起動している場合、corosync-cfgtool -sの実行結果はどうなるか? も確認していただければ。。と思います。 以上です。 ----- Original Message ----- > From: "renay****@ybb*****" <renay****@ybb*****> > To: "linux****@lists*****" <linux****@lists*****> > Cc: > Date: 2015/6/4, Thu 12:48 > Subject: Re: [Linux-ha-jp] pacemakerが正常に起動できません。 > > 北林さん > > こんにちは、山内です。 > > はい、北林さんの提示されている順番でOKです。 > > 以上です。 > > > ----- Original Message ----- >> From: よしばー <kitab****@gmail*****> >> To: renay****@ybb*****; linux****@lists***** >> Cc: >> Date: 2015/6/4, Thu 12:12 >> Subject: Re: [Linux-ha-jp] pacemakerが正常に起動できません。 >> >> 山内様 >> >> 御世話になっております。 >> 北林です。 >> ご回答ありがとうございます。 >> >> 何度も申しわけありません、 >> 起動、停止の順は >> (起動) >> #initctl start corosync >> #initctl start pacemaker >> (停止) >> #initctl stop pacemaker >> #initctl stop corosync >> >> でよろしいでしょうか。 >> >> 2015/06/04 renay****@ybb***** <renay****@ybb*****>: >>> 北林さん >>> >>> >>> こんにちは、山内です。 >>> >>> 1,2,3共に基本的な動作に違いはありません。 >>> >>> 起動・停止を簡易にしているのが、pacemaker.combinedという認識でOKです。 >>> >>> >>> pacemaker.combinedで起動できない件ですが、手元のRHEL6.5(VM)では今の所、再現しません。 >>> >>> 何かわかりましたら、ご連絡します。 >>> >>> 以上です。 >>> >>> >>> >>> ----- Original Message ----- >>>> From: よしばー <kitab****@gmail*****> >>>> To: renay****@ybb*****; linux****@lists***** >>>> Cc: >>>> Date: 2015/6/4, Thu 11:36 >>>> Subject: Re: [Linux-ha-jp] pacemakerが正常に起動できません。 >>>> >>>> 山内様 >>>> >>>> 何度も申しわけありません。 >>>> 北林です。 >>>> 追加で質問がございます。 >>>> >>>> 【1】 >>>> pacemakerを起動した後、 >>>> 以下の設定をpacemakerに読み込ませたいのですが、 >>>> #initctl start corosync >>>> #initctl start pacemaker >>>> で、pacemakerを起動させた場合でも可能なのでしょうか。 >>>> >>>> >>>> 手順①#vi 0604.crm >>>> =========================== >>>> (設定内容) >>>> node 1: first >>>> node 2: second >>>> primitive vipcheck ocf:heartbeat:VIPcheck \ >>>> params \ >>>> target_ip="172.16.87.233" \ >>>> count=3 \ >>>> wait=5 \ >>>> op start interval=0 timeout=60 > on-fail="restart" >> \ >>>> op stop interval=0 timeout=60 > on-fail="ignore" >> \ >>>> op monitor interval=10 timeout=60 > on-fail="restart" >>>> start-delay=0 >>>> primitive tomcat ocf:heartbeat:tomcat \ >>>> params \ >>>> >> java_home="/usr/lib/jvm/java-1.7.0-openjdk.x86_64" >>>> \ >>>> catalina_home="/var/lib/tomcat" \ >>>> op start interval=0 timeout=60 > on-fail="restart" >> \ >>>> op stop interval=0 timeout=120 > on-fail="ignore" >> \ >>>> op monitor interval=10 timeout=30 > on-fail="restart" >>>> primitive apache ocf:heartbeat:apache \ >>>> op start interval=0 timeout=40 > on-fail="restart" >> \ >>>> op stop interval=0 timeout=60 > on-fail="ignore" >> \ >>>> op monitor interval=10 timeout=20 > on-fail="restart" >>>> primitive vip ocf:heartbeat:IPaddr2 \ >>>> params ip="172.16.87.233" \ >>>> op start interval=0 timeout=20 > on-fail="restart" >> \ >>>> op stop interval=0 timeout=20 > on-fail="ignore" >> \ >>>> op monitor interval=10 timeout=20 > on-fail="restart" >>>> group web-group \ >>>> vipcheck tomcat apache vip >>>> location rsc_location-1 web-group \ >>>> rule 200: #uname eq first \ >>>> rule 100: #uname eq second >>>> property cib-bootstrap-options: \ >>>> no-quorum-policy=ignore \ >>>> stonith-enabled=false >>>> rsc_defaults rsc-options: \ >>>> resource-stickiness=INFINITY \ >>>> migration-threshold=1 >>>> =========================== >>>> 手順②#crm configure load update 0604.crm >>>> >>>> >>>> 【2】 >>>> #initctl start corosync >>>> #initctl start pacemaker >>>> でpacemakerを起動させた場合でも、 >>>> #initctl start pacemaker.combinedで起動させた場合と >>>> 障害が起こった後の、ノードの切り替え方は同じでしょうか。 >>>> >>>> (#crm resource cleanup ○○ >>>> #crm resource move ○○ >>>> #crm resource unmove ○○等) >>>> >>>> 【3】 >>>> その他、 >>>> #initctl start corosync >>>> #initctl start pacemaker >>>> でpacemakerを起動させた場合と >>>> #initctl start pacemaker.combined >>>> でpacmakerで起動させた場合で、操作方法等に違いはありますでしょうか。 >>>> (#initctl start corosync >>>> #initctl start pacemakerの起動・停止の順番など) >>>> >>>> 以上です。 >>>> 長くなり申しわけありません。 >>>> >>>> よろしくお願い致します。 >>>> >>>> 2015/06/04 よしばー <kitab****@gmail*****>: >>>>> 山内様 >>>>> >>>>> 御世話になっております。 >>>>> 北林です。 >>>>> 返信ありがとうございます。 >>>>> >>>>> 回答させて頂きます。 >>>>> >>>>> 【1】環境(OS,libqb,corosynのバージョン) >>>>> OS:RHEL6.5 >>>>> libqb:0.17.1-1el6 >>>>> corosync:2.3.4-1.el6 >>>>> >>>>> 【2】pacemaker.combinedは利用せずに個別の起動は可能か >>>>> ①initctl start corosync ⇒可能 >>>>> ②initctl start pacemaker ⇒可能 >>>>> >>>>> #crm_mon -fADコマンドの結果、 >>>>> 両ノードの状態が「Online」になっていることを確認出来ました。 >>>>> >>>>> 【3】pacemaker.combinedのファイル >>>>> これは、 >>>>> /etc/init/pacemaker.combined.confでよろしいでしょうか。 >>>>> >>>>> #view /etc/init/pacemaker.combined.conf >>>>> (内容) >>>>> # pacemaker-corosync - High-Availability cluster >>>>> # >>>>> # Starts Corosync cluster engine and Pacemaker cluster > manager. >>>>> >>>>> stop on runlevel [0123456] >>>>> kill timeout 3600 >>>>> respawn >>>>> >>>>> env prog=pacemakerd >>>>> env rpm_sysconf=/etc/sysconfig/pacemaker >>>>> env rpm_lockfile=/var/lock/subsys/pacemaker >>>>> env deb_sysconf=/etc/default/pacemaker >>>>> env deb_lockfile=/var/lock/pacemaker >>>>> >>>>> script >>>>> [ -f "$rpm_sysconf" ] && . $rpm_sysconf >>>>> [ -f "$deb_sysconf" ] && . $deb_sysconf >>>>> exec $prog >>>>> end script >>>>> >>>>> pre-start script >>>>> # setup the software watchdog which corosync uses. >>>>> # rewrite according to environment. >>>>> modprobe softdog soft_margin=60 >>>>> pidof corosync || start corosync >>>>> >>>>> # if you use corosync-notifyd, uncomment the line below. >>>>> #start corosync-notifyd >>>>> >>>>> # give it time to fail. >>>>> sleep 2 >>>>> pidof corosync || { exit 1; } >>>>> end script >>>>> >>>>> post-start script >>>>> [ -f "$rpm_sysconf" ] && . $rpm_sysconf >>>>> [ -f "$deb_sysconf" ] && . $deb_sysconf >>>>> [ -z "$LOCK_FILE" -a -d /etc/sysconfig ] > && >>>> LOCK_FILE="$rpm_lockfile" >>>>> [ -z "$LOCK_FILE" -a -d /etc/default ] > && >>>> LOCK_FILE="$deb_lockfile" >>>>> touch $LOCK_FILE >>>>> pidof $prog > /var/run/$prog.pid >>>>> end script >>>>> >>>>> post-stop script >>>>> [ -f "$rpm_sysconf" ] && . $rpm_sysconf >>>>> [ -f "$deb_sysconf" ] && . $deb_sysconf >>>>> [ -z "$LOCK_FILE" -a -d /etc/sysconfig ] > && >>>> LOCK_FILE="$rpm_lockfile" >>>>> [ -z "$LOCK_FILE" -a -d /etc/default ] > && >>>> LOCK_FILE="$deb_lockfile" >>>>> rm -f $LOCK_FILE >>>>> rm -f /var/run/$prog.pid >>>>> >>>>> # if you use watchdog of corosync, uncomment the line > below. >>>>> pidof corosync || false >>>>> >>>>> pidof crmd || stop corosync >>>>> >>>>> # if you want to reboot a machine by watchdog of corosync > when >>>>> # pacemakerd disappeared unexpectedly, uncomment the line > >> below >>>>> # and invalidate above "respawn" stanza. >>>>> #pidof crmd && killall -q -9 corosync >>>>> >>>>> # if you use corosync-notifyd, uncomment the line below. >>>>> #stop corosync-notifyd || true >>>>> end script >>>>> >>>>> >>>>> 以上です。 >>>>> >>>>> #initctl start corosync >>>>> #initctl start pacemaker >>>>> でもpacemakerを起動させることが出来るのを確認致しましたが、やはり >>>>> #initctl start pacemaker.combined >>>>> で起動させたいです。 >>>>> >>>>> お手数をおかけし申しわけありませんが、知恵を頂けませんでしょうか。 >>>>> >>>>> よろしくお願い致します。 >>>>> >>>>> 2015/06/04 renay****@ybb***** >> <renay****@ybb*****>: >>>>>> 北林さん >>>>>> >>>>>> >>>>>> こんにちは、山内です。 >>>>>> >>>>>> すいません。もう1点・・・ >>>>>> >>>>>> 念の為、pacemaker.combinedのファイルも開示して頂けますでしょうか? >>>>>> >>>>>> 以上です。 >>>>>> >>>>>> >>>>>> ----- Original Message ----- >>>>>>> From: "renay****@ybb*****" >>>> <renay****@ybb*****> >>>>>>> To: "linux****@lists*****" >>>> <linux****@lists*****>; >>>>>>> linux-ha-japan > <linux****@lists*****> >>>>>>> Cc: >>>>>>> Date: 2015/6/4, Thu 08:22 >>>>>>> Subject: Re: [Linux-ha-jp] pacemakerが正常に起動できません。 >>>>>>> >>>>>>> 北林さん >>>>>>> >>>>>>> こんにちは、山内です。 >>>>>>> >>>>>>> RAID1の設定は関係ないと思われます。 >>>>>>> >>>>>>> ちなみに、環境(OS,libqb,corosynのバージョン)など確認して頂けますでしょうか? >>>>>>> >>>>>>> 後1点、pacemaker.combinedは利用せずに個別の起動は可能でしょうか? >>>>>>> >>>>>>> ①initctl start corosync >>>>>>> ②initctl start pacemaker >>>>>>> >>>>>>> 以上です。 >>>>>>> >>>>>>> >>>>>>> ----- Original Message ----- >>>>>>>> From: よしばー <kitab****@gmail*****> >>>>>>>> To: linux-ha-japan >> <linux****@lists*****> >>>>>>>> Cc: >>>>>>>> Date: 2015/6/3, Wed 15:53 >>>>>>>> Subject: Re: [Linux-ha-jp] pacemakerが正常に起動できません。 >>>>>>>> >>>>>>>> いつも御世話になっております。 >>>>>>>> 北林です。 >>>>>>>> 何度も申しわけありません。 >>>>>>>> >>>>>>>> 先程質問させて頂いたサーバの環境ですが、 >>>>>>>> 2台でクラスタ構成を組もうと思っていて、 >>>>>>>> なおかつ、それぞれRAID1の設定がしてあります。 >>>>>>>> >>>>>>>> なにか関係があるのでしょうか。 >>>>>>>> >>>>>>>> お手数をおかけし申しわけありません。 >>>>>>>> 今までと全く同じ手順で行っているのに、 >>>>>>>> なぜここでエラーが起きるのかわからず困惑しています。 >>>>>>>> >>>>>>>> よろしくお願い致します。 >>>>>>>> >>>>>>>> >>>>>>>> 2015/06/03 よしばー > <kitab****@gmail*****>: >>>>>>>>> いつも御世話になっております。 >>>>>>>>> 北林です。 >>>>>>>>> >>>>>>>>> Pacemaker-1.1.12を使ったクラスタ構成において、 >>>>>>>>> 以下のエラーが発生いたしました。 >>>>>>>>> お手数をおかけし申しわけありませんが、ご教授頂けないでしょうか。 >>>>>>>>> >>>>>>>>> 設定方法は、以下を参考にしています。 >>>>>>>>> >>>> > http://linux-ha.osdn.jp/wp/wp-content/uploads/OSC-Tokyo2014Fall.pdf >>>>>>>>> >>>>>>>>> ①#initctl start pacemaker.combined が使えない。 >>>>>>>>> >>>>>>>>> 初期設定を行い、initctl start >> pacemaker.combinedコマンドを入力しますと、 >>>>>>>>> 【initctl: Job failed to start】 >>>>>>>>> とpacemakerを起動することが出来ません。 >>>>>>>>> この場合、何が原因と考えられるのでしょうか。 >>>>>>>>> >>>>>>>>> ②①の続きに、試しに#initctl start pacemakeとうってみると、 >>>>>>>>> プロセスは起動するものの、 >>>>>>>>> #crm_mon -fADコマンドをうっても >>>>>>>>> 【Attempting connection to the >> cluster...】のまま動きがありません。 >>>>>>>>> >>>>>>>>> この際の、pacemaker.logの内容は以下です。 >>>>>>>>> >>>>>>>>> ▼pacemaker.log >>>>>>>>> >>>>>>>>> Jun 03 13:32:12 [4600] first pacemakerd: > >> info: >>>> mcp_read_config: >>>>>>>>> cmap connection setup failed: > CS_ERR_LIBRARY. >> Retrying >>>> in 2s >>>>>>>>> Jun 03 13:32:14 [4600] first pacemakerd: > >> info: >>>> mcp_read_config: >>>>>>>>> cmap connection setup failed: > CS_ERR_LIBRARY. >> Retrying >>>> in 3s >>>>>>>>> Jun 03 13:32:17 [4600] first pacemakerd: > >> info: >>>> mcp_read_config: >>>>>>>>> cmap connection setup failed: > CS_ERR_LIBRARY. >> Retrying >>>> in 4s >>>>>>>>> Jun 03 13:32:21 [4600] first pacemakerd: > >> info: >>>> mcp_read_config: >>>>>>>>> cmap connection setup failed: > CS_ERR_LIBRARY. >> Retrying >>>> in 5s >>>>>>>>> Jun 03 13:32:26 [4600] first pacemakerd: >> warning: >>>> mcp_read_config: >>>>>>>>> Could not connect to Cluster > Configuration >> Database >>>> API, error 2 >>>>>>>>> Jun 03 13:32:26 [4600] first pacemakerd: >> notice: main: >>>>>>>>> Could >>>>>>>>> not obtain corosync config data, exiting >>>>>>>>> Jun 03 13:32:26 [4600] first pacemakerd: > >> info: >>>> crm_xml_cleanup: >>>>>>>>> Cleaning up memory from libxml2 >>>>>>>>> Jun 03 13:32:26 [4612] first pacemakerd: > >> info: >>>> crm_log_init: >>>>>>>>> Changed active directory to >>>> /var/lib/heartbeat/cores/root >>>>>>>>> Jun 03 13:32:26 [4612] first pacemakerd: > >> info: >>>> crm_ipc_connect: >>>>>>>>> Could not establish pacemakerd > connection: >> Connection >>>> refused >>>>>>>>> (111) >>>>>>>>> Jun 03 13:32:26 [4612] first pacemakerd: > >> info: >>>> mcp_read_config: >>>>>>>>> cmap connection setup failed: > CS_ERR_LIBRARY. >> Retrying >>>> in 1s >>>>>>>>> Jun 03 13:32:27 [4612] first pacemakerd: > >> info: >>>> mcp_read_config: >>>>>>>>> cmap connection setup failed: > CS_ERR_LIBRARY. >> Retrying >>>> in 2 >>>>>>>>> >>>>>>>>> 以上です。 >>>>>>>>> >>>>>>>>> pacemakerを正常に起動させるためにはどうすればよろしいでしょうか。 >>>>>>>>> >>>>>>>>> お手数をおかけ致しますが、 >>>>>>>>> よろしくお願い致します。 >>>>>>>>> >>>>>>>> >>>>>>>> >>>>>>>> _______________________________________________ >>>>>>>> Linux-ha-japan mailing list >>>>>>>> Linux****@lists***** >>>>>>>> > http://lists.osdn.me/mailman/listinfo/linux-ha-japan >>>>>>>> >>>>>>> >>>>>>> _______________________________________________ >>>>>>> Linux-ha-japan mailing list >>>>>>> Linux****@lists***** >>>>>>> http://lists.osdn.me/mailman/listinfo/linux-ha-japan >>>>>>> >>>>>> >>>>>> _______________________________________________ >>>>>> Linux-ha-japan mailing list >>>>>> Linux****@lists***** >>>>>> http://lists.osdn.me/mailman/listinfo/linux-ha-japan >>>>>> >>>>> >>>> >>> >>> _______________________________________________ >>> Linux-ha-japan mailing list >>> Linux****@lists***** >>> http://lists.osdn.me/mailman/listinfo/linux-ha-japan >>> >> > > _______________________________________________ > Linux-ha-japan mailing list > Linux****@lists***** > http://lists.osdn.me/mailman/listinfo/linux-ha-japan >