Keisuke MORI
keisu****@gmail*****
2014年 10月 17日 (金) 16:36:42 JST
もりと申します。 2014-10-06 10:25 GMT+09:00 Takahiro Anzai <takah****@woodp*****>: > 以前は30分程で完了した初期同期が、60分程度かかるようになってしまいました。 > 調査を実施した所、ディスクIOが以前は80~90MBだったのが、30~40MBまで落ちていました。 私の周りでも類似の事象を見たことがあります。 こちらでは max-buffers の設定値を大きくすること (少なくとも8192程度以上)により対処しました。 どの程度の値が適切なのかは環境に大きく依存するらしいのでなんとも言えないのですが、 初期同期のときのみであれば一時的に max-buffers を上限値まで引き上げ、 初期同期完了後に元に戻す、という運用も可能だと思います。 おそらく8.3.16で以下の問題に対処するために入った修正の影響のようです。 http://git.drbd.org/gitweb.cgi?p=drbd-8.3.git;a=commit;h=facf45559876f4cf3cb161b458e1f8f64b683777 以上、ご参考まで。 2014-10-06 10:25 GMT+09:00 Takahiro Anzai <takah****@woodp*****>: > お世話になります。 > 安斎と申します。 > > 下記の環境でDRBDのアップグレードを検証しています。 > > 環境: > Red Hat Enterprise Linux Server 6.1 (for x86) × 2台 > kernel-2.6.32-131.0.15.el6.i686 > corosync-1.4.1-4.el6.i686 > pacemaker-1.1.6-3.el6.i686 > drbd-8.3.12-1.el6.i386 > > 質問内容: > DRBDを8.3.16にアップグレードした所、 > 以前は30分程で完了した初期同期が、60分程度かかるようになってしまいました。 > 調査を実施した所、ディスクIOが以前は80~90MBだったのが、30~40MBまで落ちていました。 > また、DRBDを8.3.15にアップグレードした場合は特に問題はありませんでした。 > 原因と対応方法をご教授いただけると助かります。 > > DRBDの定義ファイルは以下になります。 > ※初期同期中はコマンドでsyncerを一時的に300Mにしています。 > > 【/etc/drbd.d/global__common.conf】 > > global { > #usage-count yes; > usage-count no; > # minor-count dialog-refresh disable-ip-verification > } > > common { > #protocol C; > > handlers { > pri-on-incon-degr "/usr/lib/drbd/notify-pri-on-incon-degr.sh; /usr/lib/drbd/notify-emergency-reboot.sh; echo b > /proc/sysrq-trigger ; reboot -f"; > pri-lost-after-sb "/usr/lib/drbd/notify-pri-lost-after-sb.sh; /usr/lib/drbd/notify-emergency-reboot.sh; echo b > /proc/sysrq-trigger ; reboot -f"; > local-io-error "/usr/lib/drbd/notify-io-error.sh; /usr/lib/drbd/notify-emergency-shutdown.sh; echo o > /proc/sysrq-trigger ; halt -f"; > # fence-peer "/usr/lib/drbd/crm-fence-peer.sh"; > # split-brain "/usr/lib/drbd/notify-split-brain.sh root"; > # out-of-sync "/usr/lib/drbd/notify-out-of-sync.sh root"; > # before-resync-target "/usr/lib/drbd/snapshot-resync-target-lvm.sh -p 15 -- -c 16k"; > # after-resync-target /usr/lib/drbd/unsnapshot-resync-target-lvm.sh; > } > > startup { > # wfc-timeout degr-wfc-timeout outdated-wfc-timeout wait-after-sb > } > > disk { > # on-io-error fencing use-bmbv no-disk-barrier no-disk-flushes > # no-disk-drain no-md-flushes max-bio-bvecs > no-disk-barrier; > no-disk-flushes; > } > > net { > # sndbuf-size rcvbuf-size timeout connect-int ping-int ping-timeout max-buffers > # max-epoch-size ko-count allow-two-primaries cram-hmac-alg shared-secret > # after-sb-0pri after-sb-1pri after-sb-2pri data-integrity-alg no-tcp-cork > after-sb-0pri discard-younger-primary; > after-sb-1pri discard-secondary; > after-sb-2pri disconnect; > } > > syncer { > # rate after al-extents use-rle cpu-mask verify-alg csums-alg > rate 30M; > verify-alg sha1; > } > } > > 【/etc/drbd.d/r0.res】 > > resource r0 { > protocol C; > device /dev/drbd0; > disk /dev/sda6; > meta-disk internal; > on xxxx1 { > address 192.xxx.xxx.101:7789; > } > on xxxx2 { > address 192.xxx.xxx.102:7789; > } > } > > 以上、よろしくお願いします。 > _______________________________________________ > Linux-ha-japan mailing list > Linux****@lists***** > http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan -- Keisuke MORI