momok****@mail*****
momok****@mail*****
2014年 10月 15日 (水) 12:43:07 JST
広瀬と申します 弊社で稼働中のサーバで障害が起きた為調査していたところ、以下の 点が気になりましたので、ご質問させてください。 ■Active側でのcat /proc/drbd 0: cs:Connected ro:Primary/Secondary ds:UpToDate/UpToDate A r----- ns:9504 nr:0 dw:9504 dr:25941 al:3 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:b oos:0 1: cs:Connected ro:Primary/Secondary ds:UpToDate/UpToDate A r----- ns:4 nr:0 dw:4 dr:30609 al:0 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:b oos:4 ■Standby側でのcat /proc/drbd 0: cs:Connected ro:Secondary/Primary ds:UpToDate/UpToDate A r----- ns:0 nr:9504 dw:9504 dr:0 al:0 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:b oos:0 1: cs:Connected ro:Secondary/Primary ds:UpToDate/UpToDate A r----- ns:0 nr:4 dw:4 dr:0 al:0 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:b oos:0 上記Act/Stb両方の/proc配下のDRBD状態ですが、Act側からみると、常にリソース1 側の、oosが4KiB程度非同期状態で残っていることに気づきました。 これが直近の障害で発生したのか、7月ごろの問題なのかは定かではありませんが、 この値が「0」で無い場合の対応として、正しい処置はVerifyでよいのか少し判断 が付きません。 お手数ですがご教授いただければ幸いです。よろしくお願いいたします。