停電テストとUPS設計

ここしばらく耐障害性向上のために試行錯誤をしてきたわけですが
実際に停電テストを行いました。


というと、万全なようですが、本当に雷で停電しましたw


iSCSIマルチパスを導入していたおかげで以前おこったストレージ障害
はおこりませんでした。
実は、パスの1つがHUBを含めて仮設状態のため電源が落ちました。
そのため切り替えのタイムラグがあったらしく、セッションを完全に
維持しなければならないアプリだけが落ちてしまいました。


もう一つ心配だったのがUPSの複数利用による副作用です。
サーバは冗長化電源を採用していて以前は2つある電源入力を別々のUPS
接続していたのですが、これが逆に問題を起こしたことがあります。


基礎知識としてサーバの冗長化電源は本体の消費電力が400Wだとすると、
入力1、入力2にそれぞれ200Wの負荷をかけます。
片方の入力が途絶えると残っている電源に400Wの負荷がかかるわけです。
上記のようにそれぞれUPSに接続していると通常時は問題ないのですが
もし片方のUPSが何らかの原因で電力供給を停止すると、残りのUPSに
単純計算で2倍の負荷がかかります。
2つのUPSに均等に負荷をかけていた場合、通常時の負荷が50%を超えていた
とすると、片方のUPSが停止したと同時に残ったUPSが過負荷状態となってし
まい緊急停止してしまいます。


実際にこの現象が起こったときには何がおこったのか理解できませんでした。
理解した上で、対策をとろうにも全負荷を50%以下にすることは難しかったので
冗長化電源の片方はUPSに接続せずに直接電源供給するようにしてUPS誤作動
時のリスクだけは回避することにしました。
ただし、この方法だと完全停電時には結局UPSに全負荷がかかりますので、
今回の完全停電は心配だったわけですが設計通り持ちこたえたようです。


こんな事は電力設計の業界では当たり前のことなのでしょうが、費用をけちって
全部自分でやってしまおうとすると問題発生するまで気づきませんね。