RAID1で組んでいたDELLのLinuxサーバで、ディスクが片方死んでいたのに気付かず、片肺のまま放置されていた。
再起動をきっかけに死んでいたディスクが一時的に復活し、数週間前の状態に両方のディスクを同期してくれた…。
つまりは、ここ数週間にあった更新が全て消えた…。
バックアップは取っていたけど、一世代前しかなくて、さらにそれも同期された後に気付いた。
どうしようもない…。
実話だけど、二度とこんなことがないようにバックアップ先を複数にして、さらに世代化した。
で、RAIDが死んでたのに気付かない、なんてことがないように監視をしたい。
DELLサーバなので、Open Manage Server Administratorを使えばいいらしい。
参考にしたのはこの辺り。
http://d.hatena.ne.jp/kno1020/20081007/1223387709
http://satospo.sakura.ne.jp/blog_archives/tech/hardware/r210_omsa.html
http://linux.dell.com/wiki/index.php/Repository/OMSA
yumでインストールするために、リポジトリを追加
# wget -q -O - http://linux.dell.com/repo/hardware/latest/bootstrap.cgi | bashコマンドだけあればいいので、srvadmin-baseとsrvadmin-storageservicesをyumでインストール
# yum install srvadmin-base srvadmin-storageservicesインストール完了後、勇んでコマンドを打ってみる
# omreport「あれ?」と思い、ログを見たら
-bash: omreport: command not found
**********************************************************としっかり書いてありました。
After the install process completes, you may need
to log out and then log in again to reset the PATH
variable to access the Dell OpenManage CLI utilities
**********************************************************
一回ログアウトして、ログインし直したら、ちゃんとUsageが出た。
よしよし、いい調子。
試しにちょっとやってみよう。
# omreport chassis memoryえ、メモリが見えないって…。
Memory Information
Error : Memory object not found
他にもポートもプロセッサもやってみたけど、どれもnot found。
CentOSのバージョン?PowerEdge T100はサポートされない?インストールの問題?とかいろいろ考えたけど、ちょっと調べてみたら、OMSAが起動してない、と。
では、OMSAを起動する方法は?と調べたところ、以下でいいらしい
# /opt/dell/srvadmin/sbin/srvadmin-services.sh startあら、何かエラーだ。
Starting Systems Management Device Drivers:
Starting dcdbas: [ OK ]
Starting dell_rbu: [ OK ]
Starting Systems Management Data Engine:
Starting dsm_sa_datamgrd: [ OK ]
Starting dsm_sa_eventmgrd: [ OK ]
Starting DSM SA Shared Services: [ OK ]
libstdc++.so.5 is required to run the Inventory Collector.
libstdc++がないならインストールしてやればいいだけか。
# yum install compat-libstdc++-33サービスの再起動
# /opt/dell/srvadmin/sbin/srvadmin-services.sh restartエラーもなし。毎回ここで起動するのも面倒。
Shutting down DSM SA Shared Services: [ OK ]
Stopping Systems Management Data Engine:
Stopping dsm_sa_eventmgrd: [ OK ]
Stopping dsm_sa_datamgrd: [ OK ]
Stopping Systems Management Device Drivers:
Stopping dcdbas: [ OK ]
Stopping dell_rbu: [ OK ]
Starting Systems Management Device Drivers:
Starting dcdbas: [ OK ]
Starting dell_rbu: [ OK ]
Starting Systems Management Data Engine:
Starting dsm_sa_datamgrd: [ OK ]
Starting dsm_sa_eventmgrd: [ OK ]
Starting DSM SA Shared Services: [ OK ]
あ、enableすればそれでいいらしい
# /opt/dell/srvadmin/sbin/srvadmin-services.sh enable
instsvcdrv 0:on 1:off 2:off 3:on 4:on 5:on 6:on
dataeng 0:off 1:off 2:off 3:on 4:on 5:on 6:off
dsm_om_shrsvc 0:off 1:off 2:off 3:on 4:on 5:on 6:off
# omreport storage pdisk controller=0
List of Physical Disks on Controller SAS 6/iR Adapter (Slot 2)
Controller SAS 6/iR Adapter (Slot 2)
ID : 0:0
Status : Ok
Name : Physical Disk 0:0
State : Online
~(略)~
ID : 0:1
Status : Ok
Name : Physical Disk 0:1
State : Online
~(略)~
うまく行った!!
あとはこれをNagiosかなんかで定期的に実行してステータス確認すればよさそう。
コマンドのマニュアルはこちら
http://support.dell.com/support/edocs/software/svradmin/5.4/ja/cli/report.htm
0 件のコメント:
コメントを投稿