2006年02月06日
復活できるかな?
大分、間が開いてしまいました。読んでくれる人がいるとは思えませんが、ぽつぽつとまた書いていこうかなと思ってます。
二人目の子供が生まれてから、家の事が忙しくなったのですが、そうこうしているうちに会社の僕が担当しているデータベースサーバが壊れかけてきたんですよね。毎日、リカバリ処理を手動で行わないといけなかった生活がしばらく続いていました。こんな状況下でタイに旅行に行ったのが9月。で、日本に帰ってきてすぐにデータベースの最後の手段を用いたところ、サーバが二度と起動してくれなくなったんですね。もうこれから3年分の蓄積のあったものをすぐに復活させないといけないわけで、苦しい日々が続いていましたが、ようやく落ち着いてきて平静を取り戻してきたというところです。
そんなわけで、毎日は厳しいかもしれませんが、ぽつぽつと書いていこうかなと思っております。
データベース(Oracle)のトラブルは、データブロックが破損して読めなくなるというトラブルが頻発していました。しかしソフトウェア・ハードウェア上ではエラーが検知されておらず、普通に考えればOracleの書き込み方がおかしいということになるわけですが、7月に入ってから、ぼろぼろと出てくるようになったのでどうも腑に落ちなかったんですよね。
Oracleがおかしいのであれば、もっと前からこの現象が出ていてもおかしくなかったはず。であれば、ハードウェアが壊れてハードウェアの検知機能が働かなかったという仮説がたつのですが、証明する術はないです。壊れてしまってどうにもならないし。
またまずいことに、壊れたサーバのハードウェアの保守契約が切れていたんですね。だから怪しいハードウェアを交換するというのも大変だったんですよね。で、なんとか保守契約に入って直してもらうことにして、挙動の怪しいHDDを交換して、アレイコントローラーも交換してもらってハードウェアは落ち着かせて、Windowsを起動するようにして、Oracleを一からセットアップしたのでした。
Oracleのデータは元データがあるものだからということで、バックアップを取っていなかったんですよね。だからもう復旧するのが大変なんですよね。しかも9月の下旬に壊れて10月2日ぐらいだったかに、アメリカから一番偉い人がやってくるのでその人に提出するデータを作らないとまずいということで、かなりの突貫工事で直したんです。もうかなり精神的に堪えました。
現在は、一から作り直したおかげでOracleがすこぶる安定して動いています。ただWindowsが若干怪しい(最初からインストールしなおさずに、無理やりファイルを置き換えて起動するようにした)ため、10月から一度もリブートしてないです(Oracleしか動かしていないから、メモリリークの問題などはないみたいです)。
新しいサーバを買う決済は貰っているので、早いところ新しいサーバを建ててしまいたいです。ふうぅ。。
投稿者 GonGon : 2006年02月06日 23:47
トラックバック
このエントリーのトラックバックURL:
http://www.gongon.info/mt/mt-tb.cgi/726
コメント
おおー!!復活おめでとうございます。
お忙しいようですが体を壊さないよう頑張って下さい。
ありがとうございます。
新しいサーバは、ベンダーからの見積もりの最終チェックに入ってます。あと1ヶ月もすれば、テスト運用できるかなというところです。
投稿者 GonGon
: 2006年02月15日 22:01