メインフレームはいかにして高信頼を達成してきたのか - (page 3)

山岡彰(日立製作所)

2006-02-14 00:00

部品単位での冗長化

 装置を構成する部品数が多かった時代は、故障部位を見つけて交換すべき部品の候補を挙げ、いち早く交換部品を届けることができる保守体制を整えることが課題だった。

 装置内で故障が発生したことを専用電話回線などで保守センターに自動的に報告し、即座に保守員が交換部品を持って駆けつけるといった遠隔保守機能も標準的に装備された。社会インフラに使用されるに伴って保守員が駆けつける時間すら許されなくなり、保守員がいなくても故障した部品を取り替えることができる仕掛けが必要になった。

 そこで、スペア(予備部品)をあらかじめ装置に搭載しておき、故障したらスペアに切り替える冗長化技術が開発された。予備を含めて複数ユニットを並列につなぎ、1ユニットが故障しても正常動作する「N+1電源」、オペレーション用のコンソールや冷却装置の二重化、外部装置との接続を複数パスで行えるようにするチャネルパス多重化など、装置を構成するユニット単位での冗長化。さらに、DRAMメモリが固定的に故障した場合に、DRAM単位で予備のDRAMに切り替えることができる交代メモリチップ、故障したプロセッサを切り替える交代プロセッサなど、部品単位で冗長化する技術も採用してきた。

 装置内に予備部品があるからといって、故障が引き金で装置障害を起こしたり、予備部品に切り替える際にいったん装置を止める必要があるのでは、ノンストップのニーズに応えられない。これらの冗長化は、装置としては正常に動作したまま、故障部位を隠蔽し予備に切り替えることができるようにする必要がある。たとえば、プロセスサクセション機能により、仕掛り中のジョブをアベンドさせることなく、交代プロセッサへ切り替え、そのジョブを継続して処理することができる。

部品交換でも装置を止めない

 このようにして、万一故障が発生しても装置を正常に保つための冗長化機構を装備するようになったが、いったん故障が起きた後そのままにしておいたのでは、次に別の故障が発生したら予備がなくて装置の障害を引き起こしてしまう。これを防止するには、故障部品をできるだけ早い時期に交換して、元の冗長化構成に戻す必要があるが、部品交換するのに装置を止めるのでは元も子もない。

 故障でない場合でも、防塵のためのフィルタや寿命が短いファンなどの定期交換部品がある。これらについても冗長化し、装置を正常に稼働させたままで、部品交換を可能にする稼働時保守機能を実現した。ファンは2段に並べて片方ずつ交換するなど、冗長化したユニット部品は原則的に装置稼働状態で交換できる。

図2 稼働率向上に向けたアプローチ

 さらに、装置は正常でも、処理すべき負荷が増大して、プロセッサなど装置のリソースを増強する必要が生じた場合には、装置を停止して増設工事を実施するしかなかった。この場合でもノンストップで稼働させるため、稼働中に増設が行えるCOD(Capacity On Demand)機能を実現している。

 また、マイクロプログラムなどハードウェアに組み込まれるソフトウェアについても同様に、稼動中にバグを修正するためのパッチ情報を当てるオンラインパッチ機能や機能追加などの目的での稼働時バージョンアップも可能になってきている。

10年以上障害がない

 コンピュータの信頼性を表す指標として、「障害件数/千台・月」を使うことがある。これは、1000台の装置が1カ月稼働した場合に(換算して)何件の障害が発生したかというものだ。初めてオールLSI化したメインフレームの世代は数十件/千台・月で、装置当たり平均的には3〜4年に1回障害が発生する計算になる。

 実際には、生涯に一度も障害を起こさない装置がある一方で、年に一度くらい障害を起こしてしまう装置もあるというレベルである。今のメインフレームは、この指標で1桁であり、平均的に10年以上障害がないという計算になる。実際には、一部の装置を除いて無事故で生涯を終えるというレベルに達していることになる。

 メインフレーム装置はこのようなレベルにまで達してはいるものの、ソフトウェアを含めたシステムを1台の装置に頼ることは危険なので、通常複数の装置で一つのシステムを構成する。全く同じ装置を用いて、一方を現用系、他方を待機系とするホットスタンバイ構成や、複数の装置で相互にバックアップする構成など、システム的な冗長化構成が採用されている。

 これらの冗長化は一つのセンター内で実施されるので、火災や地震などの災害により、センター全体に被害が及ぶ場合には対処できない。そこで、離れた地域にもう一つのセンターを置いてバックアップをするなどディザスタリカバリも考慮されてきた。

ノンストップ機能では一日の長

 このようにメインフレームでは長い歴史の中で、社会インフラとして成長してきた。他のコンピュータも順次機能的に追随してきているものの、特にノンストップ機能についてはまだまだ一日の長があり、簡単には置き換えられない状況にある。

 最後に少し空想めいた話で締めくくりたい。

 人里離れた温泉に向かって山道をドライブしているとタイヤがパンクした。だが、タイヤは6輪の冗長化構成であり、そのうちの4輪でそのまま走り続けることができる。しかも、パンクしたタイヤは稼働時保守機能を用いて走りながら新しいタイヤに取り替えることができる。

 エンジンは快調でこれまで壊れたことはないが、万一壊れても複数あるので問題ない。もちろん、給油やオイル交換も走りながらできるので、民家がほとんどない山奥だって何の心配もない。私たちは、予定通り目的地に到着し温泉での休暇を満喫することができた。

 その車の名前はメインフレームという。

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

関連記事

関連キーワード
日立製作所
クラウド基盤

ホワイトペーパー

新着

ランキング

  1. セキュリティ

    「デジタル・フォレンジック」から始まるセキュリティ災禍論--活用したいIT業界の防災マニュアル

  2. 運用管理

    「無線LANがつながらない」という問い合わせにAIで対応、トラブル解決の切り札とは

  3. 運用管理

    Oracle DatabaseのAzure移行時におけるポイント、移行前に確認しておきたい障害対策

  4. 運用管理

    Google Chrome ブラウザ がセキュリティを強化、ゼロトラスト移行で高まるブラウザの重要性

  5. ビジネスアプリケーション

    技術進化でさらに発展するデータサイエンス/アナリティクス、最新の6大トレンドを解説

ZDNET Japan クイックポール

注目している大規模言語モデル(LLM)を教えてください

NEWSLETTERS

エンタープライズ・コンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]