NECは11月18日、大規模なクラスタ構成型サーバの障害を高速かつ低コストで回復、情報システムの停止時間を大幅に短縮する「高速リカバリ技術」を開発したと発表した。
今回開発された「高速リカバリ技術」は、1000台程度の大規模なクラスタ構成型サーバで障害が発生した際の停止時間を短縮、情報システムの信頼性を向上できる技術だ。障害発生時にプログラムを高速復元するプロセスリカバリ方式と、クラスタを構成するコンピュータの障害を短時間で発見するクラスタ監視方式の開発により実現した。LinuxをOSとした1000台程度のクラスタ構成型サーバにおいて、障害1回あたりの停止時間を10秒未満に短縮できる。
プロセスリカバリ方式には、メモリ使用量を3分の1から10分の1に削減できるように改良したプロセスリプリケーション技術を採用。数秒程度の復旧時間を実現しながら、プロセスの複製データを保持しておくコンピュータの数も削減可能だ。クラスタ監視方式については、監視用サーバに送るモニタリングデータのサイズを通常時と高負荷時で変更。監視用サーバの負荷削減に加え、1台のサーバで1000台規模のクラスタ構成型サーバを監視しながらも数秒以内の障害発見を可能にしている。
NECでは「高速リカバリ技術」をもとに、クラスタ構成型サーバにおける高信頼化技術の確立を目指して研究・開発を強化していく予定だ。また高速リカバリ技術を含めた「大規模・高信頼サーバの研究」の成果を11月15日から18日まで開催される「NEDO成果展示会」で展示し、今回開発したクラスタ監視方式を12月7日から9日まで開催される「C&Cユーザフォーラム&iEXPO2005」で動態展示する。