エンタープライズ システム障害解析3: QLogic Persistent Hardware Error Logging (ボードレベル エラー情報) 【サーヴァンツインタナショナル株式会社(株)】

- エンジニアもユーザも頭を悩ます複雑で多様なHBA障害解析現場。今回はQLogic 8Gb HBA独自の機能を、サーヴァンツの穂積エンジニアが解説します -

サーヴァンツインターナショナル株式会社

2008-10-30 11:00

システム障害と言ってもいろいろなタイプがあり、対応方法も様々です。比較的簡単な障害の例としては、単純なバグが引き起こすものなどがあります。例えば、あるルーチンを通ったときに、本来は‘0’という値を返すべきものが‘1’という値を返してしまうというような場合です。これは、テストプログラムの強化や、例外処理を丹念に見ていくことで、比較的短時間で、確実に解決することができます。 

厄介なのは、一見直接関与しているようには見えない複数の条件がそろった時に、初めて障害が発生するというようなケースです。特に、プロトコル動作を中心とするデバイスは、ステートマシーン形式を取ることが大半なので、いくつもの条件が積み重なって障害を起こすケースが多く、最終障害が発生した時には、すでに初期段階の条件そのものが無くなってしまうことがあります。そして障害解析時には最終的な障害状況すら残っていない、という事態が起き得るのです。

このようなケースでは、障害を再現するだけでも膨大な時間が掛かります。また、条件としてタイミングウィンドウなど時間が関与していた場合は、障害の根本原因を解明することは、ほぼお手上げ状態になります。このような問題を解決するためには、システムを構成するビルティングブロック自体で、障害を発生させる条件を無くすことが必要です。1つのビルディングブロックの問題が他のビルディングブロックの動作に影響を及ぼすことが無いように、可能な限りあらゆる条件でテストし、動作検証を行います。

特にインターフェースを司るシステムは、他のシステムとの間で交信が必要な為、相互接続検証を行うことが求められます。システムの柔軟性が増すにつれ、障害発生条件はますます増加し、そして複雑になります。あらゆる条件を想定した試験さえもすり抜け、障害発生の条件になりうる問題が残ってしまうこともあります。従って単体でテストしたときにはなかった障害が、実システムで稼動後暫くして観測されるということもあります。

‘ごく稀にデータ化けが発生する’という事例がありました。頻度が小さすぎて再現することすら困難だったため、何度も障害再現試験を実施し、エラーが起きる傾向を探し、問題発生時に絞り込んだテストプログラムを作成し実行する、という事を繰り返しました。そうして、障害が再現するまでの時間を短縮してゆき、最終的に障害が発生した時点の状態を把握したときに、障害の発生メカニズムの究明が始まるのです。 

ファイバチャネルのビルディングブロックの耐障害性を向上させるために、QLogicの8Gb HBA (リンク ») は、Persistent Hardware Error Logging (リンク ») という機能を持っています。これは、ドライバが致命的な問題の発生を検知したときに、その時点でのHBAの状況をHBA自身がオンボードのフラッシュメモリに強制的に書き残すというものです。もしシステムがハングアップし、システムリセットが行われたり、電源が切られたりしても、その状況がHBAに保存されます。  

障害発生時に、ユーザ自身がHBAに書き残されたデータ読み出したり、解析したりすることは出来ませんが、QLogicは返送されてきたHBAのフラッシュメモリに書込まれたログを解析し、障害を起こした状況を正確に把握することで、ボードやドライバの改修などの対策をとることができます。HBAの障害報告から、その他の多くのHBAおよびドライバなどのビルディングブロック全体の障害に対する保守・検証作業を大幅に改善することが出来るわけです。QLogic 8Gb HBA 独自のPersistent Hardware Logging機能は、HBAの主要な障害原因に関する洞察を可能にすることで、障害解析の大幅なスピードアップを実現するとともに、QLogic製品の信頼性の向上にも生かされます。

次回は、チップレベルでの動作履歴をトレースする、Hardware Assisted Firmware Traceについてご紹介します。シリーズ No.1 (リンク ») 、シリーズ No.2 (リンク »)

当記事、およびQLogic 8Gb HBA SANblade2500シリーズ (リンク ») に関するお問い合わせは下記まで。

----------------------------------------------------
問い合わせ
----------------------------------------------------

会社名: サーヴァンツインタナショナル株式会社 (Servants International Corporation)
所在地: 〒182-0024 東京都調布市布田1-29-2 ビルディング川口3F
TEL: 042-488-9649 / FAX: 042-488-9648
お問い合わせ: (リンク »)
サーヴァンツ ホームページ: (リンク »)

---------------------------------------------------
サーヴァンツインタナショナル株式会社について
----------------------------------------------------

サーヴァンツインタナショナル(株)は、世界のユニークな先端技術とソリューションを提供している、ハイクオリティ・サービス・プロバイダです。データセンタで活用されるストレージネットワーキング、サーバクラスタリング、海外先進半導体ソリューションのエキスパートとして、海外のメーカーと日本のお客様をつなぐ架け橋となるべく、高品質の製品とサービスをお届けしています。 サーヴァンツインタナショナル(株)は、QLogic社の正規一次代理店(Authorized Distributor)です。
サーヴァンツ ホームページ: (リンク »)
サーヴァンツ 会社概要: (リンク »)

----------------------------------------------------
QLogic(キューロジック)について
----------------------------------------------------

QLogic社はコントローラ、ホストバスアダプタ、ファブリック・スイッチをふくむ高性能ストレージ・ネットワーキング・ソリューションのリーディング・サプライヤです。ファイバチャネルHBA、iSCSI HBA、ファイバチャネル・スイッチ、ルータ、インフィニバンドスイッチ、HCAを含む広範な製品を、世界中のエンタープライズ、中小企業様向けに出荷しています。
QLogic 製品情報: (リンク »)

このプレスリリースの付帯情報

QLogic 8Gb FC HBA SANblade2500シリーズ QLE2562

本プレスリリースは発表元企業よりご投稿いただいた情報を掲載しております。
お問い合わせにつきましては発表元企業までお願いいたします。

【企業の皆様へ】企業情報を掲載・登録するには?

御社の企業情報・プレスリリース・イベント情報・製品情報などを登録するには、企業情報センターサービスへのお申し込みをいただく必要がございます。詳しくは以下のページをご覧ください。

ZDNET Japan クイックポール

注目している大規模言語モデル(LLM)を教えてください

NEWSLETTERS

エンタープライズ・コンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]