原因はデッドロック、データが滞留して停止--JALシステム障害

ZDNet Japan Staff 2016年04月07日 19時11分

  • このエントリーをはてなブックマークに追加

 日本航空は4月1日に発生した重量管理システムの不具合による運航サービス遅延について、詳細を説明した。同日の障害では、国内線46便が欠航し、6670人に影響が出た。欠航しなかったものの、国内線に最大155分、国際線で最大42分、遅延した。

 障害の原因は、重量管理システムのプログラムに不具合があったこと。3月23日に変更したアプリケーションプログラムにおいて、システム内で同時に動作している2つのプログラムが互いに処理を待つ状態になり、正常に動作しなくなったと説明している。

 現在、プログラムを開発した製造元ベンダーによるプログラム修正と検証作業を実施している。

 今後は、不具合の原因となったプログラム修正を近日中に実施する、本番システムが停止した際の現場での業務維持能力を高めるバックアップとして準備している環境の処理能力を強化する、製造元ベンダーとの情報共有を密にし、外部の専門家の知見も取り入れながらシステム検証の能力向上に努めるとのこと。

 以下の図1を用いて障害を説明した。1つのキャッシュ、ディスクに対する処理要求が競合し、デッドロックを起こしたことが直接の原因だった。

図1
図1

 具体的には、図1の処理Aの1と4、処理Bの2と3は、組み合わせた1つの単位で処理される必要がある。だが、今回処理Aの1と処理B2が正常終了した後で、キャッシュを処理Aが占有、ディスクを処理Bが占有してしまう、デッドロックが起きた。これにより、3において処理Bはキャッシュにアクセスできず、4において処理Aがディスクにアクセスできなくなった。

 デッドロック発生後、他の処理が進まなくなり、データの滞留が発生、システムが停止するに至った。

 障害を起こした重量管理システムとは、飛行機の重心を計算するためのプログラム。乗客が座っている座席の位置や貨物の置かれている場所などを計算し、飛行機の重心を把握することでバランスを維持する。このシステムによる安全確認ができなければ、飛行機は離陸できないようになっている。


図2

 図2のように、燃料データ、チェックインデータ、貨物データなどを社内の他システムから受け取り、飛行機のバランスに問題が起きないかどうかを、社内の搭載管理者端末からのデータ処理要求に応じて回答する仕組みになっている。

 4月1日の状況は次の通り。7時48分ごろに重量感システムに不具合が発生。複数のユーザーから使用できないとの報告が上がった。7時55分、アプリケーションサーバ、連携サーバを再起動するが状況に変化はなかった。8時50分、連携サーバに滞留している外部からの連動データを削除、9時12分に外部との連動を停止、9時18分にアプリケーションサーバの再起動を実施。9時23分、外部との連動を再開、データの不整合がないことを確認し、9時40分にシステムを再開した。

ZDNet Japan 記事を毎朝メールでまとめ読み(登録無料)

  • このエントリーをはてなブックマークに追加

この記事を読んだ方に

関連ホワイトペーパー

連載

CIO
シェアリングエコノミーの衝撃
デジタル“失敗学”
コンサルティング現場のカラクリ
Rethink Internet:インターネット再考
インシデントをもたらすヒューマンエラー
トランザクションの今昔物語
エリック松永のデジタルIQ道場
研究現場から見たAI
Fintechの正体
米ZDNet編集長Larryの独り言
大木豊成「仕事で使うアップルのトリセツ」
山本雅史「ハードから読み解くITトレンド放談」
田中克己「展望2020年のIT企業」
松岡功「一言もの申す」
松岡功「今週の明言」
内山悟志「IT部門はどこに向かうのか」
林 雅之「デジタル未来からの手紙」
谷川耕一「エンプラITならこれは知っとけ」
大河原克行「エンプラ徒然」
内製化とユーザー体験の関係
「プロジェクトマネジメント」の解き方
ITは「ひみつ道具」の夢を見る
セキュリティ
エンドポイントセキュリティの4つの「基礎」
企業セキュリティの歩き方
サイバーセキュリティ未来考
ネットワークセキュリティの要諦
セキュリティの論点
スペシャル
エンタープライズAIの隆盛
インシュアテックで変わる保険業界
顧客は勝手に育たない--MAツール導入の心得
「ひとり情シス」の本当のところ
ざっくり解決!SNS担当者お悩み相談室
生産性向上に効くビジネスITツール最前線
ざっくりわかるSNSマーケティング入門
課題解決のためのUI/UX
誰もが開発者になる時代 ~業務システム開発の現場を行く~
「Windows 10」法人導入の手引き
ソフトウェア開発パラダイムの進化
エンタープライズトレンド
10の事情
座談会@ZDNet
Dr.津田のクラウドトップガン対談
Gartner Symposium
IBM World of Watson
de:code
Sapphire Now
VMworld
Microsoft WPC
Microsoft Connect()
HPE Discover
Oracle OpenWorld
Dell Technologies World
AWS re:Invent
AWS Summit
PTC LiveWorx
吉田行男「より賢く活用するためのOSS最新動向」
古賀政純「Dockerがもたらすビジネス変革」
中国ビジネス四方山話
ベトナムでビジネス
日本株展望
企業決算
このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]