JR西日本の「JRおでかけネット」をはじめ、グループの重要システムを支えるJR西日本ITソリューションズ。公共インフラとしての信頼性が求められる同社において、Webシステムの異常を素早く感知し、初動へつなげることは不可欠なミッションだ。
しかし、10年以上利用してきたオンプレミス環境の旧ツールの保守終了を機に、深刻な課題が浮き彫りになる。監視スクリプトを作成できるエンジニアが限られ運用が属人化していたほか、サーバー接続端末の制限により関係者間での情報共有も困難を極めていた。また、オンプレミス環境からAWS環境に移行し、システム全体をモダナイズ化する方針にもなった。そこで同社は、GUIベースで直感的に操作できるDatadogを導入。その結果、原因特定に数時間を要していたケースが、数分から数十分に短縮し、システム停止に至る前の「予兆」の段階で対処が可能になった。さらに、対応可能者が3名から15名に拡大するとともに、インフラ担当から経営層まで同一のダッシュボードを見ることで「状況の共通認識」が即座に形成される体制へ移行した。
本資料では、受動的な対応から脱却し、「使い倒す」レベルまで監視の価値を高めた同社の取り組みを担当者が詳しく語る。
ホワイトペーパー
