日本有数の大手通信事業者であるソフトバンクでは、そのサービスを支えるサーバも膨大な数にのぼる。システム数は700~800ほど、ノード数は開発・商用含めて約2万を超える。ITインフラ統括部は、同基盤におけるログ集約や性能分析・監視システムが複数存在していた。それらのシステムは個別に開発・運用・メンテナンスされ、連携性に乏しかった。また、ユーザビリティが低く、重複する機能があるなど運用コストもかさんでいた。
そこでITインフラ統括部では、性能分析・ログ集約のシステムを集約し一元化することで課題の解消に取り組む。数年越しのプロジェクトを経て、現在の性能分析システム「APOLLON」への刷新に成功。数百、数千台ものサーバのログを集約してシステム監視を効率化させ、システム性能分析の迅速化や障害検知・予防などに貢献している。
以下の資料では、サービス基盤全体の性能情報収集・可視化を実現する共通システム構築プロジェクトの詳細を担当者が語ってもらった。
ホワイトペーパー