大阪大学(阪大)とNECは、阪大のスーパーコンピューター「OCTOPUS」に民間のクラウドサービスのリソースを組み合わせて処理能力を拡張する「クラウドバースティング」を実装した。ここではMicrosoft Azureを利用している。
研究者の需要増大により、OCTOPUSは計算要求から計算完了までの待ち時間が長時間になるという問題が深刻になりつつあったという。だが、これまでスーパーコンピューターと民間のクラウドサービスの同時利用は、利用者の管理や計算の管理などに相違があるという理由から運用面で難しいとされてきた。
両者は今回、ジョブ管理機能とクラウドサービス制御機能によるスケジューラーを開発。大幅なシステム変更や開発をせずに、OCTOPUSとAzureのクラウドバースティング(コンピューティングリソースの需要が極端に高まった時、処理をクラウド上のリソースに切り替えるもの)環境を実現した。
OCTOPUSの負荷をAzure上に構築した計算機資源にオフロード(あるシステムの負荷を他の機器などが肩代わりして軽減する仕組み)をすることで、利用者の待ち時間縮減やジョブスループットの向上が期待できるという。
Azureにおいては、InfiniBandやGPUを搭載した仮想マシンを提供しており、必要な時に起動して不要な場合は停止するHPC(High Performance Computing)環境を構築できる点が評価された。また最新のCPU、GPU、高性能なノード間通信などのHPC関連技術が提供された際には、対応する仮想マシンが迅速に提供されることから、HPC分野における大型計算機のオフロード用途に適していると判断した。
2019年内にOCTOPUSの利用者である研究者を対象に実証実験を行い、今回構築したOCTOPUS-Azureクラウドバースティング環境での検証を通して、今後の本格運用に向けた技術課題を抽出する。また医療データなどの取り扱いを想定したオンプレミス環境とパブリッククラウド環境間での安全なデータ共有についても検証していく。
※クリックすると拡大画像が見られます