富士通研、顧客の業務を停止させないクラウド運用技術を開発

NO BUDGET

2018-03-29 10:30

 富士通研究所は3月28日、パブリッククラウドのメンテナンスが原因による利用者の業務遅延・停止を回避するクラウド運用技術を開発したと発表した。

 パブリッククラウドでは、メンテナンスのために仮想マシン(VM)を一旦停止させ別のサーバで再起動することが必要で、業務も一時的に停止せざるを得ない。また、VMを停止させずに別サーバに移動するライブマイグレーション(LM)により、業務の停止を回避することも可能だが、VMが高負荷のときには一時的な性能低下や数秒間の停止などの業務への影響が発生することがあり、VMが低負荷のときにLMを行う必要がある。

目指すクラウドの姿
目指すクラウドの姿(出典:富士通)

 今回開発した技術は、メンテナンスによるユーザーの業務への影響が少ない時間帯を予測する技術と、メンテナンスを短時間で完了する計画を作成する技術で構成されている。

 業務への影響が少ない時間帯を予測する技術では、業務が実行されるVMごとに、過去のLMで要した時間とそのときの負荷情報を機械学習させ、LMに掛かる所要時間の予測モデルを作成する。この予測モデルに基づいて、メモリ使用量や通信量など外部から観測可能なデータによって推定したVMの負荷から、VMごとにLMに必要な時間を算出する。そして、メンテナンスを行った場合のLMによる業務への影響を少なく抑えられる時間帯を分単位で予測する。


 メンテナンス計画を作成する技術では、業務への影響の少なさとVMごとのメンテナンス完了期限を両立でき、さらに、なるべく短期間でクラウド全体のメンテナンスが完了する計画を、大量の組み合わせの中から効率的に算出する。最適解の算出には、サーバとVMの構成情報や、メンテナンス可能な条件などのクラウド運用特有の制約を用いる。

 今回、この技術を商用クラウドの約5000VM分の稼働データに適用し、各VMが全体の8割の時間でCPU負荷が90%以上、残り2割の時間は負荷が低いという条件でのシミュレーションを行った。その結果、従来技術では、延べ425VMで業務の負荷が高いときにメンテナンスが実行されたのに対して、全てのVMについて業務の負荷が高い時期を避けてメンテナンスが実行されることが確認できた。

 富士通研究所では、今後、富士通が提供するクラウドサービス「FUJITSU Cloud Service K5」の運用を支える機能として2018年度中のサービス化を目指す。

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ZDNET Japan クイックポール

注目している大規模言語モデル(LLM)を教えてください

NEWSLETTERS

エンタープライズ・コンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]