はじめに
前回に続いて、2021年に公開された論文「Take it to the Limit: Peak Prediction-driven Resource Overcommitment in Datacenters」を元にして、サーバークラスターの「オーバーコミット」を最適化するアルゴリズムを解説します。今回は、「Peak Oracle」の考え方に基づいて、アルゴリズムを設計・評価する方法を説明します。
「Peak Oracle」によるアルゴリズムの評価
前回の記事で説明したように、サーバー上で稼働するタスク群において、個々のタスクがリソース使用量のピーク値をとるタイミングには「ずれ」があるため、サーバー全体でのリソース使用量の変化、そして、そのピーク値を正確に予測することはそれほど簡単ではありません。しかしながら、もしも、これを正確に予測するアルゴリズムが存在したとすれば、クラスター管理システムのスケジューラーは、理想的なオーバーコミットを実現することができます。具体的には、スケジューラーに対して、次のようなルールを組み入れます。
・サーバーの全リソースから、現時点での「サーバー全体でのリソース使用量のピーク値(予測値)」を引いた値が、新しいタスクに割り当てるリソースよりも大きければ、このタスクを受け入れる
この続きは以下をご覧ください
(リンク »)
お問い合わせにつきましては発表元企業までお願いいたします。