はじめに
前回に続いて、2022年に公開された論文「CacheSack: Admission Optimization for Datacenter Flash Caches」を元にして、Googleのデータセンターで使用されている、フラッシュディスクによるファイルキャッシュシステムを紹介します。この論文では、数理最適化を用いて最適なキャッシングポリシーを選択するアルゴリズムが紹介されており、ITシステムにおける数理最適化の応用例としても興味深い内容です。今回は、実環境におけるベンチマーク結果のデータを紹介します。
実環境における予測誤差とポリシー分布
前回説明したように、CacheSackは、過去のアクセス履歴データを用いたシミュレーションに基づいて、最適なポリシーの割り当て方法を決定します。この際、実際に発生するアクセスパターンは時間と共に変わるため、最適なポリシー割り当ては定期的に再計算する必要があります。冒頭の論文によると、実環境では5分ごとに再計算を行っているということです。過去データを元にした最適化というと、ニューラルネットワークを用いた機械学習処理を想像する方も多いかも知れませんが、機械学習モデルを5分ごとに再トレーニングするというのは、それほど簡単ではありません。CacheSackは、シンプルな数理最適化モデルを利用しているため、このような高頻度での再学習が可能になります。
この続きは以下をご覧ください
(リンク »)
お問い合わせにつきましては発表元企業までお願いいたします。

