はじめに
前回に続いて、2025年に公開された論文「Preventing Network Bottlenecks: Accelerating Datacenter Services with Hotspot-Aware Placement for Compute and Storage」に基づいて、Googleのデータセンターで利用されている「ToR(Top of Rack)スイッチのホットリンクを回避してコンテナを配置する技術」について解説します。今回は、ホットリンクを回避するためのBorgスケジューラーの拡張とその効果を説明します。
Borgスケジューラーの仕組み
前回の記事では、ToRスイッチの帯域使用率がストレージアクセスのテイルレイテンシーに及ぼす影響を解説しました。特に、ストレージへのデータの書き込み処理は帯域使用率の影響を受けやすく、帯域使用率が75%を超える「ホットリンク」を回避する事で、書き込み処理のテイルレイテンシーを大きく改善できる可能性があります。冒頭の論文では、Borgのスケジューラーにホットリンクを回避する機能を追加することで、テイルレイテンシーの改善を実現した結果が報告されています。論文内では、該当の機能を「UTP(ToR-Utilization aware Task Placement and migration)」、および、「CCP(ToR-Capacity aware Chunk Placement)」と呼んでいます。
この続きは以下をご覧ください
(リンク »)
お問い合わせにつきましては発表元企業までお願いいたします。

