富士通研究所は3月3日、データアーカイブ用途の磁気テープストレージにおいて、仮想的なランダムアクセスにより高速アクセスを可能にする新技術を開発したと発表した。従来方式に比べ4.1倍の高速化を可能にするという。
開発したシステムの構成イメージ(出典:富士通研究所)
同社は、テープ内のデータをファイル単位で取り扱うLTFS(Linear Tape File System)を拡張し、複数のテープカートリッジを仮想統合する新たなファイルシステムを開発、テープの特性に合わせたデータ管理やアクセス順序制御によってテープからのランダムな読み出し性能を向上させたと説明する。
安価で大容量のテープストレージは、バックアップ用途だけではなく、アーカイブでの利用が拡大している。構造的にテープ上の連続した領域に記録されているデータを順に読み書きするアクセス性能は高いが、アーカイブ用途では不連続なデータを読み書きするためアクセス性能が低い。これがテープストレージをアーカイブ用途で使う際の課題だった。
新技術では、開発した仮想統合ファイルシステムで、複数のランダムな読み出し要求を受け入れた上で、論理アドレスではなく、テープ上の物理位置が近いデータから順に処理する。また、テープへのデータの書き込み後にヘッドの位置を定期的に計測してファイルの物理位置を推定している。これにより、データの書き込みエラーの確認やエラー発生時の再書き込みに伴う処理の遅さを軽減した。
また、テープ上でファイルのインデックスを保持するLTFSでは、ファイル数の増加に応じてインデックスが指数的に増大し、書き込みや読み出しの性能が大幅に劣化する課題もある。新技術では、指定したサイズ以下の小さいファイルは、まとめて大きなファイルとして保持し、利用者向けファイルのメタデータを管理する仕組みとしたことで高速な処理を実現している。
同社は、分散ストレージソフトのCephを使ってHDDと磁気テープのそれぞれの階層ストレージにおける新技術でのアクセス性能を評価した。その結果、磁気テープ上に蓄積した5万個の100MBのファイルからランダムに100ファイルを読み出す時間が、従来方式では5400秒だったところ、新技術では1300秒に高速化させる効果を確認した。また、HDD上の256個の1MBのファイルを磁気テープへ移動させるケースでは、従来方式では2.5秒だったが、新技術では1.3秒と、1.9倍高速化できる効果が認められた。
今後は業務適用を想定した検証を進め、2022年度中に富士通が製品化する予定だという。