はじめに
前回に続いて、2023年に公開された論文「Firestore: The NoSQL Serverless Database for the Application Developer」に基づいて、Google Cloudで提供されるNoSQLデータベースサービス「Firestore」のアーキテクチャーを解説していきます。今回は、Firestoreの性能に関するベンチマークデータを紹介します。
データベースのサイズとアクセス数
第153回の記事では、論文執筆時点のデータとして、1ヶ月あたり、約400万個のプロダクションデータベースに対して、10億以上のクライアントからのアクセスがあることを紹介しました。特に、データベースのサイズやアクセス数には大きなばらつきがあると説明しましたが、図1は、これを示す実データになります。
図1 Firestoreで利用されるデータベースのサイズとアクセス数の分布(論文より抜粋)
これは、過去28日間に実際にアクセスがあったすべてのデータベースに対して、データベースのサイズ、アクセス頻度(QPS)、リアルタイムクエリーの実行数の分布を示したものです。中央値を基準にした相対値になりますが、たとえば、データベースのサイズについては、中央値に対して、10^9以上もの大きさのデータベースが存在することなどがわかります。これまでに説明したように、Firestoreに保存したデータは、分散データベースのSpannerに保存されており、数千ノードの規模で分散保存することができます。このため、ペタバイトクラスのデータベースであっても性能に大きな影響を与えることなく利用できます。
この続きは以下をご覧ください
(リンク »)
お問い合わせにつきましては発表元企業までお願いいたします。

