ここが「SQream DB」といったGPUデータベースの存在理由となっている。SQream DBを開発したSQream Technologiesは、起業家であり投資家でもあるAmi Gal氏と、プログラマーでありアルゴリズム考案者でもあるKostya Varakin氏によって2010年に立ち上げられた企業だ。両氏は、データベースにおけるGPUの活用というVarakin氏のアイデアを実現するために力を合わせ、作業を開始した。
創業からの数年で、特許の取得や、何回かの投資ラウンドを経た同社は現在、GAL氏と研究開発担当バイスプレジデントであるRazi Shoshani氏によって運営されている。Varakin氏は新たな挑戦に向けてSQreamを去ったものの、同社は現在までに1500万ドルを調達し、50人を超える従業員を抱えるまでに成長している。また、従業員数は2018年中に75人程度にまで増えると見込まれている。
GPUデータベースの選択肢
SQreamはこれまでに複数の提携関係を締結してきているが、26日にはGTCで新たな提携を発表した。この提携について説明する前にまず、GPUデータベース分野を概観しておきたい。
GPUデータベースには、SQream DBのほかに「Blazegraph」や「BlazingDB」「Brytlyt」「Kinetica」「MapD」「PG-Strom」といったものがある。SQreamは、自らをアナリティクスデータベース市場のプレーヤーとして位置付けており、大規模ワークロードに焦点を当てることで他社との差別化を図っている。SQreamの最高マーケティング責任者(CMO)であるDavid Leichner氏は以下のように語った。
GPUデータベースを開発、販売しているベンダーは複数ある。最もよく耳にするのはKinetica DBとMapD Technologiesだろう。SQreamはこれら2社とともにGPUデータベース企業としてひとくくりにされて語られる場合がしばしばあるものの、ソリューションには大きな違いが1つ、そして小さな違いがいくつか存在している。
まず挙げられるのは、KineticaとMapDがインメモリストレージを採用している点だ。これにより例えば5テラバイトや10テラバイトまでのデータを極めて高速に分析できるようになる一方、アーキテクチャ面やコストの面でスケーラビリティに制約が加えられる。こういったデータベースのベンダーが20テラバイト以上のデータストアについて語ることはほとんどないはずだ。一方、SQream DBは大規模データストアを念頭に置いて構築されている。
SQream DBは、20倍のデータ量、すなわちテラバイト規模からペタバイト規模に至るまでのデータの分析を、10%のコストと管理で最大100倍高速に実行する機能を企業にもたらせる、GPU能力を活用する唯一のSQLアナリティクスデータベースだ。典型的な応用事例として、既存の超並列処理(MPP)や分散型データレイクをリフト&シフト形式でSQream DBに移行し、SQream DB上で重量級のデータアナリティクスを実行するというものが考えられる。

GPUの興隆により、GPU能力を活用したデータベースという新たな時代の幕が開けた。
提供:NVIDIA