トップインタビュー

データの前処理が最小限で済むNoSQLこそが市場を変える--マークロジックCEO - (page 2)

吉澤亨史山田竜司（編集部）

2016-08-22 07:00

　われわれは、すべてのデータに対してインデックスを加えています。データに構造やスキーマが付加されている場合には、スキーマもインデックス化します。これはGoogleの手法に似ていて、さまざまな切り口でデータを見ることができます。非常に柔軟性が高く、データに変更や追加が発生してもアプリケーションの書き換えは不要です。

　これらは大きな差別化要因ですが、ほかのNoSQLのソリューションはデータを格納するだけなのに対して、われわれはさらにインデックス化を加えることによって、ユーザーは検索用アプリケーションを構築してもらえればよい環境を提供しています。それでETLよりもより速い結果が出るようになります。

　業界では30年以上もの間、ETLのようなデータの正規化が要求されてきました。しかし、われわれは各企業、あるいは政府に対して、すべての「データの正規化」は必要ではないと主張してきました。ETLでなく柔軟性を提供することによって、ビジネス上の俊敏性を実現することができます。

　もう少し具体的に説明すると、一般的なリレーショナルデータベースでは、情報の整合性のために、データベース設計「制約の宣言」が必要です。20の異なるシステムがあれば、すべてのシステムに対して制約を宣言し、関連性を捉える必要があります。しかし、われわれの場合は制約の宣言が要求されていません。20の異なったシステムがあっても、そのまますぐに活用できます。それはMarkLogicに「制約を発見できる仕組み」があるためです。

――NoSQLがデータ分析に求められている背景は。

　構造化データと非構造化データが入り混じりながらデータ活用が求めらている状況ではNoSQLのほうが有利だからです。例えば、米国が運営する医療保険サイト「HealthCare.gov」の事例では、多くの保険契約は非構造化された形で入ってきます。しかし、構造化されたデータと比較できることが求められます。分析を通じて一旦データ同士を比較し、納税額やその他の個別条件に基づいた適用可能な保険が提案されます。提案された保険の種類によってかかる費用など、従来のリレーショナルデータベースと同様にデータベースに対する演算処理ができます。

　これが非常に良い例で、高度に構造化されたデータと、非構造化データが入り混じった状態で分析をしなければならない。これらのデータを分析するためにインデックスやETLのためにコストを使う必要があったわけですから、その点ではNOSQLの方がより適合していたわけです。

　リレーショナルデータベースは、非構造化データや分断されたデータに向いていません。しかし、われわれは分断されたデータは非構造化でも、構造化データでも統合できます。そのため、リレーショナルデータベースの会社が市場で成熟した中で、急成長できました。

――日本での展望は。

　私はオラクルの役員でしたが、興味深いのはオラクルが日本市場に進出したときと同じパートナーが、MarkLogicと手を組んでいることです。NTTデータや富士通、CTCがパートナーです。

　各社とも、30年前にさまざまな顧客、パートナーがメインフレームからリレーショナルDBへの切り替えたのと同じように、リレーショナルからNoSQLへの切り替えをしようとしているのではと考えています。

　日本での顧客数も本番稼働で200以上のライセンスがあり、メタウォーター、富士通、ソフトバンク、三井住友カードなどでの実績があることからも自信を深めています。