ビジネスアナリティクスの未来
最後に、アナリティクスの進化における最新トレンドを見てみることにしよう。
ここまででアナリティクスのインフラや能力を作り上げることの複雑さについて述べてきた。しかし、使用しているアプリケーションからデータを取り出して、自らで分析するのではなく、そういったアプリケーションにあらかじめ分析機能が搭載されているとしたらどうだろうか?より多くのユーザーが、自ら使用しているアプリケーションから洞察を導き出そうと取り組むようになるようにつれ、組み込み型アナリティクスも注目を集めるようになってきている。
また最近では、プラットフォーム間の収れんも見られるようになってきている。NoSQLの台頭によって生み出された分断化はあったものの、プラットフォーム間をまたがるビッグデータから大局を導き出す何らかの方法が必要であることもすぐに明らかになった。NoSQLデータベースにデータが累積されるようになるとともに、ETLデータをデータウェアハウスに移送するのではなく、自らのアナリティクスソリューションを開発しなければならなくなったのだ。
そのようなソリューションは当初、リレーショナルデータベースのものに比べると洗練されているとは言えなかった。これこそ、NoSQLデータベースがSQLを採用し、自らのものとして取り込んだ理由だった。そして今日では、SQLデータベースとNoSQLデータベースをまたがって機能する多くのアナリティクスソリューションが生み出されるに至っている。
ビジネスアナリティクスという未来が急速に近づいてきている。
しかし、収れんはSQLとNoSQLという観点では語りきれないものとなっている。業務と分析のワークロード双方に利用できるデータベースがあれば、それは究極の武器になる。われわれは今日、これら双方の用途に長けたシステムを目にしようとしている。こういったソリューション(ハイブリッド型トランザクション/アナリティクス処理(HTAP)またはトランザリティクス(transalytics)と呼ばれている)は、まだ揺籃期にあるが、その未来は間違いなく有望だ。
リアルタイム処理、すなわちストリーミングも現代を象徴するものだ。データウェアハウスとHadoopの双方によって、生成された日時と、最新データに基づいて通知できる洞察の時間との間に差が生み出される。最新データからの洞察やアルゴリズムをその場で用意できれば、業務にメリットがもたらされる。これ故に、新種のストリーミングプラットフォームとして光を放ち始めることになる。
インメモリ処理は、直交しているとはいえ、それに関連するトレンドだ。メモリのコストが低下し、新種のメモリが利用可能になるとともに、データを最初にメモリ内で処理するというプラットフォームの構築が現実的なものとなった。プラットフォーム側での大規模な再設計が必要となる場合も多いが、この考え方によりユーザーはディスクに比べて高速な処理が期待できるというメモリの利点を得られるようになる。
最後に、メモリやプロセッサ以外の専用ハードウェアの台頭も忘れてはならない。今日では、GPUやFPGAといった専用チップのほか、いまだ研究中のハードウェアも存在しており、主流への道を歩みつつある。こういたチップはMLのような特殊なワークロードに大きな利点をもたらせるため、この分野は急速に進歩してきている。Hadoopといったプラットフォームは、この種のハードウェアへの適応を進めている。それと同時に、GPUデータベースといった技術に基づく特殊なプラットフォームも生み出されている。
この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。