海外コメンタリー

2018年のビッグデータ分野はどうなる--注目トレンド5選

George Anadiotis (Special to ZDNET.com) 翻訳校正: 村上雅章 野崎裕子

2017-12-27 06:30

 ビッグデータ分野では、2017年も目覚ましい技術革新が続いた。では、2018年はどういった動きが予想されるのだろうか?本記事では、注目すべきトレンドを5つ予測し、カウントダウン形式で紹介する。

#5:ストリーミングのメインストリーム化

 データの世界ではストリーミングと言ってもNetflixの話ではない。とは言うものの、Netflixもストリーミングを手がけている。混乱しただろうか?ではここで、きちんと説明したい。ここでのストリーミングとは、データのストリームをリアルタイムで処理することを指す。リアルタイムの部分は目新しい話ではない。業務用データベースの世界では何年も前から実現されている。

 新しいのは、データがバックエンドのストレージに送信され、アプリケーションで利用されるだけでなく、その場で分析処理も実行されるという点だ。ストリーミング(流れ)という名称は、アプリケーションによって生成されたデータが限りなく流れてくるという考えに由来する。またこれにより、難しい要件ももたらされる。

 データが数限りなく続いていく場合、クエリのセマンティクスをどう捉えればよいのか、そしてどのように実装すればよいのだろうか?また、このようなデータに対してどういった処理が適用できるのだろうか?他のソースからのデータとどのように組み合わせればよいのだろうか?機械学習(ML)のパイプラインにどのようにしてフィードすればよいのだろうか?こういったことを本番環境の規模で実現できるのだろうか?

 これらは手強い課題だ。これこそ、データアナリティクスが「Lambdaアーキテクチャ」を活用し始めた理由だ。Lambdaアーキテクチャには、到来したデータを処理する2種類のレイヤが存在している。1つは集積された過去のデータを処理するバッチレイヤであり、もう1つは到来したデータをその場で処理するリアルタイムレイヤだ。

 これは理想的なアーキテクチャではない。2種類のコードベースとプラットフォームをメンテナンスし続ける必要があるため、工数やコストの上昇を招くだけでなく、不整合を発生させる可能性が高くなる。またリアルタイムレイヤは実際のところ、あらゆるタスクを取り扱えるだけの力量があるとは言い難かったものの、現実的な選択肢はこれしかなかった。しかし、リアルタイムでデータを処理するプラットフォームが成熟するにつれ、Lambdaアーキテクチャは「Kappaアーキテクチャ」に道を譲りつつある。Kappaアーキテクチャは、単一のリアルタイムレイヤのみですべてを処理する。

 IoTや金融サービスといった分野は、ストリーミングデータをリアルタイムで処理するアプリケーションの普及に一役買ってきた。しかし、「時は金なり」という格言があてはまる分野はこれらだけでなく、プログラマティック広告や小売りといった分野での採用も目立ってきている。例を挙げると、承認されなかったクレジットカード決済をリアルタイムで洗い出し、処理できれば、取引の放棄を最大80%削減し、売上高の増加につなげることができる。

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ZDNET Japan クイックポール

所属する組織のデータ活用状況はどの段階にありますか?

NEWSLETTERS

エンタープライズコンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]