編集部からのお知らせ
ZDNet Japanが新しくなりました!
New! 懸念高まる産業機器のセキュリティ
海外コメンタリー

クラウドがデータレイクの“実質標準”になる--2018年展望 - (page 3)

Tony Baer (Special to ZDNet.com) 翻訳校正: 石橋啓一郎

2018-01-18 06:30

 今後は、データを保存する前にできるだけ多くの処理をしたいと考えるようになるだろう。分散メッセージ処理システムである「Kafka」が人気を得ているのはこれが理由だ。またこれは、SAPHortonworksMapRTeradataなどのデータプラットフォームプロバイダーが、この領域に参入している理由でもある。もちろん「Amazon Kinesis」や「Azure Data Factory」、「Google Cloud Dataflow」などのサービスについては言うまでもない。データパイプラインを利用すれば、リアルタイム処理を、基本的なフィルタリングや変換だけでなく、高度な予測的アナリティクスや機械学習にも対応可能な、組織化されたプロセスにも拡張できる。2018年には、データパイプラインがストリーミングアナリティクスの重要な柱になり、IBMやOracleなどのプロバイダーもこの分野の製品を積極的に発表するだろう。

クラウドストレージがデータレイクのデファクト標準になる

 データレイクと言えば、データの保持のために設計され、ほかにはあまり有効な使い道がないHadoopを思い浮かべる人が多いだろう。データレイクとは、データのデフォルト取り込みポイントとなる管理されたレポジトリだ。しかし最近では、Hadoopを超えるデータレイクの実装が登場してきている。Mike Olson氏は2014年に、Hadoopは目に見えなくなる(意識せずに利用される基盤技術になる)と予言している。

 そもそもの始まりは、事実上あらゆるアナリティクス用データベースで必須とみなされるようになった統合クエリツールだ。JSONデータベースは拡張され、Spark経由で分析クエリを実行できるようになった。また、Hadoopプロバイダー(例えばClouderaHortonworks)は、データガバナンスサービスをHDFSから切り離した。つまり、データを保管できるものは何でもデータレイクとして利用できるようになっているわけだ。

 クラウドプロバイダーが「クラウドでは、クラウドストレージがデータのデフォルト取り込みポイントになった」と主張していることに驚く者はいないだろう。またクラウドプロバイダーは、クラウドオブジェクトストアに対して直接クエリを実行できるようにしている。Amazonの「S3」は、「Athena」でも、「Redshift Spectrum」によるデータウェアハウスの拡張としても、SQLのアドホッククエリで直接アクセスできるようになった。Google CloudのクラウドストレージがBigQueryのデフォルトソースとして利用できるようになったのはかなり前のことだし、サードパーティーのクラウドデータウェアハウス「Snowflake」も同じことを実現している。

 これはちょっとした皮肉だ。クラウドストレージは、もともと単なるストレージとして設計されたものだ。しかし、クラウドオブジェクトストレージにデータの大半が保存されるようになると、企業はアクセスの最適化を求めるようになる。われわれの予想では、2018年には、事実上すべてのデータウェアハウスやアナリティクス用データベースで、S3、Azureの「BLOB Storage」、「Google Cloud Strage」などのよく使われているクラウドオブジェクトストアがサポートされるだろう。

この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。

ZDNet Japan 記事を毎朝メールでまとめ読み(登録無料)

Special PR

特集

CIO

セキュリティ

スペシャル

NEWSLETTERS

エンタープライズ・コンピューティングの最前線を配信

ZDNet Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]