提供:Amazon Web Services
「Amazon Web Services」(AWS)の最高経営責任者(CEO)Andy Jassy氏は、11月末から米ラスベガスで開催されたAWSの年次カンファレンス「re:Invent」で、多くの新サービスや新機能を発表した。アナリティクスや人工知能(AI)関連の新サービスは、他事業者と比べ大きな違いがあるわけではないが、これらのサービスが大ヒットすることはほぼ間違いない。
Jassy氏は、今回の一連の発表のテーマを、企業にスーパーヒーローが持っているような「スーパーパワー」を与えることだとした。同氏はその例として、超高速のスピードを実現する強力なコンピュートインスタンスや、高コストの商用データベースから「飛び去る」ことを可能にする新しいデータベースサービス、企業の輪郭を「変身」させる新しいIoTサービスなどを挙げた。
筆者がもっとも興味を引かれたのはあらゆるものを透視する「X線透視能力」をテーマにした部分で、ここではアナリティクスサービスの「Athena」と「QuickSight」、人工知能(AI)サービスの「Rekognition」「Polly」「Lex」が紹介された。この記事では、各サービスの概要とそれぞれに対する筆者の個人的見解を記していきたい。
Athena:AWSは大規模構造化データ用の分析サービスとして「RedShift」、大規模非構造化データ用の分析サービスとして「EMR」(Elastic MapReduce)を持っている。そして今回、同社はデータ分析サービスの3本目の柱として、Athenaを追加した。Athenaは「Amazon S3」(Simple Storage Service)上に保存されているデータに対して、SQLを用いた対話的な分析を行うことができるサービスである。たとえばクリックストリームやログファイルなどは、ばらつきがありデータタイプが可変なため、簡単にはデータベースサービスに取り込めない半構造化データであるが、Athenaを使用すれば、EMRよりもシンプルに低コストで分析が行える。クエリの実行時間は、大規模なデータを扱う場合でも1秒未満に収まるとされている。
Athenaに対する個人的見解:このサービスは、便利でコストパフォーマンスの高い選択肢になる可能性が高いが、実際にどの程度人気が出るかや、どんなケースに利用できるかは、SQLで扱えるデータの階層の深さや種類、応用範囲による。つまり、どのタイプのデータに対して、どの種類のクエリがサポートされるかによる。Microsoftが最近発表した、「U-SQL」を使用したクエリを実行できる「Azure Data Lake Analytics」も、これと似た機能を持っているが、「Azure Data Lake」サービス自体も発表されてから日が経っていないのに対し、S3は低コストクラウドストレージとしては古参であり、広く利用されている。つまり、AmazonはAthenaを利用する可能性のある大きな市場をすでに抱えていることになる。
QuickSight:Amazonがこのビジネスインテリジェンス(BI)サービスの一般提供開始を発表したのは2週間ほど前だが、その発表は目立たないものだった。これはQuickSightの最初の発表が、2015年のre:Inventカンファレンスで、鳴り物入りで行われたことを考えれば驚くべきことだ。実際、Amazonは2016年に入ってからはほとんどQuickSightに言及しておらず、筆者の聞いたうわさでは、このプロジェクトがいくつかの問題に突き当たっているからだという。長年の間、多くの事業者がBIを手懐けるのに苦労しているのにはそれなりの理由があり、Amazonが約束していた「すべての従業員が、技術的なスキルに関わらず簡単に使えるBI」のツールを作ることが難しいのも不思議ではない。QuickSightは、AWSのソース(RDS、Aurora、Redshift、またはS3上のカンマ区切りファイル)上にもともと存在する構造化データであれば、数分でデータの関係性を分析し、結果を可視化できる。さらに、「SPICE」と名付けられたカラム型のインメモリエンジンを採用したため、高速なクエリが可能であることも好材料だ。