海外コメンタリー

「Spark」をクラウドサービスで利用すべき3つの理由--Databricks担当者に聞く

Matt Asay (Special to TechRepublic) 翻訳校正: 石橋啓一郎 2015年06月30日 06時30分

  • このエントリーをはてなブックマークに追加
  • 印刷

 オープンソースプロジェクト「Apache Spark」は、いまやカリフォルニア大学バークレー校のAMPLabが生んだ成果の中で、もっとも有名なものと言えるかもしれない。Sparkを生んだAMPLabは、機械学習、クラウドコンピューティング、クラウドソーシングという3つの大きなトレンドをテーマとしており、アルゴリズムと機械、そして人の力を組み合わせて、ビッグデータから意味を引き出すことに取り組んでいる。

 Sparkはもともと、AMPLabの別のプロジェクトである「Apache Mesos」を拡張するために書かれたものだが、人気が集まったため、開発者たちは2013年にAndressen Horowitsから資金を獲得して、スタートアップ企業Databricksを立ち上げた。同社は、データ分析のプロフェッショナルが簡単にSparkを利用できる、ホスティング型のクラウドプラットフォームを提供している。

 Sparkは、Hadoopの「MapReduce」の対抗馬として人気がある。Sparkはスピードと使いやすいプログラミングモデル、統一的なデザインを併せ持っており、ユーザーは1つのシステムで双方向的なクエリ、ストリーミング分析、機械学習、グラフ計算を組み合わせて利用することができる。

 このパワーをクラウド上に乗せ、シンプルでエレガントなユーザー体験を加えれば、データを処理し、エンドツーエンドのデータパイプラインを作ろうとしている人には魅力的なプラットフォームになる。Zoomdataのような、ビッグデータ処理のためにゼロから作られた視覚的分析アプリケーションを使えば、ビジネスインテリジェンス(BI)の分析を驚くほど素早くこなすことができる。

 この記事では、Databricksの顧客エンゲージメント担当バイスプレジデントであるArsalan Tavakoli氏に、Sparkと視覚的分析ツールの組み合わせの魅力についてインタビューした。

--Sparkをクラウドで利用することの利点は何でしょうか。Sparkをダウンロードして、社内で実行することもできるわけですが、Databricksからサービスを購入するメリットを教えてください。

Arsalan Tavakoli氏
Arsalan Tavakoli氏

Tavakoli氏:ご存じの通り、Sparkはオープンソースとして入手可能です。このため、だれでも、ベンダーからSparkを自分でダウンロードして、利用することができます。しかし、ビッグデータへの取り組みに失敗している顧客を調べると、失敗の原因が3つあることがわかりました。

 第1は、インフラ管理は大変だということです。社内でSparkを利用しようとする場合、ビッグデータのためのインフラを稼働させるまでに、通常は6~9カ月かかります。それ以上かかる場合もあります。SparkはAmazon Web Services(AWS)上で実行することもできますが、そのためにはEC2のスクリプトを書かなくてはならず、開発運用スタッフが必要となります。これは厳しいことです。

 インフラは大変なのです。また、Sparkに取り組もうという企業は、一般に早いイノベーションサイクルを求めています。何百人という人が常に貢献し、改善されているテクノロジの恩恵を受けたいと思っているのです。しかし、これはテクノロジの変化が速いということを意味しています。自社スタッフのチームが、最新バージョンを導入して稼働させるのに、どれだけの時間がかかるでしょうか。


ZDNet Japan 記事を毎朝メールでまとめ読み(登録無料)

  • このエントリーをはてなブックマークに追加

SpecialPR

連載

CIO
月刊 Windows 10移行の心・技・体
ITアナリストが知る日本企業の「ITの盲点」
シェアリングエコノミーの衝撃
デジタル“失敗学”
コンサルティング現場のカラクリ
Rethink Internet:インターネット再考
インシデントをもたらすヒューマンエラー
トランザクションの今昔物語
エリック松永のデジタルIQ道場
研究現場から見たAI
Fintechの正体
米ZDNet編集長Larryの独り言
大木豊成「仕事で使うアップルのトリセツ」
山本雅史「ハードから読み解くITトレンド放談」
田中克己「展望2020年のIT企業」
松岡功「一言もの申す」
松岡功「今週の明言」
内山悟志「IT部門はどこに向かうのか」
林 雅之「デジタル未来からの手紙」
谷川耕一「エンプラITならこれは知っとけ」
大河原克行「エンプラ徒然」
内製化とユーザー体験の関係
「プロジェクトマネジメント」の解き方
ITは「ひみつ道具」の夢を見る
セキュリティ
セキュリティインシデント対応の現場
エンドポイントセキュリティの4つの「基礎」
企業セキュリティの歩き方
サイバーセキュリティ未来考
ネットワークセキュリティの要諦
セキュリティの論点
スペシャル
エンタープライズAIの隆盛
インシュアテックで変わる保険業界
顧客は勝手に育たない--MAツール導入の心得
「ひとり情シス」の本当のところ
ざっくり解決!SNS担当者お悩み相談室
生産性向上に効くビジネスITツール最前線
ざっくりわかるSNSマーケティング入門
課題解決のためのUI/UX
誰もが開発者になる時代 ~業務システム開発の現場を行く~
「Windows 10」法人導入の手引き
ソフトウェア開発パラダイムの進化
エンタープライズトレンド
10の事情
座談会@ZDNet
Dr.津田のクラウドトップガン対談
Gartner Symposium
IBM World of Watson
de:code
Sapphire Now
VMworld
Microsoft Inspire
Microsoft Connect()
HPE Discover
Oracle OpenWorld
Dell Technologies World
AWS re:Invent
AWS Summit
PTC LiveWorx
吉田行男「より賢く活用するためのOSS最新動向」
古賀政純「Dockerがもたらすビジネス変革」
中国ビジネス四方山話
ベトナムでビジネス
日本株展望
企業決算
このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]