より賢く活用するためのOSS最新動向

ここでも「火花」がブレイク--2015年のOSS動向総括 - (page 4)

吉田行男

2015-12-25 09:43

(4)Sparkに注目!

 今年の第153回芥川賞を『火花』が受賞し、世間を騒がせましたが、OSS業界でもまさしくSpark(火花)が話題になっています。従来は、ビッグデータ処理基盤といえばHadoopでしたが、最近はその様相が変化してきました。

 Apache Sparkプロジェクトのサイトによると、Hadoopに比べて、インメモリで100倍、ディスク環境で10倍高速に処理できるとうたわれています。また、ただ単に早いだけではなく、「使いやすさ」「普遍性」「どこでも走る」ということも特徴に挙げています。

 「使いやすさ」としては、Scala、Java、Python、Rの各言語を用いてアプリケーションを記述できます。「普遍性」とは、SQL、ストリーミング、分析などの機能を提供するライブラリを組み合わせて利用できる点を指しています。最後に「どこでも走る」というのは、まさにAmazon EC2上のスタンドアロンクラスタモードや、Hadoop 2.2以降のYARN(Yet Another Resource Negotiator)、Apache Mesos上での稼働をサポートしていることです。

 また、Apache Cassandra、Apache HBase、Apache Hive、Tachyonといった多様なデータソースにアクセスできます。米IBMが6月にSparkに3500人の研究員を割り当てると発表し話題になりましたが、IBMはそれだけではなく、同社のPaaSであるBluemixの顧客に、アプリケーションの重要素材としてSparkを提供しています。

 その他にもNTTデータやNECといった日本の大手ベンダーも早期からSparkに取り組んでおり、今後ビッグデータ界隈では、目が離せない状況になってきました。

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ZDNET Japan クイックポール

注目している大規模言語モデル(LLM)を教えてください

NEWSLETTERS

エンタープライズ・コンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]