データ統合基盤ソフト「Talend」新版--クラスタフレームワーク「Spark」対応

NO BUDGET

2014-06-05 12:47

 Talendは6月3日、データ統合基盤ソフトウェアの新版「Talend 5.5」を発表した。オープンソースソフトウェア(OSS)版はウェブサイトから無償でダウンロードできる。商用版は国内13社の販売パートナー経由で提供する予定。

 Talendは、OSSの分散並列処理プログラミングフレームワーク「Apache Hadoop」のディストリビューションで性能を発揮できるよう最適化されている。新版のTalend 5.5は、大量のデータをクラスタ上で分散して並列処理するアプリケーションを作成するためのソフトウェアフレームワーク「MapReduce」のコード生成で、Talend 5.4と比較して平均45%高速化できるという。

 ベンチマークテスト「TPC-H」の22項目でTalend 5.4と比較して最大67%の性能を向上させている。業界最大規模の金融サービス企業と協業した実環境でのテストでは、1000ノードのHadoopクラスタで高い拡張性と性能を実証したと説明している。

 高速化が進んだことで、例えばXML、電子データ交換(EDI)やJavaオブジェクトなどの複雑なデータを扱えるよう設計されたマッピングツール「Talend Data Mapper」では、数ギガバイトのドキュメントであってもHadoopクラスタにストリーミングでき、あらゆる大規模ファイルをサポート可能となったとしている。

 現在注目されている、大規模データのクラスタコンピューティングフレームワーク「Apache Spark」をサポートしている。試験版のSparkコンポーネントはTalendforge.orgのTalend Exchangeから無償でダウンロードできる。

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ZDNET Japan クイックポール

所属する組織のデータ活用状況はどの段階にありますか?

NEWSLETTERS

エンタープライズコンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]