Talendは6月3日、データ統合基盤ソフトウェアの新版「Talend 5.5」を発表した。オープンソースソフトウェア(OSS)版はウェブサイトから無償でダウンロードできる。商用版は国内13社の販売パートナー経由で提供する予定。
Talendは、OSSの分散並列処理プログラミングフレームワーク「Apache Hadoop」のディストリビューションで性能を発揮できるよう最適化されている。新版のTalend 5.5は、大量のデータをクラスタ上で分散して並列処理するアプリケーションを作成するためのソフトウェアフレームワーク「MapReduce」のコード生成で、Talend 5.4と比較して平均45%高速化できるという。
ベンチマークテスト「TPC-H」の22項目でTalend 5.4と比較して最大67%の性能を向上させている。業界最大規模の金融サービス企業と協業した実環境でのテストでは、1000ノードのHadoopクラスタで高い拡張性と性能を実証したと説明している。
高速化が進んだことで、例えばXML、電子データ交換(EDI)やJavaオブジェクトなどの複雑なデータを扱えるよう設計されたマッピングツール「Talend Data Mapper」では、数ギガバイトのドキュメントであってもHadoopクラスタにストリーミングでき、あらゆる大規模ファイルをサポート可能となったとしている。
現在注目されている、大規模データのクラスタコンピューティングフレームワーク「Apache Spark」をサポートしている。試験版のSparkコンポーネントはTalendforge.orgのTalend Exchangeから無償でダウンロードできる。