Talendのコンサルティングマネージャーを務める正金秀規氏は新版について「さまざまなスケールアップを実現している。統合可能なデータの量の処理がバッチウィンドで可能となり、Hadoop MapReduceエンジンをデータ統合エンジンとして活用できるようになった。対象となるデータも、従来のデータ、Hadoopデータ、NoSQLデータをひとつのTalendで処理することが可能となった」と解説している。
そのメリットとして「従来のデータ統合開発者がTalendを使用することで、ビッグデータ統合の開発者へとスキルアップすることが可能となった」と説明している。

コンサルティングマネージャー 正金秀規氏
OSS版のデータ統合ツール「Talend Open Studio for Data Integration」、データ品質ツール「Talend Open Studio for Data Quality」、MDMツール「Talend Open Studio for MDM」、ESB「Talend Open Studio for ESB」、データ統合連携基盤「Talend Open Studio for Big Data」は同社ウェブサイトからダウンロードできる。商用のサブスクリプション製品は6月末から購入できる。
新版に含まれるデータ統合連携基盤となる「Talend Platform for Big Data」と「Talend Enterprise Big Data」では、NoSQLに含まれる「Couchbase」「CouchDB」「Neo4j」へのコネクタ群を追加し、サポートする。
Enterprise Big Dataには、Hadoop向けのファイルシステム「HDFS(Hadoop Distributed File System)」やMapReduce専用のツール「Pig」、Hadoopの上で動くSQLライクといわれる言語「Hive」、Hadoopのメタデータカタログになる「HCatalog」、Hadoop向けフレームワーク「Oozie」、HDFSとリレーショナルデータベースの間でデータを転送するツールである「Sqoop」、NoSQLに含まれる分散データベース管理システムの「Cassandra」や「Hbase」、やはりNoSQLに含まれるドキュメント指向のデータベース「MongoDB」など450以上のコネクタが同梱されている。
HDFS上のファイルを操作するツールのPigでは「Pig Latin」という言語を使うが、今回の新版では、ビジュアルマッピング処理が可能となった。Pig Latinが分かるHadoopの開発者であれば、GUIでコーディングせずにデータを処理するためのジョブを開発できるようになっている。
新版となるTalend v5.3では、クラウド対応として、Amazon Web Services(AWS)上にホストされたHadoopフレームワークを利用してデータを処理する「Amazon Elastic MapReduce」とAWSのデータウェアハウス(DWH)サービス「Amazon Redshift」もサポートしている。