今回発表となった「Informatica Data Engineering」ソリューションは、SparkやDelta Lake、サーバーレスといったクラウドプラットフォームの活用を検討している企業に対し、Databricksとのシームレスな統合を可能にします。また、データセットの検出が容易になったことで、複数のソースから大容量のデータを取り込むことができるようになりました。この結果、サーバーレス機能を活用することで、大規模なデータエンジニアリングパイプラインの構築やメンテナンスにかかるコストの削減を実現します。
さらに、「Informatica Data Engineering」ソリューションには、ハイブリッドクラウド環境やマルチクラウド環境にわたるエンドツーエンドのデータマネジメントを支援する、下記の機能が含まれています。
• Data Engineering Integration:ハイブリッドクラウド環境とマルチクラウド環境でのデータ取り込みや処理により、アナリティクスと機械学習向けデータパイプラインをインテリジェントに管理します。
• Data Engineering Streaming:ストリーミングやIoTなどの大規模データをコンテキストに沿ったインサイトに変換し、推奨されるアクションを提示します。
• Data Engineering Quality:クラウド環境とハイブリッド環境にある全てのデータのガバナンスが可能となり、データの信頼性と関連性を確保します。
• Data Engineering Masking:アプリケーション、BI、AI、アナリティクスのユースケースに含まれるデータを匿名化し、情報漏洩のリスクを最小化します。
• Enterprise Data Catalog:全ての環境に存在するデータセットを分類・整理することでリネージを確保します。データの価値と再利用性を最大限に引き出します。
• Enterprise Data Preparation:アナリティクスとAIを独自の方法で組み合わせて、データの特定、準備、品質を確保します。この結果、データアナリストやデータサイエンティストはより迅速に意思決定ができるようになります。
• Mass Ingestion:簡単な5ステップのウィザードにより、データ、ファイル、データベースといったさまざまなソースから大規模なデータを取り込むことができます。
お問い合わせにつきましては発表元企業までお願いいたします。