編集部からのお知らせ
New! 記事まとめ「ISMAP-LIU」
話題の記事まとめ「通信障害と社会リスク」

クラウドでのビックデータ活用を具体例で探る - (page 2)

ZDNet Japan Ad Special

2017-09-11 11:00

[PR]ZDNet JapanおよびTechRepublic Japan主催、AWS Partner Network協賛で、クラウドの中心的存在である「アマゾン ウェブ サービス(AWS)」をテーマにした5週連続セミナーが開催された。

Talend:AWS上にデータレイクを高速で構築するポイント


Talend
プリセールスマネージャー
三浦大洋氏

 Talendのセッションでは、プリセールスマネージャーの三浦大洋氏が登壇。「AWSデータレイク構築を高速化するデータ統合ソリューションTalend」と題する講演を行った。Talendは、トラディショナルなETLだけでなく、Hadoop、Sparkなどとのシステム連携が可能なデータ統合プラットフォーム。OSSベースで開発が進められており、250万超のダウンロード実績がある。企業向けでも多くの実績があり、世界で1500社以上に利用されている。

 「企業のあらゆるデータ統合ニーズに対応できます。実際には、新システムへのデータマイグレーション、複数システムを一元化するデータ統合、複数システム間をつなぐデータ連携、DWHなどのユースケースがあります」(三浦氏)

 AWS環境についても、オンプレミスとクラウド間でのデータ統合や、AWSの各サービスをまたがったデータ統合などが可能だ。DWHサービスのAmazon EMRに対して最適なMap Reduceコードを自動生成したり、さまざまなデータソースを統合処理してEMRでの大規模処理を実行したりといった用途で使われている。モニタリングやロギングの機能も備えているので、開発だけではなく、システム運用までトータルにサポートすることができる。


※クリックすると拡大画像が見られます

ビジネス部門の意思決定を強固に支援

 そのうえで三浦氏は、Talendを使ってAWSにどのようにデータレイク基盤を構築していくかを解説。使い所としては、大きく、ビッグデータの統合、アプリケーションの統合、データプレパレーションの3つがあるという。

 ビッグデータの統合は、企業に存在する複数のデータソースを統合する取り組みだ。DWH向けのデータ集約だけでなく、Hadoopへのデータのオフロード、syslog収集などのファイル監視、KafkaやSparkのストリーミング処理なども可能。

 また、アプリケーションの統合は、企業内にESBを構築する取り組みだ。システム資産をSOAPやRESTでサービス化して、アプリケーションをリアルタイムに統合、連携させることができる。

 最後のデータプレパレーションは、ユーザーがデータ分析を行いやすくするための取り組みだ。データの準備は分析業務の80%を占めると言われている。セルフサービス型にすることで準備作業を効率化し、AIエンジンを使って異常値や欠損データの自動検出を行う。「手順の見える化と再利用、脱Excel、データ加工処理の自動化といった3ステップで、システム化を進める」のがポイントだ。

 そのうえで、三浦氏は「企業データ統合プラットフォームとしてビジネス部門の意思決定を強固に支援することができます」とアピールした。


※クリックすると拡大画像が見られます

ZDNet Japan 記事を毎朝メールでまとめ読み(登録無料)

NEWSLETTERS

エンタープライズ・コンピューティングの最前線を配信

ZDNet Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]