編集部からのお知らせ
記事まとめ「サードパーティークッキー問題」公開
記事まとめ読み:GIGAスクール

AWS、データのクレンジング処理を迅速化する「AWS Glue DataBrew」を提供

Tiernan Ray (Special to ZDNet.com) 翻訳校正: 編集部

2020-11-16 10:36

 Amazon Web Services(AWS)は米国時間11月11日、データクレンジングツール「AWS Glue」を拡張した「AWS Glue DataBrew」の提供を発表した。DataBrewは、データの準備に必要となる一部の手順を視覚的なユーザーインターフェース(UI)によって自動化し、コーディング作業に携わらない人々のタスクをシンプルなものにするという。

 DataBrewは、データアナリストやデータサイエンティストによるデータ抽出、加工、ロード(ETL)と呼ばれる作業を支援するツールだ。ETLはデータウェアハウスやその他のリポジトリーでデータが分析される前の工程となる。

 Glueは2016年に発表された。Glueがコーディング作業を必要とする、エンジニア向けの視覚ツールだった一方、DataBrewはデータアナリストやデータサイエンティストがボタンのクリックや入力フィールドからの指示といった視覚的なUIだけで同様のクレンジング処理を実行できるようにするツールを目指している。

 AWSはこの新たなツールについて、「従来であれば何日、あるいは何週間もかけてエンジニアが変換機能をコーディングしていたが、(このツールが提供する)250を超える組み込み変換機能によって、データの準備タスク(異常のフィルタリング、フォーマットの標準化、無効な値の修正など)を自動化できるようになる」と説明している。

 
 

 AWSはDataBrewツールのデモ動画を公開している。動画では、データベースエントリー中に含まれているものの、データ分析に使用できないアンパサンド(&)などの特殊文字の削除方法が例として説明されている。

 また、エントリーの分析を容易にするために、テキスト文字列を「カテゴリカルマッピング関数」によって数値へとマッピングする操作の説明も含まれている。

 例えば、「subscriber」(購読者)と「customer」(顧客)のいずれかのエントリーを含む「user type」(ユーザー種別)といったカラムがある場合、画面のマッピングボタンをクリックし、全ての文字エントリーを「1」と「2」という値に対応させた新カラムを生成するよう指示した上で、「Apply」ボタンをクリックすれば、「1」と「2」という値にマッピングされたカラムが生成される。

 また、データセット内で欠けているエントリーの数といった、対象データセットに関する統計情報を取得するプロファイリング関数も用意されている。

 Amazonのイニシアチブは、Talendなどのデータクレンジングを専門とする企業にとって新たな競合対象となる可能性もある。

 Amazonは、NTTドコモやエネルギー大手のBPなど、一部の企業がこのソフトウェアを利用していると述べている。

 さらなる詳細は、Glue DataBrewnに関するブログ記事でも確認できる。

この記事は海外Red Ventures発の記事を朝日インタラクティブが日本向けに編集したものです。

ZDNet Japan 記事を毎朝メールでまとめ読み(登録無料)

特集

CIO

モバイル

セキュリティ

スペシャル

ホワイトペーパー

新着

ランキング

  1. 運用管理

    最先端のデータサイエンティストでいるための5つのヒント—AIによる高度化でデータの達人であり続ける

  2. ビジネスアプリケーション

    経理部門 554人に聞いた「新しい経理部門の働き方」 その実現に向けた具体的な行動指針を解説

  3. セキュリティ

    パンデミックに乗じたサイバー攻撃に屈しない 最新の脅威分析レポートに見る攻撃パターンと対応策

  4. 運用管理

    DX時代にIBM i は継続利用できるのか? モダナイゼーション実施で考えておくべき5つの視点

  5. セキュリティ

    サイバー攻撃でPCに何が起きている? サイバーディフェンス研究所の名和氏が語るフォレンジックのいま

NEWSLETTERS

エンタープライズ・コンピューティングの最前線を配信

ZDNet Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]