ビッグデータはないけどバッチ処理はある そんな企業こそHadoopを - (page 2)

五味明子

2011-12-08 16:26

Asakusa Frameworkを評価してみたところ…

 Asakusa Frameworkは以前のバージョン(0.1.0)ではいくつかの懸念点が散見していたが、現バージョン(0.2.3)になってからは大幅に改善されたと日立ソリューションズでは評価している。

 以下、バージョンアップに伴う改善点を示しておく(→が0.2.3で改善された点)。

  • DB関連での制約:MySQL必須
    →データモデル記述用DSL「DMDL」および任意のRDBとHadoopを連携する「WindGate」により他DBも対応可能に
  • 情報不足:ドキュメント不足やMLなどがない
    →ドキュメントが拡充し、ウェブサイトやMLも開設
  • 実行管理:Monkey Magic(現Tengine Framework)のみ
    →外部システムと任意の方法で連携できる「Yaess」によりJP1/AJSなど他社運用管理ツールとの連携が容易に
  • 商用サポートなし
    →商用サポート開始

 では実際、Asakusa Frameworkではどのくらいの効果を得られるのだろうか。吉田氏が紹介した評価環境(ソフトウェア)は以下の通りとなる。

  • CDH3u2(Cloudera's Distribution including Apache Hadoop 3 update 2)
  • Asakusa FW 0.2.3-RC
  • MySQL 5.1.52

 ハードウェアには日立のブレードサーバ「HA8000-bd/BD10」を使用した。あえてHadoopにもMySQLにも特別なチューニングをいっさい施さず、Hadoopの設定も最低限に留めている。データベースに対する入出力はWindGateを利用し、入出力するMySQLテーブルには変更を加えていない。試作した処理は、登録IDが1000万件の顧客テーブルと、1億件の履歴からなる履歴テーブルをもとにCREATE TABLEで登録店ID(100店)と利用顧客数および総ポイント数を表示する結果テーブルを生成する。データサイズはHDFS上に展開して4GB程度だ。

  • Asakusa Frameworkの評価環境

  • 評価の際に使用したCREATE TABLE文

 開発に要したステップはJavaで10ファイル/222ステップ、DMDLで6ファイル/153ステップのみ。実装はこれだけで完了する。あとはフロー処理部分およびデータモデルからJavaファイルが自動生成されている(28ファイル/2231ステップ)。MapReduceやHDFSについての知識は必要ない。

 処理速度に関しても、RDBMSでは29分かかっていた処理が、1ノードなら24分に、6ノードなら約16分に、10ノードなら約14分にと、ノード数が増えるほど処理時間を削減できている。ただし吉田氏は「MapReduce処理はノード数が増えるごとに処理時間が短くなっているが、インポート/エクスポートの処理時間にはほとんど変化がない。ここが今後の改善ポイントになるかもしれない」と指摘する。

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ホワイトペーパー

新着

ランキング

  1. セキュリティ

    「デジタル・フォレンジック」から始まるセキュリティ災禍論--活用したいIT業界の防災マニュアル

  2. 運用管理

    「無線LANがつながらない」という問い合わせにAIで対応、トラブル解決の切り札とは

  3. 運用管理

    Oracle DatabaseのAzure移行時におけるポイント、移行前に確認しておきたい障害対策

  4. 運用管理

    Google Chrome ブラウザ がセキュリティを強化、ゼロトラスト移行で高まるブラウザの重要性

  5. ビジネスアプリケーション

    技術進化でさらに発展するデータサイエンス/アナリティクス、最新の6大トレンドを解説

NEWSLETTERS

エンタープライズ・コンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]