情シスから始まるデータ分析

データ分析にはどのようなツールが必要なのか--エンジニア編(後編)

戸嶋龍哉 2015年12月11日 07時00分

  • このエントリーをはてなブックマークに追加

 「情シスから始まるデータ分析」連載第3回は日々の分析に役立つ技術について、前編では、情シス部門に向けて、エンジニアの視点からデータ分析に有用な統計言語のRやそれにひもづくライブラリ、Pythonなどを説明した。後編でもエンジニア視点でデータ分析に役立つさまざまな技術やツールを紹介する。

データの収集

収集方法

 中間データ作成などにおいて、分析用のデータを取得する方法として、よくあるのは以下のような方法だろう。

  1. サービス運用中のDBサーバからアドホックに取得する
  2. サービス運用中のDBから定期的に分析用データ格納サーバにダンプする
  3. ログデータをログ記録時に分析用データ格納サーバにも書き込む

 (1)、(2)の用途については前編の「集計処理の自動化・分析レポートの継続化」で紹介した技術を用いれば対処可能である。

Fluentd

 そして、(3)の用途に威力を発揮するのがログ収集用ツールのFluentdだ。さまざまなインプット、アウトプットがプラグイン化されており、用途によって使い分けることで、効率的なログ収集環境を構築することが可能だ。

 参考文献のFluentdのプラグイン一覧を見れば、多種多様な入出力に対応していることがわかるだろう。複数台のサーバ上のログをFluentdで1カ所に集約した後、適切な格納先に振り分けるようにすれば、各サービスのログデータを一元管理できるようになるので、管理が非常に楽になる。

分析用データの蓄積

Hadoopの周辺技術

 次はデータウェアハウス、大規模データの倉庫として用いる技術を見ていこう。クラウド型サービスが利用できない環境、つまりインハウスで全てデータを抱えなければならない場合の大規模ストレージの第1候補になるのはHadoopだ。

 Hadoopは大規模データ向けストレージとしての役割と、そこからデータを効率よく計算し取り出す役割の組み合わせである。データストレージ機構として、HDFSという分散ファイルシステム、HBaseという列指向の分散データベースなどが存在する。また、データの取得、計算処理機構として、Javaなどのプログラミング言語によるMapReduce処理の記述、Hive、Pig、ImpalaなどによるSQLライクなデータの取得や処理が可能である。処理内容に合わせて柔軟に使い分けよう。

ZDNet Japan 記事を毎朝メールでまとめ読み(登録無料)

  • このエントリーをはてなブックマークに追加

この記事を読んだ方に

関連ホワイトペーパー

連載

CIO
デジタル“失敗学”
コンサルティング現場のカラクリ
Rethink Internet:インターネット再考
インシデントをもたらすヒューマンエラー
トランザクションの今昔物語
エリック松永のデジタルIQ道場
研究現場から見たAI
Fintechの正体
米ZDNet編集長Larryの独り言
大木豊成「仕事で使うアップルのトリセツ」
山本雅史「ハードから読み解くITトレンド放談」
田中克己「2020年のIT企業」
松岡功「一言もの申す」
松岡功「今週の明言」
内山悟志「IT部門はどこに向かうのか」
林 雅之「デジタル未来からの手紙」
谷川耕一「エンプラITならこれは知っとけ」
大河原克行「エンプラ徒然」
内製化とユーザー体験の関係
「プロジェクトマネジメント」の解き方
ITは「ひみつ道具」の夢を見る
セキュリティ
企業セキュリティの歩き方
サイバーセキュリティ未来考
ネットワークセキュリティの要諦
セキュリティの論点
スペシャル
ざっくりわかるSNSマーケティング入門
課題解決のためのUI/UX
誰もが開発者になる時代 ~業務システム開発の現場を行く~
「Windows 10」法人導入の手引き
ソフトウェア開発パラダイムの進化
エンタープライズトレンド
10の事情
座談会@ZDNet
Dr.津田のクラウドトップガン対談
Gartner Symposium
IBM World of Watson
de:code
Sapphire Now
VMworld
Microsoft WPC
Microsoft Connect()
HPE Discover
Oracle OpenWorld
Dell EMC World
AWS re:Invent
AWS Summit
PTC LiveWorx
吉田行男「より賢く活用するためのOSS最新動向」
古賀政純「Dockerがもたらすビジネス変革」
中国ビジネス四方山話
ベトナムでビジネス
日本株展望
企業決算
このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]