トップインタビュー

コンタクトレンズ型端末も--SGIのゴウCTOが見通すテクノロジの未来 - (page 2)

大川淳 怒賀新也 (編集部)

2013-10-10 12:41

Hadoopは「探すべき針」の存在が分かっている場合に有効

--ビッグデータをどのように分析しているのか?

 求めるものが存在することが分かっている場合はいわば、わらの山の中から針を見つけるようなもので、これはただ探せばいいわけです。わらの山の量は非常に大きくなります。素早く、効率的に針を見つけるためのテクニックが求められます。

 検索の演算を高速にするため、クラスタ内で多くのノードを切り分けていきます。つまり、わらの山を小さく分割してそれらをノードに載せ、各ノードに針を見つけるよう指示する。それぞれの山の中だけを探し、報告せよという流れになります。ノード同士は、連絡を取り合わなくても良いのです。

 これがHadoopのしくみです。ビッグデータを扱う際、山が大きければ大きいほどノードが多くなり、検索は速くなります。クラスタが有効に機能します。


 わらの山を例にHadoopを説明する


探すべき針があるかどうかも分からない場合

 もう1つの類型は、いうなれば探すべき針があるかどうかも分からない状態です。見つけようとしても、そこにはないかもしれません。探すべき場所が異なることもあります。あるだろうと思って探してみても見つからない。

 こちらはかなり困難な問題です。例えば不正の検出です。そこに不正があるのかどうかはわかりません。あるいは、インターネット上の侵入の検出もそうです。コンピュータウイルスの場合も、シグネチャがあればウイルスだとわかるのですが、新しいウイルスが出てくれば、それに追いつけないと、検出できません。

 しかし、「fuzzy detector」という新しいツールを用いれば、これまでになかったウイルスが現れても検出できます。ここでは、確率が1つの軸となります。もしかしたらウイルスかもしれない。その確率が80%ならイエス、30%ならノー、ウイルスではないということになります。確率を決めるやり方はさまざまですが、一つはグラフをつくることです。

 何を探せばいいのか、何を検索すべきなのかさえ不明の場合、わらの山から、わらを二本取り出して比較する。1つ1つのわらの相互間の関係性を調べ、それをグラフ化します。99%、答えはAだとしても、1%は不確かなところがあるから、グラフになるわけです。100%これだということはあまりないのです。eBayやPayPalでは、各ユーザーの行動をグラフ化しており、それを基準に取引の際に本人かどうかを判定します。

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ホワイトペーパー

新着

ランキング

  1. セキュリティ

    「デジタル・フォレンジック」から始まるセキュリティ災禍論--活用したいIT業界の防災マニュアル

  2. 運用管理

    「無線LANがつながらない」という問い合わせにAIで対応、トラブル解決の切り札とは

  3. 運用管理

    Oracle DatabaseのAzure移行時におけるポイント、移行前に確認しておきたい障害対策

  4. 運用管理

    Google Chrome ブラウザ がセキュリティを強化、ゼロトラスト移行で高まるブラウザの重要性

  5. ビジネスアプリケーション

    技術進化でさらに発展するデータサイエンス/アナリティクス、最新の6大トレンドを解説

ZDNET Japan クイックポール

注目している大規模言語モデル(LLM)を教えてください

NEWSLETTERS

エンタープライズ・コンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]