編集部からのお知らせ
新着PDF集:データセンターの省電力化
「これからの企業IT」の記事はこちら
海外コメンタリー

ビッグデータ時代を救うコグニティブストレージ--IBM Researchの取り組み

Robin Harris (Special to ZDNet.com) 翻訳校正: 石橋啓一郎

2016-05-18 06:00

 「Watson」プロジェクトなどでAIの分野をリードするIBMが、ストレージにもインテリジェンスを導入しようとするのは当然のことだ。データの量はかつてない勢いで爆発的に増えている。IoTが本格的に導入されつつある現在、データは保存し切れないほどの勢いで生成されつつある。

 ソフトウェアの問題が間接参照のレイヤを増やすことで解決できるように、アナリティクスの問題も、インテリジェンスのレイヤを増やすことで解決できる。ただしもちろん、われわれはインテリジェンスについて、間接参照についてほどの知識は持っていない。

もみ殻と小麦をより分けるには

 人間の脳は、グランドキャニオンに沈む美しい夕日のような大事な記憶はよく覚えているが、最後にいつ信号を渡ったかというような重要度の低い記憶は忘れてしまう。IBMの研究者は、この人間の脳と同様の働きをするインテリジェントなストレージシステムの研究を進めている。

 IBM Research Zurichの研究者であるGiovanni Cherubini氏、Jens Jelitto氏、Vinodh Venkatesan氏らは、論文「Cognitive Storage for Big Data」で、同氏らが構築したプロトタイプシステムについて説明している。この研究で重要なのは、データの価値を判断するために機械学習を用いていることだ。

 たとえばIoTのデータセットを処理する際には、ストレージシステムのAIは、以前のデータセットからどんな情報が重要かを「学習」し、その条件(アクセス頻度、保護レベル、基準からの乖離、時間に関する情報など)を、読み込まれるデータに適用する。システムは人間とデータセットの相互作用を観察し、ユーザーにとってどんな情報が重要かを学習して、ユーザーのニーズに応じてデータを階層化し、保護し、保存する。

実験結果

 IBMの研究者は、「情報ボトルネック」(IB)と呼ばれる学習アルゴリズムを使用した。

・・・コンテキストが密接に関連した文書の分類には、これまで教師あり学習の技術が使用されており、この手法は他の学習方式よりも複雑さを低減し、頑健性を高められることが示されている。

 基本的にIBは、情報のメタデータの値と認知的関連性の値について、この2つの値の相互情報量を保存するために、これら2つの値を関連づける。相互情報量が大きいほど、データの価値は高く、保護、アクセスなどのレベルも高くなる。


グランドキャニオンで見た景色のような大事な情報は記憶に残りやすい。

ZDNet Japan 記事を毎朝メールでまとめ読み(登録無料)

特集

CIO

モバイル

セキュリティ

スペシャル

NEWSLETTERS

エンタープライズ・コンピューティングの最前線を配信

ZDNet Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]