「Watson」プロジェクトなどでAIの分野をリードするIBMが、ストレージにもインテリジェンスを導入しようとするのは当然のことだ。データの量はかつてない勢いで爆発的に増えている。IoTが本格的に導入されつつある現在、データは保存し切れないほどの勢いで生成されつつある。
ソフトウェアの問題が間接参照のレイヤを増やすことで解決できるように、アナリティクスの問題も、インテリジェンスのレイヤを増やすことで解決できる。ただしもちろん、われわれはインテリジェンスについて、間接参照についてほどの知識は持っていない。
もみ殻と小麦をより分けるには
人間の脳は、グランドキャニオンに沈む美しい夕日のような大事な記憶はよく覚えているが、最後にいつ信号を渡ったかというような重要度の低い記憶は忘れてしまう。IBMの研究者は、この人間の脳と同様の働きをするインテリジェントなストレージシステムの研究を進めている。
- TechRepublic Japan関連記事
- 2016年春、最新のストレージ製品の選び方(1)
- 2016年春、最新のストレージ製品の選び方(2)--仮想化とクラウド
- 2016年春、最新のストレージ製品の選び方(3)--ビッグデータとオールフラッシュ
IBM Research Zurichの研究者であるGiovanni Cherubini氏、Jens Jelitto氏、Vinodh Venkatesan氏らは、論文「Cognitive Storage for Big Data」で、同氏らが構築したプロトタイプシステムについて説明している。この研究で重要なのは、データの価値を判断するために機械学習を用いていることだ。
たとえばIoTのデータセットを処理する際には、ストレージシステムのAIは、以前のデータセットからどんな情報が重要かを「学習」し、その条件(アクセス頻度、保護レベル、基準からの乖離、時間に関する情報など)を、読み込まれるデータに適用する。システムは人間とデータセットの相互作用を観察し、ユーザーにとってどんな情報が重要かを学習して、ユーザーのニーズに応じてデータを階層化し、保護し、保存する。
実験結果
IBMの研究者は、「情報ボトルネック」(IB)と呼ばれる学習アルゴリズムを使用した。
・・・コンテキストが密接に関連した文書の分類には、これまで教師あり学習の技術が使用されており、この手法は他の学習方式よりも複雑さを低減し、頑健性を高められることが示されている。
基本的にIBは、情報のメタデータの値と認知的関連性の値について、この2つの値の相互情報量を保存するために、これら2つの値を関連づける。相互情報量が大きいほど、データの価値は高く、保護、アクセスなどのレベルも高くなる。

グランドキャニオンで見た景色のような大事な情報は記憶に残りやすい。