もはや「サーチ」は「検索」ではない--2007年のエンタープライズサーチ(1) - (page 2)

栗原潔(テックバイザージェイピー)

2007-09-04 17:00

テキストマイニングの手段として

 サーチの処理においては、文書データ内から単語を切り出し、様々な分析が行われている。この過程で、文書中にあるキーワードの重要性や、キーワードとキーワードの相関関係がアルゴリズムベースで分析され、重要な価値が引き出される。たとえば、グーグルのAdSenseは、このような仕組みによりウェブページの内容と関連性が高いと判断された広告リンクを表示することで、効果の高い広告ビジネスを実現した。

 このようなテキスト処理のテクノロジーは、過去においては、一般的に「テキストマイニング」と呼ばれていた。どのような名称で呼ぶかは別として、今、処理中の文書(たとえば、顧客からのメール)に関連した重要情報を、自動的に表示できる機能には有効な応用分野が多数あると考えられる。

情報検索の手段としての「サーチ」

 大量のデータの中から、属性データを指定することで必要なレコードを得る情報検索アプリケーションはRDBMSを用いて実装されることが多い。しかし、情報の階層構造が複雑であったり、ナビゲーションのパターンが多様である場合には、サーチエンジンを利用した方が迅速な情報検索が行えることも多い。実際、情報検索を中心としたウェブサイトではサーチエンジンにより、メニュー展開の機能を実装しているケースもある。

 もちろん、いわゆるビジネスインテリジェンス(BI)と呼ばれる情報分析アプリケーションのカテゴリがすべてサーチのテクノロジで代替されるわけではない。BIは、単なる情報検索ではなく、定量的分析などの機能も含まれており、これはサーチテクノロジの範囲の外にあるからだ。しかし、サーチとBIの相互補完関係はこれからもますます強まっていくことになるだろう。

 これ以外にも、サーチテクノロジが本質的に有する文字列間の類似性評価機能を活用した名寄せ処理や、メールをリアルタイムでスキャンし、何らかの不正の疑いがある内容のメールを送受信した場合に、必要なアラートを管理者に表示するなどの応用も考えられるだろう。

 さらには、画像や音声などのマルチメディアコンテンツの内容にまで踏み込んだマルチメディアサーチ(たとえば、あるイメージと似たイメージを検索するなど)や文章の裏にある感情(たとえば、ある製品を高く評価しているのか批判しているのかなど)を分析できるセンチメントアナリシス等のサーチ分野における先進的テクノロジも実用化されつつある。

 これまで挙げてきたように、サーチテクノロジが価値を提供しうる領域は、ますます広がりつつある。エンタープライズサーチのテクノロジを評価する場合には、「サーチは単なる検索ではない」(この文章を英語に直すのは難しいが)という点を是非念頭においていただきたいと思う。

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ZDNET Japan クイックポール

マイナンバーカードの利用状況を教えてください

NEWSLETTERS

エンタープライズコンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]