ESPとは一体何か?
さて前回に引き続きESP(Enterprise Search Platform:企業内統合検索基盤)の特徴をもう少し詳細化してみよう。ESPは大きく2つの特徴を持つ。1つ目が「企業内のデータの横断的なインデックス機能」、そして2つ目は「業務アプリケーションへ組み込み可能であること」である。
「企業内のデータの横断的なインデックス機能」は、その名のとおり、企業におけるさまざまなデータストレージに蓄えられている情報に関するインデックスである。インデックスには情報の内容以外にその情報のありかや作成者、アクセスなどのプロパティ情報が含まれる。
2つ目の「業務アプリケーションへ組み込み可能であること」という特徴は、従来の検索エンジンの機能を分離したようなものである。ESPは前述のインデックスから指定された情報を探して結果を表示するための基盤だが、この機能は、たとえば実装先がウェブシステムの場合は埋め込み型のフォーム連携やWebサービス形式で提供されるほか、APIという形式などで提供されることとなる。
この2つについて詳細を説明する前にESPが従来のツールとどのように異なるかについて簡単に説明をする。
ESPと検索エンジンの違い
まずESPと従来からインターネット上にある「検索エンジン」との違いについて紹介しよう。
Yahoo!やGoogleをはじめとするインターネット上の検索エンジンは、すでに何度ものバージョンアップを繰り返して、非常に強力かつ高機能なものになっている。こういったインターネット上の検索エンジンとESPとの大きな違いは「検索対象」にある。
インターネット上の検索エンジンはその検索対象をインターネット全体に広げているために、基本的により広い範囲をより速く検索するためのツールであるが、ESPの場合、検索対象は企業内の情報(コンテンツ)であり、検索範囲はより限定的となる。また企業内の情報はインターネット上の標準的なファイル形式であるHTML形式やPDF形式に限らず他の文書ファイルの形式を含み、時には基幹システムのデータベース内にあるデータも含まれる。ESPは当然このような各種プラットフォームを巡回(クローリング)して、必要なコンテンツをデータとして抽出する機能を持つ必要がある。
そして、ESPが検索エンジンと最も異なる点は、細かいアクセス権限への対応である。企業内のコンテンツの場合はその利用に関する各種の制限が細かく定められており、利用者ごとにアクセス(利用)が許される範囲が異なる。たとえば、部長以上の管理職しかアクセスできない人事情報が一般社員の検索結果画面上に表示されるようなことは許されない。このように、企業内にある情報を検索する場合には、このアクセス権の反映問題が避けて通れない問題となる。
ESPでは、各種のディレクトリサービスなど企業内の認証基盤との連携を図り、こういったコンテンツへのアクセス権の細かい制御をESP内で一手に解決した上で、連携アプリケーション側に結果を引き渡すのである。すなわち前述した「企業内のデータの横断的なインデックス機能」では、異なる情報システムから一括してデータ収集を行うだけでなく、インデックスの中にアクセス権といったプロパティ情報までを保管する必要がある。
こうした違いを考えずに、インターネット上での検索用ツールとして開発された検索エンジンをそのまま企業内に導入することは非常に安易な選択肢であり、セキュリティ上の大きなリスクをともなうものだ。