「システム化が困難であった業務領域で、検索エンジンは情報アクセスを実現する新しい技術基盤となる」。ジャストシステムは、エンタープライズサーチエンジンをそう位置づける。同社は、2006年1月から企業向け検索エンジンの最新版「ConceptBase V」を販売。同シリーズは10年の歴史があり、すでに2700社の導入実績を持つツールだ。エンタープライズサーチカンファレンスの同社セッションでは、システム技術部部長である森徹氏が登壇し「情報再活用へのアクセサビリティをステップアップするConceptBase V」と題した講演で同ツールのメリットを紹介するとともに、情報提供のため技術基盤としてのサーチエンジンの重要性について解説した。
目的に応じた多様な検索手法が必要
株式会社ジャストシステム
システム技術部 部長
森 徹氏
森氏は冒頭、企業がサーチエンジンを上手く使いこなすためのポイントとして、情報へのアクセサビリティ(到達の仕方)について説明した。
まず、検索のアプローチについて、検索ツールのクエリーボックスにキーワードを入力するのが一般的だが、単純にキーワードを入力するだけではなく、これからはユーザーがどんな目的でどんな情報を探しているのか、といったユーザーの目的に応じた検索のやり方を選択できる多様な仕組みが求められていることを解説した。
次に、メタデータを使いこなし、ユーザーからは確実に欲しいデータを取得できるナビゲーション機能が求められていることを挙げた。そして、企業がナビゲーション機能を使いこなすようになると、それまで情報を集約するためにはシステムを構築し直す必要があった領域についても、検索エンジンを活用することによって簡単にそれを実現でき、データ活用の技術基盤になると指摘した。
森氏は、多様な検索手段の必要性について、ユーザーが情報を探す動機は3つとし、次のように説明する。
動機の1つ目が「既知情報探索」であり、検索する対象が存在することをもすでに知っている場合の検索。2つ目が「探求探索」で、検索する対象が存在するかは分からない状態での検索を意味する。3つ目が「全数調査」で、ある対象に関する情報をすべて集めたい場合の検索となる。
このように、ユーザーが見つけたいものは様々存在するのであり、単にキーワードを選定して、その結果をから必要な情報を探し出すという手段だけでは不十分なことが多い。満足な検索結果が得られなかった場合、キーワードの追加や入れ替え、あるいは条件式を修正する必要がある。企業においては、多くのユーザーが条件式のテクニックを身につけていることはない。森氏は「目的に応じて、見つけたいものを探す手段が必要になっている」と語った。
自然文クエリーができる「コンセプト検索」は初心者に最適
ジャストシステムの検索エンジン「ConceptBase V」は、多様な探索手段を提供するツールといえる。その特徴は「コンセプト検索」と「フレーズ検索」、さらに、この2つの検索を合わせた「ハイブリッド検索」が可能であることだ。
フレーズ検索は、伝統的な検索アプローチであり、グーグルやヤフーなどで行う検索と同じだ。目的とする語句が含まれない文書は決してヒットしない。ユーザーは意図した文書に含まれている語句を知っている必要がある。
コンセプト検索は、自然文によるクエリーもできる。フレーズ検索では、いくつかの単語と論理式によってクエリーするのが一般的だが、コンセプト検索では自然な文章によるクエリーが行える。森氏は「企業の中で論理式をかける人は半分にも満たないだろう。コンセプト検索なら検索の意図を自然文で記述すればいい」と、その有効性を強調した。語句の微妙な変化活用や、表記の揺れに対応するため、サポートデスクやコールセンターでの検索にも役立ちそうだ。
また、コンセプト検索の応用としての類似検索は分析的アプローチとなる。最初は曖昧な語句や文章を入力すれば、意味の近い文書が検索される。検索した文書の主題をたどっていくことによって、最終的に意図した文書の発見を狙う。文書の中の意味を判断してくれるため、初心者にわかりやすい手法といえる。