英語に比べ表記揺れが多い日本語
日本語は、英語に比べ、全角/半角、大文字/小文字、“バイオリン/ヴァイオリン”のような代表表記統制、“渡辺/渡部”のような異体字統制、“10,000円/1万円”のような数詞統制など、表記揺れが多い。そこで検索エンジンには、日本語特有の表記揺れによる検索漏れを防止する仕組みが必要になる。
「ステップ1では、検索キーワードを入力すると、必要な情報を見つけ出すことができることが重要だった。ステップ2では、さらに業務に適応させるための“情報の見つけやすさ(Findability)”が重要になる」と高瀬氏。
「たとえば、インターネットで必要な情報を検索するときに、検索窓にどんなキーワードを入れれば良いかが分からないという話しをよく耳にする。この問題を放置すると、いくら企業に検索システムを導入しても使われないシステムになってしまう」(高瀬氏)
そこで、いかに簡単に情報を見つけ出すことができる仕組みを実現するかが検索システムを企業に導入する場合の最大のポイントであり、これがFaindabilityだ。
Faindabilityを実現するためのアクセスメソッドには、タキソノミー、ファセットナビゲーション、サーチリザルトナビゲーションの3つがある。
タキソノミーは、Yahoo!のような階層による分類による検索で、ドリルダウンで検索できるために分かりやすいがメンテナンスが難しいという難点がある。また、ファセットナビゲーションは、多視点化された分類で、検索性が高く、メンテナンスも容易な特長を持つ。
さらにサーチリザルトナビゲーションでは、メタデータやクラスタリングなどの機能により、検索結果をダイナミックに絞り込んだり、広げたりすることができる。
高瀬氏は、「ConceptBaseに搭載されたこれらの機能により、情報活用を個人レベルから業務レベルへと引き上げることができる」と話している。
最終段階ともいえるステップ3では、ユーザー要求の変化に柔軟に対応できる、検索エンジンをベースとした新しい情報系システム構築が必要になる。
たとえば、これまで部門内でしか閲覧できなかった情報を全社データとして開放したり、ニーズの変化に即時に対応できる柔軟なシステム、検索速度の向上などが情報系システム構築の最大の課題。この問題を解決するのがエンタープライズサーチプラットフォーム(ESP)となる。
「ConceptBaseでは、リレーショナルデータベースによるERPやCRM、SFA、文書管理などの情報やLotus Notesなどのアプリケーションで管理されている情報、XMLなどで作成されたオフィス文書などを統合し、効果的な情報管理システムを実現することができる」(高瀬氏)
また、柔軟な情報へのアクセスや高いパフォーマンス、アクセス制御などの機能を既存システムを変更することなく実現することも可能だ。
「ConceptBaseを導入することで、ステップ1からステップ3までの情報活用を効率的に実現できる。特にステップ1は、基本中の基本で、ここで失敗するとすべてがダメになる。効果的な企業情報検索システムを実現することで、必要なデータはどこにあるのか、統合されているのか、簡単に見つけ出せるのかなど、企業システムの課題を解決することが可能だ」(高瀬氏)