シンプルな検索から業務アプリに組み込んだ高度な検索まで実現 〜ATOKで培った日本語処理技術を生かしたESP「ConceptBase Enterprise Search」〜
参考情報が見つかれば良いインターネット検索と異なり、エンタープライズ検索では正しい判断や行動を伴う、“信頼できる情報”に到達できることが必要だ。その上、日本語で作成された文書には“表記ゆれ”や“語尾の変化”などがつき物で、的確な日本語処理技術も求められる。こうした「ほしい情報」をピンポイントで検索できる機能を提供するのが、ジャストシステムの「ConceptBase Enterprise Search」である。ここではATOKなどで培った技術が盛り込まれた同製品について紹介しよう。
今やキーワード検索ではビジネス文書は探せない
社長室 ビジネス戦略グループ 兼 エンタープライズマーケティング部 部長
松田 潤 氏
「これまでのキーワード検索で本当に必要なビジネス文書を探せますか?」――こう問いかけるのは、ジャストシステムの社長室 ビジネス戦略グループ兼エンタープライズマーケティング部 部長である松田潤氏だ。現在“検索技術”と聞けば、まずアメリカ発のインターネット検索技術が思い浮かぶ。しかし松田氏には、「日本の検索エンジン市場を切り開いてきたのはジャストシステムである」という自負がある。
「検索技術はインターネット検索技術が最初ではなく、それ以前から存在している技術です。ただし、現在の検索技術の進歩を牽引しているのがインターネット検索技術であることも否定できない事実です」(松田氏)
インターネット検索とエンタープライズ検索の違いは、インターネット検索が幅広い情報の中から参考になる情報を見つけ出せればよいのに対し、エンタープライズ検索は正しい判断や行動を伴う“信頼できる情報”に迅速に到達することが求められる点だ。「インターネット検索の場合には、ありとあらゆる情報が対象で、本当の情報か嘘の情報かは定かではないが、何か役に立つ情報があればいいというものです。一方、企業内の検索は、ビジネスに直結する信頼性の高い情報を迅速に見つけ出せることが要求されます」(松田氏)
企業内検索に必要なアルゴリズムとは
当初、検索エンジンはキーワードの出現頻度が多いものが検索上位に表示されるというアルゴリズムが採用されていた。次に主流となった技術は、インターネットの特性を活かした、リンクの数が多いコンテンツが大勢の求めている情報であるというアルゴリズムだ。しかし、企業に蓄積されている情報にはリンク情報は存在しないため、この手法をそのまま使うのは有効ではない。ただし企業の文書検索では、一定の構造(フォーマット)やキーワード以外の要素を検索に使えるので、インターネット検索とは違ったキーで操作することで、業務に最適な情報をピンポイントで検索できる仕組みを実現できる。
たとえば、インターネット検索で「定期預金」というキーワードで検索すれば、定期預金とはどういうものか、どんな銀行がどんな商品を提供しているのかなど、さまざまな情報が検索され、これはこれで役に立つ。しかし、銀行業務を考えてみると、銀行に蓄積された情報には銀行業務に関係するものしか蓄積されていないため、「定期預金」というキーワードで検索すると、蓄積されているほとんどの情報がヒットしてしまう。これでは役に立たない。
つまり、企業内での情報をキーワードだけで絞り込むことは困難であり、ほしい情報をピンポイントで検索できる機能が必要になる。こうした背景のもとに開発されたのがジャストシステムの企業内情報系アプリケーション基盤である「ConceptBase Enterprise Search(以下、ConceptBase)」だ。
ページリンク
ホワイトペーパー
- 【ビジネスの「見える化」から「使える化」へ】ジャストシステムの真・情報活用基盤
あらゆる業種、職場で、業務プロセスの自動化、オンライン化、さらにコンプライアンスへの対応のために、膨大な数値データやログ、電子メール、オフィス文書など非構造化データが日々生成され…
- 【ビジネスに必要な文書を今すぐに探し出せますか?】日本語文書特有の構造や記述に着目し、高い峻別能力を提供
企業内検索システム、いわゆる「エンタープライズサーチ」において、インターネット同様、キーワード検索が適していると考えられています。しかしながらキーワード検索だけで、大容量・高速検索…