最後の事例セッションには、住友電工情報システム システム営業部 部長補佐である伊藤彰康氏が登場。「こんな使い方もある!企業内検索 〜お手軽版から基幹DB横断検索まで。QuickSolutionの驚くべき力〜」と題し、同社製のエンタープライズサーチエンジンである「QuickSolution」最新バージョンの機能や導入事例を紹介した。
伊藤氏はまず、検索エンジンに求められる性能について「検索精度(適合率と再現率)、検索速度、インデックスの生成/差分更新速度、そして検索容量が問われる」と話した。
同社のQuickSolutionは、企業のイントラネット内に点在する様々なデータを、Webブラウザから横断的に検索できるシステム。その検索機能は、単純なキーワード検索(全文検索)ではなく自然文による類似検索、いわゆる「曖昧検索(文章表現の曖昧さを吸収した検索)」を行える。「組み合わせと組合せ」「画面とモニタ」といった表記の揺れを吸収し、「デジタルカメラとデジカメ」といった短縮表現に対応。「インターネットとインタネット」といったスペルミスもカバーする。利用者は頭に思い浮かぶ質問フレーズをそのまま入力すれば検索できる。
高速な検索処理を行うために、検索対象となるデータをあらかじめ読み込みインデックス(索引)を生成するが、辞書についてはN-gram方式を基本とし、必要に応じて辞書を用いるハイブリッド方式をとる。
これからのサーチエンジンには、爆発的に増え続ける情報量に対応しなければならない。QuickSolutionは超大容量のデータを検索対象とすることができる。伊藤氏は「最初は検索サーバーを1台だけ導入しておき、データが増えて検索容量を超えたら1台追加する。デイジーチェーンのように拡張していける」と話した。QuickSolutionはサーバー1台で1テラバイトまで対応できる。
伊藤氏は「最初に文書ファイルの検索に適用し、次にFAQに活用し、その次にはXMLデータベースを使ったナレッジマネジメントやコンテンツマネジメントへの適用。あるいはLotus DominoやMicrosoft Exchangeのデータベースに適用する、といったようにスケーラブルに展開できることが、エンタープライズサーチエンジンの重要な要件だと考える」と話した。また、QuickSolutionは標準でログを出す機能があり、いつ誰が何を検索し、その結果何が得られたかを把握することができる。ログを分析することで、社内システムの利便性の向上や改善、ユーザーの嗜好(志向)からビジネスの方向性を捉えることも可能になるという。
エンタープライズサーチは、リレーショナルデータベース(RDB)の限界も打ち破れる利点がある。例えばカテゴリーをまたいで、しかも項目の部分一致の条件で、SQLクエリーによる検索を行うと答えが返ってくるまでに非常に時間がかかる。これをサーチエンジンで行うと効率がいい。しかも複数のテーブルやビューをまたぐ検索も簡単に行える。
同氏はRDBの高度な検索を実現したHMV Japanの事例を紹介した。同社では、RDBで200万件以上のコンテンツデータを管理しており、これらを高速かつ安定的に処理する必要がある。それまで数多くの海外製検索サーバーを立てて処理していたが、現在では2台のQuickSolutionで処理。検索サーバーの大幅なダウンサイジングと同時に、うろ覚えのアーティスト名や短縮表現にも対応できるようになった。
産業機械メーカーのイシダでは、提案営業において、紙ベースの過去の類似事例(設計図面や仕様書、見積書等)を有効活用するためにQuickSolutionを導入した。紙ベースの書類をOCRで処理し管理してきたが、文字化けが発生するためスキャンしてもうまく活用できなかった。QuickSolutionの曖昧検索で精度が高まり、業務効率が大幅に向上。伊藤氏は「レガシーな環境からデジタルな環境へと体制を切り替えようとするとき、曖昧検索が役立つ」と語った。
東京大学工学部は、シラバスの検索にQuickSolutionを採用した。知識を階層化、類似化、視覚化する「MIMA Searchシラバス構造化システム」の検索エンジンに採用。検索結果からシラバスの内容を抽出し、さらに内容の意味的関連性をもとに整理し、シラバスの構造を視覚化することで、必要な情報に早く到達できる。
伊藤氏は「われわれはエンタープライズサーチのコアな技術をすべて内製し、様々な技術を保有している。必要な機能がどこにも見当たらないときは、まず当社に問い合わせて欲しい」と話し、講演を締め括った。