• メールアドレス:
  • パスワード:
ZDNet Japan Ad special

情報洪水を解決し、企業活動を革新するエンタープライズサーチとは

 

重要なデータを見落とさない曖昧検索

 最後の事例セッションには、住友電工情報システム システム営業部 部長補佐である伊藤彰康氏が登場。「こんな使い方もある!企業内検索 〜お手軽版から基幹DB横断検索まで。QuickSolutionの驚くべき力〜」と題し、同社製のエンタープライズサーチエンジンである「QuickSolution」最新バージョンの機能や導入事例を紹介した。

住友電工情報システム株式会社 システム営業部 部長補佐 伊藤彰康氏
住友電工情報システム株式会社
システム営業部
部長補佐
伊藤彰康氏

 伊藤氏はまず、検索エンジンに求められる性能について「検索精度(適合率と再現率)、検索速度、インデックスの生成/差分更新速度、そして検索容量が問われる」と話した。

 同社のQuickSolutionは、企業のイントラネット内に点在する様々なデータを、Webブラウザから横断的に検索できるシステム。その検索機能は、単純なキーワード検索(全文検索)ではなく自然文による類似検索、いわゆる「曖昧検索(文章表現の曖昧さを吸収した検索)」を行える。「組み合わせと組合せ」「画面とモニタ」といった表記の揺れを吸収し、「デジタルカメラとデジカメ」といった短縮表現に対応。「インターネットとインタネット」といったスペルミスもカバーする。利用者は頭に思い浮かぶ質問フレーズをそのまま入力すれば検索できる。

 高速な検索処理を行うために、検索対象となるデータをあらかじめ読み込みインデックス(索引)を生成するが、辞書についてはN-gram方式を基本とし、必要に応じて辞書を用いるハイブリッド方式をとる。

スケーラブルに展開できることが重要

 これからのサーチエンジンには、爆発的に増え続ける情報量に対応しなければならない。QuickSolutionは超大容量のデータを検索対象とすることができる。伊藤氏は「最初は検索サーバーを1台だけ導入しておき、データが増えて検索容量を超えたら1台追加する。デイジーチェーンのように拡張していける」と話した。QuickSolutionはサーバー1台で1テラバイトまで対応できる。

 伊藤氏は「最初に文書ファイルの検索に適用し、次にFAQに活用し、その次にはXMLデータベースを使ったナレッジマネジメントやコンテンツマネジメントへの適用。あるいはLotus DominoやMicrosoft Exchangeのデータベースに適用する、といったようにスケーラブルに展開できることが、エンタープライズサーチエンジンの重要な要件だと考える」と話した。また、QuickSolutionは標準でログを出す機能があり、いつ誰が何を検索し、その結果何が得られたかを把握することができる。ログを分析することで、社内システムの利便性の向上や改善、ユーザーの嗜好(志向)からビジネスの方向性を捉えることも可能になるという。

ダウンサイジングと同時に高速処理を実現

 エンタープライズサーチは、リレーショナルデータベース(RDB)の限界も打ち破れる利点がある。例えばカテゴリーをまたいで、しかも項目の部分一致の条件で、SQLクエリーによる検索を行うと答えが返ってくるまでに非常に時間がかかる。これをサーチエンジンで行うと効率がいい。しかも複数のテーブルやビューをまたぐ検索も簡単に行える。

 同氏はRDBの高度な検索を実現したHMV Japanの事例を紹介した。同社では、RDBで200万件以上のコンテンツデータを管理しており、これらを高速かつ安定的に処理する必要がある。それまで数多くの海外製検索サーバーを立てて処理していたが、現在では2台のQuickSolutionで処理。検索サーバーの大幅なダウンサイジングと同時に、うろ覚えのアーティスト名や短縮表現にも対応できるようになった。

 産業機械メーカーのイシダでは、提案営業において、紙ベースの過去の類似事例(設計図面や仕様書、見積書等)を有効活用するためにQuickSolutionを導入した。紙ベースの書類をOCRで処理し管理してきたが、文字化けが発生するためスキャンしてもうまく活用できなかった。QuickSolutionの曖昧検索で精度が高まり、業務効率が大幅に向上。伊藤氏は「レガシーな環境からデジタルな環境へと体制を切り替えようとするとき、曖昧検索が役立つ」と語った。

 東京大学工学部は、シラバスの検索にQuickSolutionを採用した。知識を階層化、類似化、視覚化する「MIMA Searchシラバス構造化システム」の検索エンジンに採用。検索結果からシラバスの内容を抽出し、さらに内容の意味的関連性をもとに整理し、シラバスの構造を視覚化することで、必要な情報に早く到達できる。

 伊藤氏は「われわれはエンタープライズサーチのコアな技術をすべて内製し、様々な技術を保有している。必要な機能がどこにも見当たらないときは、まず当社に問い合わせて欲しい」と話し、講演を締め括った。


« 前へ
  • 1
  • 2
キーショートカット:  b - 前のページ n - 次のページ

企画特集

Techno ExchangeTechno Exchange
全体最適化で進めるCTCのグリーンIT戦略
ZDNet Japan Green ITZDNet Japan Green IT
洞爺湖サミット目前!環境に配慮したGreen ITとは?
今知るべき仮想化情報今知るべき仮想化情報
インフラからアプリケーションまで、これを知らずに仮想化は語れない
DELL連載第4回〜「Microsoft System Center」DELL連載第4回〜「Microsoft System Center」
PowerEdgeサーバに最適な運用管理ソリューション後編
「未来の、その先」をどう提言していくか「未来の、その先」をどう提言していくか
クラウドコンピューティングが導く新しいシステム
ブログ RSS Feed
洞爺湖と環境と私
裏方の裏方日記〜日々是広報 2008/05/20 12:57
プロがなぜ、二次創作を願うのか--Gacktが歌い、三浦建太郎が描く「がくっぽいど」
ミュージシャンのGacktさんと漫画家の三浦建太郎さんという2人のプロが参加しながらも、ユーザーが自由に作品を公開できるという歌声合成ソフト「がくっぽいど」。この開発経緯を開発元に聞いた。
iPhone、月額通信料金は7280円からに--ソフトバンクモバイルが発表
UPDATE ソフトバンクモバイルはiPhoneの通信料金プランを発表した。月額980円のホワイトプランに、データ定額制プラン「パケット定額フル」、「S!ベーシックパック(i)」をあわせ、月額7280円からとなる。
ジョブズ氏引退後のアップルを考える
カリスマ的な創業者が社を去った後、会社の業績が低迷する事例は、ハイテクだけでなく、さまざまな業界で見られる。アップルは「ジョブズ氏後」に備えているのかどうか検討する。