検索が業務の中で重要な役割を担うにつれ、そのシステムはミッションクリティカルな要件を求められるようになっています。ファストは、メリルリンチ、シーメンス、ゼネラル・エレクトリック(GE)、日本では楽天、リクルート、ソフトバンクといった先進的な企業に対して導入を進めてきた実績があり、その点でも有利です。例えば、メリルリンチなどは、約20の情報ソースから収集したデータをベースに、リスク管理のコアファンクションとしてファストの検索技術を利用しています。こうした現状は、「検索が経済をドライブしている」と言っても過言ではないでしょう。
--ファストが推進しているような検索基盤のコンセプトを他社のエンジンで実現することはできないのでしょうか。
先ほど述べたスケーラビリティの問題に加え、技術面での差異も大きいと思います。検索に必要な技術的要件は何段階かに分けられます。まず最初は、あらゆるデータソースからのデータ抽出の段階です。ここでは、データ抽出の対象に応じたコネクタが必要になります。ファストには、OracleやSQL Serverといったデータベースに対するコネクタ、Notes、Exchange、Documentum、Stellent、Sibel、SAPといったアプリケーションに対するコネクタなどを多様に用意しています。
次に抽出したデータの分析の段階があります。収集したデータを同一のスキームで検索できるようにするためには、インデックスを作成する必要がありますが、ファストのエンジンでは、通常のインデックスに加えて、意味的な内容を持ったセマンティックインデックスと呼ばれるものも同時に作成します。これは、検索結果を利用する企業の業種、地域、データの作成者、検索利用者の社内でのロールなどに応じた検索結果が提示できるよう、情報に対して意味づけを行うもので、何らかの統計的な情報や辞書的な情報を利用して作成されます。また、セマンティックインデックスは、利用する企業が独自にカスタマイズすることも可能です。内部がブラックボックス化されたような検索システムでは、そうしたことは不可能です。
ファストは6年前からこのような機能のモジュラー化に取り組んでおり、それらはサービス指向アーキテクチャ(SOA)で統合されます。また、研究開発のスタッフが直接、顧客と共に開発に取り組んできており、そこでの成果は製品の標準機能として取り込まれています。
--日本語は欧米の言語と比べて、インデクシングの面でも、マッチングの面でも特殊な処理が必要になるという印象があるのですが、どのように対応していますか。
ファストはノルウェーの企業であり、創業時から世界には多様な言語体系があることを理解していました。ダブルバイトの日本語を含む多くの言語に対応することを当初からデザインコンセプトとして組み込んでいました。特に日本語の扱いについては、東京大学の石塚研究室や、奈良先端科学技術大学院大学などと協力して研究を行っています。