日立システムアンドサービス(日立システム)と、日立アイ・エヌ・エス・ソフトウェア(日立INS)は6月29日、「ハイブリッド検索ソリューション」を7月1日から販売開始することを発表した。
同ソリューションは、日立INSの大規模音声検索ソリューション「Voice Searcher」と、日立システムの「画像検索ソリューション」および全文検索ソリューション「InWeave Search」の各々の機能の特長を生かし、連携することで、「音声」「画像」「テキスト」からなるマルチメディア情報を、ハイブリッド型で高速かつ高精度に検索するという。
特長としては、音声、画像、動画コンテンツの特徴量を自動生成し、生成されたテキストまたは画像を検索キーとして用いて検索する点。このため、事前のキーワード(属性情報)付与作業を行うことなく検索できる。
音声検索では、音素の記号列と音声特徴量による検索方式とを組み合わせ、多段階の照合を行う。開発元検証環境における実測値では、2000時間分のデータから約3秒という速さで検索結果を導き出したという。これによりユーザーは、テキスト検索と同じ感覚で、任意の文字列をキーワードとして音声データおよび音声付き映像データの発話シーンを検索できるという。
画像検索では、同実測値で、数千万件の画像データから約1秒で類似した画像を検索したという。画像データから、画像の色分布や輝度勾配パターン分布などの情報を数値ベクトル化した画像特徴量を自動生成し、これを基に類似検索。形重視や色重視を指定して類似した画像も検索可能だという。
全文検索は「n-gram」という方式を採用した全文検索エンジンで、1000万件のデータを約0.1秒(同実測値)で検索。通常のキーワード検索以外に、類似した内容の文書を検索する自然文検索、更新日やURLなどを入力して文書を検索するプロパティ検索が可能だという。また、エンタープライズサーチ機能によりシステム内のコンテンツと社内外のフィード情報を横断的に検索することもできるという。
日立システムと日立INSでは、同ソリューションの提供にあたり、ユーザーの課題や要件にあわせ、各種検索技術の最適な組合せを検討、システム構成立案に向けたコンサルティングを実施。またコンサルティングの結果を元に、システム設計からアプリケーション開発、システム構築まで、ワンストップソリューションを提供するという。
両社は、遠隔教育(Eラーニング)やインターネットショッピング、ネットでの旅行パック販売など、幅広い業種に向けて同ソリューションを販売し、今後3年間で約20億円の売上を目指すという。