独立行政法人 情報通信研究機構(NICT)
大規模Web情報分析システム「WISDOM X(ウィズダム エックス)」をWeb上に試験公開
【ポイント】
■ 10億件以上のWebページの情報を用いて、自然な質問文に回答する情報分析システムを公開
■ 「なに?」「なぜ?」「どうなる?」などの質問の種類に適した回答、更に意外な回答も発見
■ 利用者に質問を提案するなど、新しいWeb検索の概念により、“気づき”を利用者に提供
独立行政法人 情報通信研究機構(NICT、理事長: 坂内 正夫) (リンク ») は、ユニバーサルコミュニケーション研究所において開発を行っている大規模Web情報分析システム「WISDOM X」を、3月31日(火)からWeb上に試験公開します。
WISDOM Xは、従来型の検索エンジンとは異なり、「東京オリンピックで何を心配すべきか?」「キーマカレーに何を入れる?」「地球温暖化が進むとどうなる?」「なぜ日本はデフレに陥ったのか?」といった自然な質問文を受け付け、10億件以上のWebページの情報に基づき、多種多様な回答と、回答が抽出されたWebページへのリンクを返します。例えば、「ビッグデータで何を作るか?」といった質問では、数百件の回答を表示し、その中には、「人工知能」「交通情報サービス」といった比較的知られているものから、「人気アニメ」「観光資源」「産業地図」「第4の科学」といった一部の専門家以外には意外なものまでも含まれます。
本システム開発の最終目的は、こうした“気づき”を利用者に与え、日常生活からビジネスまでの広範囲にわたるイノベーションを促すことです。また、従来、このような質問応答システムは、適切な質問を考える負担が大きいため、一般社会には普及してきませんでした。しかし、本システムでは「スマホ」のように単語だけを入力すると、「スマホで〇〇を解決する」「スマホは何が懸念される」「スマホが普及するとどうなる?」など、システムがその単語に関する質問を提案することができ、キーワードの入力とマウスクリックだけで、様々な“気づき”にたどり着けるように作られています。本システムが分析できるWebページは、現在10億ページを超えており、今後40億ページまで増加させる予定です。WISDOM Xは、 (リンク ») でご利用いただけます。
【背景】
近年、大量かつ有用な情報がWebに蓄積されていく一方で、有用な情報の発見は、しばしば非常に困難になっています。例えば、「地球温暖化」は多岐にわたる影響があると言われていますが、既存の検索エンジンでそれらの影響をリストアップすることは困難です。これは、そうした検索エンジンで欲しい情報を特定するには提示されたWebページを読む必要があり、「地球温暖化の影響」「ビッグデータの応用」など、前もって答えの数や多様性が分からない疑問に答えるには莫大な量のWebページを読む必要があるからです。NICTでは、そうした多様な答えを持つ疑問に対して、大量のWebページから端的な回答のリストを抽出するシステムを研究開発してきました、これは、そうした多様な答えを持つ疑問に対する答えこそが、近年重要性を増しているイノベーションやリスク管理といった、不確実性に対処しなければならない作業において重要なヒントになると考えられるからです。
【今回の成果】
このたび、NICTは、自然な質問文を入力すると、10億件以上のWebページの情報を基にして回答のリストを返すシステム「WISDOM X」をWeb上に試験公開します。このシステムは、利用者が「何で少子化問題を解決するか?」「なぜ日本はデフレに陥ったのか?」「円安が進むとどうなる?」などの質問を入力すると、異なる表現間の意味の同一性等を考慮して、柔軟に回答を抽出します。質問が思い付かない場合には、単語を入力すると、回答可能な質問を提案します。例えば、「地球温暖化」と入力すると、「地球温暖化が進むとどうなる?」などの質問を提案します。
【今後の展望】
今後は、より複雑な質問により精度よく答えられるよう、研究開発を進めていきます。さらに、現在は日本語のWebページのみを分析していますが、科学技術論文や英語を含む他の言語への対応を進めていく予定です。
お問い合わせにつきましては発表元企業までお願いいたします。