Microsoftは、何百万もの概念にリンクされた言葉のデータベースである「Concept Graph」をリリースした。Concept Graphは、機械が人間と同じようなやり方で、文章の意味を把握するのを支援する。
Microsoftによれば、文章の理解能力に関する人間と機械の違いの1つは、人間は概念(たとえば日付、人、動物など)に関する知識を持っていることだという。
また人間は物事を概念化する能力を持っており、例えば「猫は動物だ」ということを理解できる。
機械はその域に達していない。例えば「猫などの犬以外の動物」という表現があったとき、コンピュータは「猫は動物である」という解釈も、「猫は犬である」という解釈も可能だと考える。しかし人間は、猫は犬ではないと知っているため、2つめの解釈は不可能だと理解できる。
Microsoftの考えでは、Concept Graphは、日常会話の曖昧さに混乱させられることなく、このような文章を解釈できる人間のような能力を機械に持たせることを可能にするツールだ。同社の表現を借りれば、Concept Graphは機械に「常識を使ったコンピューティング能力」と、人間の精神世界に対する知識を持たせることができ、それはテキストにマッピングされた概念に裏打ちされる。
Concept Graphは、2010年から開発が進められており、数十億におよぶウェブページの情報や、数年分の人間のウェブ検索から得られた「知識」を反映させたMicrosoftの概念グラフ「Probase」に基づいて構築されている。
Probaseは、2012年の段階で16億8000万のウェブページから得られた270万件の概念を持っていたが、Concept Graphは現在540万件の概念を有しており、Microsoftによれば、これはCycなど公開されている他の知識ベースよりも大きい。
Googleも、独自の知識ベースである「Knowledge Graph」持っている。Knowledge Graphは2012年時点で5億7000万件の要素を網羅する180億件の属性や関連性を持っていたが、現在で700億件のファクトを網羅しており、検索や機械翻訳の品質向上に利用されている。
Concept Graphが持っている概念には、それぞれ下位概念、属性、関係性(「リンゴ」と「ニュートン」の結びつきなど)などの情報が付随している。
「Concept Graph」には540万件以上の概念が収録されている。
提供:Microsoft
この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。