以下に例を1つ挙げてみよう。2016年5月の話だ。米国の刑事司法制度において、被告を保釈するか拘留するかを決定するために広く用いられている「COMPAS」というプロプライエタリなリスク評価アルゴリズムを搭載したシステムが、アフリカ系米国人を白人よりも不当に低く評価してしまう偏りがあるという主張がオンラインのジャーナリズムサイトであるProPublicaによってなされた。
Northpointe(COMPASを手がける営利企業)はProPublicaの統計解析の結果に異議を唱えたものの、それによってさらなる議論が引き起こされた。刑事司法制度のような扱いが難しい分野で、内容が厳重に秘匿されているプロプライエタリなアルゴリズムを広く利用するのは控えめに言っても懸念の種であるはずだ。
ニューラルネットワークベースのアルゴリズムを訓練するデータによっても、偏りが発生する可能性がある。例を挙げると、ワシントン大学で言語学を研究する、米国立科学財団大学院生研究フェローであるRachael Tatman氏は7月、YouTube動画に対して自動的に字幕を付けるGoogleの音声認識システムは女性の声よりも男性の声の方が認識率が高くなっているという所見を述べるとともに、その原因として「訓練用集合の偏り」すなわち男性話者の数が多かったためではないかと推測している。Tatman氏は、YouTubeの字幕が多少誤っていても何の問題も引き起こされないが、例えば医療やコネクテッドカーといった応用分野では話が違ってくるはずだと指摘している。
AIという言葉は、多層構造のニューラルネットワークを用いた「深層学習」(Deep Learning)という意味で用いられる場合も多いが、AIのエコシステムにはさまざまな種類のアルゴリズムが存在している。
提供:Narrative Science
「ブラックボックス」としてのニューラルネットワーク
ニューラルネットワークは、画像認識や音声認識、自然言語理解、機械翻訳といった多くのAIアプリケーションで鍵となる技術になるため、特に懸念を呼ぶものとなっている。しかも、結果を導き出す過程を明確にしようとした際に、ある種の「ブラックボックス」化が避けて通れないという点も懸念として無視できない。
ニューラルネットワークがその名前、すなわち神経回路網という名前で呼ばれるのは、ある面において人間の脳の構造を模しているためだ。ニューラルネットワークを作るには、神経細胞の役割を果たすノードを相互に接続し、入力層と出力層、「隠れ」中間層(その数はさまざまだ)からなる多層構造を作ることになる。ディープ(「深層」構造の)ニューラルネットワークというのは単に、隠れ層が複数あるという意味だ。これらのノード自体は比較的単純な数学的演算処理しか行わないものの、それらが連携し合うことで、訓練が終われば、今までに遭遇していないデータが入力された場合でも、訓練データで学習した内容に基づき、適切な解を導き出せるのだ。
ディープニューラルネットワークの構造と訓練
提供:Nuance Communications