こんにちは、日立ソリューションズの吉田です。今回は、最近話題の「人工知能」とOSSとの関連について、紹介したいと思います。
現在、さまざまなところで人工知能が話題になっています。米国Google社によって買収された英国DeepMind社が開発した「AlphaGo」が韓国のプロ囲碁棋士のイ・セドル氏に勝利したことが、人工知能の進化を人々に印象づけたようにように思います。
第3次人工知能ブーム
今回の人工知能への期待の高まりは、一般的に「第3次人工知能ブーム」と呼ばれています。1950年代に「第1次人工知能ブーム」が起こりました。1956年のダートマス会議の研究発表会で、ジョン・マッカーシー氏によって、「人工知能(Artificial Intelligence)」という用語が使用されたのが始まりだと言われています。また、この会議でアレン・ニューウェル氏とハーバート・サイモン氏がデモンストレーションを行った“Logic Theorist”と呼ばれる数学の定理を証明するプログラムが最初の人工知能プログラムとされています。
その後、1980年代になると「エキスパートシステム」が注目されました。それが「第2次人工知能ブーム」です。「エキスパートシステム」とは、人間の専門家の意思決定をエミュレートするもので、知識によって複雑な問題を解くよう設計されており、通常のプログラムのように手続きによって処理されるものではないシステムです。その頃、日本では通産省が550億円をかけて行った「第五世代コンピュータプロジェクト」が1982年に立ち上がりましたが、それほど成果を上げることもなく、1992年に完了しました。
機械学習とディープラーニング
そして、現在は「第3次人工知能ブーム」なのですが、キーワードは「機械学習」と「ディープラーニング」です。機械学習は、コンピュータの振る舞い方(モデル)をデータからの学習で獲得することです。応用例としては、画像認識、音声認識などが有名です。機械学習自体は、ずいぶん前からある技術ですが、アルゴリズムは数式の塊で、現実に活用しようとするとその数式を理解する必要があります。しかしながら、近年はライブラリが充実し、ハードルがどんどん低くなってきています。
機械学習は、大きく「教師あり学習」「教師なし学習」に分けられます。「教師あり学習」は問題と答え(ラベル)がセットになって傾向を学習し、新しいデータがどこに分類されるかを予測する方法で、スパムメールの分類などに使用する「分類問題」、株価の予測や天気予報などに使用される「回帰問題」などに適用されます。
「教師なし学習」は正解不正解のデータが入っていないので、値が近いデータをまとめるクラスタリングやセンサの異常値検出などに活用できる外れ値検出で傾向をつかむ学習方法です。
しかし、この機械学習の問題点は、特徴を「ヒト」が学ばせなければいけないことです。これを解決するのが、次にご紹介する「ディープラーニング」です。
「ディープラーニング」とは、多層構造の「ニューラルネットワーク」を用いた機械学習のことです。「ニューラルネットワーク」は、人間の脳の神経回路の仕組みを模したモデルですが、神経科学の知見の改定などにより、次第に脳モデルとは乖離が著しくなり、生物学や神経科学との区別のために「人工ニューラルネットワーク」と呼ばれる場合もあります。ここで、「ディープラーニング」でよく使われる「ニューラルネットワーク」をご紹介したいと思います。
種類 | 学習方法 | 対応領域 | 特徴・動向など |
全結合型順伝播:Feed Forward | 教師あり | 主に音声認識 | ロジスティック回帰を多層化したもの。中間層がすべて全結合層となっている。 |
畳み込みニューラルネットワーク:Convolutional Neural Network(CNN) | 教師あり | 画像認識、自然言語処理 | 生物学的処理に影響されたモデルであり、少ない事前処理で済むよう設計された多層パーセプトロンの一種。画像や動画認識に広く使われている。 |
リカレントニューラル ネットワーク:Recurrent Neural Network(RNN) |
教師あり | 動画の分類、自然言語処理、音声認識、ロボット行動制御 | 唯一中間層への自己フィードバックができる点が特徴で、系列データへの対応と応用範囲が広い。 現在、世界中の研究機関が注目しており、ディープラーニングによる世界最先端の研究課題となっている。 |
ボルツマンマシン:Boltzmann Machine | 教師なし | 画像認識、音声認識 | Hinton教授が使用しディープラーニングが有名になるきっかけとなったモデル。中間層の中の層同士の関係が確率モデルで記述される。 |
オートエンコーダ:AutoEncoder | 教師なし | ノイズ除去、次元削減 | その名の通り、入力データを再現(デコード)することが可能な低次元の特徴を抽出(エンコード)できる。 |