「今知っておきたいエンタープライズAIの2019年(前編)--企業における活用状況」に続き、後編をお届けする。
どのようにして取りかかるか?
目的を明確にせずにMLを導入するのが愚かな選択となるのはもちろんだ。では、MLでどういったことが実現できるのだろうか?
MLモデルによる作業は通常の場合、大量のデータからパターンを導き出すというものになる。実際のところ、このパターン認識能力の例をいくつか挙げると、音声からの単語抽出や、画像に写っている人の識別、文章内における単語の意味理解といったシステムになる。
手始めに、業務領域の専門知識と社内におけるデータ科学のスキルを組み合わせる必要がある。また、何を達成したいのか、MLが適切なのか、出来合いのサービスを使用しない場合にどのカテゴリのML(「教師あり学習」か「教師なし学習」「強化学習」)を使用するのかを決定する必要もある。
そしてプロジェクトを開始する前に、「どのようなデータを収集するのか?」や、「そのデータをMLモデルの学習に適切となるよう変換するにはどうするのか?」「そのデータのどういった特徴がMLモデルの訓練に重要となるのか?」といった数多くの事項を考慮する必要もある。
Constantinides氏は「データがそのまま使えると考えてはいけない」と述べ、「MLアルゴリズムが機能するカテゴリを決定するのはデータサイエンティストの仕事だ。データを適切なかたちにできないのであれば、目的を達成するMLのアプリケーションなど作り出すことはできない」と続けた。
モデルの訓練に既存データを使用する際に、さらなる同意を得る必要があるかどうか、あるいは欧州連合(EU)の一般データ保護規則(GDPR)のようなプライバシー規制に準拠するために、追加の保護対策を講じる必要があるかどうかという疑問もある。
Constantinides氏は「データの収集方法が原因で、データが実際にどこから収集されたのかや、特定ケースにおいてどのような意思決定がなされるかを把握することが困難になっている」と述べ、GDPRに準拠するための適切な同意を得るのは、特にディープニューラルネットワーク(DNN)を訓練する際には困難だと続けた。GDPRによってMLベースのテクノロジーの利用に障壁がもたらされる分野としては、小売店舗における顔認証が挙げられる。
テクノロジーの選択にあたっては、クラウド上のハードウェアを借りるか、自社専用のディープラーニング設備を用意するかを決定する必要がある。AmazonやMicrosoft、Googleといった大手クラウドプロバイダーは使った分だけ料金を支払うオンデマンド型のさまざまなMLサービスを提供している。