編集部からのお知らせ
(記事集)ニューノーマルで伸びる業界
「ニューノーマルとIT」新着記事一覧

AI導入--機械学習で事業価値を生み出すデータとは - (page 2)

田中耕太郎

2017-05-22 07:00

機械学習の基本はパターン認識

 「機械学習をさせる」とは一体どういうことでしょうか。機械学習は、ほぼ同義語として「パターン認識」と呼ばれることがあります。学習からアウトプットまでの流れは、概ね以下のようになります。

 『(1)膨大なパターンを学習することにより、(2) 新しいインプット・データに対して、(3) 学習から導かれたモデルを利用し、(4)最も妥当なものをアウトプットする』

 上記を分解し、要素ごとに簡単な解説をします。(1)では実際に観測されたデータ(学習データ)を使用し、パターンを学習させます。この作業は「モデル作成」などと呼ばれます。(2)では予測に使用するデータを入力します。(3)では学習済みのモデルにインプットされたデータを当てはめます。(4)では予測結果をアウトプットとして出力します。

 モデル作成のための手法はさまざまなものが提案されており、最近は入門者向けの書籍も多く刊行されています。また、PythonやRといった言語で、機械学習アルゴリズムに特化したライブラリも活発に開発が続けられています。

 そのため、具体的な理論や数式を活用したアルゴリズム、実装方法についての説明は書籍などに譲り、本稿ではデータを中心にして説明します。


提供:iStock

「前処理」は、データを知るところから

 事業やサービスを運営していると、さまざまなデータを取得することができます。そのようなデータの中から目的変数や説明変数として用いるものを決めたら、学習に適した形に変換・加工します。

 この工程は一般的に「前処理」と呼ばれます。前処理は非常に地味な作業ながら、予測精度を左右する重要な工程です。特に、アルゴリズムを独自に開発しないような場合は、実験や開発の時間の大きな部分を占めます。

 前処理はデータを知るところから始まります。次ページに利用するデータについて確認すべき事項を列挙しました。これらの事項は一般的なデータ分析のみならず、機械学習においてもデータの正しい解釈や活用をする上で有効です。

 データを正しく知るというプロセスを踏まえ、実際の学習データを作り込んでいきます。

ZDNet Japan 記事を毎朝メールでまとめ読み(登録無料)

特集

CIO

モバイル

セキュリティ

スペシャル

ホワイトペーパー

新着

ランキング

  1. 運用管理

    ファイルサーバ管理のコツはここにあり!「無法状態」から脱出するプロセスを徹底解説

  2. クラウドコンピューティング

    社員の生産性を約2倍まで向上、注目の企業事例から学ぶDX成功のポイント

  3. コミュニケーション

    真の顧客理解でCX向上を実現、いまさら聞けない「データドリブンマーケティング」入門

  4. ビジネスアプリケーション

    デメリットも把握しなければテレワークは失敗に?─LIXIL等に学ぶ導入ステップや運用のコツ

  5. 運用管理

    ニューノーマルな働き方を支えるセキュリティ-曖昧になる境界に変わらなくてはならないデータセンター運用

NEWSLETTERS

エンタープライズ・コンピューティングの最前線を配信

ZDNet Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]