第16回「scikit-learnの使い方（2）カテゴリ変数のエンコーディングと特徴量の正規化」

一般社団法人Pythonエンジニア育成推進協会

2025-01-31 09:00

一般社団法人Pythonエンジニア育成推進協会はコラム「第16回「scikit-learnの使い方（2）カテゴリ変数のエンコーディングと特徴量の正規化」」を公開しました。

＃＃＃

こんにちは、小澤です。

今回も引き続き、「scikit-learn」における前処理について解説していきます。今回は、機械学習モデルの性能に大きな影響を与える2つの前処理として、「カテゴリ変数のエンコーディング」と「特徴量の正規化」を取り上げ、それぞれの実装方法と活用方法について説明します。

なお、教科書『Pythonによる新しいデータ分析の教科書（第2版）』では、4.4.1章「前処理」（217〜225ページ）の箇所です。

カテゴリ変数のエンコーディング
機械学習アルゴリズムは数値データを前提として動作するため、文字列などのカテゴリ変数は数値データに変換する必要があります。カテゴリ変数とは、性別、血液型、職業など、限られた種類の値をとる変数のことを指します。このようなカテゴリ変数を機械学習で扱えるようにするため、数値データへの変換プロセスが必要となります。この変換プロセスを「カテゴリ変数のエンコーディング」と呼び、scikit-learnでは以下の手法を利用できます。

この続きは以下をご覧ください
(リンク »)

関連情報へのリンク

本プレスリリースは発表元企業よりご投稿いただいた情報を掲載しております。
お問い合わせにつきましては発表元企業までお願いいたします。

一般社団法人Pythonエンジニア育成推進協会のプレスリリース

一般社団法人Pythonエンジニア育成推進協会のプレスリリース一覧へ

【企業の皆様へ】企業情報を掲載・登録するには？

御社の企業情報・プレスリリース・イベント情報・製品情報などを登録するには、企業情報センターサービスへのお申し込みをいただく必要がございます。詳しくは以下のページをご覧ください。

企業情報センターにログイン企業情報センターサービスについて

企業情報センター利用規約

CNET Japan Top Story

ホワイトペーパー

新着

セキュリティ

ランサムウェアで止まらない基幹業務へ--クラウド選定で見るべき4つの要点
ビジネスアプリケーション

CRMに投資してもなぜ顧客体験は下がるのか。記録から実行へ、部門の垣根を越える次世代CRMの条件
クラウド基盤

AIファクトリー成功の鍵はインフラにあり！統合型冷却・電力基盤が求められる理由
経営

Excel依存とデータ散在を解決、キュリエが実践した「業務標準化」の舞台裏
セキュリティ

“攻撃者と同じ視点”で認知外アセットを可視化。見落としがちな外部公開資産のリスクに対応するには？

ランキング

セキュリティ

調査結果が示す「モバイルセキュリティの死角」、主要なリスクと具体的な防御策とは？
経営

生成AI活用はなぜ成果につながらないのか？　P/Lヒットを生む3つのポイント
ビジネスアプリケーション

CRMに投資してもなぜ顧客体験は下がるのか。記録から実行へ、部門の垣根を越える次世代CRMの条件
ビジネスアプリケーション

CIO必見、経営層に響く「AIエージェント導入」説明--7つの役職別シナリオで解説
セキュリティ

AIセキュリティ確保のための実践ガイド--なぜ従来のセキュリティはAIに通用しないのか

ホワイトペーパーライブラリー

NEWSLETTERS

エンタープライズコンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]