第23回「scikit-learnの使い方（9）クラスタリング」

2025-08-04 08:00

一般社団法人Pythonエンジニア育成推進協会はコラム「第23回「scikit-learnの使い方（9）クラスタリング」」を公開しました。

＃＃＃

こんにちは、小澤です。

これまでに見てきた「分類」や「回帰」は、あらかじめ正解ラベルが与えられているデータを用いて学習を行う「教師あり学習」に分類されるものでした。一方で、「教師なし学習」は、正解ラベルのないデータからパターンや構造を見つけ出す手法を指します。

その中でも特に代表的な手法がクラスタリングです。クラスタリングでは、データの類似性や距離関係に基づいて、自然なグループ（クラスタ）に分けることを目的とします。クラスタリングの結果は「分類」と似たような形になりますが、あらかじめ定義された正解ラベルを必要としないという点で本質的に異なります。

クラスタリングでは、与えられたデータを「似た者同士」にまとめてグループ化します。代表的な用途として、以下のようなさまざまな分野で活用されています。

マーケティング：顧客を購買パターンや嗜好に応じてグループ分けする（セグメンテーション）
画像処理：似たような色や形のピクセルをまとめて物体を抽出
異常検知：通常と異なるグループに属するデータを検出
文書分析：似たトピックを含む文書を自動的に分類する

この続きは以下をご覧ください
(リンク »)

第23回「scikit-learnの使い方（9）クラスタリング」

一般社団法人Pythonエンジニア育成推進協会のプレスリリース

【企業の皆様へ】企業情報を掲載・登録するには？

CNET Japan Top Story

ホワイトペーパー

新着

ランキング

NEWSLETTERS