第1回Python3データ分析模擬試験【第40問】解説

2021-04-26 08:00

プライム・ストラテジー株式会社は「第1回Python3データ分析模擬試験【第40問】解説」を公開しました。

＃＃＃

本問題では「scikit-learn」のうち、教師なし学習の典型的タスクの1つであるクラスタリングと、そのアルゴリズムである階層的クラスタリング（凝集型・分割型）や、非階層的クラスタリングのk-meansについてについて学びます。

■問題

クラスタリングに関する次の記述のうち、誤っているものはどれか。

① クラスタリングは、ある基準を設定してデータ間の類似性を計算し、データをクラスタ（グループ）にまとめるタスクであり、教師なし学習の典型的なタスクである。

② 凝集型の階層的クラスタリングは、まず似ているデータをまとめて小さなクラスタを作り、次にそのクラスタと似ているデータをまとめ、最終的にデータが1つのクラスタにまとめられるまで処理を繰り返すクラスタリング手法である。

③ 分割型の階層的クラスタリングは、最初にすべてのデータが1つのクラスタに所属していると考え、順次クラスタを分割していくアプローチであり、一般的に凝集型に比べて計算量が少なく精度が高いためよく用いられる。

④ k-meansは最初にランダムにクラスタ中心を割り当て、クラスタ中心を各データとの距離を計算しながら修正し、最終的なクラスタ中心が収束するまで再計算を行いクラスタリングする手法である。

⑤ k-meansは、scikit-learnのclusterモジュールのKMeansクラスを用いることによって実行することができる。

解説と回答は以下をご覧ください
(リンク »)

第1回Python3データ分析模擬試験【第40問】解説

プライム・ストラテジー株式会社のプレスリリース

【企業の皆様へ】企業情報を掲載・登録するには？

CNET Japan Top Story

ホワイトペーパー

新着

ランキング

カテゴリランキング

NEWSLETTERS