こんにちは、小澤です。
前回、データ値のばらつきと相関関係を表す分散共分散をNumPyライブラリを使って求めてみました。数学的なアプローチを中心に話題を展開しましたが、数学的な厳密な理解にこだわる必要はありません。データ分析には数学的なアプローチが深く関与しており、それをPythonを使って解決できるということが分かることが重要です。
さて、せっかく分散共分散を求めたので、引き続き、主成分分析の計算までしてみます。『Pythonによるあたらしいデータ分析の教科書(第2版)』では、scikit-learnを使った方法が249ページに掲載されていますが、今回も数学的な要素があるということを理解することが目的ですので、NumPyを使って計算してみます。scikit-learnを使った方法については、別の機会に解説しますので、それまでお待ちください。
この続きは以下をご覧ください
(リンク »)
お問い合わせにつきましては発表元企業までお願いいたします。