さて、話が少しそれましたが、実際に回帰分析を実施してみましょう。
先ほどのデータセットにおいて、「オゾンの量を太陽の放射の量と風力、気温で説明したい」とします。わかりやすく書くと、下記のような式で表します。
オゾンの量=a×太陽の放射の量+b×風力+c×気温
Rで上記のような回帰式の変数を推定するには回帰分析のための関数「lm関数」を使います。
Rのコンソールに上記のように打ち込んでみましょう。
air.lmという変数を定義します。その内容が先ほどのairqualityのデータセットから上記の回帰式で推定した結果ということになります。
さて、上記の結果を要約統計量がわかる「summary関数」で見てみましょう。
すると、上記のような結果が表示されます。すべての数値に意味があるのですが、誌面の都合上、一部の係数のみ説明します。これらの指標を詳しく解釈したい方は別途、統計学の書籍や「R」の解説本を読まれるとよいでしょう。
まず、先ほど立てた回帰式の係数が推定されました。それがEstimate(概算)です。(Intercept)は切片、つまりグラフと座標軸の交点に該当します。変数ごとの係数はそれぞれ、該当係数の横に表示されています。