データサイエンティスト講座

統計解析ソフト「R」を使う--環境構築と利用方法の基本 - (page 3)

伊藤徹郎(ALBERT)

2014-05-27 07:30

Rで基本統計量などを算出する

 前回の可視化の際にも用いましたが、Rで最もよく利用されるサンプルデータにirisデータがあります。Rの画面にirisと打ち込むとデータの概要が表示されます。


 irisデータには5つの種類のデータが入っています。例えば、この中の1列目だけを取り出したい場合、Rには「iris[,1]」と指定します。


 すると、先ほどのデータ内の1列目だけを返してくれます。このデータの基本統計量を取りたければ、用途によって下記の関数を用います。



 ※基本統計量については以前の記事をご参照ください。

 以上のように、関数を使うことで簡単に基本統計量を求めることもできます。

 また、便利な関数の1つにsummary関数があります。この関数を用いると、データの最大・最小値、最頻値、平均、四分位点などの情報が一度に把握できます。


 他にもたくさんの便利な関数が多くありますが、割愛します。

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

関連記事

ZDNET Japan クイックポール

マイナンバーカードの利用状況を教えてください

NEWSLETTERS

エンタープライズ・コンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]