Learn to Live and Live to Learn

IT(たまにビジネス)に関する記事を読んで、考えて、使ってみたことをまとめる場。

Rで基本統計量

Rで基本統計量を求める方法をまとめました。

1. 合計

sum(ベクトル)

2. 比率

> library(sca)
> noquote(percent(ベクトル/sum(ベクトル),d=1))

3. 平均
3.1 算術平均

mean(ベクトル)

3.2 最頻値
最頻値が直接求められる関数はありません。
tableは要素が何回出てきたかを表示してくれるので
それを使って間接的に出します。

table(ベクトル)

3.3 中央値

median(ベクトル)

4. バラツキ
4.1 範囲

> range(ベクトル)
[1] 最小値 最大値
> max(ベクトル)
[1] 最大値
> min(ベクトル)
[1] 最小値

4.2 分散と標準偏差
4.2.1 分散( variance )

var(ベクトル)

4.2.2 標準偏差( standard deviation )

sd(ベクトル)

4.2.3 散布図

> plot(,ベクトル,pch=,bg=,col=,cex=,ylim(range(ベクトル)))
散布図が別ウインドウで出てきます。
開いたまま
> abline(mean(ベクトル),0,lw=,col=3)
散布図に平均値の線が引かれます。

plot
f:id:A_01:20131215135738p:plain
abline
f:id:A_01:20131215135746p:plain

4.3 四分位数
4.3.1 四分位数

quantile(ベクトル)

4.3.2 四分位偏差

IQR(ベクトル)

四分位偏差とはバラツキを表す統計量です。
( 第3四分位 - 第1四分位 ) ÷ 2
で求められる。
参考: http://www.wwq.jp/stacalcul2/quartile-dev.htm

> quantile(c(3,4,6,8,9,11,12,15,16))
  0%  25%  50%  75% 100% 
   3    6    9   12   16 
25%=6=第1四分位、75%=12=第3四分位である。
> IQR(c(3,4,6,8,9,11,12,15,16))
[1] 6