Rで基本統計量
Rで基本統計量を求める方法をまとめました。
1. 合計
sum(ベクトル)
2. 比率
> library(sca) > noquote(percent(ベクトル/sum(ベクトル),d=1))
3. 平均
3.1 算術平均
mean(ベクトル)
3.2 最頻値
最頻値が直接求められる関数はありません。
tableは要素が何回出てきたかを表示してくれるので
それを使って間接的に出します。
table(ベクトル)
3.3 中央値
median(ベクトル)
4. バラツキ
4.1 範囲
> range(ベクトル) [1] 最小値 最大値 > max(ベクトル) [1] 最大値 > min(ベクトル) [1] 最小値
4.2 分散と標準偏差
4.2.1 分散( variance )
var(ベクトル)
4.2.2 標準偏差( standard deviation )
sd(ベクトル)
4.2.3 散布図
> plot(,ベクトル,pch=,bg=,col=,cex=,ylim(range(ベクトル))) 散布図が別ウインドウで出てきます。 開いたまま > abline(mean(ベクトル),0,lw=,col=3) 散布図に平均値の線が引かれます。
plot
abline
4.3 四分位数
4.3.1 四分位数
quantile(ベクトル)
4.3.2 四分位偏差
IQR(ベクトル)
四分位偏差とはバラツキを表す統計量です。
( 第3四分位 - 第1四分位 ) ÷ 2
で求められる。
参考: http://www.wwq.jp/stacalcul2/quartile-dev.htm
> quantile(c(3,4,6,8,9,11,12,15,16)) 0% 25% 50% 75% 100% 3 6 9 12 16 25%=6=第1四分位、75%=12=第3四分位である。 > IQR(c(3,4,6,8,9,11,12,15,16)) [1] 6