用R进行描述性统计

来自OBHRM百科
Lichaoping讨论 | 贡献2022年4月12日 (二) 17:51的版本 计算平均数与标准差

(差异) ←上一版本 | 最后版本 (差异) | 下一版本→ (差异)
跳转至: 导航搜索

频次分析

可以用descr包中的freq()函数来进行频次分析。

脚本与注释

datafilename <- "http://personality-project.org/r/datasets/maps.mixx.epi.bfi.data" # 指定文件名与路径
mydata <-  read.table(datafilename,header=TRUE)                                      # 读取数据到mydata
attach(mydata)                                                                       # 激活mydata
library(descr)                                                                       # 使用descr包中的freq来进行频次分析
freq(epiE)                                                                           # 计算epiE变量的频次,得到频次分析结果和统计图

结果

> freq(epiE)
epiE 
      Frequency  Percent
1             1   0.4329
2             2   0.8658
4             2   0.8658
5             4   1.7316
6             8   3.4632
7             5   2.1645
8             7   3.0303
9             8   3.4632
10           15   6.4935
11           16   6.9264
12           24  10.3896
13           23   9.9567
14           26  11.2554
15           21   9.0909
16           16   6.9264
17           16   6.9264
18           10   4.3290
19           14   6.0606
20            6   2.5974
21            4   1.7316
22            3   1.2987
Total       231 100.0000

计算平均数与标准差

脚本与注释

datafilename <- "http://personality-project.org/r/datasets/maps.mixx.epi.bfi.data" # 指定文件名与路径
mydata <-  read.table(datafilename,header=TRUE)                                      # 读取数据到mydata
attach(mydata)                                                                       # 激活mydata
epi <- data.frame(epiE ,epiS ,epiImp ,epilie ,epiNeur)                               # 从mydata中提取数据子集,只包括要分析的变量
library(psych)                                                                       # 使用psych包中的describe计算平均数与标准差
describe(epi)                                                                         # 描述性统计
describe(epi,fast=TRUE)                                                              # 快速描述性统计,得到核心结果

结果

> describe(epi)   #描述性统计结果。可以把结果复制到Editplus或notepad++,然后复制平均值与标准差两列到论文中
        vars   n  mean   sd median trimmed  mad min max range  skew kurtosis   se
epiE       1 231 13.33 4.14     14   13.49 4.45   1  22    21 -0.33    -0.06 0.27
epiS       2 231  7.58 2.69      8    7.77 2.97   0  13    13 -0.57    -0.02 0.18
epiImp     3 231  4.37 1.88      4    4.36 1.48   0   9     9  0.06    -0.62 0.12
epilie     4 231  2.38 1.50      2    2.27 1.48   0   7     7  0.66     0.24 0.10
epiNeur    5 231 10.41 4.90     10   10.39 4.45   0  23    23  0.06    -0.50 0.32

> describe(epi,fast=TRUE)  #快速描述性统计结果。可以把结果复制到Editplus或notepad++,然后复制平均值与标准差两列到论文中
        vars   n  mean   sd min max range   se
epiE       1 231 13.33 4.14   1  22    21 0.27
epiS       2 231  7.58 2.69   0  13    13 0.18
epiImp     3 231  4.37 1.88   0   9     9 0.12
epilie     4 231  2.38 1.50   0   7     7 0.10
epiNeur    5 231 10.41 4.90   0  23    23 0.32