R:数据合并
来自OBHRM百科
合并变量
如果您有不同的数据文件,每个数据文件包括同一批样本,但是每个文件包括不同的变量。在进行后续的统计分析之前,需要将这些数据合并,这个时候就是“合并变量”。
合并变量使用函数:merge(),merge函数的具体用法如下,如果您希望了解每个参数的具体含义和使用方法,可以在R控制台输入:? merge。
merge(x, y, by = intersect(names(x), names(y)), by.x = by, by.y = by, all = FALSE, all.x = all, all.y = all, sort = TRUE, suffixes = c(".x",".y"), incomparables = NULL, ...)
如果您已经有两个数据框,分别为mydata1, mydata2。合并变量需要在两个数据框里头有一个用来标识样本身份的变量,一般是根据这个变量对两个数据框中的样本进行匹配。这个变量在两个数据框中,可以名称相同(比如,都是caseid),也可以不同(比如,一个是caseid,一个是sampleid)。具体合并方法如下:
如果两个数据框中的身份变量一样,均为:caseid,则:
mydata <- merge(mydata1,mydata2, by="caseid")
如果两个数据框中的身份变量不一样,mydata1中为caseid,mydata2中为sampleid,则:
mydata <- merge(mydata1,mydata2, by="caseid")
如果mydata1, mydata2里头都有一个
合并样本
如果您有不同的数据文件,每个数据文件包括不同的样本,变量基本相同。在进行后续的统计分析之前,需要将这些数据合并,这个时候就是“合并样本”。