我正在整理数据集,我想要一个唯一的值。 例如,我的数据集中有三列。
我的input.txt设计为:
Var1 Var2 ACC
A B 0.10
B A 0.10
A C 0.12
我想要的output.txt:
Var1 Var2 ACC
A B 0.10
A C 0.12
我已经尝试创建两个额外的列,分别粘贴input $ Var1和input $ Var2,以及input $ Var2和input $ Var1;并尝试保留control1和control2中的唯一值。 但这不起作用:
sample=sample[!(sample[,1]==sample[,2]),]
sample$control1=paste(sample[,1],";",sample[,2])
sample$control2=paste(sample[,2],";",sample[,1])
sample2=sample[sample$control1 %in% (unique(sample$control1,sample$control2)),]
请问有人可以帮助我修复此问题吗?