我有一个看起来像这样的data.frame:
GN PN
a 3.4
a 3.4
a 9.8
d 8.4
e 9
e 6.5
我想要以下输出:
GN PN
a 3.4
a 9.8
d 8.4
e 9
e 6.5
(相同的行将被删除!)
我正在尝试使用multiple columns comparison中发布的代码,但没有成功,因为复制的行(3.4)仍然存在。 我有一个大的data.frame(大约66.000行和10列)。
有人可以帮我吗?
真实案例:
GN SP PN
A1CF 52573692 TCGA-B6-A0RS-01A-11D-A099
A1CF 52595854 TCGA-BH-A0HP-01A-12D-A099
A1CF 52595854 TCGA-BH-A0HP-01A-12D-A099
A1CF 52595937 TCGA-BH-A18P-01A-11D-A12B
A2BP1 7568361 TCGA-D8-A1JN-01A-11D-A13L
A2BP1 7102099 TCGA-E2-A1BC-01A-11D-A14G
A2BP1 7102099 TCGA-E2-A1BC-01A-11D-A14G
A2BP1 7383011 TCGA-AR-A1AJ-01A-21D-A12Q
A2BP1 7383011 TCGA-AR-A1AJ-01A-21D-A12Q
A2BP1 7568188 TCGA-BH-A18J-01A-11D-A12B
A2BP1 7629860 TCGA-AO-A03O-01A-11W-A019
A2BP1 7629860 TCGA-AO-A03O-01A-11W-A019
答案 0 :(得分:1)
只需使用:
unique(df)
给出了:
GN PN
1 a 3.4
3 a 9.8
4 d 8.4
5 e 9.0
6 e 6.5
答案 1 :(得分:1)
也许你可以尝试new.df=subset(df,!duplicate(df))