对于两组坐标,提取Set A的唯一行而不是Set B.

时间:2017-03-14 19:09:31

标签: r excel unique combinations set-operations

我有两套坐标:

  • 设置一个具有49,898个x和y
  • 组合的一个
  • 使用36,404个x和y组合设置B.
  • (套装A具有套装B中的所有组合以及额外的13,494种组合)
  • Excel或R中的解决方案都很好

我想提取这套独特的13,494种组合。为了尝试使用Excel或R提取这些唯一值,我复制了Set B的x& y将组合与A组相同的列进行协调。

表格布局有两列Data -> Advanced Filter -> Unique records onlyx and y example

我已阅读了一些建议使用excel& amp;部分处理此问题的R除输出外总是49,898种组合,因为它们保持“原始”重复值集。我理解为什么会这样,但我想要完全删除那些重复项,以便我有一个包含Set A独特的13,494组合的最终输出。

[Excel]我使用了以下内容:UniqRemDups <- unique(RemDups[,c('Xcod','Ycod')])

[R]我使用了以下代码中的代码:

{{1}}

How to filter for unique combination of columns from an R dataframe

非常感谢任何帮助/建议。

1 个答案:

答案 0 :(得分:1)

使用mgcv中的uniquecombs函数在R中的一种方式。

data <- structure(list(Xcod = c(4405000L, 4415000L, 4425000L, 4435000L, 
4445000L, 4455000L, 4465000L, 4475000L, 4435000L, 4495000L, 4505000L, 
4515000L, 4525000L, 4535000L, 4545000L, 4555000L, 4565000L, 4575000L, 
4585000L), Ycod = c(4725000L, 4725000L, 4725000L, 4725000L, 4725000L, 
4725000L, 4725000L, 4725000L, 4725000L, 4725000L, 4725000L, 4725000L, 
4725000L, 4725000L, 4725000L, 4725000L, 4725000L, 4725000L, 4725000L
)), .Names = c("Xcod", "Ycod"), class = "data.frame", row.names = c(NA, 
-19L))

library(mgcv)
unique_rows <- uniquecombs(data)