Question

我有两套坐标：

设置一个具有49,898个x和y
使用36,404个x和y组合设置B.
（套装A具有套装B中的所有组合以及额外的13,494种组合）
Excel或R中的解决方案都很好

我想提取这套独特的13,494种组合。为了尝试使用Excel或R提取这些唯一值，我复制了Set B的x＆amp; y将组合与A组相同的列进行协调。

表格布局有两列Data -> Advanced Filter -> Unique records only：x and y example

我已阅读了一些建议使用excel＆amp; amp;部分处理此问题的R除输出外总是49,898种组合，因为它们保持“原始”重复值集。我理解为什么会这样，但我想要完全删除那些重复项，以便我有一个包含Set A独特的13,494组合的最终输出。

[Excel]我使用了以下内容：UniqRemDups <- unique(RemDups[,c('Xcod','Ycod')])

[R]我使用了以下代码中的代码：

{{1}}

How to filter for unique combination of columns from an R dataframe

非常感谢任何帮助/建议。

Answer 1

使用mgcv中的uniquecombs函数在R中的一种方式。

data <- structure(list(Xcod = c(4405000L, 4415000L, 4425000L, 4435000L, 
4445000L, 4455000L, 4465000L, 4475000L, 4435000L, 4495000L, 4505000L, 
4515000L, 4525000L, 4535000L, 4545000L, 4555000L, 4565000L, 4575000L, 
4585000L), Ycod = c(4725000L, 4725000L, 4725000L, 4725000L, 4725000L, 
4725000L, 4725000L, 4725000L, 4725000L, 4725000L, 4725000L, 4725000L, 
4725000L, 4725000L, 4725000L, 4725000L, 4725000L, 4725000L, 4725000L
)), .Names = c("Xcod", "Ycod"), class = "data.frame", row.names = c(NA, 
-19L))

library(mgcv)
unique_rows <- uniquecombs(data)

对于两组坐标，提取Set A的唯一行而不是Set B.

1 个答案: