我试图在R中的两个数据帧上执行左外连接,我得到了一些奇怪的行为。第一个数据帧(a)包含509100个元素(行),第二个数据帧(b)包含325020个行。我用于左外连接的函数如下:
merge(a, b, by=c("ID","SEQUENCE"), all.x = T, all.y = F)
结果数据框现在包含513248行。我在脚本中使用了相同参数配置的相同方法,并且工作正常(即,生成的数据帧与在合并函数中作为参数传递的第一个数据帧具有相同的行数)。我还在两个数据帧的每一个中创建了一个列,作为ID_SEQUENCE的组合(在字符级别,例如ID = 345和SEQUENCE = 4,然后结果值是345_4),以避免在多个列上合并,如果这会引发问题,但结果是相同的... 513248行而不是预期的509100.任何想法为什么会发生这种情况或我做错了什么?