我有以下疑问:
cc <- c(1,3,4,6) # some vector with positive integers, max(cc)<=nrow(df)
df1 <- df[cc,]
df2 <- df[-cc,]
n <- nrow(df1)+nrow(df2)
当数据框df有大量行时,比如大约10M且length(cc)
大约是1M,那么为什么n
不等于nrow(df)
?
我想不出任何理由......
答案 0 :(得分:0)
原因是向量cc
中的重复。 cc=unique(cc)
会给我们nrow(df1)+nrow(df2)=n
。