我在一个包含15.000个条目的数据框中有2列。
col1 col2
mike anna
eve charly
george mike
jenn george
我想知道,Col1中的哪些条目比Col2中的条件高一些。
我已经有了一个解决方案,我通过Col1中的每个条目循环并检查它在Col2中的位置,但是需要15.000英寸的时间:
for(i in 1:nrow(df)){
myposinCol2 <- grep(df[i,1], df[,2])
if(myposinCol2[1] > (i + 500)){ #take it }
}
有人能指出我改进这个方向吗?
THX 约尔格
答案 0 :(得分:1)
事实上它非常简单 - 如果这是你正在寻找的东西:
import * as io from "socket.io-client";
希望这有帮助!
答案 1 :(得分:0)
这是一个dplyr解决方案,用于计算col1和col2中每个名称的等级之间的距离。
library(dplyr)
library(tidyr)
add_rownames(d) %>%
gather(key, name, -rowname) %>%
group_by(name) %>%
arrange(key) %>%
summarise(diff=as.numeric(first(rowname)) - as.numeric(last(rowname)))
然后,如果你只想要在col2中出现500个等级的名字:
%>% filter(diff < -500)