R:查找类似/“重复”的文本数据对

时间:2018-11-07 04:12:19

标签: r excel if-statement

我有2列地址,它们不是完全重复的,但是我想传递一个代码,如果第1列地址的前5个字符与第2列地址的前5个字符匹配,则为true,否则为true错误。

这是我现在的数据

第1列


2310 Aldergrove Ave


3901海恩城堡

第2列

2310Aldergrove

3901城堡

因此,由于前四个字符都匹配,因此我希望我的第三列都说True,True。

1 个答案:

答案 0 :(得分:1)

尝试:

data <- data.frame(col1=c("2310 Aldergrove Ave", "3901 Castle Hayne"), 
                   col2=c("2310Aldergrove", "3901Castle"))
substr(gsub(" ", "", data$col1), 1, 5) == substr(data$col2, 1, 5)
[1] TRUE TRUE