我有2列地址,它们不是完全重复的,但是我想传递一个代码,如果第1列地址的前5个字符与第2列地址的前5个字符匹配,则为true,否则为true错误。
这是我现在的数据
2310 Aldergrove Ave
3901海恩城堡
2310Aldergrove
3901城堡
因此,由于前四个字符都匹配,因此我希望我的第三列都说True,True。
答案 0 :(得分:1)
尝试:
data <- data.frame(col1=c("2310 Aldergrove Ave", "3901 Castle Hayne"),
col2=c("2310Aldergrove", "3901Castle"))
substr(gsub(" ", "", data$col1), 1, 5) == substr(data$col2, 1, 5)
[1] TRUE TRUE