在R中的列上使用子字符串

时间:2015-01-08 00:14:46

标签: r substring

我如何使用子字符串仅使用数据表中邮政编码的前3位数字?

YEAR    PERSON    POSTALCODE   STORE_ID
2012    245345    M2H 2I4       20001319
2012    234324    L6N 3R5       20001319
2012    556464    L6N 4T5       20001319

这是我试过的一段代码,但是在我添加代码的子串部分后,我的数据表出现了0个对象(我猜我犯了一个非常愚蠢的错误):

combined <- merge(df1, df2, by.y="PERSON")
store1  <- combined[combined$STORE_ID == 20001319 && substr(combined$POSTALCODE, 1, 3), ]  

1 个答案:

答案 0 :(得分:6)

substr(combined$POSTALCODE, 1, 3)为您提供

# [1] "M2H" "L6N" "L6N"

所以一种可能的选择可能是

combined[combined$STORE_ID == 20001319 & substr(combined$POSTALCODE, 1, 3) == "M2H", ]为您提供子集

#   YEAR PERSON POSTALCODE STORE_ID
# 1 2012 245345    M2H 2I4 20001319