比较两列字符串以进行逐行文本匹配

时间:2017-04-11 12:33:46

标签: r text match

在单个数据集(QueryTM)中,我有两列Query和TM。我想检查Query是否包含TM的值(在同一行中)。考虑一个例子,如果TM是“可口可乐”而查询是“可口可乐印度”,则查询应与​​TM匹配。但是,如果查询是“Coca Colala India”,则不应该匹配。结果将存储在另一列中,例如Result

我使用R作为平台。

1 个答案:

答案 0 :(得分:0)

您需要添加单词边界以捕获精确匹配。使用 services: inventory: git_url: git@github.com:launchany/microservices-node-inventory.git git_branch: master command: npm start build_root: . ports: - container: 8080 http: 80 https: 443 env_vars: NODE_ENV: production databases: - mongodb 即可,

mapply

数据

dd$result <- mapply(grepl, paste0('\\b', dd$TM, '\\b'), dd$Query)

dd
#            TM              Query result
#1    Coca Cola  Coca Colala India  FALSE
#2 Fanta Orange Fanta Orange India   TRUE