匹配包含引号的文本字符串,引号的编码方式不同

时间:2018-08-21 20:57:30

标签: r dplyr stringr fuzzyjoin

我有两个包含相同信息的数据帧。第一个包含唯一标识符。我希望用户dplyr::inner_join通过标题进行匹配。

不幸的是,其中一个数据框包含{“}表示引号,而另一个仅使用单引号

例如,我想匹配下面显示的两个标题。

The {"}Level of Readiness{"} for HCV treatment
The 'Level of Readiness' for HCV treatment

1 个答案:

答案 0 :(得分:1)

您可以使用gsub将其转换为单引号,但是需要将{"}用单引号括起来并将'用双引号括起来。请注意,fixed = TRUE'{"}'视为原义字符串而不是正则表达式:

gsub('{"}', "'", 'The {"}Level of Readiness{"} for HCV treatment', fixed = TRUE)
# [1] "The 'Level of Readiness' for HCV treatment"