如何在R中找到给定字符的unicode索引?

时间:2016-09-27 12:49:03

标签: r string unicode character-encoding

所以,我正在处理文本,并希望删除其他'字符,作为预处理文本的一部分。这似乎很容易。只需在控制台中打印有问题的字符,将其复制粘贴到代码中,然后使用正则表达式删除此字符的所有实例。但是,字符RStudio print不等于字符串中的字符,这意味着:

  

> substr(myString,38,38)
  [1]“'”
  > substr(myString,38,38)==“'”
  [1]错误

在第二行中我手动复制了前一行的输出。所以我的问题是:给定字符串的特定实例中的字符,如何生成等于该字符的内容?

编辑:charToRaw给出e2 80 99作为输出。也:

  

> rawToChar(charToRaw(substr(t,38,38)))
  “’”
  > rawToChar(charToRaw(substr(t,38,38)))== substr(t,38,38)
  FALSE

0 个答案:

没有答案