gsub错误地识别[:cntrl:]个字符

时间:2019-01-06 20:59:54

标签: r string utf-8

我已经从.csv导入了以UTF-8编码的文本-否则Excel会告诉我。现在,我有一行特定的文本:mystring="drück dir die Daumen",我怀疑它具有ASCII控制字符。所以我使用gsub("[:cntrl:]", "XX", "Ich drück dir die Daumen")并得到"dXXüXXk diXX die DaumeXX",这是错误的。 我测试了该字符串是否实际上是由Encoding(mystring)编码的UTF-8,它实际上给了我UTF-8

这与我有关,因为我需要识别标点符号。但是,当我尝试替换字符串中的)(例如"a) this is an enumeration")时,gsub()不会删除括号。

我担心这个问题可能无法重现...仍然欢迎任何帮助。

0 个答案:

没有答案