我已经从.csv导入了以UTF-8编码的文本-否则Excel会告诉我。现在,我有一行特定的文本:mystring="drück dir die Daumen"
,我怀疑它具有ASCII控制字符。所以我使用gsub("[:cntrl:]", "XX", "Ich drück dir die Daumen")
并得到"dXXüXXk diXX die DaumeXX"
,这是错误的。
我测试了该字符串是否实际上是由Encoding(mystring)
编码的UTF-8,它实际上给了我UTF-8
。
这与我有关,因为我需要识别标点符号。但是,当我尝试替换字符串中的)
(例如"a) this is an enumeration"
)时,gsub()
不会删除括号。
我担心这个问题可能无法重现...仍然欢迎任何帮助。