我正在处理一个凌乱的数据库,我需要在其中为某些数据列提供格式。为此,我使用了很多GSub和其他形式的正则表达式。我的问题是我需要清理的一些字符是“奇怪的”字符,特别是A上面有卷曲的东西,后跟其他奇怪的字符(Ã')。
当我从数据库中复制然后粘贴我的gsub函数时:
gsub("CALLÑE", "CALLE", data)
它工作正常,直到我关闭和RStudio并重新打开它。然后RScript文件中的字符不同。就好像RStudio本身不支持奇怪的字符,并在重新打开时将它们从脚本中删除:
gsub("CALLÃ'E", "CALLE", data)
我该如何避免这种情况?并且在关闭文件后保留我的怪异角色。
答案 0 :(得分:2)
在RStudio中,转到File
- > Save with Encoding...
选择UTF-8
选项。