我有一个非常大的工作项目(在Java中),并且在迁移到UTF-8后改变了编码。 我在python中编写脚本来替换每个" Unicode替换字符" (�)但我在这方面遇到了麻烦:
if ("�" in word) :
// replace word for proper one
显然这不起作用,因为Python解释器并不了解特殊字符。我查了一下,找到了像你这样的东西。\ uFFD"但是无法使它发挥作用。
答案 0 :(得分:0)
如果我误解了你的问题,我会删除这个答案,但是在Python 3中(以及进一步测试Python 2)你可以处理像#34;�"就像任何其他角色一样:
foo bar
baz REPLACEMENT
<强>输出强>
{{1}}