Python项目字符串从ascii迁移到unicode

时间:2015-09-16 13:36:04

标签: python unicode

我对蟒蛇字符串有一些懒散的麻烦 我有一个python 2.x项目,我们在那里的所有字符串都是'blabla' 现在,我们希望将此字符串移动到unicode,而无需使用额外的库__future__或移至python 3或使用sys.setdefaultencoding。 我必须点击此全部项目才能将''更改为u''。但并非所有字符串都需要更改,例如对象字段我不想更改:
obj = {'field': field}

一个问题:有没有办法让它自动化?我已经堆积了下一个问题,我的正则表达式[^u]([\'][^\'\"]*[\'])捕获' ' ' '中间部分,它们不是字符串。

现在我有下一个替代品:(\'.*\') - > u$1

1 个答案:

答案 0 :(得分:1)

  

有没有办法让它自动化?

如果你的意思是 - 是否有一个程序可以决定什么类型的字符串(Unicode(u''),bytestring(b'')或native(''))应该是在任意程序中的特定位置使用 - 然后否:没有这样的程序 - 您应该非常仔细地检查每个案例。请参阅Text versus binary data