我对蟒蛇字符串有一些懒散的麻烦
我有一个python 2.x项目,我们在那里的所有字符串都是'blabla'
现在,我们希望将此字符串移动到unicode,而无需使用额外的库__future__
或移至python 3
或使用sys.setdefaultencoding
。
我必须点击此全部项目才能将''
更改为u''
。但并非所有字符串都需要更改,例如对象字段我不想更改:
obj = {'field': field}
一个问题:有没有办法让它自动化?我已经堆积了下一个问题,我的正则表达式[^u]([\'][^\'\"]*[\'])
捕获' ' ' '
中间部分,它们不是字符串。
现在我有下一个替代品:(\'.*\')
- > u$1
答案 0 :(得分:1)
有没有办法让它自动化?
如果你的意思是 - 是否有一个程序可以决定什么类型的字符串(Unicode(u''
),bytestring(b''
)或native(''
))应该是在任意程序中的特定位置使用 - 然后否:没有这样的程序 - 您应该非常仔细地检查每个案例。请参阅Text versus binary data。