应用错误收集

Python项目字符串从ascii迁移到unicode

时间：2015-09-16 13:36:04

标签： python unicode

我对蟒蛇字符串有一些懒散的麻烦我有一个python 2.x项目，我们在那里的所有字符串都是'blabla' 现在，我们希望将此字符串移动到unicode，而无需使用额外的库__future__或移至python 3或使用sys.setdefaultencoding。我必须点击此全部项目才能将''更改为u''。但并非所有字符串都需要更改，例如对象字段我不想更改：
obj = {'field': field}

一个问题：有没有办法让它自动化？我已经堆积了下一个问题，我的正则表达式[^u]([\'][^\'\"]*[\'])捕获' ' ' '中间部分，它们不是字符串。

现在我有下一个替代品：(\'.*\') - ＆gt; u$1

1 个答案:

答案 0 :(得分：1)

有没有办法让它自动化？

如果你的意思是 - 是否有一个程序可以决定什么类型的字符串（Unicode（u''），bytestring（b''）或native（''））应该是在任意程序中的特定位置使用 - 然后否：没有这样的程序 - 您应该非常仔细地检查每个案例。请参阅Text versus binary data。