Python 2.X中的拆分和非拉丁字符串

时间:2011-12-01 09:53:39

标签: python utf-8 split

示例:

# -*- coding: utf-8 -*-
my_str = u'Строка ^ с ^ разделителями!' # Russian letters
print my_str.replace(' ', '')
print my_str.replace(' ', '').split('^')

结果:

Строка^с^разделителями!
[u'\u0421\u0442\u0440\u043e\u043a\u0430 ', u' \u0441 ', u' \u0440\u0430\u0437\u0434\u0435\u043b\u0438\u0442\u0435\u043b\u044f\u043c\u0438!']

请帮忙。分裂后如何显示“普通”字符串?

P.S。 文件脚本编码是utf8

1 个答案:

答案 0 :(得分:4)

这些普通字符串,你只是看到它们的内部表示(因为你没有打印字符串,你在第二个例子中打印一个列表)。做

for s in my_str.replace(' ', '').split('^'):
    print s

你会看到。相反,试试

print repr(my_str.replace(' ', ''))

然后看看会发生什么。