正则表达式Python - unicode到纯文本

时间:2016-01-16 23:23:48

标签: python unicode

任何人都知道一种简单的方法来执行以下操作吗?

给定一个包含'USA'的中文(美国),日文(米国)或韩文(美国)的unicode字符串,编写一个返回普通Python字节字符串的函数,其中“USA”的国际版本被翻译成'USA'英文。 例如:  translate_usa(美国是一个国家。)应该返回'美国是一个国家。'

1 个答案:

答案 0 :(得分:2)

您可以链接str.replace或使用与三个字符串中的任何一个匹配的正则表达式。

>>> import re
>>> usa = (u'美国', u'米国', u'미êµ')
>>> re.sub('|'.join(usa), 'USA', u'美国 is a country.')
u'USA is a country.'