Python将字符从Unicode转换为HTML

时间:2013-04-19 13:56:45

标签: python python-2.7

嘿伙计们我试图在python 2.7.3中转换它:

the+c\xf8\xf8n

到html字符串:

the+c%C3%B8%C3%B8n

原来是c\xf8\xf8n,但我确实使用了替换来使用+而不是空格。

我不完全确定后者是什么约定我会使用字符串替换,但约定会因不同的字符而改变。

思考?谢谢你们

1 个答案:

答案 0 :(得分:1)

您是网址编码,而不是HTML。使用urllib.quote

from urllib import quote

但请确保先编码为UTF-8

quote(inputstring.encode('utf8'))

这将明确引用+;如果你的意思是空间角色,你需要将其标记为安全:

quote(inputstring.encode('utf8'), '+')

后一种形式给出:

>>> quote(inputstring.encode('utf8'), '+')
'the+c%C3%B8%C3%B8n'