嘿伙计们我试图在python 2.7.3中转换它:
the+c\xf8\xf8n
到html字符串:
the+c%C3%B8%C3%B8n
原来是c\xf8\xf8n
,但我确实使用了替换来使用+而不是空格。
我不完全确定后者是什么约定我会使用字符串替换,但约定会因不同的字符而改变。
思考?谢谢你们
答案 0 :(得分:1)
您是网址编码,而不是HTML。使用urllib.quote
:
from urllib import quote
但请确保先编码为UTF-8
:
quote(inputstring.encode('utf8'))
这将明确引用+
;如果你的意思是空间角色,你需要将其标记为安全:
quote(inputstring.encode('utf8'), '+')
后一种形式给出:
>>> quote(inputstring.encode('utf8'), '+')
'the+c%C3%B8%C3%B8n'