我有这样的字节(来自requests.get):
<th class=\"app_result_head\">\u0414\u043e\u043b\u0436\u043d\u0438\u043a<\/th>
如何将此转换为适当的python字符串?:
<th class="app_result_head">Должник</th>
答案 0 :(得分:1)
my_bytes - &#39; bytes&#39;有问题。事实证明,答案很简单。
out = my_bytes.decode('raw_unicode_escape')
out = out.replace('\"', '"')
out = out.replace('\/', "/")
来自raw_unicode_escape的文档:
Latin-1 encoding with \uXXXX and \UXXXXXXXX for other code points.
这正是我所需要的