如何获得中文的文本解码?

时间:2016-07-27 10:25:27

标签: python encoding utf-8 python-requests

在request.get(url)的结果的中文部分中的Python是

“æ??¯ä¸?§§?Å?ä以è??ªç?±å?åå?¸ç?????????????”

以这种方式出现。

如何解码你能打印中文字符吗?

在以下方法中,将输出源语句和其他语句。

  1. result.content.decode( “GBK”, “忽略”)。编码( “UTF-8”, “忽略”)
  2. content.encode( 'UTF-8')。解码( 'GBK')
  3. 网站示例在这里。 https://lvyou.baidu.com/notes/20fd27d671563fe1e8927d21?sid=9739db6e97289b7e6b22f9ea?request_id=831992042&idx=0

    让我们知道真的很感激。

1 个答案:

答案 0 :(得分:0)

问题已经解决。

在请求中设置编码选项,我们能够获得所需的值。

非常感谢。

sub_result = requests.get(sub_url)
sub_result.encoding = 'utf-8'
sub_soup = BeautifulSoup(sub_result.text, 'lxml')