硒浏览器驱动程序解码错误

时间:2019-04-29 12:03:42

标签: python selenium google-chrome selenium-webdriver

由于中文,浏览器会解码页面源错误,而我无法使用Python解码为正确的内容 enter image description here

但是对于浏览器,它可以正确显示...

如何解码页面源以获取正确的内容?

the api url the page url

这是我的代码:


from selenium import webdriver

driver = webdriver.Chrome("/home/ug/Desktop/bin/chromedriver")

# the url is the `api url`       
driver.get("http://data.stats.gov.cn/easyquery.htm?m=QueryData&dbcode=fsjd&rowcode=zb&colcode=sj&wds=%5B%7B%22wdcode%22%3A%22reg%22%2C%22valuecode%22%3A%22350000%22%7D%5D&dfwds=%5B%5D&k1=1555920886106")

driver.page_source

1 个答案:

答案 0 :(得分:0)

我通过执行javascript解决了这个问题。

首先,我使用driver.get("http://data.stats.gov.cn"), 接下来,driver.execute_script('$.ajax...'),然后将返回值设置为页面内容,

现在,页面源已正确解码...

我认为这是ajax有效的