我想从网站中提取数据表。 Pandas read_html提供HTTP错误403.是否有任何其他模块可以通过python提取数据。
答案 0 :(得分:1)
屏蔽您的会话,就像使用浏览器一样:
import requests
header = {
"User-Agent": "Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.75 Safari/537.36",
"X-Requested-With": "XMLHttpRequest"
}
r = requests.get(url, headers=header)
dfs = pd.read_html(r.text)