从网站提取数据表

时间:2017-02-20 11:01:52

标签: python-3.x pandas

我想从网站中提取数据表。 Pandas read_html提供HTTP错误403.是否有任何其他模块可以通过python提取数据。

以下是网站:https://pakstockexchange.com/stock2/index_new.php?section=research&page=show_price_table_new&symbol=ABOT

1 个答案:

答案 0 :(得分:1)

屏蔽您的会话,就像使用浏览器一样:

import requests

header = {
  "User-Agent": "Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.75 Safari/537.36",
  "X-Requested-With": "XMLHttpRequest"
}

r = requests.get(url, headers=header)

dfs = pd.read_html(r.text)