使用panda.read_html使用超链接条目刮擦html表

时间:2018-09-25 23:36:19

标签: python pandas web-scraping

我正在抓取一个网页,并且该页面中有一个html表。我希望将此表解析为熊猫数据框。我使用了pandas.read_html,它可以工作。但是,一列的条目是超链接的,我也需要提取那些超链接。有什么建议吗?

示例

颜色0颜色1颜色2

0 123 abc

1 567 efg

2 901 igk

现在,我使数据框具有所有条目,但没有基础链接。最终,我希望在数据框中添加具有基础条目的另一列,但现在,我希望提取基础的link1,link2和link3。

谢谢

0 个答案:

没有答案