标签: python pandas web-scraping
我正在抓取一个网页,并且该页面中有一个html表。我希望将此表解析为熊猫数据框。我使用了pandas.read_html,它可以工作。但是,一列的条目是超链接的,我也需要提取那些超链接。有什么建议吗?
示例
颜色0颜色1颜色2
0 123 abc
1 567 efg
2 901 igk
现在,我使数据框具有所有条目,但没有基础链接。最终,我希望在数据框中添加具有基础条目的另一列,但现在,我希望提取基础的link1,link2和link3。
谢谢