我正在使用read_html()
将table
放入df
。
我面临的问题是columns
中的一个具有两个由<hr>
分隔的值,我想避免在表中获取该值之后的值,因为整个表对该值都无用了。
元素:
<td align="right">
600<hr><a id="a0" href="javascript://" onmouseover="showLongTermPopup(this,true,'600','251','349','349','Aug 13, 2019');" onmouseout="showLongTermPopup(this,false);">251</a>
<div style="position:absolute;display:none;z-index:9999999;width:200px;border:1px solid black;background-color:White;padding:5px;"> </div>
</td>
我相信我可以使用beautifulsoup
并删除存在的hr
,但想知道pandas read_html()
中是否有办法避免某些元素。