熊猫-read_html并避免使用某些元素?

时间:2018-08-14 10:47:08

标签: python pandas

我正在使用read_html()table放入df

我面临的问题是columns中的一个具有两个由<hr>分隔的值,我想避免在表中获取该值之后的值,因为整个表对该值都无用了。

元素:

<td align="right">
     600<hr><a id="a0" href="javascript://" onmouseover="showLongTermPopup(this,true,'600','251','349','349','Aug 13, 2019');" onmouseout="showLongTermPopup(this,false);">251</a>
     <div style="position:absolute;display:none;z-index:9999999;width:200px;border:1px solid black;background-color:White;padding:5px;"> </div>
</td>

我相信我可以使用beautifulsoup并删除存在的hr,但想知道pandas read_html()中是否有办法避免某些元素。

0 个答案:

没有答案