应用错误收集

我正在使用read_html()将table放入df。

我面临的问题是columns中的一个具有两个由<hr>分隔的值，我想避免在表中获取该值之后的值，因为整个表对该值都无用了。

元素：

<td align="right">
     600<hr><a id="a0" href="javascript://" onmouseover="showLongTermPopup(this,true,'600','251','349','349','Aug 13, 2019');" onmouseout="showLongTermPopup(this,false);">251</a>
     <div style="position:absolute;display:none;z-index:9999999;width:200px;border:1px solid black;background-color:White;padding:5px;"> </div>
</td>

我相信我可以使用beautifulsoup并删除存在的hr，但想知道pandas read_html()中是否有办法避免某些元素。

熊猫-read_html并避免使用某些元素？

0 个答案: