Read_HTML跳过一些不起作用的行

时间:2018-05-13 21:45:06

标签: python-3.x pandas html-table

我试图从网站上搜索我的标题位于第1行的表格,我需要跳过第0行和第2行。我尝试以下内容

tables=pd.read_html(table.get_attribute('outerHTML'),header=0,skiprows=[0,2])

这样做是跳过第0,1和2行,然后获取第4行的标题。了解问题是在问题中,我已尝试过以下方法:

skiprows=[[0],[2]] error list not hashable
header=0,skiprows=(0,2) here gets header of row 1, but skips rows 0,2 and 3 (why 3?)
skiprows=0,2 error because it is giving too many arguments

简而言之,我需要将标题行放1,并跳过第0行和第2行,我不知道如何使其正常工作

1 个答案:

答案 0 :(得分:0)

好的,最后这是正确答案

tables=pd.read_html(table.get_attribute('outerHTML'),header=0,skiprows=(0,2))

发生了什么事情之后,我没有'删除我以前的方法来删除那个额外的列,这是

tables[0].drop(tables[0].head(1).index,inplace=True)

这使得表不仅下降了第2行,而且之后第3行也下降了。