在不同数量的标头数据Python Pandas之后创建所有行的数据帧

时间:2016-06-25 12:19:39

标签: python pandas

我的数据帧有不同数量的标题数据。 我需要删除标题数据,(即创建一个只包含此标题后面的数据的新数据框)

我使用以下代码查找标题数据结束的行。

df = xlsx_file.parse('ActualSheet',header= None)    
value_list = ['var1','var2']
df_Header = df[df[0].isin(value_list) & (df[1].isin(value_list))] 

上面的代码可以工作并创建最后一行标题数据的数据框。

我在原始数据中创建新数据框时遇到问题,原始数据只包含行 AFTER 这个“df_Header”行。

任何帮助都表示赞赏,我知道答案已经存在,但我找不到它。

1 个答案:

答案 0 :(得分:1)

IIUC你可以这样做:

df = df[df_Header.index.max():]

df = df[~(df[0].isin(value_list) & (df[1].isin(value_list)))] 

PS您可能还想使用read_excel()函数的header和/或skiprows参数