Question

我的数据帧有不同数量的标题数据。我需要删除标题数据，（即创建一个只包含此标题后面的数据的新数据框）

我使用以下代码查找标题数据结束的行。

df = xlsx_file.parse('ActualSheet',header= None)    
value_list = ['var1','var2']
df_Header = df[df[0].isin(value_list) & (df[1].isin(value_list))]

上面的代码可以工作并创建最后一行标题数据的数据框。

我在原始数据中创建新数据框时遇到问题，原始数据只包含行 AFTER 这个“df_Header”行。

任何帮助都表示赞赏，我知道答案已经存在，但我找不到它。

Answer 1

IIUC你可以这样做：

df = df[df_Header.index.max():]

或

df = df[~(df[0].isin(value_list) & (df[1].isin(value_list)))]

PS您可能还想使用read_excel()函数的header和/或skiprows参数