我的数据帧有不同数量的标题数据。 我需要删除标题数据,(即创建一个只包含此标题后面的数据的新数据框)
我使用以下代码查找标题数据结束的行。
df = xlsx_file.parse('ActualSheet',header= None)
value_list = ['var1','var2']
df_Header = df[df[0].isin(value_list) & (df[1].isin(value_list))]
上面的代码可以工作并创建最后一行标题数据的数据框。
我在原始数据中创建新数据框时遇到问题,原始数据只包含行 AFTER 这个“df_Header”行。
任何帮助都表示赞赏,我知道答案已经存在,但我找不到它。
答案 0 :(得分:1)
IIUC你可以这样做:
df = df[df_Header.index.max():]
或
df = df[~(df[0].isin(value_list) & (df[1].isin(value_list)))]
PS您可能还想使用read_excel()函数的header
和/或skiprows
参数