Python Pandas:使用pd.read_csv按特定模式(不是行号)跳过行

时间:2017-06-28 04:01:40

标签: python python-2.7

我正在尝试将csv文件导入Pandas DataFrame。 但是,这是挑战,例如,我不能使用 skiprows = 9 ,因为csv格式不时会不一致,它会在实际表格开始之前包含一些无用的信息。

幸运的是,在表开始之前,总会有一行包含字符串“report field”,然后真实表从下一行开始。

有没有什么方法可以跳过所有行,直到它捕获模式“报告字段”?

感谢。

1 个答案:

答案 0 :(得分:0)

df= pandas.read_csv("file.csv",header= None)
df_2= df.iloc[(df.loc[df[0]=='report field'].index[0]+1):, :].reset_index(drop = True)

因此,上面一行搜索"报告字段"值" 0" " df"数据帧,然后从" file.csv"中的下一行到最后一行获取数据。文件