Question

我正在尝试将csv文件导入Pandas DataFrame。但是，这是挑战，例如，我不能使用 skiprows = 9 ，因为csv格式不时会不一致，它会在实际表格开始之前包含一些无用的信息。

幸运的是，在表开始之前，总会有一行包含字符串“report field”，然后真实表从下一行开始。

有没有什么方法可以跳过所有行，直到它捕获模式“报告字段”？

感谢。

Answer 1

df= pandas.read_csv("file.csv",header= None)
df_2= df.iloc[(df.loc[df[0]=='report field'].index[0]+1):, :].reset_index(drop = True)

因此，上面一行搜索＆＃34;报告字段＆＃34;值＆＃34; 0＆＃34; ＆＃34; df＆＃34;数据帧，然后从＆＃34; file.csv＆＃34;中的下一行到最后一行获取数据。文件