我正在尝试将csv文件导入Pandas DataFrame。 但是,这是挑战,例如,我不能使用 skiprows = 9 ,因为csv格式不时会不一致,它会在实际表格开始之前包含一些无用的信息。
幸运的是,在表开始之前,总会有一行包含字符串“report field”,然后真实表从下一行开始。
有没有什么方法可以跳过所有行,直到它捕获模式“报告字段”?
感谢。
答案 0 :(得分:0)
df= pandas.read_csv("file.csv",header= None)
df_2= df.iloc[(df.loc[df[0]=='report field'].index[0]+1):, :].reset_index(drop = True)
因此,上面一行搜索"报告字段"值" 0" " df"数据帧,然后从" file.csv"中的下一行到最后一行获取数据。文件