我正在使用以下命令将csv文件读入python中
df = pd.read_csv(r"C:\csvfile.csv")
但是该文件具有一些摘要数据,并且如果找到值“ valx”,则原始数据将开始。如果找不到“ valx”,则该文件无用。我想创建在找到“ valx”时开始的新闻数据帧。我尝试了一段时间没有成功。非常感谢您提供有关实现此目标的帮助。
答案 0 :(得分:0)
不幸的是,pandas只接受skiprows
来跳过开头的行。您可能要在创建数据框之前解析文件。
例如:
import csv
with open(r"C:\csvfile.csv","r") as f:
lines = csv.reader(f, newline = '')
if any('valx' in i for i in lines):
data = lines
使用标准库csv模块,您可以读取文件并检查文件中是否valx
,如果找到,则将在data
变量中返回内容。
从那里,您可以使用data变量创建数据框。