我有一个文件夹big
,其中包含一百万个文件。我编写了一个代码,在其中将符合特定条件的文件复制到另一个文件夹中。我认为文件夹big
中有空文件,因为复制了几个文件后,出现错误“没有可从文件解析的列”。
为避免此问题,我尝试使用delim_whitespace=true
df = pd.read_csv("big/"+i, parse_dates=True, delim_whitespace=True)
但是随后我成为KeyError:“时间”。时间是每个文件中一列的标题。我认为是因为某些文件为空时不存在“时间”列?我只是假设问题是有空文件,但不确定。有什么办法可以忽略这些文件吗?
for i in result:
df = pd.read_csv("big/"+i, parse_dates=True, delim_whitespace=True)
df['time'] = pd.to_datetime(df['time'])
df['just_dates'] = df['time'].dt.date
days=abs(( df['just_dates'].min() - df['just_dates'].max()).days)
if days > 55:
copy("big/"+i,"twomonth/"+i)