如何忽略文件夹中的空文件?

时间:2019-06-11 15:06:16

标签: python pandas error-handling

我有一个文件夹big,其中包含一百万个文件。我编写了一个代码,在其中将符合特定条件的文件复制到另一个文件夹中。我认为文件夹big中有空文件,因为复制了几个文件后,出现错误“没有可从文件解析的列”。 为避免此问题,我尝试使用delim_whitespace=true

df = pd.read_csv("big/"+i, parse_dates=True, delim_whitespace=True)

但是随后我成为KeyError:“时间”。时间是每个文件中一列的标题。我认为是因为某些文件为空时不存在“时间”列?我只是假设问题是有空文件,但不确定。有什么办法可以忽略这些文件吗?

for i in result:
    df = pd.read_csv("big/"+i, parse_dates=True, delim_whitespace=True)
    df['time'] = pd.to_datetime(df['time'])
    df['just_dates'] = df['time'].dt.date
    days=abs(( df['just_dates'].min() - df['just_dates'].max()).days)
    if days > 55:
        copy("big/"+i,"twomonth/"+i)

0 个答案:

没有答案