如何从FTP服务器删除超过7天的Python脚本文件?

时间:2010-05-19 15:57:32

标签: python file ftp delete-file

我想写一个Python脚本,它允许我在达到一定年龄后从FTP服务器中删除文件。我准备了下面的scipt,但它会抛出错误消息:WindowsError: [Error 3] The system cannot find the path specified: '/test123/*.*'

有人知道如何解决此问题吗?提前谢谢!

import os, time
from ftplib import FTP

ftp = FTP('127.0.0.1')
print "Automated FTP Maintainance"
print 'Logging in.'
ftp.login('admin', 'admin')

# This is the directory that we want to go to
path = 'test123'
print 'Changing to:' + path
ftp.cwd(path)
files = ftp.retrlines('LIST')
print 'List of Files:' + files 
#--everything works fine until here!...

#--The Logic which shall delete the files after the are 7 days old--
now = time.time()
for f in os.listdir(path):
  if os.stat(f).st_mtime < now - 7 * 86400:
    if os.path.isfile(f):
        os.remove(os.path.join(path, f))
except:
    exit ("Cannot delete files")

print 'Closing FTP connection'
ftp.close()

5 个答案:

答案 0 :(得分:9)

行。假设您的FTP服务器支持MLSD命令,请使用以下代码创建一个模块(这是我用来将远程FTP站点与本地目录同步的脚本中的代码):

模块代码

# for python ≥ 2.6
import sys, os, time, ftplib
import collections
FTPDir= collections.namedtuple("FTPDir", "name size mtime tree")
FTPFile= collections.namedtuple("FTPFile", "name size mtime")

class FTPDirectory(object):
    def __init__(self, path='.'):
        self.dirs= []
        self.files= []
        self.path= path

    def getdata(self, ftpobj):
        ftpobj.retrlines('MLSD', self.addline)

    def addline(self, line):
        data, _, name= line.partition('; ')
        fields= data.split(';')
        for field in fields:
            field_name, _, field_value= field.partition('=')
            if field_name == 'type':
                target= self.dirs if field_value == 'dir' else self.files
            elif field_name in ('sizd', 'size'):
                size= int(field_value)
            elif field_name == 'modify':
                mtime= time.mktime(time.strptime(field_value, "%Y%m%d%H%M%S"))
        if target is self.files:
            target.append(FTPFile(name, size, mtime))
        else:
            target.append(FTPDir(name, size, mtime, self.__class__(os.path.join(self.path, name))))

    def walk(self):
        for ftpfile in self.files:
            yield self.path, ftpfile
        for ftpdir in self.dirs:
            for path, ftpfile in ftpdir.tree.walk():
                yield path, ftpfile

class FTPTree(FTPDirectory):
    def getdata(self, ftpobj):
        super(FTPTree, self).getdata(ftpobj)
        for dirname in self.dirs:
            ftpobj.cwd(dirname.name)
            dirname.tree.getdata(ftpobj)
            ftpobj.cwd('..')

单个目录案例

如果您想处理目录的文件,可以:

import ftplib, time

quite_old= time.time() - 7*86400 # seven days

site= ftplib.FTP(hostname, username, password)
site.cwd(the_directory_to_work_on) # if it's '.', you can skip this line
folder= FTPDirectory()
folder.getdata(site) # get the filenames
for path, ftpfile in folder.walk():
    if ftpfile.mtime < quite_old:
        site.delete(ftpfile.name)

这应该做你想要的。

目录及其后代

现在,如果这应该以递归方式工作,则必须在“单目录案例”的代码中进行以下两项更改:

folder= FTPTree()

site.delete(os.path.join(path, ftpfile.name))

可能需要警告

我使用的服务器在STORDELE命令中的相对路径没有任何问题,因此具有相对路径的site.delete也有效。如果您的FTP服务器需要无路径文件名,则应首先.cwd提供path.delete普通ftpfile.name,然后.cwd返回基本文件夹。

答案 1 :(得分:3)

我不得不这样做,花了一段时间,以为我可以节省一些时间在这里。我们正在使用安装了ftputil模块的python:

#! /usr/bin/python
import time
import ftputil
host = ftputil.FTPHost('ftphost.com', 'username', 'password')
mypath = 'ftp_dir'
now = time.time()
host.chdir(mypath)
names = host.listdir(host.curdir)
for name in names:
    if host.path.getmtime(name) < (now - (7 * 86400)):
      if host.path.isfile(name):
         host.remove(name)


print 'Closing FTP connection'
host.close()

答案 2 :(得分:2)

好的,而不是分析你已经发布的代码,这里是一个例子,可能会让你走上正确的轨道。

from ftplib import FTP
import re

pattern = r'.* ([A-Z|a-z].. .. .....) (.*)'

def callback(line):
    found = re.match(pattern, line)
    if (found is not None):
        print found.groups()

ftp = FTP('myserver.wherever.com')
ftp.login('elvis','presley')
ftp.cwd('testing123')
ftp.retrlines('LIST',callback)

ftp.close()
del ftp

运行它,你会得到类似这样的输出,这应该是你想要实现的目标的开始。要完成它,您需要将第一个结果解析为日期时间,将其与“now”进行比较,并使用ftp.delete()删除远程文件(如果它太旧)。

>>> 
('May 16 13:47', 'Thumbs.db')
('Feb 16 17:47', 'docs')
('Feb 23  2007', 'marvin')
('May 08  2009', 'notes')
('Aug 04  2009', 'other')
('Feb 11 18:24', 'ppp.xml')
('Jan 20  2010', 'reports')
('Oct 10  2005', 'transition')
>>> 

答案 3 :(得分:0)

嗯,看起来您看到的错误与您尝试从本地计算机而不是FTP站点删除“test123”目录这一事实有关。 FTP文档有一个名为delete的方法,这就是您要用来删除文件的方法。至于测试某些东西是否有7天之久,您可能实际上必须暂时从FTP中删除这些文件,然后在使用FTP.delete之前检查修改时间。

答案 4 :(得分:0)

你在运行什么操作系统?文件路径/test123/*.*是Unix风格的,但消息显示为WindowsError。您是否正在使用ftp LIST命令的输出,该命令是Unix风格的,并尝试在Windows脚本中逐字使用它?