是否可以在不使用Python编写FTP文件的情况下读取它们?

时间:2012-06-26 13:56:31

标签: python ftp ftplib

我正在尝试使用Python的ftplib读取文件而不编写它们。大致等同于:

def get_page(url):
    try:
        return urllib.urlopen(url).read()
    except:
        return ""

但使用FTP。

我试过了:

def get_page(path):
    try:
        ftp = FTP('ftp.site.com', 'anonymous', 'passwd')
        return ftp.retrbinary('RETR '+path, open('page').read())
    except:
        return ''

但这不起作用。文档中的唯一示例涉及使用ftp.retrbinary('RETR README', open('README', 'wb').write)格式编写文件。是否可以在不先写入的情况下读取ftp文件?

1 个答案:

答案 0 :(得分:46)

嗯,你的答案就在你面前:retrbinary方法接受第二个参数,即每当从ftp连接中检索文件内容时调用的函数的引用。

这是一个简单的例子:

#!/usr/bin/env python
from ftplib import FTP

def writeFunc(s):
  print "Read: " + s

ftp = FTP('ftp.kernel.org') 
ftp.login()
ftp.retrbinary('RETR /pub/README_ABOUT_BZ2_FILES', writeFunc)

您应该实现writeFunc,以便它实际将读取的数据附加到内部变量,类似于此,它使用可调用对象:

#!/usr/bin/env python
from ftplib import FTP

class Reader:
  def __init__(self):
    self.data = ""
  def __call__(self,s):
     self.data += s

ftp = FTP('ftp.kernel.org') 
ftp.login()
r = Reader()
ftp.retrbinary('RETR /pub/README_ABOUT_BZ2_FILES', r)

print r.data

更新:我意识到Python标准库中有一个用于此类事情的模块,StringIO:

#!/usr/bin/env python
from ftplib import FTP
from io import StringIO

ftp = FTP('ftp.kernel.org') 
ftp.login()
r = StringIO()
ftp.retrbinary('RETR /pub/README_ABOUT_BZ2_FILES', r.write)

print r.getvalue()

更新2: StringIO已经进入了io。合并@TimRichardson的评论。: