我正在尝试使用Python的ftplib读取文件而不编写它们。大致等同于:
def get_page(url):
try:
return urllib.urlopen(url).read()
except:
return ""
但使用FTP。
我试过了:
def get_page(path):
try:
ftp = FTP('ftp.site.com', 'anonymous', 'passwd')
return ftp.retrbinary('RETR '+path, open('page').read())
except:
return ''
但这不起作用。文档中的唯一示例涉及使用ftp.retrbinary('RETR README', open('README', 'wb').write)
格式编写文件。是否可以在不先写入的情况下读取ftp文件?
答案 0 :(得分:46)
嗯,你的答案就在你面前:retrbinary方法接受第二个参数,即每当从ftp连接中检索文件内容时调用的函数的引用。
这是一个简单的例子:
#!/usr/bin/env python
from ftplib import FTP
def writeFunc(s):
print "Read: " + s
ftp = FTP('ftp.kernel.org')
ftp.login()
ftp.retrbinary('RETR /pub/README_ABOUT_BZ2_FILES', writeFunc)
您应该实现writeFunc,以便它实际将读取的数据附加到内部变量,类似于此,它使用可调用对象:
#!/usr/bin/env python
from ftplib import FTP
class Reader:
def __init__(self):
self.data = ""
def __call__(self,s):
self.data += s
ftp = FTP('ftp.kernel.org')
ftp.login()
r = Reader()
ftp.retrbinary('RETR /pub/README_ABOUT_BZ2_FILES', r)
print r.data
更新:我意识到Python标准库中有一个用于此类事情的模块,StringIO:
#!/usr/bin/env python
from ftplib import FTP
from io import StringIO
ftp = FTP('ftp.kernel.org')
ftp.login()
r = StringIO()
ftp.retrbinary('RETR /pub/README_ABOUT_BZ2_FILES', r.write)
print r.getvalue()
更新2: StringIO已经进入了io。合并@TimRichardson的评论。: