self.agent = Agent(reactor, pool=pool)
self.deferred = self.agent.request(
'GET',
self.url,
Headers({'User-Agent': ['Mozilla/5.0']})
)
self.deferred.addCallback(self.gotResponse)
但是gotResponse要求接收数据的每一部分,而不是全部。我可以收集它,但是如何知道我得到了所有数据?
修改
我找到this(来自“如果响应主体已被完全接收”),但仍然不知道如何实现这一点。我的意思是,“失败会包裹......”是什么意思?
答案 0 :(得分:3)
在twisted 13.1.0中,您可以使用readBody()。从 http://twistedmatrix.com/documents/13.1.0/api/twisted.web.client.readBody.html,“这是不希望逐步接收HTTP响应主体的客户端的辅助函数。”
你从回调中调用readBody(),在上面的例子中调用dataReceived(),它处理数据,readBody()返回一个deferred,你附加另一个回调,它将整个身体作为参数。
HTH, Reshad。
答案 1 :(得分:1)
扭曲的文档提供了如何执行此操作的示例。
来自http://twistedmatrix.com/documents/current/web/howto/client.html
from pprint import pformat
from twisted.internet import reactor
from twisted.internet.defer import Deferred
from twisted.internet.protocol import Protocol
from twisted.web.client import Agent
from twisted.web.http_headers import Headers
class BeginningPrinter(Protocol):
def __init__(self, finished):
self.finished = finished
self.remaining = 1024 * 10
def dataReceived(self, bytes):
if self.remaining:
display = bytes[:self.remaining]
print 'Some data received:'
print display
self.remaining -= len(display)
def connectionLost(self, reason):
print 'Finished receiving body:', reason.getErrorMessage()
self.finished.callback(None)
agent = Agent(reactor)
d = agent.request(
'GET',
'http://example.com/',
Headers({'User-Agent': ['Twisted Web Client Example']}),
None)
def cbRequest(response):
print 'Response version:', response.version
print 'Response code:', response.code
print 'Response phrase:', response.phrase
print 'Response headers:'
print pformat(list(response.headers.getAllRawHeaders()))
finished = Deferred()
response.deliverBody(BeginningPrinter(finished))
return finished
d.addCallback(cbRequest)
def cbShutdown(ignored):
reactor.stop()
d.addBoth(cbShutdown)
reactor.run()
请求完成后,将调用BeginningPrinter的connectionLost()方法。
Response version: ('HTTP', 1, 0)
Response code: 302
Response phrase: Found
Response headers:
[('Location', ['http://www.iana.org/domains/example/']), ('Server', ['BigIP'])]
Finished receiving body: Response body fully received
看起来检查if reason.check(twisted.web.client.ResponseDone)
会告诉您它是否成功。
答案 2 :(得分:1)
我不会因为扭曲到足以给你一个正确的答案而知识渊博......但我可以指出一些好的方向。
使用扭曲延迟,您可以创建一系列回调(成功)和错误(失败),在某些事情完成时触发。
在你的例子中- 我不确定self.agent.request做了什么,或者为什么它可以返回部分数据。这对我来说听起来并不完全正确 - 但通常我会使用包含在延迟的SemaphoreService中的阻塞代码来获取URL。
但是,根据您的代码,我想建议两件事:
a - 在此处阅读延迟http://twistedmatrix.com/documents/current/core/howto/defer.html
b - 你想要添加一个errback来处理坏请求。关于“包装”的文本必须处理扭曲并不会真正引发错误的事实 - 相反,它允许您定义errBacks来运行,并且您可以在这些中捕获错误。扭曲的人可以更好地解释这一点 - 但由于延迟是异步的,你需要这样的机制来有效地处理错误。
class YourExample(object):
def your_example(self):
self.agent = Agent(reactor, pool=pool)
self.deferred = self.agent.request(
'GET',
self.url,
Headers({'User-Agent': ['Mozilla/5.0']})
)
self.deferred.addCallback(self.gotResponse).addErrback(self.gotBadResponse)
def gotBadResponse(self,raised):
"""you might have cleanup code here, or mark the url as bad in the database, or something similar"""
pass