我目前正在开发一种工具,可以通过Tweepy上的单个用户时间轴进行解析。这是一个使用Cursor对象完成工作的for循环。
for status in tweepy.Cursor(self.api.user_timeline,screen_name=self.user, tweet_mode="extended",
include_rts=False,include_entities=True).items():
但是,通过用户时间轴进行解析可能会花费大量时间,尤其是当他们有很多推文时。我想知道是否有可能仅解析时间轴的特定部分,即在20号和40号推文之间。我浏览了Cursor文档,但未找到任何内容。
我也尝试过这个:
中的状态tweepy.Cursor(self.api.user_timeline,screen_name=self.user, tweet_mode="extended",
include_rts=True,include_entities=True).items():
if r>=count and r<=max:
Do operations here
但是它并没有缩短花费的时间。
答案 0 :(得分:0)
Cursor只是围绕实际分页界面的用户友好包装器。来自docs:
page = 1
while True:
statuses = api.user_timeline(page=page)
if statuses:
for status in statuses:
# process status here
process_status(status)
else:
# All done
break
page += 1 # next page
这样,您可以手动以适当的值开始页面,并在一个点之后停止它。
我检查了Cursor的源代码,虽然可以在其中插入开始/结束页面,但这可能会更容易。