我想要一个脚本代码从芝加哥收集随机推文而没有任何关键字,每30分钟自动运行并收集推文20毫秒(例如) 所有可用代码都需要关键字,在大多数代码中我无法定义地理位置。 谢谢你的帮助。
答案 0 :(得分:0)
请参阅以下页面:An Introduction to Text Mining using Twitter Streaming API and Python和此页面run a python script every hour
答案 1 :(得分:0)
这是非常可行的。使用Twitter的REST API,需要一个关键字;但是,Twitter还提供了一个流媒体API,它可以使用关键字或位置来过滤推文。在你的情况下,你需要在经度和纬度上定义芝加哥的边界框。然后将此提供给此处记录的Twitter statuses/filter
端点:https://developer.twitter.com/en/docs/tweets/filter-realtime/api-reference/post-statuses-filter.html。此端点具有您将使用的locations
参数。它会在发布时返回推文。无需计时器。
你可以使用tweepy。或者,使用TwitterAPI,您只需执行以下操作:
from TwitterAPI import TwitterAPI
api = TwitterAPI(CONSUMERKEY,CONSUMERSECRET,ACCESSTOKENKEY,ACCESSTOKENSECRET)
r = api.request('statuses/filter', {'locations':'-87.9,41.6,-87.5,42.0'})
for item in r:
print(item)