我已经使用R的twitteR软件包近一年了,而我对Python和tweepy相对较新。如果重要的话,我在Windows 10和Python 3.5上运行tweepy。
我面临的问题是,使用两种技术从搜索到Twitter api获得的输出提供了截然不同的输出。也就是说,tweepy仅输出R所做的一小部分。那个,并且随着我的不断运行速率限制在哪里,因为我很少用R来点击(在几次搜索之后我只能使用Python,我可以达到速率限制,这不应该是这种情况)
所以我不知道我在Python方面做错了什么。或者这是否是一个常见问题。
例如,使用以下代码的R为我提供了1565条推文:
library(twitter)
consumer_key = 'stuff'
consumer_secret = 'stuff'
access_token = 'stuff'
access_secret = 'stuff'
setup_twitter_oauth(consumer_key,
consumer_secret,
access_token,
access_secret)
searchterm <- "#arsenalfc"
tweets <- searchTwitter(searchterm,n=5000))
在Python方面,我应该在以下代码中具有完全相同的功能:
import tweepy
consumer_key = 'stuff'
consumer_secret = 'stuff'
access_token = 'stuff'
access_secret = 'stuff'
auth = tweepy.OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_token, access_secret)
api = tweepy.API(auth, wait_on_rate_limit=True, wait_on_rate_limit_notify=True)
results = []
for tweet in tweepy.Cursor(api.search,q='#arsenalfc').items(5000):
results.append(tweet)
但结果呢?实际上是108条推文。
我需要使用Python,所以我希望输出类似于R方法提供的输出。或者至少不是那么低劣。
知道这里发生了什么吗?我很茫然。