嗨,所以我是python的新手,我正在尝试编写此代码来利用tweepy来拉动所有使用特定标签的用户。到目前为止,主题标签的数量非常少,大约有30条推文,但是当我运行脚本时,它仅返回12个名称。只是好奇是否是我做错了什么,从而阻止了我提取完整的姓名列表。
consumer_key = ''
consumer_secret = ''
access_token = ''
access_token_secret = ''
auth = tw.OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_token, access_token_secret)
api = tw.API(auth, wait_on_rate_limit=True)
search_words = "#Testhashtag"
date_since = "2019-06-12"
new_search = search_words
tweets = tw.Cursor(
api.search,
q=new_search,
lang="en",
since=date_since).items(9999999999)
users_locs = [[tweet.user.screen_name, tweet.created_at] for tweet in
tweets]
tweet_text = pd.DataFrame(
data=users_locs,
columns=['Username', "Date Posted"])
tweet_text.drop_duplicates(
subset="Username",
keep='first', inplace=True)
还想知道如何使用该井号标签合并所有tweet的计数,以检查这是否是输出的用户总数。
答案 0 :(得分:0)
基于下面的链接api.search
有一个名为count
的参数,它将限制您的结果。
https://github.com/tweepy/tweepy/blob/master/tweepy/api.py
通过设置计数可能会比默认计数更多,从而获得更多结果。因此,代码如下:
tweets = tw.Cursor(
api.search,
q=new_search,
lang="en",
count=50,
since=date_since).items(9999999999)
让我知道它是否有效。