我正在使用tweepy来获取有关巴西登革热的推文。 我很有兴趣收到最近关于10个拥有最多粉丝的人的推文。我使用搜索api,而不是流式api,因为我不需要所有的推文,只是最相关的推文。
我很惊讶得到这么少的推文(只有17篇)。我应该使用流式api吗?
这是我的代码:
#api access
consumer_key=""
consumer_secret=""
access_token_key=""
access_token_secret=""
import csv
#write results in file
writer= csv.writer(open(r"twitter.csv", "wt"), lineterminator='\n', delimiter =';')
writer.writerow(["date", "langage", "place", "country", "username", "nb_followers", "tweet_text"])
import tweepy
auth = tweepy.OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_token_key, access_token_secret)
api = tweepy.API(auth)
#get tweets for Brazil only
places = api.geo_search(query="Brazil", granularity="country")
place_id = places[0].id
print(place_id)
for tweet in tweepy.Cursor(api.search, q="dengue+OR+%23dengue&place:" + place_id, since="2015-08-01", until="2015-08-25").items():
date=tweet.created_at
langage=tweet.lang
try:
place=tweet.place.full_name
country=tweet.place.country
except:
place=None
country=None
username=tweet.user.screen_name
nb_followers=tweet.user.followers_count
tweet_text=tweet.text.encode('utf-8')
print("created on", tweet.created_at)
print("langage", tweet.lang)
print("place:", place)
print("country:", country)
print("user:", tweet.user.screen_name)
print("nb_followers:", tweet.user.followers_count)
print(tweet.text.encode("utf-8"))
print('')
writer.writerow([date, langage, place, country, username, nb_followers, tweet_text])
答案 0 :(得分:0)
尝试手动搜索,看看你得到了什么。听起来您的应用程序适用于搜索API。
答案 1 :(得分:0)
我想我知道问题所在:place
属性很少出现在数据中。因此返回的推文很少。
我现在使用带有lang
值的pt
属性(遗憾的是,它们不是pt-br
langage)。这不是我想要的,因为它返回其他国家如葡萄牙的推文,但它是迄今为止我能找到的最好的。
for tweet in tweepy.Cursor(api.search, q="dengue+OR+%23dengue", lang="pt", since=date, until=end_date).items():