关于巴西登革热的推文:前10名

时间:2015-08-25 14:21:29

标签: python twitter tweepy

我正在使用tweepy来获取有关巴西登革热的推文。 我很有兴趣收到最近关于10个拥有最多粉丝的人的推文。我使用搜索api,而不是流式api,因为我不需要所有的推文,只是最相关的推文。

我很惊讶得到这么少的推文(只有17篇)。我应该使用流式api吗?

这是我的代码:

#api access
consumer_key=""
consumer_secret=""
access_token_key=""
access_token_secret=""

import csv
#write results in file
writer= csv.writer(open(r"twitter.csv", "wt"), lineterminator='\n', delimiter =';')
writer.writerow(["date", "langage", "place", "country", "username", "nb_followers", "tweet_text"])


import tweepy

auth = tweepy.OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_token_key, access_token_secret)
api = tweepy.API(auth)

#get tweets for Brazil only
places = api.geo_search(query="Brazil", granularity="country")
place_id = places[0].id
print(place_id)

for tweet in tweepy.Cursor(api.search, q="dengue+OR+%23dengue&place:" + place_id, since="2015-08-01", until="2015-08-25").items():
    date=tweet.created_at
    langage=tweet.lang
    try:
        place=tweet.place.full_name
        country=tweet.place.country
    except:
        place=None
        country=None

    username=tweet.user.screen_name
    nb_followers=tweet.user.followers_count
    tweet_text=tweet.text.encode('utf-8')

    print("created on", tweet.created_at)
    print("langage", tweet.lang)
    print("place:", place)
    print("country:", country)
    print("user:", tweet.user.screen_name)
    print("nb_followers:", tweet.user.followers_count)
    print(tweet.text.encode("utf-8"))
    print('')

    writer.writerow([date, langage, place, country, username, nb_followers, tweet_text])

2 个答案:

答案 0 :(得分:0)

尝试手动搜索,看看你得到了什么。听起来您的应用程序适用于搜索API。

答案 1 :(得分:0)

我想我知道问题所在:place属性很少出现在数据中。因此返回的推文很少。

我现在使用带有lang值的pt属性(遗憾的是,它们不是pt-br langage)。这不是我想要的,因为它返回其他国家如葡萄牙的推文,但它是迄今为止我能找到的最好的。

for tweet in tweepy.Cursor(api.search, q="dengue+OR+%23dengue", lang="pt", since=date, until=end_date).items():