我正在使用tweepy.Cursor提取特定主题的过去推文,但是,如果该推文确实很长,则会将其截断。我使用full_text属性为True,但仍然无法解决问题。该如何解决?
我的代码在这里:
auth = tweepy.OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_token, access_token_secret)
API = tweepy.API(auth)
csvFile = open('tweets2.csv', 'a')
csvWriter = csv.writer(csvFile)
for tweet in tweepy.Cursor(API.search,q="$EURUSD",count=1000,
lang="en", full_text = True).items():
csvWriter.writerow([tweet.created_at, tweet.text.encode('utf-8')])
csvFile.close()
答案 0 :(得分:2)
您必须显式访问名为“ full_text”的字段。 您可以尝试这样的事情:
# First you get the tweets in a json object
results = [status._json for status in tweepy.Cursor(API.search, q="$EURUSD", count=1000, tweet_mode='extended', lang='en').items()]
# Now you can iterate over 'results' and store the complete message from each tweet.
my_tweets = []
for result in results:
my_tweets.append(result["full_text"])
您可以根据需要提取尽可能多的信息,然后将其写入CSV文件或任何您想要的内容。
我建议您将tweets提取到json文件中,以便您可以轻松检查它提供给您的所有字段。
希望有帮助!
编辑:如果检索到的推文是RT,则全文将显示在结果中[“ retweeted_status”] [“ full_text”]