我正在尝试根据某些主题标签或关键字提取推文,并希望捕获以下信息: 日期,用户名(推文),转发次数和喜欢次数。
我想以列行格式显示所有这些信息,并以Excel或CSV格式导出。我已尝试过以下代码,但我无法获得所有内容。
我该怎么做?
import tweepy
import csv
ckey = "*************"
csecret = "******************"
atoken = "****************"
asecret = "************************"
OAUTH_KEYS = {'consumer_key':ckey,'consumer_secret':csecret,'access_token_key':atoken,'access_token_secret':asecret}
auth=tweepy.OAuthHandler(OAUTH_KEYS['consumer_key'],OAUTH_KEYS['consumer_secret'api = tweepy.API(auth)
testTweet = tweepy.Cursor(api.search, q="Trump AND H1B").items(1000)
for tweet in testTweet:
print (tweet.created_at, tweet.text, tweet.lang, tweet.user)
答案 0 :(得分:4)
Tweepy使用Twitter API,因此您可以使用these fields提取所有推文信息。
您可以通过以下方式修改代码:
for tweet in testTweet:
text = tweet.text
language = tweet.lang
date = tweet.created_at
username = tweet.user
retweets = tweet.retweet_count
likes = tweet.favorite_count
最后,如果您想将所有信息存储在Excel文件中,我建议您使用xlsxwriter。此软件包允许您处理.xls和.xlsx格式,并且使用起来非常简单。
否则,如果您想使用CSV,请检查this Stack Overflow question。