使用Tweepy提取Tweet,需要特定字段

时间:2017-03-24 08:24:47

标签: python python-3.x twitter web-scraping tweepy

我正在尝试根据某些主题标签或关键字提取推文,并希望捕获以下信息: 日期,用户名(推文),转发次数和喜欢次数。

我想以列行格式显示所有这些信息,并以Excel或CSV格式导出。我已尝试过以下代码,但我无法获得所有内容。

我该怎么做?

import tweepy
import csv
ckey = "*************"
csecret = "******************"
atoken = "****************"
asecret = "************************"
OAUTH_KEYS = {'consumer_key':ckey,'consumer_secret':csecret,'access_token_key':atoken,'access_token_secret':asecret}
auth=tweepy.OAuthHandler(OAUTH_KEYS['consumer_key'],OAUTH_KEYS['consumer_secret'api = tweepy.API(auth)
testTweet = tweepy.Cursor(api.search, q="Trump AND H1B").items(1000)
for tweet in testTweet:
    print (tweet.created_at, tweet.text, tweet.lang, tweet.user)

1 个答案:

答案 0 :(得分:4)

Tweepy使用Twitter API,因此您可以使用these fields提取所有推文信息。

您可以通过以下方式修改代码:

for tweet in testTweet:
    text     = tweet.text
    language = tweet.lang
    date     = tweet.created_at
    username = tweet.user
    retweets = tweet.retweet_count
    likes    = tweet.favorite_count

最后,如果您想将所有信息存储在Excel文件中,我建议您使用xlsxwriter。此软件包允许您处理.xls和.xlsx格式,并且使用起来非常简单。

否则,如果您想使用CSV,请检查this Stack Overflow question