我正在从twitter收集数据以进行数据分析。我需要一个包含“ #depression”标记的tweet集合以创建数据集。很难先搜索再复制粘贴。 是否有任何现有代码/插件/ api来获取所有带有用户名和发布日期的帖子?我将使用它在我的excel数据集上存储帖子,用户名和日期。
答案 0 :(得分:0)
为此,我建议使用一些python。顺便说一句,这里似乎是一个脚本,可以执行您想要的操作。它将获取具有指定日期和指定#tag的指定日期的所有tweet,并将它们打印到CSV文件。我想您可以在Excel中导入文件。
脚本: https://gist.github.com/vickyqian/f70e9ab3910c7c290d9d715491cde44c
我还没有仔细阅读过-请在阅读之前先通读它。当然,请替换#tag参数:
...
for tweet in tweepy.Cursor(api.search,q="#depression",count=100,
...
您还需要设置参数:
consumer_key = ''
consumer_secret = ''
access_token = ''
access_token_secret = ''
以下是如何获取这些说明:
https://developer.twitter.com/en/docs/basics/authentication/guides/access-tokens.html
您需要在此行中指定所需的字段
print (tweet.created_at, tweet.text)
这些字段可用:
text = tweet.text
language = tweet.lang
date = tweet.created_at
username = tweet.user
retweets = tweet.retweet_count
likes = tweet.favorite_count
因此您可以将其更改为:
print (tweet.created_at, tweet.user, tweet.text)