获取有关抑郁症的用户名和推文

时间:2019-03-02 10:02:42

标签: twitter dataset

我正在从twitter收集数据以进行数据分析。我需要一个包含“ #depression”标记的tweet集合以创建数据集。很难先搜索再复制粘贴。 是否有任何现有代码/插件/ api来获取所有带有用户名和发布日期的帖子?我将使用它在我的excel数据集上存储帖子,用户名和日期。

1 个答案:

答案 0 :(得分:0)

为此,我建议使用一些python。顺便说一句,这里似乎是一个脚本,可以执行您想要的操作。它将获取具有指定日期和指定#tag的指定日期的所有tweet,并将它们打印到CSV文件。我想您可以在Excel中导入文件。

脚本: https://gist.github.com/vickyqian/f70e9ab3910c7c290d9d715491cde44c

我还没有仔细阅读过-请在阅读之前先通读它。当然,请替换#tag参数:

...
for tweet in tweepy.Cursor(api.search,q="#depression",count=100,
...

您还需要设置参数:

consumer_key = ''
consumer_secret = ''
access_token = ''
access_token_secret = ''

以下是如何获取这些说明:

https://developer.twitter.com/en/docs/basics/authentication/guides/access-tokens.html

您需要在此行中指定所需的字段

print (tweet.created_at, tweet.text)

这些字段可用:

text     = tweet.text
language = tweet.lang
date     = tweet.created_at
username = tweet.user
retweets = tweet.retweet_count
likes    = tweet.favorite_count

因此您可以将其更改为:

print (tweet.created_at, tweet.user, tweet.text)