查找与主题相关联的Twitter帐户

时间:2013-11-06 17:17:19

标签: twitter machine-learning

我被要求找到与Dominican Republic相关联的Twitter帐户(该项目与投票有关)。这是一个奇怪的请求,因为一些Twitter帐户有与该帐户关联的地理空间数据,我们不知道它是否准确。

我最终手动搜索了我知道相关的关键字:#dominican#washingtonheights我和他们的朋友和粉丝一起跳了起来,我找到了我要找的人。


更多基因:

如何搜索与特定主题相关联的Twitter帐户? 如何训练机器人识别与给定主题相关的主题标签?然后我们可以搜索这些关键字。


@Moderators :这不是一个编码问题。如果您能想到更好的StackExchange,请迁移它!

1 个答案:

答案 0 :(得分:0)

由于您已经有一个给定的话题,我建议他遵循:

  1. 通过您提到的这些Hashtags手工获取几个账户。
  2. 检索这些帐户的X推文
  3. 对这些推文进行一些自然语言处理,以获得关键字的新想法。
  4. 我在这个/类似情境中使用过的一些东西:

    • tf-idf + NMF获取主题,然后按要检索的组件排序 用户正在谈论的主题(用户可以有多个主题)。
    • 某种聚类(这里你最大的问题就是高 数据的可用性,因此PCA可以是一个选项)
    • 使用wordnet等来收集类似的关键词