挖掘Twitter数据以查找有关用户的见解?

时间:2012-03-25 15:27:01

标签: twitter nlp data-mining text-mining

我从一个项目开始,该项目将通过他的推特个人资料分析用户的兴趣和参与度。通过分析他的推特数据可以获得什么样的指标?我觉得可以做的事情包括:

  1. 用户通过分析他的推文谈论最多(他的兴趣)的主题。
  2. 他所活跃的社区(通过分析哈希标签)
  3. 通过将推文分类为正面/负面的人的情绪。
  4. 其他趋势可能包括他的外展以及他与之交往的人。

    是否可以通过他的个人资料获得有关某人的其他有趣方面? Twitalyzer似乎也显示了此人与之交互的年龄组,但我对如何做到这一点并不了解。

    此外,我计划将该项目开发为webapp。我计划使用PHP来制作爬虫。对于挖掘部分,您会建议坚持使用PHP还是推荐其他技术/语言?

    我一直在寻找灵感的一些项目包括:

3 个答案:

答案 0 :(得分:1)

你也可以考虑他所在的社区。 通过提取他所提到的(或他提到的那些)并生成图表,将为您提供有关用户和他感兴趣的人的大量见解。特别是如果您在工作中介绍中心性的概念......

答案 1 :(得分:0)

分析某个人的品牌忠诚度,特别是如果这个人具有影响力,可能会非常有洞察力。

答案 2 :(得分:0)

如果关于用户的见解是最重要的,我会将范围扩展到Twitter以外。

例如,您可以假设twitter标签是他们在其他服务上使用的用户名,甚至可能是普通的电子邮件地址分销商(gmail,yahoo)。如果他们的生物中有其他帐户名称,您可以调查他们,看看他们是否在对用户信息限制较少的平台上拥有帐户。

如果主要关注的是专门使用用户的Twitter Feed,我想我会将此作为扩展理念。