分析影响程度

时间:2013-01-02 11:24:39

标签: twitter social-networking ipython

我正在使用Ipython并通过库Twython我能够使用用户名获取推文。 是否有可能分析影响力度量(比如我的检索推文的人有多大影响力)或推文的影响

由于

1 个答案:

答案 0 :(得分:2)

您的问题的简短答案是,是的,您当然可以通过某种方式衡量Twitter数据的影响力。另一方面,您可能应该充分考虑如何将影响理解为度量标准,如何将其与数据相关联,以及如何衡量数据中的影响力。

您可能会考虑的一些事项:

1。)除了为个人用户提供推文之外,您可能还想提取他们的个人资料信息(例如,关注者数量,推文总数等)。通过将这些数据与推文中的元数据相结合,您可以获得更多内容。

2。)考虑按个别基础查看以下某些数据点:

  • 分享推文转发:假设您为个人提供了1000条推文;您可以确定转发这些推文的百分比(例如,这些推文中有多少百分比正在影响其他推文转发)。
  • 每转发推文的平均转发次数:当转发这个人时,只有一两个人转推他/她,或者是一团糟?
  • 追随者计数:这个数据点本身告诉你一些事情。一般情况下,拥有更多粉丝的人可能比拥有更少粉丝的人更有影响力。

3.)你也应该考虑主题相关性。如果有人在Twitter上被转发很多并且拥有大量的关注,是因为与他们的职业有关的推文,还是因为他们写的是猫?根据您的使用案例和业务逻辑,这些问题可能至关重要。

这些只是一些起点。我花了一些时间查看Twitter REST API 1.1文档和Twython文档,以便更好地了解哪些数据点可用,然后考虑这些数据点如何影响您的影响力。

祝你好运。

修改 如果我理解正确,vishal1985,在你的评论中,你问的是如何使用Twython来收集有关转推的信息。这可能意味着其中的一件事,但我认为你所询问的是如何获得我列出的一些数据点(例如,上面的“转发的推文份额”)。

在这里,我再次指出Twython和Twitter API Documentation,如果您打算使用这类数据进行大量工作,您应该知道。但是为了指出你正确的方向,这里是你如何确定被其他人转发的作者的原始推文的百分比。

from twython import Twython
from __future__ import division  #assuming you're using Python 2.X

t = Twython(app_key='...',
        app_secret='...',
        oauth_token = '...',
        oauth_token_secret = '...')  #supply your credentials for each of these

tweets = t.getUserTimeline(screen_name='justinbieber', include_retweets=False) #see note below
retweeted_tweets = 0  

for tweet in tweets:
  if tweet['retweet_count']> 0: #...if at least one person has retweeted the tweet
    retweeted_tweets += 1

share_tweets_retweeted = retweeted_tweets/len(tweets) 
   #e.g., #number retweeted divided by total number of sampled tweets

这些步骤的作用是提取用户时间轴中出现的200条推文。 include_retweets = False 部分可能看起来令人困惑,但这是必要的。这样做是排除其他人写的那些你感兴趣的作者(在这种情况下是Justin Bieber)转推的推文,因为你想知道的是有多少人在你写作原创内容时转发你的作者。我们遍历用户的时间线,并确定至少一个人转发的推文数量。然后我们将其除以抽样推文的总数,这样就可以获得转发的份额。

请注意,这并未考虑分页(例如,浏览时间轴的多个页面 - 您一次只能从时间轴请求200条推文,总共最多可以请求5000条),这是您的意思d可能想要实施。希望这会有所帮助。