是否有API来确定许多推文中最常见的链接?

时间:2010-02-27 00:00:25

标签: php twitter bit.ly

是否有API(Twitter API不提供此功能)可用于确定200条推文中最常见的链接。我想做的是获取最新的200条推文,然后确定人们在谈论什么,我确信推文将包含链接(因为我会要求twitter API返回仅包含链接的推文)但我也会我希望确保我的代码能够理解两个URL是相同的,即使它们具有不同的bit.ly链接。

我想要做的事情(这可能会让你的家伙更容易提供一些帮助)是我试图确定人们在这200条推文中谈论的最重要的主题是什么。我知道人们可能会谈论相同的故事,但提供不同的链接,但是,我不确定是否有一种简单的方法来理解它。

示例,API,示例代码和任何其他想法的链接将有所帮助:)

如果您需要更多信息来解释这一点,请告诉我,我将编辑问题以包含更多信息

3 个答案:

答案 0 :(得分:2)

不是我所知道的,但你可以通过......来实现这个目标。

  1. 使用正则表达式模式查找推文列表中的所有链接。

  2. 使用twitter搜索API搜索每个链接。返回结果数。

  3. 按返回的结果手动对链接进行排序。

答案 1 :(得分:0)

从根本上你可以从api获得这个,首先得到最新的公共时间线(这将是100条推文,如果你需要200,那么你需要请求一个游标并创建一个循环来检查next_cursor值是否大于0然后构建一个确定相关性的蜘蛛。

http://api.twitter.com/1/statuses/public_timeline。???

在哪里???是json,xml,rss或atom

如果你想确定单词的流行度,那么将所有文本转储成字符串,然后将其拆分为空格,标点等,丢弃非名词,对其进行排序,并创建一个包含单词和字数的字典变量。词语的

如果您想确定链接的受欢迎程度,那么它是相同的过程,但需要在每个链接上执行Web请求以确定最终链接目标。

答案 2 :(得分:0)

基于别人的说法,您可以使用Twitter搜索来获取推文没有问题,我不会在这个答案中进入该部分。

短链接的可能路线:

例如,您可以转到bit.ly并为您想要跟踪的网址创建自定义短链接。如果您在网址末尾添加+,则使用该链接即可获得链接统计信息。示例:http://bit.ly/tweelay+此外,bit.ly会跟踪指向同一网址的其他短链接。然后您可以在搜索中使用它。

使用bit.ly /stats API ,您可以获得缩短网址的列表。

根据您尝试跟踪的网址,您可以访问引荐日志。 (即您自己的网站)使用您的推荐日志,您也可以找到可用于搜索的其他简短网址。