美味的书签 - 网址经常收藏

时间:2009-08-27 04:55:16

标签: data-mining delicious-api

我还没有找到任何可以帮助我分析美味书签的预制脚本。我想知道是否有任何我经常收藏的网站。我知道我可以导出我的书签,可以从那里开始。有没有人这样做过?你过得怎么样了?

旁注 - 是否有任何类似的RSS阅读器?

2 个答案:

答案 0 :(得分:1)

好吧,我建议最简单的方法是将它们全部导出为XML(使用AJAX API)或HTML,然后将它们全部解析为一个数组,迭代它们并提取域然后对它们进行排序列表并进行值计数,这样你就会得到像{“example.org”=>这样的哈希值。 1,“cnn.com”,50}等。然后对它们进行排序,这样你就可以看到前十名。

如何操作取决于您喜欢使用哪种编程语言和库。我可能会使用Nokogiri和Ruby。基本上,使用API​​下载数据,使用XML解析库为您的首选编程语言解析数据,使用URI库提取URI的主机部分(或使用正则表达式),然后只是将数组抖动直到它做你想做的。

答案 1 :(得分:0)

如何使用Export / Download Your Delicious Bookmarks页面进行进一步分析呢?