页面排名算法

时间:2012-10-13 23:34:48

标签: search-engine pagerank google-ranking

我真的很有兴趣让我的GP基于开发这样的页面排名算法,而不是建立我自己的搜索引擎。

有没有办法在没有搜索引擎的情况下测试我的算法?

1 个答案:

答案 0 :(得分:2)

假设您有兴趣对网络进行测试,因为从PageRank的角度来看,大多数非网络数据集并不那么有趣:

commoncrawl.org有一个网络爬行,您可以在AWS中相对便宜地处理;这可能会在整个过程中摆脱很多工作。

相关问题