标签: search-engine pagerank google-ranking
我真的很有兴趣让我的GP基于开发这样的页面排名算法,而不是建立我自己的搜索引擎。
有没有办法在没有搜索引擎的情况下测试我的算法?
答案 0 :(得分:2)
假设您有兴趣对网络进行测试,因为从PageRank的角度来看,大多数非网络数据集并不那么有趣:
commoncrawl.org有一个网络爬行,您可以在AWS中相对便宜地处理;这可能会在整个过程中摆脱很多工作。