如何获取我自己的搜索引擎的初始索引数据?

时间:2014-10-07 21:11:58

标签: javascript php search web-crawler search-engine

我正在尝试创建一个搜索引擎。我想知道如何在启动中获取 URL以在我的数据库中编制索引?例如,google如何获取网站的网址以进行抓取?

1 个答案:

答案 0 :(得分:1)

您可以从现有索引开始,并使用它来构建自己的索引。 dmoz是一个人类可编辑的索引:http://www.dmoz.org/