如何制作搜索引擎?

时间:2012-04-16 10:57:38

标签: apache solr search-engine

我不知道我是否提出了正确的问题,但我的表现非常糟糕。我想为我的最后一年项目制作自己的搜索引擎。此外,我已经对网络引擎进行了大约一个月的研究。我遇到了nutch,lucene,solr,xapian,yaCy。但这还不够。 我也知道我需要一个解析器,一个索引器,一个爬虫和一个页面排名算法,但是有很多东西要开始,我不知道从哪里开始。

我需要的是一些教程或书籍,我可以找到这些术语(索引器,爬虫等)以及如何逐步实现这些apache项目以及我应该选择使用哪个apache项目。

3 个答案:

答案 0 :(得分:2)

答案 1 :(得分:0)

如果您需要搜索引擎,请查看OpenSearchServer基于lucene的搜索引擎及其功能数量。阅读文档。

如果您打算自己编写。你正试图重新发明一个轮子。试着读一下这本书 Introduction to information retrieval.

答案 2 :(得分:0)

你需要像solr这样的东西来执行搜索,然后你可以将权重应用到不同的字段,例如元标题。你需要查看部分文档的添加和更新。

您还需要抓取网站以创建索引。你可以按照siva post中的例子进行操作。

如果你想编写自己的,你可以使用python或卷曲网站。查找所有链接并启动更多进程以收集信息。

的solr http://wiki.apache.org/solr/SolrInstall要安装 然后创建一个schema.xml http://wiki.apache.org/solr/SchemaXml - 想想你需要哪些领域,哪些领域是可搜索的等等。 那么你可以使用apache solr for php或许多替代查询。

享受