我需要用蜘蛛和所有这些东西编写一个小型搜索引擎。你推荐哪些人使用ASP.NET或PHP? 我应该阅读哪些资料来获取知识?
答案 0 :(得分:4)
在你开始编写这个项目的怪物之前(决不会很小)我想知道为什么你需要编写这个引擎...它是否适用于内部项目其他搜索引擎无法编入索引,或者是什么?
如果它是您自己完全控制的自己网站的搜索引擎,最好在添加,编辑和删除网站时对网站上的信息编制索引,以防止使用蜘蛛。
如果它适用于其他网站,那么谷歌,雅虎和必应等引擎提供的技术总会比几周内提出的要好。如果它是他们可以索引的东西,那么我建议查看他们的API(如果你对他们提供的结果没问题,Bing有一些非常简洁的那些)并使用它们来抓取和查询你需要的任何内容。
如果你真的需要制作自己的引擎,它不会是一个小项目..
答案 1 :(得分:1)
如果您不想写,我建议您:Sphider