我即将创建一个非常大的项目。
如何创建具有以下功能的搜索引擎: -
如果可能的话,请:我如何构建我的数据库?
答案 0 :(得分:5)
您提到的前两项 大纲。你现在就可以开始编码了。
其余的一些事情使雅虎,然后谷歌,需要很多人发现和实施。从你所知道的开始,从你的经历和错误中学习,然后从修订版2开始。等等。
答案 1 :(得分:3)
1号 - 4号是你的第一阶段。这是您收集所有信息的爬行阶段。您需要编写一个爬网程序,在页面之间添加指向其数据库的链接。您还需要确定哪些页面需要更多/更少地被抓取。
一旦你对它进行了排序,你将不得不查看算法来弄清楚页面实际上在说什么。您需要将页面分解为其组件并存储其含义。您还需要大量的硬盘驱动器内存来存储页面中的文本。
相关强>
How do I make a simple crawler in PHP?
Where do search engines start crawling?
Google-like Search Engine in PHP/mySQL(最基本的文字匹配)