在内部页面上索引和搜索文本的最佳解决方案?

时间:2012-07-05 02:52:11

标签: php mysql search google-search-api

我有一个高流量新闻网站,我需要添加搜索功能。我需要一些免费或便宜的东西,可以立即为搜索结果添加新的新闻故事,处理高流量,并允许自定义样式的结果。我查看了谷歌自定义搜索,它似乎不是一个好选择,因为你必须支付高流量,他们不会立即添加新的新闻文章,除非我每次添加一篇文章时付费索引它们。

是否有人知道可以满足我的需求或更好的不同搜索API,我可以使用某种类型的库或脚本?例如,Sphinx,Lucene,Solr等是否有能力索引网页?如果是这样,这会有巨大的数据需求,这会使我的亚马逊网络服务账单飙升吗?什么是最好的解决方案?

1 个答案:

答案 0 :(得分:1)

如果它们只是一堆文本文件,您可以使用elasticsearchattachment plugin来索引这些文本文件。

但请注意,这不是一个简单的即插即用案例。您需要编写一些代码来抓取这些文本文件,然后将其编入索引进行弹性搜索。

您还必须编写一些代码,以便每次更新或添加页面时,都会调用elasticsearch的Web服务来索引或更新它。

Elasticsearch使用REST API,因此您可以使用CURL轻松地与其进行交互,就像任何普通的Web服务一样。还有PHP库可以简化交互。数据以JSON格式发送和接收。

我认为弹性搜索在这里非常合适,但请尝试一下,看看它是如何工作的。