solr可以像CMS一样提供单独的文件吗?

时间:2012-04-07 06:53:32

标签: php drupal joomla solr content-management-system

我希望建立一个房地产搜索引擎规范 约50万个房源 每日更新可能有50 000个房源 干净(ish)CSV中提供的数据 - 需要删除字符,编码utf,通常。 50多个数据领域(30个图像,各种属性规格等)

我对Drupal7和Joomla有很多问题无法处理它。这只是数据导入。

我想让solr索引数据并充当搜索引擎。我有几个问题。

  1. 可以直接从索引中提供列表吗? (如果需要,我需要一个数据存储,如Mysql甚至CMS)
  2. 我最好将数据放在一个简单的单表mysql DB中,并使用它将文件推送到solr索引,然后从DB或Solr索引加载列表。
  3. 由于数据困难,似乎我可以简单地消除许多并发症,试图弄清楚D7 / Joomla /任何其他cms的内部工作方式,并且只是将几个简单的php文件作为前端。

    我不需要任何花哨的东西,我会在这个项目中使用基本的drupal模板。

    我需要速度和可靠性以及出色的搜索结果。

1 个答案:

答案 0 :(得分:2)

恕我直言,应该可以专门为您的目的使用SOLR。即使对于单个服务器,50000个列表的数量对于SOLR也不是很多,但是我建议的每10小时更新500000个确实很多。由于您每小时将有大约50000次更新,相当于每小时完整的重新索引。

我们也将SOLR用于我们的企业,并使用大约40-120个字段。 40000项需要大约5分钟完全索引。如果您想要自动装配缓存,则必须添加一些时间。

据我所知,您的问题将是较小的更新周期。如果要每小时更新单个文档而不是所有50000个列表,则solr无法使用缓存,或者您必须使用多个solr服务器。 (也许对于solr 4.0,您甚至可以考虑扩展您的solr服务器硬件,但我怀疑3.x会从中获益) 不使用缓存可能会导致搜索性能降低,但它不必。

由于SOLR提供了dynamic fields功能,您可以为每个文档添加不同的结构。这应该符合您的各种属性要求。