我有一些使用SOLR / Lucene的知识,但实际上从未广泛使用过。
我们有多个6个电子商务网站,每个B2B客户都可以获得他们自己对网站上销售的数千种产品的定价。有些客户甚至可以获得他们自己的产品描述,有些则没有,但应该可以搜索任何一种方式。 我们计划用SOLR取代第三方搜索,并想知道如何设置它,以便客户A不会获得客户B数据(产品,描述和/或定价),等等。在索引数据时,我不确定每个客户或大型索引是否需要每个客户的记录具有唯一令牌。
当前记录大小:1000个客户接近3000万种组合。简单地假设每个客户都有自己的产品,定价和描述。还有定价,制造商和许多其他定制方面,因此客户可以深入了解他们正在寻找的内容。
这些是B2B网站,每个客户都可以获得自己的定价和所售产品的自定义名称/描述。 示例场景:
item_number name price
----------- ------- -------
123 Brush $1.00 -- customer A might call this as 'MyBrush' and customer B as 'TomBrush'
234 shirt -- $20.00
112 pencil -- $1.50
Customer A pricing and descriptions.
item_number name price
----------- ------- -------
123 MyBrush $1.00
234 shirt $20.00
112 pencil $1.50
Customer B pricing and descriptions.
item_number name price
----------- ------ -------
123 TomBrush $1.10
234 shirt $23.00
112 pencil $1.70
Customer C pricing and descriptions.
item number name
123 CBrush -- $1.11
234 shirt -- $13.00
112 pencil -- $2.70
对于成千上万的客户来说,等等,这导致3000万的定价记录,但客户A不应该对客户的客户B项目和定价进行评估。