需要能够从两个 Solr 集合中获取数据

时间:2021-02-08 21:20:24

标签: solr

我有两个 Solr 集合:

Collection A - 是独一无二的记录集(数亿) 集合 B - 是一个详细信息集,包含有关第一组(40 亿条记录)的详细信息

示例: 集合 A

购物篮 ID、成本、标题

1、5650、1

2、6500、1

集合 B

ID、购物篮 ID、描述、成本

1,1,Apple,2000

2,1,梨形,2000

3,1,橙色,1650

4,2,苹果,3000

5,2,橙色,2000

6,2,Book,1500

我想通过描述创建平均成本,我们想要的公式是SUM(b.cost)/COUNT(DISTINCT bag_id),例如苹果是2500

今天,我有 API 调用点击集合 b 以通过描述获取成本总和,然后使用 UNIQUE(basket id) 函数进行划分,但这不是 100% 准确,只是一个近似值,这会导致我们的数据出现明显问题网页界面。我们收集了数十亿条记录 b。

我需要的是 100% 准确的唯一篮子 ID 计数,或者加入 a 并从 A 中获取 SUM(header)。

有什么想法吗?

1 个答案:

答案 0 :(得分:1)

使用关系数据库。这是一个具有连接和唯一结果的关系数据库问题。 Solr 在这方面不会很快。

相关问题