我有以下情况。维度表,例如PRODUCT加载到SQL Server 2016中。事实表,例如ORDER_ITEM加载到Hadoop中。我想在PRODUCT和ORDER_ITEM之间运行汇总查询,例如
SELECT
PRODUCT.PRODUCT_CATEGORY,
SUM(ORDER_ITEM.AMOUNT)
FROM
HADOOP.ORDER_ITEM OI
JOIN RDBMS.PRODUCT P ON (OI.PRODUCT_ID = P.PRODUCT_ID)
GROUP BY
PRODUCT.PRODUCT_CATEGORY
行为是什么。 (1)Polybase是否将PRODUCT维度广播到Hadoop中,在那里执行连接和聚合并返回结果 (2)Polybase是否将ORDER_ITEM表广播到SQL Server并在那里进行连接和聚合?
可能是(2),但如果有人尝试过,请告诉我
答案 0 :(得分:1)
A)将order_item表流回SQL Server并计算连接并聚合数据。
B)按OI.ProductiD下推部分聚合Sum(Order_Item.Amount)组,将结果集流式传输到SQL Server,然后在SQL Server中进行连接和最终聚合。