我需要加入两个不同的数据集 - 一个在Sql Server中(每周大约13M行),另一个是Excel工作表(大约25k行)。
大数据集是发生错误的实例,较小的数据集是支持调用。有一个customerID
字段链接这两个。
我正在构建一个报告,显示哪些错误导致支持调用最多,并且不希望将所有~13M行放入Excel中,然后根据Excel工作表中的customerID
字段进行过滤包含支持呼叫数据。此外,我认为无论如何这都是Excel无法处理的数据。
我想在Excel查询中进行简单的连接,只返回导致支持调用的错误,例如:
SELECT
errors.CustomerID
,errors.ErrorID
,call.callID
FROM errors --SQL Server Error data
INNER JOIN [support call worksheet] calls
ON errors.CustomerID = calls.CustomerID
你能在Excel中这样做吗?我已经看到了类似的问题,这些问题表明了一个巨大的WHERE IN (...)
语句,但如果没有大量的字符串操作,这对我不起作用。
手动替代方法是将Excel数据加载到SQL中并在那里进行查询,但我正在为最终用户尝试自动化。
Power Pivot是一个可行的解决方案吗?它可以处理那么多数据而没有严重的性能问题吗?