我们有一个需要尽可能实时的Analysis Services多维数据集。这是一个相对较小的立方体,目前需要几秒钟才能完成。
这有什么指导方针吗?我很好奇其他人在做什么。
此外,过于频繁地处理多维数据集会产生什么影响?主要关注的是SSAS服务器和源数据库上的负载吗?在我们的例子中,这将是相当名义上的。 SSAS客户将如何受到影响?当前的SSAS使用者是Excel,PerformancePoint和Sharepoint / Excel Services。
答案 0 :(得分:0)
我想说你必须考虑的第一个问题是这个立方体会随着时间的推移而增长多少?如果不断更新和处理,几秒钟就可以很快变成20分钟。
例如,我们目前有一个拥有2000万行的立方体(现在可能更多),其中包含与医院账单相关的财务数据和大约需要20分钟处理的费用,我们每天早上都会这样做。根据一年中的时间,我们有时会在白天进行处理,但只要我们通知我们这样做的人就没有投诉。
答案 1 :(得分:0)
可能你必须'把它放在那里'并跟踪它的表现。
一旦你可以看到人们如何使用多维数据集,你就可以确定是否真的需要不断的重新处理,如果是,你可能需要优化它的发生方式。
如此处所述,使用“基于使用情况的优化”:
答案 2 :(得分:0)
您是否考虑过实时(ROLAP)分区来存储当天的数据?通过这种方式,您可以获得当天之前所有数据的MOLAP性能,您可以在夜间处理,但ROLAP对自上次多维数据集流程以来收集的数据的延迟较低。
如果您的立方体足够小,您甚至可以将其拉伸为当前周的数据或更多。
对于经常处理的缺点,请查看下面的文章,其中说明:“如果处理作业成功,则在提交更改时对对象施加排他锁,这意味着该对象暂时不可用查询或处理。在事务的提交阶段,查询仍然可以发送到对象,但它们将排队,直到提交完成。“ http://technet.microsoft.com/en-us/library/ms174860.aspx
因此,您的用户会看到对查询效果的影响。