我们正在开发一个审计系统,使审计人员可以访问上一季度处理的交易。审核员会对数据进行各种分析,以找出存在某些例外情况的无效/错误交易。
通常,这些分析需要一些图表上显示数据以查看外层,或者有时基于多个列进行重复检测。 有时涉及异常检测算法,需要使用存储过程的多个处理步骤。 请注意,分析很少涉及大行的聚合。
有时候,如果发现数据丢失或不正确,他们可以更改一些数据。 我们正在评估基于行的数据库(sql和nosql数据库)和基于列的存储库(例如数据仓库系统)。
这是数据仓库或基于行的存储(例如nosql或某些RDBMS)的用例吗?
简而言之,要求是: -偶尔更新 -主要读取过去3个月/月数据中的查询 -读取数据需要几个消息传递步骤,例如在步骤1中创建临时表,在步骤规则中与另一个表建立联接,删除一些行等。
谢谢
答案 0 :(得分:1)
对于您的任务,数据的存储方式并不重要。您需要考虑如何创建实体尺寸模型,正确填充数据以及要使用的报告工具。
举个例子,这是我在项目中使用的一些常见设置:
Microsoft堆栈设置:
开源设置:
我认为NoSQL数据库在这里是错误的选择,因为审计将需要高度结构化的数据。