我有两个文件,A和B.两个文件中的记录共享相同的格式,记录的前n个字符是其唯一标识符。该记录具有固定长度格式,由m个字段组成(field1,field2,field3,... fieldm)。文件B包含已更改的文件A中的新记录和记录。如何使用cloverETL确定两个文件中出现的记录中哪些字段已更改?
另外,我如何收集个别fiels变化频率的指标。例如,我想知道有多少记录在fieldm中有变化。
答案 0 :(得分:1)
这是缓慢变化维度问题的典型示例。 CloverETL的解决方案在他们的博客上有描述:Building Data Warehouse with CloverETL: Slowly Changing Dimension Type 1和Building Data Warehouse with CloverETL: Slowly Changing Dimension Type 2。