我有一个带有VARCHAR
数据类型的自然键的表。传入的Feed可以是VARCHAR
或BIGINT
自然键,但存储为VARCHAR
数据类型。我们使用自然键生成代理键。传入的每日饲料在自然键上有间隙和岛屿,但最终填补了追赶过程。然而,由于数字中的间歇性间隙,在加载过程中在自然键之上生成的代理不能保证相同的正常性。
现在,我需要在数据集上包含一个采样机制,仅加载5%的音量,并将其级联到每日追赶。由于自然键是VARCHAR列,因此无法使用MOD函数提供采样。但是,如果我使用Surrogate键列进行抽样,那么在一段时间内,数据集的增长将超出预期的5%。
例如,
Day NK SK
1 1 1
1 3 2
2 2 3
3 4 4
3 5 5
3 7 6
4 6 7
. . .
. . .
. . .
是否有更清洁的方法来规避这个?