Teradata SQL:将随机数据插入表

时间:2016-01-07 18:35:45

标签: sql database performance teradata sql-tuning

我正在尝试创建随机数据并将其插入表中。现在只是想想完成这项工作的有效方法是什么。 例如

Create  volatile table mytb , no fallback, no journal
( C1 integer not null
  C2 Varchar (50) Not null , 
  C3 D1 Date Not null, 
  C4 D2 date not null 
) with data primary index ( c1) on commit preserve rows; 

我想要的是为每个列值的特定列表或范围的X次迭代随机插入值。例如C1范围在30到3000000之间C2是一个列表('已批准','待定','未知','有争议','wip','已处理','已预处理','已拒绝')等等C3 1999年1月1日至2015年3月12日期间的日期等 然后,对于100万次迭代,我想为这些列插入随机值并为某些值创建一个SKEW--这些值应该比其余值多。 有人曾经对此进行过挖掘。最好的方法是什么 - 递归Q逻辑?

1 个答案:

答案 0 :(得分:6)

我使用RANDOM生成测试数据:

SELECT
   RANDOM(30,3000000) AS c1,
   CASE RANDOM(1,8) 
      WHEN 1 THEN 'approved'
      WHEN 2 THEN 'pending'
      WHEN 3 THEN 'unknown'
      WHEN 4 THEN 'disputed'
      WHEN 5 THEN 'wip'
      WHEN 6 THEN 'processed'
      WHEN 7 THEN 'pre-processed'
      WHEN 8 THEN 'denied'
   END,
   DATE '1999-01-01' + RANDOM(0,6208) -- up to 2015-12-31
FROM sys_calendar.CALENDAR -- any table with a large number of rows

这会产生均匀分布的数据,如果你想要倾斜,你可以运行不同的插入/选择或玩多个RANDOM:

RANDOM(1,50) + RANDOM(0,50)
(RANDOM(1, 50) * RANDOM(1,200) + RANDOM(0,100)) / 100.00