我有一个具有以下结构的数据流
user_id (integer)
user_name (string)
user_id
是100到65536之间的任何值。我想根据以下逻辑添加target_user_id
(整数)字段:
user_id
的范围是1000..9999,那么让target_user_id
字段等于user_id
target_user_id
,其范围为1000..9999,不会引起冲突。最好尽可能低。流的长度低于9000. user_id
字段在原始流中是唯一的。
答案 0 :(得分:3)
我不确定您使用的是什么Kettle环境,但一般程序可能如下:
使用user_id处理每个输入流记录,而不是在1000..9999中:
通过执行SQL查询(DBLookup)获取最低的未使用的user_id
SELECT MIN(user_id) FROM temporary_table WHERE user_name IS NULL;
使用当前用户名(使用更新)
希望这有帮助