我有一张de normalized table。我想从该表的一个特定列中选择所有值,并仅将该列中的唯一值加载到单独的表中。
如何使用Pentaho Spoon做到这一点?请注意,我完全是Spoon的新手。在我的生活中,我只尝试过世界的转变。
我有一个名为'Employees'的表,它有很多列如下(我没有在这里给出不相关的列):
+-------------------------------------------------------+
Employees
+-------------------------------------------------------+
employee_number | employee_name | deputed_branch | phone
+-------------------------------------------------------+
现在我想使用Spoon将唯一的分支名称移动到名为branches
的新表中。
'branches'表格如下所示:
+-------------------------------------------------------+
branches
+-------------------------------------------------------+
| branch_id | branch_name
+-------------------------------------------------------+
其中branch_id将是唯一的并自动递增。
要连接Employees
和branches
表,我将使用Employee_branch
表,其中包含employee_number
和branch_id
列。
有人可以告诉你怎么做吗?
提前致谢!!
答案 0 :(得分:3)
你能不能在sql中做到这一点?
从员工中选择不同的deputed_branch
如果没有;然后使用唯一行步骤(不是必须对数据进行排序)或逐步进行分组。 (也已分类)
或;内存组by if行数低(数据不需要排序)