删除任何行中的字段集中的重复项

时间:2019-04-30 07:27:43

标签: knime

我使用Knime,尝试通过Groupby节点删除列集中所有行中的重复项。您能告诉我如何实现此功能,还是可以使用其他任何节点来完成此操作。 首先,我将表格分为几列 集1是-> Col1,Col2,Col3,Col4 集2是-> Col5,col6,Col7,col8  像这样,我有10组(每组4列),现在我要检查在任何特定组中是否有相同的数据。让我们说一下组1中的值是否存在 Col1有4 Col2有4 Col3有4 Col4有4

然后我将Col1保持为4,而Col2,col3,col4中的值将为'null'。

能否请您告诉我如何通过KNIME中的GroupBy节点执行此操作

我已经使用其他节点(例如,恒定值列过滤器,数学公式,规则引擎)进行了尝试,但是似乎没有任何效果。

首先,我将表格分为几列 集1是-> Col1,Col2,Col3,Col4 集2是-> Col5,col6,Col7,col8  像这样,我有10组(每组4列),现在我要检查在任何特定组中是否有相同的数据。让我们说一下组1中的值是否存在 Col1有4 Col2有4 Col3有4 Col4有4

然后我将Col1保持为4,而Col2,col3,col4中的值将为'null'。

1 个答案:

答案 0 :(得分:0)

无法在GroupBy节点中执行此操作。您可以在GroupBy节点中获得唯一的值,但是您需要一些逻辑来确定该值是重复的,而不是将其放置为null或其他标识符。我建议您在最后一列中使用具有以下语法的Rule Engine节点:

$column4$ MATCHES $column1$ OR $column4$ MATCHES $column2$ OR $column4$ MATCHES $column3$ => "null"
TRUE => $column4$

此后,再添加两个带有column3和column2语法的Rule Engine节点。显然,您不需要为column1做任何事情。