Question

我在天蓝色机器学习（.csv）中有一个数据集，在同一个数据集上我有多个模型构建，我想根据不同的列为每个模型的子集数据

输入：

ID col1 col2 col3
1  0    13   0
2  5    45   0
3  10   0    34
4  12   1    3

对于第一个模型，我想保留col1不等于None

的所有记录

ID col1 col2 col3
2  5    45   0
3  10   0    34
4  12   1    3

类似于模型2

ID col1 col2 col3
1  0    13   0
2  5    45   0
4  12   1    3

希望很清楚

R中的等价物是

df[!df$col1 == "None",]

Answer 1

不是完美的解决方案，但我们可以使用名为＆＃34; Split Data＆＃34;

的模块

输入

ID col1 col2 col3
1  0    13   0
2  5    45   0
3  10   0    34
4  12   1    3

预期产出

ID col1 col2 col3
2  5    45   None
3  10   None 34
4  12   1    3

解决方案：

说明：

我使用了＆＃34; MetaData编辑器＆＃34;重命名＆＃39; col1＆＃39;到＆＃39;标签＆＃39;

模块＆＃34;拆分数据＆＃34;正在使用拆分模式作为＆＃39;正则表达式

在正则表达式下，我们使用以下条件

\"Label" ^0

Answer 2

您可以使用“执行R脚本”模块，只需在那里插入R代码。

df <- maml.mapInputPort(1)
df <- df[!df$col1 == "None",] 
maml.mapOutputPort("df");