我正在运行KNIME来准备一些ML数据集。 关于经济交易,以后应进行关联规则分析。但是我当前的问题很简单,我处于“数据准备步骤”中,其中KNIME中的缺失值节点不起作用。
我在Mac OS X上运行KNIME 3.5.2
示例工作流是原始的,看起来像:
读取Excel文件(XLSX)的第一个节点的第二个节点的配置,应替换缺少的值:
但是令人讨厌的结果是:
显示的警告是:
WARN缺少值2:2当前设置使用的是缺少的>值处理方法,在PMML 4.2中无法体现
所显示的警告与机器学习上下文中重用KNIME节点有关,可能与R oder Spark / MLLIB有关,因为如果模型不兼容存在问题。这可以在这里忽略。
我不得不说,昨天这奏效了。我基本上更改了KNIME.ini中的XMX设置,重新启动了KNIME,并运行了其他几个工作流程。当我回来时,它不再起作用了。
我认为KNIME在此节点中具有某种状态,至少可以肯定地是在Eclipse工作区中。我已经开始KNIME了-clean,没有任何帮助。在同事计算机上的相同KNIME版本上运行此示例可以正常工作。
有什么想法吗?谢谢 (顺便说一句:我知道我可以很容易地用罗德火花中的几行来做同样的工作...)
答案 0 :(得分:1)
在KNIME中,如果看到“?”,则只是一个正确的缺失值。在Knime表中。
答案 1 :(得分:0)
“解决方案”: 我已经从Excel文件阅读器更改为CSV阅读器。 Excel文件显然在显示为空的单元格中包含某种“值”。