我正在将一个R randomForest模型导出到PMML。生成的PMML始终将类作为DataDictionary元素的第一个元素,并不总是如此。
有没有办法解决这个问题,或者至少用自定义扩展元素增加PMML?这样我就可以将类索引放在那里。
我查看了pmml包文档以及pmmlTransformations包,但找不到任何可以帮我解决这个问题的内容。
答案 0 :(得分:1)
通过PMML类我假设您指的是PMML模型属性中的模型类型(分类与回归)? 如果是这样,模型类型不是根据DataDictionary的第一个元素的数据类型确定的......这些是完全独立的。模型类型由R认为的模型类型确定。 R随机森林对象确定它认为的类型(模型$ type),这是由pmml函数导出的模型类型。如果你想让你的模型成为某种类型,只要确保你让R知道...例如,如果你使用虹膜数据集,如果你的预测变量是Sepal.Length,R将正确地假设它是一个回归模型。如果您坚持将其视为分类模型,请尝试使用as.factor(Sepal.Length)。