我在R中构建了一个监督学习模型,并以PMML格式导出模型/决策规则。我希望我可以使用类似JPMML库的东西直接将PMML链接到MongoDB(因为JPMML与PostgreSQL很好地集成)。
然而,似乎将MongoDB链接到我的PMML xml文件的唯一方法是通过Hadoop使用级联模式。由于我的数据集不是很大(<50GB),我真的不需要Hadoop。
有没有人使用过PMML和MongoDB,之前不必涉及hadoop路线?非常感谢
答案 0 :(得分:0)
基本上,你有两个选择:
50 GB仍然是相当多的数据,因此选项#1在设置的简易性和执行速度方面显然更为可取。是否可以为MongoDB编写Java用户定义函数(UDF)?如果是这样,那么可以在MongoDB中运行JPMML库。否则,您可能会看到是否可以将PMML模型转换为SQL脚本。例如,最新版本的KNIME software(2.11.1和更新版本)包含&#34; PMML到SQL&#34;转换节点。
如果您回到选项#2,那么以下技术文章可能会为您提供一些启发:Applying predictive models to database data: the REST web service approach。