我正在开发一些项目,需要使用数据文件训练我的模型。问题是用于训练模型的数据文件的大小是10演出。所以,我无法一次导入数据。 另一种方法是修剪数据并仅使用5%的训练数据。但我可能会遗漏一些信息。 我的问题是“是否可以通过将文件拆分成多个文件来训练模型?”
答案 0 :(得分:0)
可以使用Update Model
运算符使用新的示例集数据更新以前创建的模型。并非所有模型运算符都可以这种方式使用,Naive Bayes和k-NN的工作方式与Weka的W-IBk一样。
可以在RapidMiner中创建一个流程,将文件拆分成更小的块,逐个读取并从中创建模型。