我正在使用WEKA为我的大学做一个项目,我正在分类一个非常大的文本文件(300MB)。但这是一个非常缓慢的过程。
我查看了任务管理器,我发现weka只使用了10%的cpu,整体cpu利用率约为13%。我想增加weka的cpu utilsation。我已经将weka的优先级设置为“高”。
任何想法我该怎么做?
答案 0 :(得分:1)
如果您正在训练(训练数据集),weka默认使用10倍交叉验证。 Weka Explorer或命令行在单线程中完成所有折叠。可以使用GUI Weka KnowledgeFlow分别在线程上执行每个折叠。在你的情况下,这将是最简单的方法。但是,每个折叠可以分配给其他计算机,因此每个折叠可以在不同的机器上执行。有关折叠分布的详细信息,请参阅Weka-Parallel。