我是Mahout的新手,我正在使用FileDataModel
,但我发现delimiterPattern不能被覆盖,这是非常有线的,我认为一个设计良好的框架应该考虑不同的用例。 / p>
private final Splitter delimiterPattern;
在我的情况下,我想将其更改为:
private final Splitter delimiterPattern = Splitter.onPattern("\\s+");
我有两个问题:
不再重要了,我只是向Mahout提交补丁(https://issues.apache.org/jira/browse/MAHOUT-1398),将整合到0.9版本中。
答案 0 :(得分:0)
您可以执行一些预处理并替换给定的分隔符,并将其设置为CSV文件或可以与mahout的FileDataModel一起使用的内容。