运行此命令时出错mahout trainnb -i path_to / train-vectors -el -li path_to / labelindex -o path_to / model -ow -c

时间:2018-02-13 19:12:53

标签: linux hadoop hdfs mahout

enter image description here

参见附图。我在本地使用mahout。我已将序列文件转换为稀疏向量,我还将该集合分为两组:训练集和测试集:

mahout split -i tweets-vectors/tfidf-vectors --trainingOutput train-vectors --testOutput test-vectors --randomSelectionPct 40 --overwrite --sequenceFiles -xm sequential.

运行此命令mahout trainnb -i train-vectors -el -li labelindex -o model -ow -c

时出错

1 个答案:

答案 0 :(得分:1)

java.lang.ArrayIndexOutOfBoundsException通常是由于您在记录或向量中包含错误的字段数。这可能是由于解析不正确(错误的分隔符,逗号分隔文件中的杂散逗号等)或者您希望在错误位置的字段的其他问题引起的。