我尝试使用以下命令行运行MALLET主题建模:
bin/mallet import-dir --input data\my_text \
--output my.mallet \
--remove-stopwords TRUE \
--keep-sequence TRUE \
--gram-sizes 1,2 \
--keep-sequence-bigrams TRUE
我收到以下错误:
Exception in thread "main" java.lang.IllegalArgumentException: Unrecognized option 10: 2
at cc.mallet.util.CommandOption$List.process(CommandOption.java:344)
at cc.mallet.util.CommandOption.process(CommandOption.java:146)
at cc.mallet.classify.tui.Text2Vectors.main(Text2Vectors.java:122)
看来MALLET已经认可了#34; 2"之后逗号作为第10个参数。谁能让我知道我的输入是否错误以及如何纠正?
谢谢!
答案 0 :(得分:0)
将参数引用到--gram-sizes
选项
--gram-sizes "1,2" \
它会起作用。