我想使用--use-ngrams true选项运行槌,但似乎无法使其正常工作。
bin\mallet import-file --input ovary.txt --output ovary2.mallet --keep-sequence-bigrams --remove-stopwords
bin\mallet train-topics --input ovary2.mallet --output-topic-keys ovary_keys2_2.txt --use-ngrams true --num-topics 15
但是我收到了这个错误:
无法识别的选项4: - use-ngrams
答案 0 :(得分:0)
在mallet版本2.0.8中,您将使用:
bin\mallet import-file --input ovary.txt --output ovary2.mallet --keep-sequence-bigrams --remove-stopwords --gram-sizes 1,2
bin\mallet train-topics --input ovary2.mallet --output-topic-keys ovary_keys2_2.txt --num-topics 15
您可以在以下位置查看可用选项:
bin\mallet import-file --help
bin\mallet train-topics --help