mallet管道:首先是停用词或多字停止术语

时间:2018-06-14 17:23:49

标签: topic-modeling mallet

我在命令行中使用了mallet。我想同时使用自定义停止列表(unigrams)和包含多字停止短语的删除文件。我希望首先应用删除文件(即首先删除短语),然后应用自定义停止列表(即删除短语后删除单字停用词)。有没有办法指定哪个先发生?如果不是,那么首先会发生这种情况(因为我可以修改两个列表以完全按照我想要的方式执行,如果我知道它们将应用于我的文本的顺序)。

0 个答案:

没有答案