标签: topic-modeling mallet
我在命令行中使用了mallet。我想同时使用自定义停止列表(unigrams)和包含多字停止短语的删除文件。我希望首先应用删除文件(即首先删除短语),然后应用自定义停止列表(即删除短语后删除单字停用词)。有没有办法指定哪个先发生?如果不是,那么首先会发生这种情况(因为我可以修改两个列表以完全按照我想要的方式执行,如果我知道它们将应用于我的文本的顺序)。