Mallet自然语言处理槌

时间:2015-11-21 19:36:15

标签: nlp mallet

我正在努力学习由UMASS Amhrest开发的MALLET。我对此很陌生,因此这可能是一个愚蠢的问题。

我刚刚使用以下命令在他们的网站上运行了一个示例。

bin/mallet import-dir --input sample-data/web/* --output web.mallet

现在,我有web.mallet输出文件,我不知道如何打开它。 我正在使用Linux并且gedit无法读取此文件。

如何打开输出文件并查看其内容?

谢谢。

1 个答案:

答案 0 :(得分:4)

文件web.mallet不是人类可读的。它用作MALLET进一步处理的输入。

获得文件web.mallet后,您可以将bin/mallet train-topics应用于该文件。网上有一些MALLET教程,请查看,例如http://fedora.clarin-d.uni-saarland.de/hub/kwsearch/MALLET/0/或尝试您最喜爱的搜索引擎。