mallet error IllegalArgumentExce ption:无法从文件complaints.mallet中读取InstanceList

时间:2017-07-13 15:45:12

标签: java mallet

我正在尝试使用Mallet进行研究项目,并且我一直遇到同样的错误。 以下是我一直在使用的说明:

在Complaints文件夹中包含所有文件后

步骤1:使用CAT扫描仪清理文件

  • 从桌面打开程序
  • 点击“从文本文件中删除特殊字符”
  • 单击“文件”,“清理单个文件”
  • 选择投诉文件夹中的所有文件
  • 点击打开
  • 点击清洁
  • 转到C:驱动器中的Complaints文件夹并删除Backup文件夹,以便只有已清理的文件位于Complaints文件夹中

第2步 - 创建.mallet文件

  • 打开命令提示符(在“开始”菜单中搜索)
  • 键入cd ..(cd space period period)
  • 再次输入cd ..(最后一行应该只有C:\>)
  • 输入cd mallet
  • 复制并粘贴“数据导入例程”文件中的语法...您无需更改bin \ mallet import-dir - 输入C:\ mallet \ complaints - 输出C:\ mallet \ complaint.mallet - - keep-sequence - remove-stopwords

第3步 - 运行主题建模

  • 在命令提示符下,复制并粘贴“主题模型例程”文本文件中的语法。
  • 下面突出显示您需要更改的内容(基本上您只是告诉它要生成多少主题 - 3,5,10,15,25,50)bin \ mallet train-topics - 输入投诉。 mallet - num-topics 3 - optimize-interval 3 - output-state topic-state.gz - output-topic- keys complaint_3_keys.txt - output-doc- topics complaint_3_composition.txt

  • 每次运行分析时,您将获得2个输出文件(位于mallet文件夹中,标记为compliance_x_keys.txt和complaint_x_composition).txt)。打开这些并复制并粘贴到Excel中。

enter image description here

1 个答案:

答案 0 :(得分:1)

看起来像-s bug:命令正在创建文件complaint.mallet,然后尝试阅读complaints.mallet