应用错误收集

啊，我也遇到了这个问题。

首先，确保Genres属性被识别为String类型。如果您仅使用GUI，请转到Open File...并打开文件（我假设它是.dat文件。如果您已将其重命名为.csv，请选中以下复选框：调用选项对话框”）。

在“通用对象编辑器”窗口中，输入“流派”属性的索引（此处为最后）。

这样做会导致属性在GUI中看起来像这样。

现在选择名为StringToWordVector（weka.filters.unsupervised.attribute.StringToWordVector）的过滤器。现在，在“编辑器”窗口下，找到 Tokenizer 条目，单击其字段，然后在 delimeters 下删除默认值并添加管道字符。您也可以选择编辑属性前缀字段。

套用并找到作为数字属性添加的所需流派，如果原始字符串中不存在该流派，则设置为0，否则设置为1。

StringToWordVector是一个非常有用的过滤器，文档中还有更多内容：http://weka.sourceforge.net/doc.dev/weka/filters/unsupervised/attribute/StringToWordVector.html。

使用分隔符拆分属性标签以处理

1 个答案: