用于LibSVM,Weka的.arff文件中的字符串属性。

时间:2015-01-03 17:42:13

标签: weka libsvm

我正在尝试在Weka中使用LibSVM。在我的.arff数据集中,我有@attribute attr1 String。但是当我检查LibSVM功能时,我发现LibSVM不支持String属性。有没有办法将字符串转换为数值,所以我可以将它保存在我的数据集中。

1 个答案:

答案 0 :(得分:3)

如果它确实是一个字符串(而不是标称值),您可以使用StringToWordVector

  

将String属性转换为一组属性,表示字符串中包含的文本中出现的单词(取决于tokenizer)信息。单词集(属性)由第一批过滤(通常是训练数据)确定。

这实际上取决于你想要从String中得到什么。如果它不是“正常”文本,而是类似DNA序列的东西,那么你需要完全不同的东西。