在Weka中,长字符串转换为数字数据

时间:2018-08-28 22:44:38

标签: string classification weka numeric arff

我正在使用WEKA工具进行模式分类。我的数据类型是字符串。我在分类之前使用“ StringtoWordVector”过滤器。该过滤器对单词使用n-gram方法。但是我的模式不是单词,它们是长字符串且无意义。我认为此过滤器对我的数据类型无效。如何将模式转换为“ StringtoWordVector”以外的数字数据类型?还是这个过滤器是解决我的问题的好选择?

感谢您的帮助!

我的arff文件示例:

@attribute pattern string

@attribute class  {yes,no}

@data

hahdddswga, yes

cfecrrr, yes

ffffffdddfe, yes

ggggggggggggggggh, no

0 个答案:

没有答案