我正在使用WEKA工具进行模式分类。我的数据类型是字符串。我在分类之前使用“ StringtoWordVector”过滤器。该过滤器对单词使用n-gram方法。但是我的模式不是单词,它们是长字符串且无意义。我认为此过滤器对我的数据类型无效。如何将模式转换为“ StringtoWordVector”以外的数字数据类型?还是这个过滤器是解决我的问题的好选择?
感谢您的帮助!
我的arff文件示例:
@attribute pattern string
@attribute class {yes,no}
@data
hahdddswga, yes
cfecrrr, yes
ffffffdddfe, yes
ggggggggggggggggh, no