我正在开发电子商务应用程序。我所拥有的大部分产品都包含类别属性,但有些则不包含(约70-30%)。我试图使用Weka来检测类别,但我拥有的属性是字符串(name, brand, price, description, category)
,因此所有分类器都不起作用,因为它需要属性为数字,名义或二进制。
以前有人遇到过这样的问题吗?
答案 0 :(得分:0)
只需制作离散的连续属性然后它就可以工作,因为有些算法不能使用连续值。
答案 1 :(得分:0)
使用“StringToWordVector”过滤器将您的字符串属性转换为数字属性。