使用weka进行产品类别检测

时间:2015-01-27 15:57:37

标签: machine-learning classification weka data-mining

我正在开发电子商务应用程序。我所拥有的大部分产品都包含类别属性,但有些则不包含(约70-30%)。我试图使用Weka来检测类别,但我拥有的属性是字符串(name, brand, price, description, category),因此所有分类器都不起作用,因为它需要属性为数字,名义或二进制。

以前有人遇到过这样的问题吗?

2 个答案:

答案 0 :(得分:0)

只需制作离散的连续属性然后它就可以工作,因为有些算法不能使用连续值。

答案 1 :(得分:0)

使用“StringToWordVector”过滤器将您的字符串属性转换为数字属性。