我使用Weka构建SVM分类器,对一些推文进行分类。
某些功能可以使用单个值表示(例如,单个推文的转推数量)
其他一些特征是具有非常高维度的矢量(例如一袋1000字的直方图)。
如果我在Weka中建模每个值作为属性;我担心直方图(我认为它是一个单一的特征,但实际上是1000个属性)将优于其他单值特征。
在Weka中是否存在将多值功能作为单一功能处理的某种方式?
答案 0 :(得分:0)
也许你可以使用第一个标签组合功能数组,只获得一个功能。
在我看来,如果要素数组描述的是可以拟合到分布的直方图(具有高精度,请小心!),您可以将要素数组表示为分布的参数。类似的发行版将具有类似的初始化参数,因此它是有意义的。但是你必须检查这是否可以应用于你的数据。