如何在Mallet中使用双精度数组作为特征向量

时间:2016-12-09 09:39:09

标签: java machine-learning classification mallet

从我在文档和各种示例中看到的情况来看, 在Mallet中使用数据的典型worfklow要求您使用通常通过将数据传递到"管道"来获取的功能列表。用某种迭代器迭代它们。数据通常存储在某些csv文件中。

我正在尝试从两个双打数组中获取功能列表。 一个阵列存储实际特征,其大小为n×m(其中n是特征量,m是特征向量的数量),另一个大小为1×m,包含二进制标签。我应该如何将它们转换为功能列表,因此我可以在分类器中使用它们。

1 个答案:

答案 0 :(得分:0)

我最终编写了自定义Itereator,类似于Mullet中的一个名为" ArrayDataAndTargetIterator"。我还必须使用这样定义的管道:

new SerialPipes(Arrays.asList(new Target2Label(), new Array2FeatureVector()));