我正在尝试使用mahout库对Mnist数据集进行分类。它有784个特征,每个连续变量。我正在使用ContinuousValueEncoder对矢量进行编码。所以我怀疑是否必须创建784 ContinuousVectorEncoder实例。
encoder_feature_1.addToVector((byte [])null,value1,v);
encoder_feature_2.addToVector((byte [])null,value2,v);
encoder_feature_3.addToVector((byte [])null,value3,v);
...........
...........
...........
encoder_feature_784.addToVector((byte [])null,value784,v);
//其中v是RandomAccessSparseVector,基数为784
这是正确的方法吗?或者我需要制作编码器的单个实例。 我似乎没有正确理解这个概念。