什么时候应该优先选择Mahout的SequentialAccessSparseVector而不是RandomAccessSparseVector?

时间:2013-07-10 07:23:14

标签: mahout

我是关于mahout的新手。我想用mahout的工具构建我自己的算法。我对Mahout的SequentialAccessSparseVectorRandomAccessSparseVector的使用感到非常困惑。有人会建议什么时候应该优先于另一个?

由于

1 个答案:

答案 0 :(得分:1)

随机访问版本由哈希表支持,哈希表具有最快的设置和获取。但是迭代顺序是未定义的。有时按维度顺序迭代向量会使其他操作有效,就像计算点积一样,只需要查看定义两者的维度。它会有稍慢的设置并获得并可能使用更多的内存。两者都是稀疏的表示。