我是关于mahout的新手。我想用mahout的工具构建我自己的算法。我对Mahout的SequentialAccessSparseVector
和RandomAccessSparseVector
的使用感到非常困惑。有人会建议什么时候应该优先于另一个?
由于
答案 0 :(得分:1)
随机访问版本由哈希表支持,哈希表具有最快的设置和获取。但是迭代顺序是未定义的。有时按维度顺序迭代向量会使其他操作有效,就像计算点积一样,只需要查看定义两者的维度。它会有稍慢的设置并获得并可能使用更多的内存。两者都是稀疏的表示。