应用错误收集

是否存在SparseVectorsFromSequenceFiles，RowIdJob和RowSimilarityJob作业的内存实现

时间：2012-07-02 07:52:42

标签： hadoop mahout semantic-analysis lsa latent-semantic-analysis

我一直致力于使用运行Map / Reduce作业的Mahout提供的SparseVectorsFromSequenceFiles，RowIdJob和RowSimilarityJob Hadoop作业执行潜在语义分析。我一直试图找到在内存中运行的这些功能的等效实现，无论是在单个线程中，还是最好在多个线程中。

有这样的事吗？

1 个答案:

答案 0 :(得分：2)

我不知道，不这么认为，但写作会很简单。您只需打开SequenceFile.Reader并为每条记录获取值Vector中的Writable并执行您想要的操作它可能是10行代码而不值得使用工具。

有免费的Ada实现吗？
是否存在JVM的最坏情况实现？
是否有可读的STL实现？
关于寄存器和内存的硬件实现
是否有快速实现log1p功能？
ConcurrentBag <t>实现中是否存在内存泄漏？</t>
是否存在SparseVectorsFromSequenceFiles，RowIdJob和RowSimilarityJob作业的内存实现
是否有MergeIterator的实现？
监视Spark作业的内存使用情况
以下代码是否有更快的实现？

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？