为什么Spark MLib中的HashingTF不能生成稀疏向量?

时间:2016-09-30 10:53:39

标签: scala apache-spark machine-learning apache-spark-mllib

为什么必须限制HashingTF(桶数)产生的最大功能数量?我试图将其设置为Int.MaxValue,但在尝试分配大型数组时内存不足。为什么它不能产生稀疏的向量?

0 个答案:

没有答案