我正在尝试将MatrixFactorizationModel的userFeature保存到textFile,根据doc是[(Int,Array [Double])]类型的RDD。所以我刚刚打电话给
model.userFeature.saveAsTextFile("feature")
然而,我得到的结果是:
(1,[D@4b7707f1)
(5,[D@513e9aca)
(9,[D@7d09bcab)
(13,[D@31058458)
(17,[D@2a5df2a7)
(21,[D@5372efd7)
(25,[D@59d1c59a)
(29,[D@53ee5e25)
(33,[D@498f5a34)
(37,[D@4f9967eb)
(41,[D@5560afb)
(45,[D@2dc7f659)
(49,[D@b46fcc)
(53,[D@38098dd1)
(57,[D@77090fb5)
(61,[D@64769e18)
我期待的是:
(1, [1.1, 2.3, 0.4, ...])
(2, [0.1, 0.3, 0.4, ...])
...
那有什么不对?
答案 0 :(得分:3)
saveAsTextFile
的行为是使用toString
方法。因此,对于Array
,这仅仅是hashcode
。如果坚持使用saveAsTextFile
,您有两种选择:
.mapValues(x=>/*TURN ARRAY DATA INTO A STRING*/).saveAsTextFile...
或者您可以使用map
将数据打包到具有自定义toString
的自定义对象中,或者在这种情况下为List
并且其toString
可能正常工作
.mapValues(_.toList).saveAsTextFile