输出mahout中的项目项相似度矩阵

时间:2014-09-10 10:33:21

标签: hadoop matrix mapreduce mahout mahout-recommender

我遵循了Mahout in Action教科书第6章中给出的推荐引擎示例。现在,当我获得指定用户的输出时, 现在可以输出在第3个地图减少作业期间计算的项目 - 项目相似度矩阵。完成MapReduce作业后,我发现存在一个temp文件夹,其中包含一个名为/user/hduser/temp/similarityMatrix的目录但是在执行时 hadoop fs -cat temp/similarityMatrix/part-r-00000我得到了

SEQ org.apache.hadoop.io.IntWritable%org.apache.mahout.math.VectorWritable�h��8��Oh�pg;Q����@@����@@2����?�����@����?�&����@?�?�&   ����?�@?�&
                      ����?�?�@+�"���������?��D?�?�t�"�����
����@�?��?��?��?�?�����?�?��?��?�|�"�����
                                                    ����@(@�?��"?��?��?��?�
?�J?�΍��?��?�B�"���������?��M?�Ї��?��$?�!?�L�"�����!����@(@"�?�?�&?��@�?��?��@0@!?�)?�� ?��
                                   ?��
                                      ?��?��?�?�k?��?��ӯ�?��?��?�(?�?�F?�'?�!?��
     ?�

是否可以以任何方式输出项目 - 项目相似度矩阵?

1 个答案:

答案 0 :(得分:0)

这是一个hadoop序列文件,一个二进制格式。您需要编写代码才能使用它。尝试使用mahout seqdumper来检查内容。