我遵循了Mahout in Action教科书第6章中给出的推荐引擎示例。现在,当我获得指定用户的输出时,
现在可以输出在第3个地图减少作业期间计算的项目 - 项目相似度矩阵。完成MapReduce作业后,我发现存在一个temp
文件夹,其中包含一个名为/user/hduser/temp/similarityMatrix
的目录但是在执行时
hadoop fs -cat temp/similarityMatrix/part-r-00000
我得到了
SEQ org.apache.hadoop.io.IntWritable%org.apache.mahout.math.VectorWritable�h��8��Oh�pg;Q����@@����@@2����?�����@����?�&����@?�?�& ����?�@?�&
����?�?�@+�"���������?��D?�?�t�"�����
����@�?��?��?��?�?�����?�?��?��?�|�"�����
����@(@�?��"?��?��?��?�
?�J?���?��?�B�"���������?��M?�Ї��?��$?�!?�L�"�����!����@(@"�?�?�&?��@�?��?��@0@!?�)?�� ?��
?��
?��?��?�?�k?��?��ӯ�?��?��?�(?�?�F?�'?�!?��
?�
是否可以以任何方式输出项目 - 项目相似度矩阵?
答案 0 :(得分:0)
这是一个hadoop序列文件,一个二进制格式。您需要编写代码才能使用它。尝试使用mahout seqdumper来检查内容。