我的要求如下:
我们正在尝试为其中一位客户实施推荐引擎。为了实现这一目标,我们需要从Web应用程序中存储HDFS中的数据(对于产品的每次点击),并在后端计算建议并在Web应用程序中显示结果(作为产品)。
我的方法如下所示:
我们陷入第4步& 5.请建议,我们如何创建一个JSON服务来从HDFS读/写?
答案 0 :(得分:0)
你问了一个非常笼统的问题。我建议你先熟悉Apache Spark。快速阅读guide。开始从hdfs读取\写入数据到jsonRDD,如tutorial中所述。在了解了如何使用批处理之后,请阅读spark streaming。
有一个old story托勒密我问过,学习几何学的路径是否比欧几里德的元素更短。欧几里得回答说几何学没有皇家之路。因此除了阅读和理解Apache Spark Usage的基础知识之外,没有快速的方法为您的客户构建mllib引擎。祝你好运!