我想设置以下(粗略)方案
数据库/ storageFile,用于存储这些事件中发生的事件和活动的数据 一种(理想情况下为java)map-reduce算法,应用于这些数据集以获取所需数据 Rest API也允许外部访问先前算法的结果
[我知道我的数据集不会很大,但这是一个概念验证]
我已经从我的天蓝色门户网站设置了一个HDInsight群集,但不知道接下来应该如何进展。
我找到了一些有关此问题的信息,但它在Windows Azure上已经过时,而且已经发生了重大变化。我也不想使用powershell,因为我只需要运行java代码来自动执行。