是否有Spark社区(/ DataBricks / AmpLab)认可的位置可以获得背书(/精选?)火花奖励?或者像CRAN / CPAN一样的火花?
如果不是在哪里可以寻找火花贡献 - 或者只是在搜索github.com上的火花相关项目(最终会找到许多不稳定/死亡的项目)?
特别感兴趣的领域是机器学习算法。 mllib / graphx有目的地保持小而精简 - 以保持较小的代码库。
然而,应该有一种方法允许扩展可用的ML库以适合Spark分发之外的火花。也许我们最终不会像R一样拥有4000个库。但是"数十个"或者可能低几百?似乎是合理的。