标签: python apache-spark apache-kafka nosql open-source
我是一位专门研究Microsoft Azure堆栈的数据开发人员。我想在业余时间探索一些开源的apache大数据堆栈,并想知道是否存在可以在线下载的用于研究和探索的现实世界中大型大数据解决方案。 我可以找到很多涵盖基础知识和小任务的教程和项目,但是我非常渴望看到基于行业标准的项目,这些项目使用良好的设计模式和行业实践来最终学习。