我有大约1T的数据来自跟踪用户行为(AddToCart,Pageview,Purchased ....)并保存到Cassandra。 现在我必须分析这些数据以获得收入,请求数量......以及构建推荐系统
正如我研究的那样,有些候选人是:
推荐:
+ Spark on HDFS or HBase (Do i have to migrate data from cassandra to HDFS)
+ Spark on Cassandra
查询:
+ Cassandra + Hive
+ Hbase + Hive
深入,我不完全了解处理bigdata
您对我的技术有什么建议可以解决这个问题吗?