标签: mongodb hadoop apache-spark hdfs data-storage
在我的项目中,我对数据存储方法充满挑战。首先,在我的项目中,有JSON格式的流数据,最合适的数据库是MongoDB。我必须使用Hadoop或Spark分析数据。
所以,我的冲突从这里开始:我可以将MongoDB集合存储在HDFS中,还是MongoDB和HDFS存储单元必须不同?这是我决定的一个重要问题。我必须在相同的磁盘单元或单独的单元中使用Hadoop和MongoDB吗?
答案 0 :(得分:0)
它们需要是不同的单元,因为存储方法,安全策略实现和存储机制本身是不同的。