标签: mongodb apache-spark pyspark pymongo
我正在使用mongodb / mongo-hadoop (https://github.com/mongodb/mongo-hadoop/wiki/Spark-Usage#python-example)但我对如何进行并行读取操作感到困惑。
通过并行读操作意味着,对我的MongoDB索引进行并发读操作。我根据时间戳索引了我的数据库,并希望并行查询数据bw T1-T2,T3-T4等。