mongo-hadoop connector:如何查询数据

时间:2015-11-20 16:34:28

标签: java mongodb apache-spark hadoop-streaming

我在java(spark应用程序)中使用hadoop mongo连接器。我已经通过设置此配置读取了mongo db

Configuration mongodbConfig = new Configuration();
mongodbConfig.set("mongo.job.input.format", "com.mongodb.hadoop.MongoInputFormat");
mongodbConfig.set("mongo.input.uri", "mongodb://localhost:27017/MyCollectionName.collection");

我可以添加什么来查询数据(例如.limit(100000)

1 个答案:

答案 0 :(得分:3)

您可以在配置中添加更多参数 例如:

mongodbConfig.set("mongo.input.query", "{'field':'value'}");

https://github.com/mongodb/mongo-hadoop/wiki/Configuration-Reference 了解更多详情