我在java(spark应用程序)中使用hadoop mongo连接器。我已经通过设置此配置读取了mongo db
Configuration mongodbConfig = new Configuration();
mongodbConfig.set("mongo.job.input.format", "com.mongodb.hadoop.MongoInputFormat");
mongodbConfig.set("mongo.input.uri", "mongodb://localhost:27017/MyCollectionName.collection");
我可以添加什么来查询数据(例如.limit(100000)
)
答案 0 :(得分:3)
您可以在配置中添加更多参数 例如:
mongodbConfig.set("mongo.input.query", "{'field':'value'}");
见https://github.com/mongodb/mongo-hadoop/wiki/Configuration-Reference 了解更多详情