如何使用mongo-spark连接器添加特定于MongoDB的查询?

时间:2016-12-27 13:17:53

标签: mongodb apache-spark mongodb-query apache-spark-sql

我正在使用“ mongo-spark ”来从spark 2.0应用程序中读取mongodb。 (https://github.com/mongodb/mongo-spark

这是一个代码示例:

val readConfig: ReadConfig = ReadConfig(Map(
      "spark.mongodb.input.uri"-> "mongodb://mongodb01.blabla.com/xqwer",
      "collection" -> "some_collection"), 
None)

sparkSession.read.format("com.mongodb.spark.sql").options(readConfig.asOptions).load()

有谁知道如何添加mongodb查询(例如“find({uid:'ZesSZY3Ch0k8nQtQUIfH'})”)?

1 个答案:

答案 0 :(得分:2)

您可以在filter()

上使用df
val df = sparkSession.read.format("com.mongodb.spark.sql")
                        .options(readConfig.asOptions).load()
df.filter($"uid".equalTo(lit("ZesSZY3Ch0k8nQtQUIfH"))).show()