我正在玩Mobius(Spark的C#语言绑定)和MongoDB的C#驱动程序。我的目标是使用MongoDB作为我的C#应用程序中Spark查询的输入/输出。我知道有一个Java MongoDB Hadoop连接器,但我想继续使用Mobius编写我的Spark查询。
答案 0 :(得分:0)
您可以使用MongoDB Spark Connector中的Mobius和DataFrame API来查询MongoDB。加载数据的代码看起来像
var mongoDbDataFrame = sqlContext.Read.Format("com.mongodb.spark.sql").Load()
加载数据后,您可以对DataFrame执行Select(),Filter()操作。您还可以使用下面的代码模板将DataFrame注册为TempTable以使用SQL查询
mongoDbDataFrame.RegisterTempTable("MongDbDataFrameTempTable")
sqlContext.Sql("SELECT <columns> FROM MongDbDataFrameTempTable WHERE <condition>")
请注意,您需要在类路径中包含连接器及其依赖项,并且&#34; - jars&#34;参数可用于此。