有没有办法从hdfs中的Parquet文件读取到Mobius的SqlContext?

时间:2016-05-19 23:56:39

标签: c# apache-spark parquet mobius

我知道在Scala中,您可以按如下方式阅读镶木地板文件:

//Create Spark Context
val sparkConf = new SparkConf().setAppName(appName).setMaster(sparkMaster)
val sc = new SparkContext(sparkConf)
val sqlContext = new SQLContext(sc)
import sqlContext.implicits._

 val pf = 
      sqlContext.read.parquet(hdfsDataUri + "test.parquet")
 pf.registerTempTable("test")

有没有办法使用Mobius(C#API for Spark)来做到这一点?我只能找到一种读取CSV文件的方法。 参考:https://github.com/Microsoft/Mobius

1 个答案:

答案 0 :(得分:2)

C# API for using Parquet in Apache Spark中提供了

Mobius。以下是您的问题中的Apache Spark Scala代码的C#实现:

        var sparkConf = new SparkConf().SetAppName(appName).SetMaster(sparkMaster);
        var sc = new SparkContext(sparkConf);
        var sqlContext = new SqlContext(sc);
        var pf = sqlContext.Read().Parquet(hdfsDataUri + "test.parquet");
        pf.RegisterTempTable("test");