读取sqlContext

时间:2017-03-06 10:03:36

标签: csv pyspark pyspark-sql

如上所述https://github.com/databricks/spark-csv, 我也在读csv

from pyspark.sql import SQLContext
sqlContext = SQLContext(sc)

df = sqlContext.read.format('com.databricks.spark.csv').options(header='true', inferschema='true').load('cars.csv')

是否有任何选项只能读取标题或只读取前几行。 基本上我只想检查数据框中是否存在特定列?

1 个答案:

答案 0 :(得分:0)

如果header选项设置为true,则可以使用:

df.first()

这样它将返回标题行。