有没有办法可以在加载完成后直接调用inferSchema?
例如:
val df = sqlContext.read.format("com.databricks.spark.csv").
option("header", "true").
option("inferSchema", "false").load(location)
df.schema
我想打电话给下面的话:
val newdf = df.inferSchema()
newdf.printSchema()
此致
答案 0 :(得分:3)
DataFrame
,否则不可能。
您还可以使用csv
源读取架构并将其存储以供使用,但这将以任一方式扫描数据。
您尚未推断出架构,spark-csv
会将每列视为字符串。