标签: apache-spark spark-dataframe databricks
使用Apache Spark处理大型文件时,例如sc.textFile("somefile.xml"),它是否将它拆分为跨执行程序的并行处理,还是作为单个执行程序中的单个块处理?< / p>
sc.textFile("somefile.xml")
使用数据框时,来自Databricks的implicit XMLContext是否为此类大型数据集处理预先构建了优化?
implicit XMLContext
答案 0 :(得分:1)
rowTag