更改Spark Dataset show方法的定界符

时间:2019-07-11 21:38:04

标签: apache-spark dataset delimiter

我非常喜欢Datasets的.show()方法,但是我正在使用管道'|'填充的数据字符。有没有办法获得其他定界符?这段代码

import org.apache.spark.sql.{Encoders, SparkSession}
import scala.collection.JavaConverters._
object Junk extends App {
  val spark = SparkSession.builder().appName("Hello, World!").master("local[2]").getOrCreate()
  val dataset = spark.createDataset[String](List("I'm|as|corny", "as|Kansas|in|August").asJava)(Encoders.STRING)
  dataset.show()
  spark.close()
}

给我

+-------------------+
|              value|
+-------------------+
|       I'm|as|corny|
|as|Kansas|in|August|
+-------------------+

我更喜欢

+-------------------+
☺              value☺
+-------------------+
☺       I'm|as|corny☺
☺as|Kansas|in|August☺
+-------------------+

0 个答案:

没有答案