标签: python-3.x apache-spark pyspark
我有一个包含两列的数据框。两者都是字符串类型。
当我尝试将数据框保存为csv pipe作为分隔符时,使用以下代码:
csv
pipe
df.write.csv("/outputpath/",sep="|")
输出文件包含奇怪的字符。
请参阅随附的屏幕截图。
如果我改用tab作为分隔符sep="\t",一切看起来都不错。
sep="\t"
只是想知道是否有人知道这里会出现什么问题?
我正在使用
Spark 2.2.0 with Python 3.4