我有一个.csv文件,该文件仅包含一列数据,我想将一列数据分成两列。
我对如何使用SED和AWK很熟悉,但是我从来没有将一列分为两列。
.csv文件包含一列,该列由2个字符串组成,并用空格隔开。我想保留一个包含字符串#1的列,并创建另一个包含字符串#2的列
我不确定代码
这就是我现在拥有的:
One Column
String#1 String#1
String#2 String#2
这就是我想要的:
Column One Column Two
String#1 String#2
答案 0 :(得分:2)
使用awk(只是偷了头文件):
OFS
这说:
\t
设置为选项卡Column One
。 Column Two
和next
import os
os.environ['PYSPARK_SUBMIT_ARGS'] = '--jars /path/tojar/spark-avro_2.11:4.0.0.jar pyspark-shell'
跳至下一条记录