Pyspark数据框列(类型字符串)拆分并取出第5个位置值

时间:2018-11-21 17:18:25

标签: python dataframe

data_str = (df .select(df.withColumn('column1',split(df['column1'],',').getItem(4)), df.column2.alias('column2')) )

column1 = '"gh","dfg","jsd","shj","wyw","djg"'

从上面的代码中,我想要column1字段中的第5个位置值。 我正在使用上面的代码,并收到错误“无效的参数,而不是字符串或列:类型的DataFrame [product_code:字符串,variation_number:int,data_string:字符串]。对于列文字,请使用'lit' ,“数组”,“结构”或“创建映射”功能。 ” 请给我您有关发生问题的建议。

0 个答案:

没有答案