pyspark:专栏'对象不可调用

时间:2018-03-11 06:30:38

标签: python pandas pyspark

我试图在' H'之后删除所有值。并将其存储在一列中。

df['col1'] = df['col1'].str.split('H').str[0]

但是pyspark给了我错误:列'对象不可调用

1 个答案:

答案 0 :(得分:1)

一种可能的解决方案是为expand=True添加DataFrame,然后选择第二列:

df['col1'] = df['col1'].str.split('H', expand=True).iloc[:, 1]

或者:

df['col1'] = df['col1'].str.split('H', expand=True)[1]