我试图在' H'之后删除所有值。并将其存储在一列中。
df['col1'] = df['col1'].str.split('H').str[0]
但是pyspark给了我错误:列'对象不可调用
答案 0 :(得分:1)
一种可能的解决方案是为expand=True
添加DataFrame
,然后选择第二列:
df['col1'] = df['col1'].str.split('H', expand=True).iloc[:, 1]
或者:
df['col1'] = df['col1'].str.split('H', expand=True)[1]