Question

我试图在＆＃39; H＆＃39;之后删除所有值。并将其存储在一列中。

df['col1'] = df['col1'].str.split('H').str[0]

但是pyspark给了我错误：列＆＃39;对象不可调用

Answer 1

一种可能的解决方案是为expand=True添加DataFrame，然后选择第二列：

df['col1'] = df['col1'].str.split('H', expand=True).iloc[:, 1]

或者：

df['col1'] = df['col1'].str.split('H', expand=True)[1]