在Pyspark中使用另一列拆分列

时间:2019-06-03 13:17:20

标签: split pyspark

我有一个包含两列的数据框,XY。我想使用X中的值拆分Y。示例:

|  X   |  Y | split_result |
|abc_xy| bc |    _xy       |

我尝试使用split function F.split("X", F.col("Y")).getItem(1)),但是我的代码TypeError: 'Column' object is not callable错误。我想这可能与pattern中的第二个参数split应该是正则表达式有关。

如何使用列X中的值拆分列Y

0 个答案:

没有答案