具有列功能的数据框

时间:2018-07-24 15:41:27

标签: apache-spark dataframe pyspark

我知道如何在像

这样的DataFrame中使用withColumn函数的一般结构
df = df.withColumn("new_column_name", ((df.someColumn > someValue) & (df.someColumn < someOtherValue)))

现在让我们说,操作员信息(在上例中为>和<)存储为字符串(由用户输入)。如何执行上述操作?我可以想到的一种幼稚的方法是为每种操作编写许多if else块,并且每当我们要添加新操作时,我们就必须添加更多if else块。

我在这里缺少什么明显的调整?

先谢谢了。

0 个答案:

没有答案