标签: scala apache-spark
就Spark DataFrame / SQL上下文而言,UDF和自定义表达式之间的区别是什么?特别是,它们都对Catalyst不透明吗?使用一个与另一个的原因是什么?
(例如,here提到了自定义表达式 - 尽管在这种情况下它们并不需要。)
答案 0 :(得分:3)
UDF:
表达式:
这两个 - 除非由表达式特定的催化剂规则支持,否则是不透明的