我在hive中使用getLastProcessedVal2
UDF来从表中获取最新的分区。这个UDF是用java编写的。我想使用hive上下文从pyspark使用相同的UDF。
dfsql_sel_nxt_batch_id_ini=sqlContext.sql(''' select l4_xxxx_seee.**getLastProcessedVal2**("/data/l4/work/hive/l4__stge/proctl_stg","APP_AMLMKTE_L1","L1_AMLMKT_MDWE","TRE_EXTION","2.1")''')
错误:
错误exec.FunctionRegistry:无法加载UDF类: 抛出java.lang.ClassNotFoundException:
答案 0 :(得分:1)
将pyspark
shell作为:
pyspark --jars /path/to.udf.jar <all-other-param>
OR
使用--jars
选项提交您的pyspark作业:
spark-submit --jars /path/to/udf.jar <all-other-param>
答案 1 :(得分:-1)