标签: hadoop hive user-defined-functions
我很好奇hive如何执行查询,特别是自定义UDF。我有4个数据节点,因此在4个不同的虚拟机上有4个任务跟踪器。
数据节点上的数据已加密,我的UDF会对数据进行解密。我很好奇hive如何执行这个UDF,是吧:
1)每个任务跟踪器检索其datanode上的任何数据,并对其进行解密并将其返回
2)作业跟踪器检索所有加密数据,然后将解密委托给所有4个任务跟踪器。
我希望我的问题很明确......