多年来,我一直在阅读/听到关于 bigint 列的数据库连接的'
不幸的是,在寻找关于'类似问题' 的真实答案/建议时:
我 没有看到 使用 Hive 版本(最好是版本1.2.1或更高版本)的示例,其中有一个大 (BIG-DATA-ISH)数据集(让我们说 5亿+行)连接到类似大小的数据集:
我选择32的大小,因为它是MD5哈希的大小,转换为字符和255,因为它是'在最大的自然键I的范围内曾见过。
Futhermore ,我希望Hive:
有没有人知道 这样的例子 ,通过展示Hive 解释计划,CPU,文件&网络资源+查询运行时?